申请/专利权人:腾讯科技(深圳)有限公司
申请日:2020-11-18
公开(公告)日:2021-02-23
公开(公告)号:CN112396106A
主分类号:G06K9/62(20060101)
分类号:G06K9/62(20060101)
优先权:
专利状态码:在审-实质审查的生效
法律状态:2022.10.28#实质审查的生效;2021.02.23#公开
摘要:本公开涉及机器学习技术领域,提供了一种内容识别方法、内容识别模型训练方法及存储介质。该内容识别模型训练方法通过对所述图像样本中图像抽象内容相关的实体对象进行原型提取,并获得每个图像样本对应的目标原型类别,基于图像样本的弱标签信息、图像样本对应的目标原型类别和识别结果,获得目标损失函数并进行模型训练处理,得到经训练的初始内容识别模型。本公开提升了对抽象概念的内容识别的效果和准确率。
主权项:1.一种内容识别模型训练方法,其特征在于,包括:获取训练集和初始内容识别模型,所述训练集包括具有表征图像抽象内容类别的弱标签信息的图像样本;获得所述图像样本的内容特征信息,并基于所述图像样本的内容特征信息,对所述图像样本中图像抽象内容相关的实体对象进行原型提取,获得所述图像样本对应的原型类别表达;基于所述图像样本的内容特征信息和所述原型类别表达,获得每个图像样本对应的目标原型类别;通过所述初始内容识别模型对所述训练集进行识别处理,获得所述训练集的识别结果;所述识别结果至少包括表征每个图像样本为目标抽象内容类别的概率和表征每个图像样本为目标原型类别的概率;基于所述图像样本的弱标签信息、所述图像样本对应的目标原型类别和所述识别结果,获得目标损失函数;根据所述目标损失函数对所述初始内容识别模型进行训练,获得经训练的内容识别模型。
全文数据:
权利要求:
百度查询: 腾讯科技(深圳)有限公司 内容识别方法、内容识别模型训练方法及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。