申请/专利权人:百度在线网络技术(北京)有限公司
申请日:2022-11-18
公开(公告)日:2024-04-09
公开(公告)号:CN115861684B
主分类号:G06V10/764
分类号:G06V10/764;G06V10/774;G06V10/82;G06N3/045;G06N3/08
优先权:
专利状态码:有效-授权
法律状态:2024.04.09#授权;2023.04.14#实质审查的生效;2023.03.28#公开
摘要:本公开提供了图像分类模型的训练方法、图像分类方法及装置,涉及计算机技术领域,尤其涉及深度学习、计算机视觉等人工智能领域。方案为:获取互为镜像的第一图像和第二图像;分别对第一图像和第二图像进行特征提取,获取第一图像对应的第一特征图和第二图像对应的第二特征图;分别对第一特征图和第二特征图按通道维度进行池化操作,获取第一特征图对应的第一空间注意力权重图和第二特征图对应的第二空间注意力权重图;根据第一空间注意力权重图与第二空间注意力权重图,确定第一约束损失;根据第一约束损失对图像分类模型进行训练。该方法根据互为镜像的第一图像和第二图像的空间注意力权重图,进行注意力一致性约束,提高了模型的分类效果。
主权项:1.一种图像分类模型的训练方法,包括:获取第一图像和第二图像,其中,所述第二图像与所述第一图像互为镜像;分别对所述第一图像和所述第二图像进行特征提取,以获取所述第一图像对应的第一特征图和所述第二图像对应的第二特征图;分别对所述第一特征图和所述第二特征图按通道维度进行池化操作,以获取所述第一特征图对应的第一空间注意力权重图和所述第二特征图对应的第二空间注意力权重图;根据所述第一空间注意力权重图与所述第二空间注意力权重图,确定第一约束损失;根据所述第一约束损失对图像分类模型进行训练;其中,所述根据所述第一约束损失对图像分类模型进行训练,包括:在所述第一图像具有标注框的情况下,根据所述标注框生成第三空间注意力权重图;根据所述第一空间注意力权重图和所述第三空间注意力权重图之间的差异,确定第二约束损失;根据所述第一约束损失和所述第二约束损失对所述图像分类模型进行训练。
全文数据:
权利要求:
百度查询: 百度在线网络技术(北京)有限公司 图像分类模型的训练方法、图像分类方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。