买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种图像分类模型的增量训练方法、图像分类模型及方法_中国科学院计算技术研究所_202311795114.5 

申请/专利权人:中国科学院计算技术研究所

申请日:2023-12-25

公开(公告)日:2024-03-22

公开(公告)号:CN117746184A

主分类号:G06V10/774

分类号:G06V10/774;G06V10/764;G06V10/77;G06V10/44;G06N3/045;G06N3/0495;G06N3/096

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.09#实质审查的生效;2024.03.22#公开

摘要:本发明提供了一种图像分类模型的增量训练方法,所述方法包括:S1、采用上一次增量训练得到的图像分类模型作为当前轮初始图像分类模型;所述图像分类模型包括特征提取器和分类器,所述特征提取器用于提取图像数据的特征向量,所述分类器用于根据特征向量进行图像分类;S2、采用新训练集和旧训练集训练所述步骤S1中得到的初始图像分类模型至收敛,在训练过程中采用预设的总损失函数更新模型参数,所述总损失包括交叉熵损失和对比损失,所述对比损失是基于新训练集和旧训练集中的所有正对和负对计算。本发明的技术方案通过在训练中采用了包括基于图像的特征向量和类的特征向量的构建的正对和负对的对比损失,从而缓解了增量学习中的灾难性遗忘问题。

主权项:1.一种图像分类模型的增量训练方法,其特征在于,所述方法将图像数据集划分为多个子训练集,每个子数据集包括多个类别的图像数据且不同子数据集之间的类别没有交叉,每个图像有对应的类别标签,采用划分的子训练集对图像分类模型进行多次增量训练,其中,每次增量训练包括以一个还未参与过训练的子数据集作为新训练集,已经参与过训练的所有子数据集的部分或全部为旧训练集,并执行如下步骤:S1、采用上一次增量训练得到的图像分类模型作为当前轮初始图像分类模型;所述图像分类模型包括特征提取器和分类器,所述特征提取器用于提取图像数据的特征向量,所述分类器用于根据特征向量进行图像分类;S2、采用新训练集和旧训练集训练所述步骤S1中得到的初始图像分类模型至收敛,在训练过程中采用预设的总损失函数更新模型参数,所述总损失包括交叉熵损失和对比损失,其中:所述交叉熵损失是基于新训练集和旧训练集中所有图像的交叉熵损失;所述对比损失是基于新训练集和旧训练集中的所有正对和负对计算,其中,新训练集和旧训练集中的每个图像的特征向量与该图像所属的类的特征向量组成一个正对,新训练集和旧训练集中的每个图像的特征向量与任意一个其他类的特征向量组成一个负对,新训练集和旧训练集中的每个图像的特征向量与和该图像不同类的任意一个其他图像的特征向量组成一个负对。

全文数据:

权利要求:

百度查询: 中国科学院计算技术研究所 一种图像分类模型的增量训练方法、图像分类模型及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。