首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于梯度校准的持续学习方法、系统、设备及存储介质_中国科学技术大学_202311845308.1 

申请/专利权人:中国科学技术大学

申请日:2023-12-29

公开(公告)日:2024-05-17

公开(公告)号:CN117521767B

主分类号:G06N3/084

分类号:G06N3/084;G06N3/044;G06N3/045;G06N3/0464;G06V10/764;G06V10/82

优先权:

专利状态码:有效-授权

法律状态:2024.05.17#授权;2024.02.27#实质审查的生效;2024.02.06#公开

摘要:本发明公开了一种基于梯度校准的持续学习方法、系统、设备及存储介质,它们是一一对应的方案,方案中:只需要额外保存训练阶段递归计算的全梯度的无偏估计结果,仅增加少量的内存开销,并且提升训练效率,提升模型的性能;并且,可以加速模型的收敛,增加模型训练过程中损失下降的稳定性,更有利于模型的参数调整以及模型效果提升;例如,图像分类模型通过本发明提供的方法进行训练后,能够提升后续图像分类任务的准确率;文本识别模型通过本发明提供的方法进行训练后,能够提升后续文本识别任务的准确率。

主权项:1.一种基于梯度校准的持续学习方法,其特征在于,包括:获取待学习的模型,以及训练数据集;其中,所述待学习的模型包括:图像分类模型与文本识别模型;当待学习的模型为图像分类模型时训练数据集为图像数据,当待学习的模型为文本识别模型时训练数据集为文本数据;利用训练数据集对待学习的模型进行训练,在每一时间点,从训练数据集中取出相应的训练数据,通过待学习的模型进行预测,获得预测输出,利用训练数据与对应的预测输出计算损失函数,并结合递归计算的全梯度的无偏估计结果计算出对应的校准梯度,并以此更新模型参数,在每一时间点的训练完毕后,结合更新获得的模型参数更新全梯度的无偏估计结果并应用于下一时间点的训练过程;重复多个时间点的训练,获得最终模型参数;对于当前时间点t,相应的训练数据为,将当前时间点t划分为S个训练阶段,每一个训练阶段划分为m步,将每一训练阶段开始时的模型参数记为;对于当前时间点t中当前训练阶段的第k步,对应模型参数记为,通过下述方式计算出校准梯度: ;其中,为利用递归计算的全梯度的无偏估计结果计算的校准参数;为使用训练数据与模型参数计算出的梯度;为利用数据与模型参数时的预测输出计算的损失函数,为训练数据中的数据,为导数符号,利用训练数据和模型参数时的预测输出计算的损失函数,数据是从中采样出的数据,为梯度校准项,各数据中的x表示图像数据或者文本数据,y表示x对应的真实标签;校准参数的计算方式为: ;其中,为递归计算的全梯度的无偏估计结果,校准参数为时间点t中当前训练阶段的第k步计算的校准参数,为利用数据和模型参数时的预测输出计算的损失函数,为利用数据和模型参数时的预测输出计算的损失函数,数据与数据是缓存中采样出的数据,所述缓存中通过蓄水池采样算法保存有之前训练数据中的一部分数据,为梯度校准项。

全文数据:

权利要求:

百度查询: 中国科学技术大学 基于梯度校准的持续学习方法、系统、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术