买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于提示自蒸馏的部分测试时间自适应的图像识别方法_中国人民解放军国防科技大学_202410057715.4 

申请/专利权人:中国人民解放军国防科技大学

申请日:2024-01-15

公开(公告)日:2024-04-16

公开(公告)号:CN117893810A

主分类号:G06V10/764

分类号:G06V10/764;G06V10/774;G06V40/16

优先权:

专利状态码:在审-公开

法律状态:2024.04.16#公开

摘要:本申请涉及一种基于提示自蒸馏的部分测试时间自适应的图像识别方法。所述方法包括:利用测试图像集对视觉语言模型进行测试自适应训练,在测试过程中对单个测试图像进行图像增强,对多个增强视图的预测概率进行聚合,得到聚合预测概率;对测试图像集进行部分测试时间自适应计算得到原始测试图像的预测概率;将聚合预测概率和原始测试图像的预测概率进行前馈预测聚合,将前馈预测聚合概率和所有增强方法的预测的均值进行对齐,得初始测试时间提示;对初始测试时间提示进行虚拟批次更新,根据每个批次测试图像的测试时间提示进行模型测试,得到测试好的视觉语言模型。采用本方法能够提高图像识别准确率。

主权项:1.一种基于提示自蒸馏的部分测试时间自适应的图像识别方法,其特征在于,所述方法包括:获取测试图像集;所述测试图像集包括多个测试图像;利用所述测试图像集对视觉语言模型进行测试自适应训练,在测试过程中根据随机增强函数对单个测试图像进行图像增强,得到多个增强视图的预测概率;对所述多个增强视图的预测概率进行聚合,得到聚合预测概率;对所述测试图像集进行部分测试时间自适应,将所述测试图像集的标签空间作为视觉语言模型的标签空间的子集来计算得到原始测试图像的预测概率;将所述聚合预测概率和原始测试图像的预测概率进行前馈预测聚合,得到前馈预测聚合概率;将所述前馈预测聚合概率和所有增强方法的预测的均值进行对齐,得初始测试时间提示;对所述初始测试时间提示进行虚拟批次更新,得到当前批次测试图像的下一批次测试图像的测试时间提示;根据每个批次测试图像的测试时间提示进行模型测试,利用所述测试好的视觉语言模型对待识别的图像进行识别。

全文数据:

权利要求:

百度查询: 中国人民解放军国防科技大学 基于提示自蒸馏的部分测试时间自适应的图像识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。