买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于主动学习与迁移学习的字体类别视觉检测方法和系统_湖南大学_202410122672.3 

申请/专利权人:湖南大学

申请日:2024-01-30

公开(公告)日:2024-04-26

公开(公告)号:CN117649672B

主分类号:G06V30/19

分类号:G06V30/19;G06N3/0464;G06N3/091;G06N3/096;G06V10/82;G06V30/148;G06V30/16;G06V30/18

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2024.03.22#实质审查的生效;2024.03.05#公开

摘要:本发明公开了基于主动学习与迁移学习的字体类别视觉检测方法和系统,获取三种场景下的数据集,对数据集进行预处理并划分;基于迁移学习,利用预训练模型的对三种场景下的测试集中的字体图像进行分析并且得到相应的预测结果;采用主动学习策略,计算对应场景下的预测结果的置信度和准确率,当对应场景的准确率小于该场景的预设的准确率阈值时,选择该场景下置信度大于该场景下预设的置信度阈值但是标记错误的样本进行人工标注后,放入该场景的训练集中进行模型再训练,直至该场景的准确率大于或等于该场景的预设的准确率阈值;重复上述过程,直至三种场景的准确率均大于或等于对应场景的预设的准确率阈值。提高模型的扩展、泛化能力和准确性。

主权项:1.基于主动学习与迁移学习的字体类别视觉检测方法,其特征在于,所述方法包括以下步骤:S100、获取数据集,数据集包括拍摄图片、文档截取图片和标准字符图片,对数据集进行预处理,得到单个拍摄的字体图像、单个文档中的字体图像和单个字符图像,将预处理后的数据集进行划分,得到三种场景下的训练集、验证集和测试集;S200、基于迁移学习,利用预训练模型的特征提取能力对三种场景下的测试集中的字体图像进行分析并且得到三种场景下相应的预测结果;S300、采用主动学习策略,计算对应场景下的预测结果的置信度和准确率,当对应场景的准确率小于该场景的预设的准确率阈值时,选择该场景下置信度大于该场景下预设的置信度阈值但是标记错误的样本进行人工标注,将标注后的样本放入该场景的训练集中对预训练模型进行再训练,更新预训练模型的参数,直至该场景的准确率大于或等于该场景的预设的准确率阈值;S300中采用主动学习策略,计算对应场景下的预测结果的置信度和准确率,具体为:对于一个样本,预训练模型预测为类别的概率表示为,置信度通过以下公式计算: ;其中,表示在所有类别的预测概率中取最大值;第一种场景中置信度高于第一种场景的预设置信度阈值但标记错误的样本中最低的置信度作为第二种场景和第三种场景的置信度阈值;S400、重复S300,直至三种场景的准确率均大于或等于对应场景的预设的准确率阈值。

全文数据:

权利要求:

百度查询: 湖南大学 基于主动学习与迁移学习的字体类别视觉检测方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。