买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种轻量级自然场景文本识别方法_南京航空航天大学_202010579311.3 

申请/专利权人:南京航空航天大学

申请日:2020-06-23

公开(公告)日:2024-04-02

公开(公告)号:CN111832546B

主分类号:G06V20/62

分类号:G06V20/62;G06V30/14;G06V10/82;G06N3/0464;G06N3/0442;G06N3/045

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2020.11.13#实质审查的生效;2020.10.27#公开

摘要:本发明公开了一种轻量级自然场景文本识别方法,首先,获取自然场景文本数据,选用自然场景文本图片数据集用于训练及测试;然后,将训练集数据送入深度学习网络进行训练,直至网络收敛,得到最终权重文件;最后,利用权重文件,将测试集的图片数据送入训练好的深度学习网络进行测试,并输出识别结果。本发明识别速度快且精度高,克服了传统图像处理算法在自然场景文本识别中难以解决的噪声干扰、光照不均、对比度低、字符粘连等难题;与现有方法相比,本发明在保证识别的高精度情况下,大大减少了计算量以及模型的参数量,提高了识别速度,且鲁棒性强,具有深远的发展与应用前景。

主权项:1.一种轻量级自然场景文本识别方法,其特征在于,包括以下步骤:1获取自然场景文本图片数据集,并将数据集分为训练集和测试集;2将获得的训练集送入深度学习网络进行训练,直至深度学习网络收敛,得到权重文件;3利用训练好的深度学习网络和权重文件进行测试集中自然场景图片的文本识别测试,并输出识别结果;步骤2所述的深度学习网络由特征序列提取层、循环神经网络层以及注意力机制组成,具体结构如下:所述深度学习网络包括8个阶段,分别为阶段0,1,2,......,7;受轻量级网络PeleeNet启发,本发明保留原网络的前4个阶段,摒弃最后一个阶段,后续增加4个阶段完成最终识别;其中,训练数据从阶段0输入特征提取网络,依次经阶段1,2,3,…,7处理后得到最终识别结果,其中,特征序列提取层由阶段0,1,2,3,4,5构成,阶段0,1,2,3,4完成对输入图片特征图的提取,阶段5完成特征图到特征序列的转换;阶段6,7则由循环神经网络层以及注意力机制组成,完成特征序列的标签分布获得最终识别结果;其中,阶段0由StemBlock构成,实现在增加很少计算量的情况下获得更加丰富的语义特征;阶段1,2,3由DenseBlock以及1×1卷积、平均池化层构成;阶段4由1×1卷积构成,5个阶段最终完成输入图片特征的提取,阶段5实现特征图到特征序列的转换;阶段6,7将双向长短期记忆网络与DenseBlock相结合,在每个输入与输出之间以级联方式建立直接关联通道,随后引入注意力机制,得到特征序列的标签分布并获得最终结果。

全文数据:

权利要求:

百度查询: 南京航空航天大学 一种轻量级自然场景文本识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。