买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于深度学习的高温板坯ID字符识别方法和系统_湖南天桥嘉成智能科技有限公司_202311127473.3 

申请/专利权人:湖南天桥嘉成智能科技有限公司

申请日:2023-09-01

公开(公告)日:2024-03-26

公开(公告)号:CN117173716B

主分类号:G06V30/19

分类号:G06V30/19;G06V30/148;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/08;G06T7/66

优先权:

专利状态码:有效-授权

法律状态:2024.03.26#授权;2023.12.22#实质审查的生效;2023.12.05#公开

摘要:本发明提供一种基于深度学习的高温板坯ID字符识别方法和系统,方法包括:获取板坯图像数据集;建立板坯ID字符识别模型,包括依次连接的OCR文本检测模型、OCR方向分类器和OCR文本识别模型;将板坯图像数据集板坯ID字符识别模型中进行互学习训练;完成训练后将待识别板坯图像输入最优的板坯ID字符识别模型中进行ID检测和识别,获取板坯ID字符识别结果,完成高温板坯的ID字符识别;本发明通过建立板坯ID字符识别模型,并对其检测模型和识别模型进行优化,在训练时引入深度互学习等策略进行训练,能够有效提升ID字符识别的效率、准确率和稳定性。

主权项:1.一种基于深度学习的高温板坯ID字符识别方法,其特征在于,包括以下步骤:S1:获取板坯图像数据集;所述板坯图像数据集包括若干张带有板坯ID字符的板坯图像;S2:建立板坯ID字符识别模型,包括依次连接的OCR文本检测模型、OCR方向分类器和OCR文本识别模型;所述的OCR文本检测模型具体为:所述OCR文本检测模型包括:教师网络,以及结构相同且并列设置的第一学生网络和第二学生网络;所述教师网络的结构包括依次连接的:第一输入层、Resnet子网络、LK-PAN子网络和第一输出层;所述Resnet子网络包括依次连接的:第一残差卷积块、第二残差卷积块、第三残差卷积块、第四残差卷积块和第五残差卷积块;所述LK-PAN子网络包括:卷积层1、卷积层2、卷积层3、卷积层4、卷积层5、卷积层6、卷积层7、卷积层8、卷积层9、卷积层10、卷积层11、卷积层12、卷积层13、卷积层14、卷积层15和第一全连接层;所述卷积层1~4参数相同,卷积层5~12参数相同,卷积层13~15参数相同;所述LK-PAN子网络包括并列设置的支路1、支路2、支路3和支路4,支路1具体为依次连接的卷积层1、卷积层5和卷积层9;支路2具体为依次连接的卷积层2、卷积层6和卷积层10;支路3具体为依次连接的卷积层3、卷积层7和卷积层11;支路4具体为依次连接的卷积层4、卷积层8和卷积层12;卷积层9~12的输出端分别连接第一全连接层的输入端,第一全连接层的输出端连接教师网络的第一输出层;所述卷积层2的输出还上采样至卷积层5的输入,卷积层3的输出还上采样至卷积层6的输入,卷积层4的输出还上采样至卷积层7的输入;所述卷积层5的输出还经卷积层13下采样至卷积层10的输入,卷积层6的输出还经卷积层14下采样至卷积层11的输入,卷积层7的输出还经卷积层15下采样至卷积层12的输入;每个所述学生网络的结构均包括依次连接的:第二输入层、MobileNet子网络、RSE-FPN子网络和第二输出层;所述MobileNet子网络包括依次连接的:卷积层16、第一批归一化层、第一h-swish激活层、bneck通道注意力卷积模块、第一全局平均池化层、第一FC层、第二批归一化层、第二h-swish激活层、第二FC层和第二全连接层;所述RSE-FPN子网络包括:RSE卷积层1、RSE卷积层2、RSE卷积层3、RSE卷积层4、RSE卷积层5、RSE卷积层6、RSE卷积层7、RSE卷积层8和第三全连接层;RSE卷积层1~8的结构和参数相同;所述RSE-FPN子网络包括并列设置的支路5、支路6、支路7和支路8,支路5具体为依次连接的RSE卷积层1和RSE卷积层5,支路6具体为依次连接的RSE卷积层2和RSE卷积层6,支路7具体为依次连接的RSE卷积层3和RSE卷积层7,支路8具体为依次连接的RSE卷积层4和RSE卷积层8,RSE卷积层4~8的输出端分别连接第三全连接层的输入端,第三全连接层的输出端连接对应的学生网络的第二输出层;所述RSE卷积层2的输出还上采样至RSE卷积层5的输入,RSE卷积层3的输出还上采样至RSE卷积层6的输入,RSE卷积层4的输出还上采样至RSE卷积层7的输入;所述上采样均为2倍上采样;每个所述RSE卷积层的结构均包括依次连接的第三输入层、SE激励块和第三输出层;所述SE激励块包括依次连接的第二全局平均池化层、SE卷积层1、ReLU激活层、SE卷积层2和HardSigmoid激活层;SE卷积层1和SE卷积层2的参数相同;第二全局平均池化层的输入还与HardSigmoid激活层的输出进行加权相乘操作,将加权相乘结果作为SE激励块的输出;所述第三输入层的输出还与SE激励块的输出构成残差加和连接;所述的OCR文本识别模型具体为:所述OCR文本识别模型包括依次连接的:第四输入层、PP-LCNet网络、卷积层17、第三全局平均池化层、SVTR全局混合块、第四全连接层和第四输出层;所述PP-LCNet网络包括依次连接的:卷积层17、DepthSep卷积层1、DepthSep卷积层2、DepthSep卷积层3、DepthSep卷积层4、DepthSep卷积层5、DepthSep卷积层6、DepthSep卷积层7、DepthSep卷积层8、DepthSep卷积层9、DepthSep卷积层10、DepthSep卷积层11、DepthSep卷积层12、DepthSep卷积层13、GAP层和第五全连接层;所述SVTR全局混合块包括依次连接的:第一LN层、混合层、第二LN层、多层感知器MLP层;所述第一LN层的输入还与混合层的输出构成残差连接,第二LN层的输入还与多层感知器MLP层的输出构成残差连接;S3:将板坯图像数据集输入所述OCR文本检测模型中进行ID文本区域检测和互学习优化训练,获取ID文本区域数据集,以及最优的OCR文本检测模型;所述ID文本区域数据集包括若干张ID文本区域图像,ID文本区域图像与所述板坯图像一一对应;S4:将获取到的ID文本区域数据集输入所述OCR方向分类器中进行ID文本区域的方向旋转调整和训练,获取方向调整后的ID文本区域数据集,以及最优的OCR方向分类器;S5:将方向调整后的ID文本区域数据集输入所述OCR文本识别模型中进行ID文本识别和联合互学习优化训练,获取最优的OCR文本识别模型;将所述最优的OCR文本检测模型、最优的OCR方向分类器和最优的OCR文本识别模型共同保存为最优的板坯ID字符识别模型;S6:在高温板坯生产过程中,利用工业相机拍摄带有板坯ID字符的待识别板坯图像;将待识别板坯图像输入最优的板坯ID字符识别模型中进行ID检测和识别,获取板坯ID字符识别结果,完成高温板坯的ID字符识别。

全文数据:

权利要求:

百度查询: 湖南天桥嘉成智能科技有限公司 一种基于深度学习的高温板坯ID字符识别方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。