买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】竖排文字识别方法、装置、计算机设备和存储介质_中国平安人寿保险股份有限公司_202110434869.7 

申请/专利权人:中国平安人寿保险股份有限公司

申请日:2021-04-22

公开(公告)日:2023-07-21

公开(公告)号:CN113011132B

主分类号:G06F40/109

分类号:G06F40/109;G06V30/14;G06V30/148;G06V30/18;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2023.07.21#授权;2021.07.09#实质审查的生效;2021.06.22#公开

摘要:本申请实施例属于文字识别领域,应用于智慧城市领域中,涉及一种竖排文字识别方法,包括在接收到待识别文本图像时,扫描待识别文本图像中文字区域的宽度和高度;根据所述文字区域的宽度和高度,确定待识别文本图像的排版类型;将所述待识别文本图像输入到文字识别神经网络模型中;基于所述排版类‑型,采用所述卷积网络层和残差网络层对所述待识别文本图像进行特征提取与维度归一化,得到二维特征序列;采用所述序列识别层对所述二维特征序列进行识别,得到文本识别结果。本申请还提供一种竖排文字识别装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,待识别文本图像数据还存储于区块链中。采用本方法提高了对竖排文本的识别精度。

主权项:1.一种竖排文字识别方法,其特征在于,所述方法包括:在接收到待识别文本图像时,扫描所述待识别文本图像中文字区域的宽度和高度;根据所述文字区域的宽度和高度,确定所述待识别文本图像的排版类型,其中,所述排版类型包括水平文本和竖排文字;将所述待识别文本图像输入到文字识别神经网络模型中,其中,所述文字识别神经网络模型包括卷积网络层、残差网络层和序列识别层,不同排版类型对应的所述残差网络层的滑动步长不同;基于所述排版类型,采用所述卷积网络层和残差网络层对所述待识别文本图像进行特征提取与维度归一化,得到二维特征序列;采用所述序列识别层对所述二维特征序列进行识别,得到文本识别结果;所述基于所述排版类型,采用所述卷积网络层和残差网络层对所述待识别文本图像进行特征提取与维度归一化,得到二维特征序列,包括:根据所述排版类型,确定残差网络层中的滑动步长;采用所述卷积网络层和残差网络层对所述待识别文本图像进行特征提取和维度归一化,得到三维维度的特征序列,其中,所述三维维度的特征序列中包括至少一个归一化为1的维度;删除归一化为1的维度,得到所述二维特征序列;在所述在接收到待识别文本图像时,扫描所述待识别文本图像中文字区域的宽度和高度之前,还包括:计算字符串中预设字体占用的矩形空间;基于所述矩形空间,确定所述字符串中第一个字符的起始位置和相邻两个字符在高度方向之间的间隔距离;采用从上至下的方式,按照所述间隔距离进行字符串的输出,得到按所述间隔距离排列的竖排文字;基于所述竖排文字和背景图片,生成竖排文字图像,并对所述竖排文字图像进行裁剪,得到竖排训练样本图像;基于所述竖排训练样本图像,对所述文字识别神经网络模型进行训练,得到竖排文字对应的滑动步长。

全文数据:

权利要求:

百度查询: 中国平安人寿保险股份有限公司 竖排文字识别方法、装置、计算机设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。