买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于OCR的目标字段识别方法、装置及存储介质_平安科技(深圳)有限公司_202010186614.9 

申请/专利权人:平安科技(深圳)有限公司

申请日:2020-03-17

公开(公告)日:2024-04-05

公开(公告)号:CN111476227B

主分类号:G06V30/14

分类号:G06V30/14;G06V30/18;G06V30/19

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2022.02.01#实质审查的生效;2020.07.31#公开

摘要:本发明涉及图像处理领域,揭露了一种基于OCR的目标字段识别方法,该方法包括:接收目标字段识别指令后,根据待识别图片的图片类型确定对应的模板信息,对待识别图片进行OCR识别,基于识别结果及模板信息依次确定待识别图片的目标锚点区域、定位图案区域,并根据目标锚点区域及定位图案区域确定目标字段区域,根据确定的目标字段区域及识别结果确定待识别的目标字段。本发明还揭露了一种电子装置及计算机存储介质。利用本发明,可以提高基于OCR的目标字段识别的效率及准确性。

主权项:1.一种基于OCR的目标字段识别方法,适用于电子装置,其特征在于,该方法包括:接收步骤:接收并响应用户发出的目标字段识别指令,所述目标字段识别指令包括待识别图片、所述待识别图片的图片类型及待识别目标字段标识;模板确定步骤:从预设存储路径中读取预设的图片类型与模板信息的映射数据,根据所述待识别图片的图片类型及所述映射数据确定与所述待识别图片对应的目标模板信息;第一识别步骤:对所述待识别图片进行OCR识别,得到多个文本框及所述多个文本框对应的文本信息;第一区域确定步骤:将所述多个文本框对应的文本信息中与所述待识别目标字段标识对应的文本信息作为目标锚点信息,根据所述目标锚点信息对应的文本框确定所述待识别图片的目标锚点区域;第二区域确定步骤:基于预设分析规则、所述目标模板信息及所述待识别图片的目标锚点区域对所述待识别图片进行分析,得到所述待识别图片的定位图案区域;第三区域确定步骤:根据所述待识别图片的目标锚点区域、定位图案区域及所述目标模板信息,计算所述待识别图片中与所述待识别目标字段标识对应的目标字段区域;及第二识别步骤:从所述多个文本框中筛选出与所述目标字段区域匹配的文本框,对应的文本信息中筛选出与所述目标字段区域匹配的文本信息,作为目标字段,并向用户展示所述目标字段;其中,所述目标模板信息包括:模板图片的锚点信息、定位图案信息及第一相对位置信息;所述基于预设分析规则、所述目标模板信息及所述待识别图片的目标锚点区域对所述待识别图片进行分析,得到所述待识别图片的定位图案区域,包括:从所述目标模板信息中获取所述模板图片的锚点信息、定位图案信息及第一相对位置信息;根据所述模板图片的锚点信息、定位图案信息及第一相对位置信息确定所述待识别图片的搜索区域及滑动窗口;将所述滑动窗口按照预设步长在所述待识别图片的搜索区域滑动,得到多个待选区域,分别提取所述多个待选区域的特征得到所述多个待选区域对应的特征数据;及分别计算所述定位图案信息与所述多个待选区域对应的特征数据的匹配度,将匹配度最高的待选区域作为所述待识别图片的定位图案区域。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 基于OCR的目标字段识别方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。