买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于票据内容和位置信息的文本抽取方法_金科览智科技(北京)有限公司_202110119105.9 

申请/专利权人:金科览智科技(北京)有限公司

申请日:2021-01-28

公开(公告)日:2024-04-12

公开(公告)号:CN112818823B

主分类号:G06F16/35

分类号:G06F16/35

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2022.02.25#著录事项变更;2021.06.04#实质审查的生效;2021.05.18#公开

摘要:本发明提供了一种基于票据内容和位置信息的文本抽取方法,包括以下步骤:S1:图像校正;S2:进行文字检测,检测出文字块;S3:在检测好的文字块上进行文字识别;S4:对文字块进行分类,得到文字块的文字信息和坐标信息;S5:将文字块的文字信息和坐标信息送入神经网络中,输出每个文字块的标签;S6:对相同标签类型的文字块进行匹配链接,输出抽取结果。本发明通过引入了位置信息的textCNN+blocklink的方法,解决了在二维票据中实体抽取的问题,并通引入的位置信息有效提高了文本抽取的准确率。

主权项:1.一种基于票据内容和位置信息的文本抽取方法,其特征在于,包括如下步骤:S1:图像校正;S2:进行文字检测,检测出文字块;S3:在检测好的文字块上进行文字识别;S4:对文字块进行分类,得到文字块的文字信息和坐标信息;S5:将文字块的文字信息和坐标信息送入神经网络中,输出每个文字块的标签;S6:对相同标签类型的文字块进行匹配链接,输出抽取结果;所述步骤S1中,采用east算法求出文字块的倾斜角度,然后根据文字块的倾斜角度校正图片;所述步骤S2中,采用pixellink算法进行文字检测,采用pixellink算法进行像素级别的实例分割,分辨哪些像素属于文字区域,哪些像素不属于文字区域,pixellink首先将同一实例中的像素链接起来分割出不同的文本实例,然后直接从分割结果中提取文本包围框;所述步骤S3中,采用crnn+ctc算法在检测好的文字块上进行文字识别,然后对文字识别后的文字块进行分类,得到文字块的文字信息和坐标信息;所述步骤S4中,所述文字信息包括文字块的宽度信息以及高度信息,所述坐标信息包括文字块的左上、左下、右上以及右下的坐标;所述步骤S5中,所述神经网络为双层神经网络;得到文字块的文字信息以及坐标信息后,后续通过textCNN+location的双层神经网络对文字信息以及坐标信息进行分类;采用textCNN+location神经网络输出每个文字块的分类标签;所述步骤S6中,对分类好的文字块识别其周围的文字块,对相同标签类型的文字块进行合并;神经网络对文字块进行分类识别后,会输出两种标签类型的文字块,所述文字块的标签类型包括包含key的文字块以及包括value的文字块;通过最短距离链接相邻的文字块,实现key和value的链接,链接成功的key和value构成的成对文字块,即为要抽取的内容,从而完成了对票据中文本的抽取。

全文数据:

权利要求:

百度查询: 金科览智科技(北京)有限公司 一种基于票据内容和位置信息的文本抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。