买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种增值税发票识别系统及方法_武汉天喻信息产业股份有限公司_202110216933.4 

申请/专利权人:武汉天喻信息产业股份有限公司

申请日:2021-02-26

公开(公告)日:2024-04-05

公开(公告)号:CN112949455B

主分类号:G06V30/412

分类号:G06V30/412;G06V20/62;G06V10/82;G06N3/0464;G06N3/044

优先权:

专利状态码:有效-授权

法律状态:2024.04.05#授权;2021.07.02#实质审查的生效;2021.06.11#公开

摘要:本发明公开了一种增值税发票识别系统及方法,涉及票据识别领域,该系统包括PDF识别模块和图片识别模块,PDF识别模块用于对PDF形式增值税发票进行识别,以及当对PDF形式增值税发票识别失败时,基于PDF格式和图片格式间的转化,将PDF形式增值税发票转化为图片形式增值税发票;图片识别模块用于对于图片形式增值税发票以及PDF识别模块转化得到的图片形式增值税发票进行识别。本发明无需进行增值税发票文件类型的指定,便可实现增值税发票的自动识别。

主权项:1.一种增值税发票识别系统,其特征在于,包括:PDF识别模块,其用于对PDF形式增值税发票进行识别,以及当对PDF形式增值税发票识别失败时,基于PDF格式和图片格式间的转化,将PDF形式增值税发票转化为图片形式增值税发票;图片识别模块,其用于对于图片形式增值税发票以及PDF识别模块转化得到的图片形式增值税发票进行识别;其中,所述图片识别模块包括区域分割模块、文字检测模块、模型连接模块、文字识别模块、版面分析模块、字段提取模块和结果校验模块;所述区域分割模块用于将图片形式增值税发票所在图片中的发票区域进行分割,得到增值税发票图片;所述文字检测模块用于检测增值税发票图片上文字行所在的位置,得到文字行的边界框坐标,所述文字行为多个,且每个文字行对应一边界框坐标;所述模型连接模块用于将文字检测模块检测得到的文字行的边界框坐标所在区域转化为图片,得到文字行图片;所述文字识别模块用于对文字行图片上的文字内容进行识别;所述版面分析模块用于基于文字行的边界框坐标、文字行间的相对位置和识别得到的文字行的文字内容,得到每个文字行所属的字段类别;所述字段提取模块用于基于文字行所属的字段类别,将文字行的文字内容组合成key-value形式的字段,并得到每个字段对应文字内容的位置坐标,输出识别结果;所述结果校验模块用于对识别结果进行校验;其中,所述文字识别模块对文字行图片上的文字内容进行识别,具体的,文字识别模块基于CRNN+CTC模型对文字行图片上的文字内容进行识别;所述CRNN+CTC模型在对文字行图片进行识别时,将宽高比相近的文字行图片合并成一个批次,输入CRNN+CTC模型以进行文字内容识别;所述CRNN+CTC模型有提取图像特征的卷积神经网络backbone、提取语义特征的循环神经网络languagemodel和计算损失的CTCLoss串联组成;所述卷积神经网络backbone和循环神经网络languagemodel之间设有可插拔的超分辨率模块,所述超分辨率模块用于在卷积神经网络backbone的输出之后添加一个与循环神经网络languagemodel平行的分支,利用上采样结构将输入恢复到与输入相同的尺寸;所述CRNN+CTC模型还用于根据语料统计字符出现的频率,并采用Huffman树的形式对字符进行编码。

全文数据:

权利要求:

百度查询: 武汉天喻信息产业股份有限公司 一种增值税发票识别系统及方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。