申请/专利权人:百望股份有限公司
申请日:2022-05-29
公开(公告)日:2022-10-11
公开(公告)号:CN115171143A
主分类号:G06V30/42
分类号:G06V30/42;G06V30/412;G06V30/416;G06V30/148;G06V30/19;G06V30/24
优先权:
专利状态码:在审-公开
法律状态:2022.10.11#公开
摘要:本发明属于电子发票识别技术领域,具体公开了一种电子发票全票面信息提取方法及系统,其中方法包括:获取电子发票,检测几何图形,对电子发票版式样式进行主区划分,再对主区域划分为多个子区域;搜索电子发票元素信息标签,精确定位坐标范围;解析文本内容,提取文本数据结合业务含义,清洗文本数据以获取票面信息。该方案实现了一个基于规则的专家系统,通过最直接的方式分析版式文件中的图形信息,通过打散、分类进行简单的发票表格几何图形检测,通过文字区域信息提取技术结合聚类算法精确提取票面元素信息,最终形成能够快速提取发票全票面信息的技术方案,推动业务系统对于发票版式文件的利用效率提升。
主权项:1.一种电子发票全票面信息提取方法,其特征在于,包括以下步骤:S1,获取电子发票,检测几何图形,对电子发票版式样式进行主区划分,再对主区域划分为多个子区域;S2,搜索电子发票元素信息标签,精确定位坐标范围;S3,解析文本内容,提取文本数据;S4,结合业务含义,清洗文本数据以获取票面信息。
全文数据:
权利要求:
百度查询: 百望股份有限公司 一种电子发票全票面信息提取方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。