中国工商银行股份有限公司王建奇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国工商银行股份有限公司申请的专利基于文字识别的财务报表识别方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN111414889B 。
龙图腾网通过国家知识产权局官网在2023-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202010245364.1,技术领域涉及:G06V30/412;该发明授权基于文字识别的财务报表识别方法及装置是由王建奇;郑振雷;钱江;张力引设计研发完成,并于2020-03-31向国家知识产权局提交的专利申请。
本基于文字识别的财务报表识别方法及装置在说明书摘要公布了:本发明提供了一种基于文字识别的财务报表识别方法及装置,基于文字识别的财务报表识别方法包括:接收所述财务报表的图像数据;对所述图像数据进行标准化处理以及预处理;利用预生成的CNN神经网络模型对处理后的图像数据进行文字识别。本发明将财务报表录入与文字识别技术相结合,能有效减少人工录入的工作量,提升信息采集的准确度。
本发明授权基于文字识别的财务报表识别方法及装置在权利要求书中公布了:1.一种基于文字识别的财务报表识别方法,其特征在于,包括:接收所述财务报表的图像数据;对所述图像数据进行标准化处理以及预处理;利用预生成的CNN神经网络模型对处理后的图像数据进行文字识别;匹配财报类型、指标列以及指标名称;所述利用预生成的CNN神经网络模型对处理后的图像数据进行文字识别,包括:利用lsd算法对所述图像数据进行直线检测,以获取所述图像数据中的单元格位置以及所述单元格中的内容;对所述单元格中的内容进行碎片化处理;将碎片化之后的内容输入至所述CNN神经网络模型中;对所述单元格中的内容进行碎片化处理包括:将图像数据创建多个相互偏移的副本,以产生重影的效果;对所述图像数据进行标准化处理包括:判断所述图像数据的dpi是否大于预设值、表格线是否完整以及倾斜角度是否小于预设角度;对所述图像数据进行预处理包括:对标准化后的图像数据一次进行二值化处理、倾斜矫正以及归一化;对标准化之后的图像数据进行矩形卷积核处理;所述利用预生成的CNN神经网络模型对处理后的图像数据进行文字识别,包括:以特征提取的方式,根据表格线提取各个表格位置,在表格内根据神经网络算法进行文字识别,将图片识别为文字;识别后输出数据格式为坐标位置和文字组成的json数据;所述匹配财报类型、指标列以及指标名称包括:财报类型匹配、表格列匹配以及指标名称匹配。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国工商银行股份有限公司,其通讯地址为:100140 北京市西城区复兴门内大街55号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。