买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】银行流水数据解析方法_华道数据处理(苏州)有限公司_202410066634.0 

申请/专利权人:华道数据处理(苏州)有限公司

申请日:2024-01-17

公开(公告)日:2024-04-16

公开(公告)号:CN117892716A

主分类号:G06F40/205

分类号:G06F40/205;G06F40/186;G06F40/258;G06Q40/02;G06F16/25;G06F16/22;G06Q40/12

优先权:

专利状态码:在审-公开

法律状态:2024.04.16#公开

摘要:本发明公开了一种银行流水数据解析方法,包括通过上传模块获取各类银行流水数据文件,通过上传文件后缀名或文件特征区分流水文件格式,针对文本数据、Excel数据、PDF数据文件格式加载对应的格式转换模块,基于生成的统一格式内存数据表,加载流水解析模块,根据不同银行流水数据标题特征,进行银行分类,根据不同银行种类的不同账户种类,流水解析模块加载对应的流水模版,依据模版配置的字段坐标,字段转换规则,字段合并规则,逐行提取流水数据转换成标准数据格式存储到数据库。本发明能够全面的、准确的,快捷的解析目前不同银行不同格式的流水数据,特别是对无边框表格PDF流水格式的准确解析,为后续资金自动化管理提供数据支持。

主权项:1.一种银行流水数据解析方法,其特征在于:包括以下步骤:S1:通过上传模块获取各类银行流水数据文件;S2:通过上传文件后缀名或文件特征区分流水文件格式;S3:针对上传文件格式加载对应的格式转换模块;S31:对txt、csv类型文件加载文本文件格式转换模块进行统一格式转换;S32:对xls、xlsx类型文件加载Excel文件格式转换模块进行统一格式转换;S33:对PDF类型文件加载PDF文件格式转换模块进行统一格式转换;S331:逐页提取PDF文件所有表格数据,合并表格数据转换存储到统一格式内存数据表;S332:如果PDF文件没有提取到表格数据,开始对文件进行无框表格识别,重建表格结构数据,表格识别成功后将表格数据转换存储到统一格式内存数据表;S3321:通过流水关键字识别出页面上表格区域,更进一步划分表头区域和内容区域;S3322:在表格表头区域和表格内容区域内进一步识别具体的表头数据和内容数据;S3323:根据表格内容字符数据区域坐标做垂直投影做列切分;S3324:根据相邻垂直投影区域间距计算平均列宽,将小于平均列宽的垂直投影区域进行列合并,计算表头偏移,解决表头和表数据发生偏移的情况,做列合并生成最终内容列区域;S3325:根据表格内容数据区域坐标做水平投影做行切分;S3326:根据相邻水平投影区域间距计算平均行高,将小于行高的水平投影区域进行合并,生成最终表格内容行区域;S3327:将表格区域按识别出的行列区域进行划分重建表格;S3328:表格区域内所有文字内容区域,与识别出来的行列区域做交集匹配,判断所属行列,按行列索引存储到内存表;S4:基于上面步骤完成后生成的统一格式内存数据表,加载流水解析模块,根据不同银行流水数据标题特征,进行银行分类;根据不同银行种类的不同账户种类,流水解析模块加载对应的流水模版,依据模版配置的字段坐标,字段转换规则,字段合并规则,逐行提取流水数据转换成标准数据格式存储到数据库。

全文数据:

权利要求:

百度查询: 华道数据处理(苏州)有限公司 银行流水数据解析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。