买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种合同信息及票据凭证自动对照审核方法及装置_深度(山东)数字科技集团有限公司_202410110417.7 

申请/专利权人:深度(山东)数字科技集团有限公司

申请日:2024-01-26

公开(公告)日:2024-04-19

公开(公告)号:CN117910974A

主分类号:G06Q10/10

分类号:G06Q10/10;G06F40/194;G06F40/30

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.07#实质审查的生效;2024.04.19#公开

摘要:本发明涉及信息管理技术领域,尤其涉及一种合同信息及票据凭证自动对照审核方法及装置。本发明提供的合同信息及票据凭证自动对照审核方法,通过距离算法计算两个字符串之间差异,解决两个企业名称比对问题;采用基于预训练模型将系统登记的合同交易内容文本、用户填写的交易背景文本转化为向量,将两个向量代入余弦计算公式计算两段文本的相似度,解决长度、表述不一样的两段文本是否存在语义相似性的问题。本发明提供的合同信息及票据凭证自动对照审核装置,能够实现平台掌握的票据交易信息与真实贸易背景合同有效匹配核对,实现各种汇票交易复杂场景的逻辑判断和有效处理,实现全天24小时不间断审核,降低人工审核成本、有效提高审核效率。

主权项:1.一种合同信息及票据凭证自动对照审核方法,将用户上传的合同信息与系统登记的汇票信息进行对照审核,包括:S1判断文件类型并读取文件内容,判断待审核的合同文件是pdf格式还是图片格式,如果是pdf格式则直接读取文件内容,如果是图片格式则调用光学字符识别技术OCR接口提取文本内容;S2关键内容提取,采用正则表达式从步骤S1读取的内容中提取合同关键字标记;如果能提取到有效的合同关键字标记,确认待审核的文件为合同,继续从步骤S1读取的内容中提取合同签署双方名字、合同交易信息;如果不能提取到有效的合同关键字标记,则认为待审核的文件不是合同,审核结果不通过;S3企业名称比对,把系统登记的企业名称记为Name1,OCR获取的企业名称记为Name2,使用距离算法计算Name1转换Name2一共需要操作次数,即通过距离算法计算两个字符串之间差异,解决两个企业名称比对问题; ;对距离算法计算结果N赋予不同的含义:当时,认为是OCR错误识别,审核通过,流转到S4;当时,大概率是OCR识别错误,不排除合同上传错误导致企业名称不对应,转人工确认核实;如人工核实确认企业名称相同,流转到S4;否则,审核不通过;当时,认为是合同上传错误,审核不通过;S4合同交易内容与用户填写的交易背景比对,采用基于预训练模型将系统登记的合同交易内容文本、用户填写的交易背景文本转化为向量,然后将两个向量代入余弦计算公式,计算两段文本的相似度,从而解决长度、表述不一样的两段文本是否存在语义相似性的问题;S4.1文本编码,使用Python计算机编程语言Transformers自然语言处理库预训练模型,把两段文本分别输入到预训练模型,将文本转化为向量,获得两段文本的词嵌入编码;S4.2对两段文本向量进行余弦相似度计算,获得两段文本的相似度,对计算结果取值范围进行量化; ;对不同的取值范围赋予不同的含义:当时,认为两段文本不相关,审核不通过;当时,认为两段文本较大概率具有相关性,转人工确认核实;如人工核实确认两段文本语义具有相关性,审核通过;否则,审核不通过;如果,认为两段文本具有相关性,审核通过。

全文数据:

权利要求:

百度查询: 深度(山东)数字科技集团有限公司 一种合同信息及票据凭证自动对照审核方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。