买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种监管数据报送平台数据指标血缘关系智能识别方法_海穗信息技术(上海)有限公司_202410022817.2 

申请/专利权人:海穗信息技术(上海)有限公司

申请日:2024-01-08

公开(公告)日:2024-04-26

公开(公告)号:CN117933264A

主分类号:G06F40/30

分类号:G06F40/30;G06F40/295;G06F16/36;G06F16/33;G06F18/214;G06F18/243;G06F16/35

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本发明公开了一种监管数据报送平台数据指标血缘关系智能识别方法,涉及数据处理技术领域。本发明监管指标数据采集配置的灵活多样性,即可以采集指标脚本数据,亦可采集相关数据库元数据和相关文档;采集数据通过数据验证与校验,以及归一化和标准化处理,可形成计算监管指标溯源的基础数据;增强了与监管指标计算密切相关的脚本语料库数据和元数据的处理,丰富了数据采集维度,扩大了指标数据血缘分析的特征变量及相互关系,使得数据血缘分析的更加准确与全面;通过可量化的监管数据指标的计算脚本、元数据及文档等,利用GPT实体与关系计算模型和指标脚本相似度计算模型,可智能化、自动化地解决系统中各项监管数据指标的准确性、合规性、时效性等问题。

主权项:1.一种监管数据报送平台数据指标血缘关系智能识别方法,其特征在于,包括如下步骤:S1、配置监管数据指标SQL脚本和相关元数据来源;S2、定期或实时对脚本或数据进行采集;实时数据采集主要包括对时间敏感型业务脚本与数据,每小时或每天的采集周期内相关发生变更的业务脚本及数据;采用定期或实时的脚本和数据采集,结合具体业务场景,根据脚本及数据特征进行设置;S3、采集的脚本和数据校验与清洗;S4、采集的脚本及元数据按照语料库构建的数据定义格式,封装成数据集;S5、针对数据集,依次遍历生成机器学习能够识别的脚本和数据表达,即文本数据向量;S6、生成完毕的文本数据向量存入向量数据库以作为检索资料或可处理向量化语料信息;S7、通过GPT文本关系识别模块,利用监管指标及脚本提取模块将向量数据库中的语料知识提取出来,并识别实体以及实体之间的关系,该步骤具体由定制化生成式预训练模型实现;S8、识别出的实体与实体之间的关系存放入图数据,利用图数据库的功能,便能够将监管指标信息中的实体关系绘制出来;S9、当需要检索某监管指标时,通过指标脚本相似模型算法,从库中获取与该指标最相似的指标;并通过将相似指标的数据血缘关系展现并报告呈现。

全文数据:

权利要求:

百度查询: 海穗信息技术(上海)有限公司 一种监管数据报送平台数据指标血缘关系智能识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。