买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于大数据的社保数据处理方法及系统_吉贝克信息技术(北京)有限公司;北京碧地智能科技有限公司_202311255464.2 

申请/专利权人:吉贝克信息技术(北京)有限公司;北京碧地智能科技有限公司

申请日:2023-09-27

公开(公告)日:2024-04-12

公开(公告)号:CN117314163B

主分类号:G06Q10/0635

分类号:G06Q10/0635;G06Q40/08;G06F16/28

优先权:

专利状态码:有效-授权

法律状态:2024.04.12#授权;2024.01.16#实质审查的生效;2023.12.29#公开

摘要:本申请公开了一种基于大数据的社保数据处理方法及系统,其获取社保数据;对社保数据进行数据质量分析与治理以得到质量规范社保数据;基于所述质量规范社保数据,构建企业级的社保数据主题库;以及,基于所述企业级的社保数据主题库,对被分析企业进行风险验证。这样,可以提高数据处理效率,对于新型的风险或复杂的风险问题进行有效应对。

主权项:1.一种基于大数据的社保数据处理方法,其特征在于,包括:获取社保数据;对社保数据进行数据质量分析与治理以得到质量规范社保数据;基于所述质量规范社保数据,构建企业级的社保数据主题库;以及基于所述企业级的社保数据主题库,对被分析企业对象进行风险验证;基于所述企业级的社保数据主题库,对被分析企业对象进行风险验证,包括:从所述企业级的社保数据主题库提取所述被分析企业对象的社保数据;对所述被分析企业对象的社保数据进行关键信息提取与语义编码分析以得到被分析企业对象社保上下文特征向量;以及基于所述被分析企业对象社保上下文特征向量,确定所述被分析企业对象的风险等级;对所述被分析企业对象的社保数据进行关键信息提取与语义编码分析以得到被分析企业对象社保上下文特征向量,包括:从所述被分析企业对象的社保数据提取缴费基数、参考人数、社保应缴金额、社保实缴金额、当前是否欠费、欠费次数和当前欠费金额;以及对所述缴费基数、参考人数、社保应缴金额、社保实缴金额、当前是否欠费、欠费次数和当前欠费金额进行数据结构化处理和关联分析以得到所述被分析企业对象社保上下文特征向量;对所述缴费基数、参考人数、社保应缴金额、社保实缴金额、当前是否欠费、欠费次数和当前欠费金额进行数据结构化处理和关联分析以得到所述被分析企业对象社保上下文特征向量,包括:将所述缴费基数、参考人数、社保应缴金额、社保实缴金额、当前是否欠费、欠费次数和当前欠费金额进行向量化以得到缴费基数编码向量、参考人数编码向量、社保应缴金额编码向量、社保实缴金额编码向量、当前是否欠费编码向量、欠费次数编码向量和当前欠费金额编码向量;以及将所述缴费基数编码向量、参考人数编码向量、社保应缴金额编码向量、社保实缴金额编码向量、当前是否欠费编码向量、欠费次数编码向量和当前欠费金额编码向量通过基于转换器的上下文编码器以得到所述被分析企业对象社保上下文特征向量;基于所述被分析企业对象社保上下文特征向量,确定所述被分析企业对象的风险等级,包括:对所述被分析企业对象社保上下文特征向量进行特征分布优化以得到优化被分析企业对象社保上下文特征向量;以及将所述优化被分析企业对象社保上下文特征向量通过分类器以得到分类结果,所述分类结果用于表示被分析企业对象的风险等级标签;对所述被分析企业对象社保上下文特征向量进行特征分布优化以得到优化被分析企业对象社保上下文特征向量,包括:将所述缴费基数编码向量、参考人数编码向量、社保应缴金额编码向量、社保实缴金额编码向量、当前是否欠费编码向量、欠费次数编码向量和当前欠费金额编码向量级联以获得级联特征向量;以及通过所述级联特征向量来对所述被分析企业对象社保上下文特征向量进行希尔伯特空间启发式序列跟踪均衡化以得到所述优化被分析企业对象社保上下文特征向量;通过所述级联特征向量来对所述被分析企业对象社保上下文特征向量进行希尔伯特空间启发式序列跟踪均衡化以得到所述优化被分析企业对象社保上下文特征向量,包括:以如下优化公式通过所述级联特征向量来对所述被分析企业对象社保上下文特征向量进行希尔伯特空间启发式序列跟踪均衡化以得到所述优化被分析企业对象社保上下文特征向量;其中,所述优化公式为: ; ;其中,是所述级联特征向量,是所述被分析企业对象社保上下文特征向量,是所述被分析企业对象社保上下文特征向量的转置向量,表示所述级联特征向量和所述被分析企业对象社保上下文特征向量的级联向量的二范数,表示所述级联特征向量和所述被分析企业对象社保上下文特征向量的所有特征值构成的并集集合的均值,且所述级联特征向量和所述被分析企业对象社保上下文特征向量均为行向量,表示按位置点乘,表示向量加法,是所述优化被分析企业对象社保上下文特征向量,是所述级联特征向量中所有位置的特征值的集合,是所述被分析企业对象社保上下文特征向量中所有位置的特征值的集合,是合并后的集合中的第i个特征值,是合并后的集合中的特征值数量。

全文数据:

权利要求:

百度查询: 吉贝克信息技术(北京)有限公司;北京碧地智能科技有限公司 基于大数据的社保数据处理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。