买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种税务大数据模型的构建方法及系统_航天信息股份有限公司_201911354990.8 

申请/专利权人:航天信息股份有限公司

申请日:2019-12-25

公开(公告)日:2024-04-16

公开(公告)号:CN111260452B

主分类号:G06Q40/10

分类号:G06Q40/10;G06Q10/0635;G06F16/28;G06F16/248

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2021.08.03#实质审查的生效;2020.06.09#公开

摘要:本发明公开了一种税务大数据模型的构建方法及系统,所述方法包括:接收并解析用户提供的风险指标内部数据需求,获得取数范围及数据处理顺序;根据所述内部数据需求建立分析过程表;将分析过程表中的事实表和维度表聚合,获得宽表;对所述宽表分析处理,形成结果分析表;定义数据模型,根据所述结果分析表确定预设的初始模型所需的维度;设定模型中需要计算的维度字段,并设定模型更新时间;根据所述模型创建数据立方体;所述采用一张结果分析表构建大数据模型,对基于多指标风险分析多维大数据模型构造进行了优化处理,从处理的时间和空间上对模型进行了优化,提高了资源利用率,能够显著地提高风险分析处理的效率。

主权项:1.一种税务大数据模型的构建方法,其特征在于,所述方法包括:接收并解析用户提供的风险指标内部数据需求,获得取数范围及数据处理顺序;根据所述内部数据需求建立分析过程表;所述分析过程表包括事实表和维度表;其中,所述分析过程表包括纳税人相关信息表以及发票相关信息表;其中,所述维度表构建方法包括:设置所述维度表主键;所述主键是唯一的;设置所述维度表容量上限;将所述事实表和维度表聚合,获得宽表;对所述宽表分析处理,形成结果分析表;其中,所述宽表分析处理方法包括:根据不同的业务需求增加是否为新办企业的判断字段;分析包含业务所需的各个角度和创建模型所需的所有维度;所述维度包括强制维度和层次维度;将所述宽表中所有字段都纳入强制维度;采用Apachekylin大数据分析引擎定义数据模型,根据所述结果分析表确定预设的初始数据模型所需的维度;其中,设定数据模型中需要计算的维度字段,并设定数据模型更新时间;其中,所述设定数据模型中需要计算的维度字段方法包括:确定需要计算的模块的维度字段及计算方式;所述需要计算的模块包括纳税人的进项发票数量、销项发票数量、进项发票金额、销项发票金额、进项发票税额、销项发票税额、作废发票金额;其中,所述设定数据模型更新时间方法包括:设置单独的分区时间列,根据需要选择分区时间字段的日期格式,采用时间分段方式添加新的发票数据;或者设置完成自动更新时间后,在规定的时间添加新的发票数据;所述根据所述结果分析表确定预设的初始数据模型所需的维度,还包括:设置强制维度和层次维度以及检查行键;所述设置强制维度和层次维度的方法包括创建层级结构的聚合组,删除强制维度中不需要的维度;所述检查行键的设置方法包括将参与数据立方体子集生成的维度添加至数据立方体的行键中,所述数据立方体子集为数据立方体每种维度组合的预计算结果;设置每个行键的列值编码方法为dict编码;将过滤条件中出现频次最高的维度放置于行键前面,按照层级结构将发票类字段排布在所述出现频次最高的维度后面;根据所述数据模型创建数据立方体,所述数据模型包括星型或雪花型;对数据立方体的信息进行概览,数据立方体的信息包括数据模型名称、事实表以及维度和度量个数;将生成的数据立方体供给前端进行数据查询和展现。

全文数据:

权利要求:

百度查询: 航天信息股份有限公司 一种税务大数据模型的构建方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。