买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于Kylin逐层算法的Cube存储优化方法_中电福富信息科技有限公司_202311751432.1 

申请/专利权人:中电福富信息科技有限公司

申请日:2023-12-19

公开(公告)日:2024-04-12

公开(公告)号:CN117873382A

主分类号:G06F3/06

分类号:G06F3/06;G06F16/25;G06F16/28;G06F16/22;G06F16/182;G06F16/242;G06F16/2453

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.30#实质审查的生效;2024.04.12#公开

摘要:本发明公开一种基于Kylin逐层算法的Cube存储优化方法,Cube模型设计时通过指定跳跃层数,在预计算时据此进行层级裁剪,当跳跃层数N时,预计算cuboid数量约降为原来的1N+1,大幅降低预计算结果数据量,实现存储空间优化。Cube构建时通过层级裁剪策略过滤无需预计算的cuboid,降低预计算cuboid数量,并利用逐层算法低维可从高维获取的特性,提升预计算速度。多维分析查询时,采用最近层级依赖原则,选择与当前查询语句涉及的模型中相应的cuboid最贴近且维度更高的cuboid进行二次计算,提升查询性能,满足业务多维分析的要求。本发明通过合理的减少预计算的cuboid,降低预计算结果所占用的存储空间。

主权项:1.一种基于Kylin逐层算法的Cube存储优化方法,其特征在于:其包括以下步骤:步骤1,Cube配置:获取Hive事实表和维度表信息进行Cube配置,在创建Cube的基础模型的基础上新建Cube配置基本信息,并在高级配置中指定跳跃层数,自动计算cube的所有cuboid、直接依赖的更高维度cuboid以及标识是否需要预计算;步骤2,Cube构建:扫描数据源得到Cube的元数据以创建扁平化的中间表,并计算所有维度的cuboid;再从元数据库中读取并过滤需要预计算的cuboid依赖关系,从高维到低维逐步完成计算并将结果保存到HDFS中;步骤3,多维度查询:获取一个多维分析查询SQL,Kylin查询引擎通过查询语句中的维度和指标信息确定查询涉及的cuboid;根据最近层级依赖原则找到cuboid依赖的更高维度的且已完成预计算的上级cuboid,并进行二次计算返回查询结果。

全文数据:

权利要求:

百度查询: 中电福富信息科技有限公司 一种基于Kylin逐层算法的Cube存储优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。