申请/专利权人:上海麦克风文化传媒有限公司
申请日:2019-11-12
公开(公告)日:2024-04-12
公开(公告)号:CN110990340B
主分类号:G06F16/13
分类号:G06F16/13;G06F16/17;G06F16/182
优先权:
专利状态码:有效-授权
法律状态:2024.04.12#授权;2020.07.10#实质审查的生效;2020.04.10#公开
摘要:本发明属于大数据存储技术领域,尤其是涉及一种大数据多层次存储系统,包括三个层次,三个所述层次分别为层级一、层级二和层级三;所述层级一包括以下步骤:只保存热点数据;使用Hbase来提供低延迟的随机读写;使用SSD硬盘来作为硬件提供良好性能;所述层级二包括以下步骤:保存相对热门数据;使用Spark来提供高效的大规模分析计算;使用开源的ApacheHadoop分布式文件系统来存储数据;数据存储使用Parquet格式,来提升Spark计算效率。本发明提出利用不同大数据框架和技术搭建多层次的大数据架构平台,针对不同的使用场景运用不同的技术和解决方案,提升业务性能和降低计算时间以及硬件成本。
主权项:1.一种大数据多层次存储系统,其特征在于,包括三个层次,三个所述层次分别为层级一、层级二和层级三;所述层级一包括以下步骤:S1、只保存热点数据或者只保存7天内的热点数据;S2、使用Hbase来提供低延迟的随机读写;S3、使用SSD硬盘来作为硬件提供良好性能;所述层级二包括以下步骤:A1、保存相对热门数据或者保存180天内的相对热门数据;A2、使用Spark来提供高效的大规模分析计算;A3、使用开源的ApacheHadoop分布式文件系统HDFS来存储数据;A4、数据存储使用Parquet格式,来提升Spark计算效率;所述层级三包括以下步骤:B1、使用Hive,HDFS来保存全部的数据;B2、数据按照日期进行分组,方便查询某一个时间段内的数据。
全文数据:
权利要求:
百度查询: 上海麦克风文化传媒有限公司 一种大数据多层次存储架构
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。