申请/专利权人:亚马逊技术股份有限公司
申请日:2019-06-24
公开(公告)日:2021-01-08
公开(公告)号:CN112204544A
主分类号:G06F16/27(20060101)
分类号:G06F16/27(20060101);G06F16/2458(20060101)
优先权:["20180628 US 16/021,701"]
专利状态码:有效-授权
法律状态:2021.12.28#授权;2021.03.05#实质审查的生效;2021.01.08#公开
摘要:描述了用于在摄取时对数据进行聚类以便使用可扩展存储资源进行存储的技术。本文所述的聚类技术用于以某种方式对时间序列数据进行聚类,以便将可能要一起查询的数据定位到同一分区,或者如果数据集大,则定位到最小分区集,其中所述分区被映射到要在其中存储数据以进行后续处理的物理存储资源。除其他有益效果外,所述数据在所述物理存储资源处的所述聚类存储可能会减少需要通过多种类型的查询过滤的数据量,从而提高依赖于查询所述数据的任何应用或过程的性能。
主权项:1.一种计算机实现的方法,其包括:生成用于基于与多个数据点相关联的属性值对所述多个数据点进行聚类的分区表,所述分区表包括第一分区集,所述第一分区集限定有序值的总范围的第一分割;接收包括属性值的数据点;确定所述第一分区集不包括映射到所述属性值的分区并且不存在所述第一分区集中的能向其映射所述属性值的可用分区;生成比所述第一分区集具有更多分区的第二分区集,所述第二分区集限定有序值的所述总范围的第二分割;将所述属性值映射到所述第二分区集中的可用分区;将所述第二分区集中的可用分区映射到一个或多个物理存储资源;以及将所述数据点存储在所述一个或多个物理存储资源处。
全文数据:
权利要求:
百度查询: 亚马逊技术股份有限公司 动态分布式数据聚类
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。