买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种时序数据存储引擎的索引构建方法_南开大学_202410070820.1 

申请/专利权人:南开大学

申请日:2024-01-18

公开(公告)日:2024-04-09

公开(公告)号:CN117851537A

主分类号:G06F16/31

分类号:G06F16/31;G06F16/35;G06N20/20

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明提供一种时序数据存储引擎的索引构建方法,属于数据库存储技术领域。具体包括:根据标签键的文档频率及标签值的出现频率对数据块进行预筛选;通过标签键的历史访问频率,对预筛选集合进行特征提取,获得数据特征并进行机器学习以进一步筛选,获得包括每条时间线的指标标签组的目标集合;根据指标标签组中多个不同的指标对目标集合进行目标标签提取,获得多个组标签集合;对指标标签相同的组标签集合置入对应的时间线,获得多个时间线集合;对每个时间线集合分配唯一的组ID,建立标签键值对与组ID映射的倒排索引,并建立目标标签与倒排索引映射的前置索引。本发明能够提升时序数据的写入效率与索引构建效率。

主权项:1.一种时序数据存储引擎的索引构建方法,其特征在于,包括:S1:根据标签键的文档频率及标签值的出现频率对待存储的数据块进行预筛选,获得预筛选集合;S2:通过标签键的历史访问频率,对所述预筛选集合进行特征提取,获得数据特征;S3:对所述数据特征进行机器学习获得筛选函数,通过所述筛选函数对所述预筛选集合进行筛选,获得目标集合,所述目标集合中至少包括每条时间线的指标标签组;S4:根据所述指标标签组中多个不同的指标对所述目标集合进行目标标签提取,获得多个组标签集合;S5:对指标标签相同的组标签集合,置入所述指标标签对应的时间线,获得多个时间线集合;S6:对每个时间线集合分配唯一的组ID,建立标签键值对与组ID映射的倒排索引,并建立目标标签与倒排索引映射的前置索引,以完成时序数据存储引擎的索引构建。

全文数据:

权利要求:

百度查询: 南开大学 一种时序数据存储引擎的索引构建方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。