买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于ClickHouse列式数据库的星表快速合并方法_广州大学_202410042229.5 

申请/专利权人:广州大学

申请日:2024-01-10

公开(公告)日:2024-04-12

公开(公告)号:CN117874029A

主分类号:G06F16/22

分类号:G06F16/22;G06F16/29

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.04.30#实质审查的生效;2024.04.12#公开

摘要:本发明提供了一种基于ClickHouse列式数据库的海量星表数据快速合并方法与系统,通过降低球面距离计算的复杂度以及运用等间距网格划分索引建立方法,加速了多波段星表数据的合并过程;本发明针对天文学交叉证认和星表合并的应用场景以及CSST高性能、低延迟的数据处理需求,研究使用列式数据库来完成海量星表数据的存储、检索和证认过程,具有良好的使用价值,在天文数据处理领域有着广阔的应用场景,同时也为天文领域进□数据处理提供了一种新的思路和方向。

主权项:1.一种基于ClickHouse列式数据库的星表快速合并方法,其特征在于,包括以下步骤:S100将原始观测的多个星表数据文件导入数据库;S200将数据库内的天体记录划分为参考数据表和样本数据表,判断以上两个数据表中的数据记录是否有采用相同划分方法的划分号数据字段;若无该数据字段,则执行S300;否则,执行S400;S300对参考数据表和样本数据表中的记录在赤经和赤纬方向分别进行等间距网格划分,并对划分生成的网格区块进行编码;添加划分号数据字段存储天体记录所处网格编号,依此建立空间索引S400对参考数据表和样本数据表中的记录执行坐标系转换,将赤经赤纬坐标转换为三维空间坐标;S500将两个数据表中的划分号字段作为连接条件,进行数据表空间连接,生成临时中间结果数据表;S600根据临时中间结果数据表中包含的两坐标点信息,计算每一条记录对应的球面距离;将计算所得的距离与第一预设阈值r进行比较,筛选出小于等于第一预设阈值r的记录;S700对筛选出的记录,根据参考数据表中的数据字段进行分组,被分为同一组的记录即为同一天体的多次观测记录,对这多条记录在所有数据字段上依次进行相应数据的合并,得到最终的结果。

全文数据:

权利要求:

百度查询: 广州大学 一种基于ClickHouse列式数据库的星表快速合并方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。