买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于探索价值和查询代价的数据库查询优化方法_凯美瑞德(苏州)信息科技股份有限公司;西北工业大学太仓长三角研究院_202410018425.9 

申请/专利权人:凯美瑞德(苏州)信息科技股份有限公司;西北工业大学太仓长三角研究院

申请日:2024-01-05

公开(公告)日:2024-04-16

公开(公告)号:CN117520385B

主分类号:G06F16/2453

分类号:G06F16/2453;G06N20/00;G06F18/27

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2024.02.27#实质审查的生效;2024.02.06#公开

摘要:本发明提供了一种基于探索价值和查询代价的数据库查询优化方法,通过负载预测来推断未来的查询模板分布,通过机器学习进行基数估计进而估计每个查询的查询代价。本发明优化了传统学习只对当前的查询进行代价估计的策略,使得查询估计面向未来和当前的结合来选择最优的查询执行计划。本发明的查询方法提出的探索价值的定义,使得当前查询的查询计划对于未来预测的查询的价值能够具象化,进而为数据库查询优化提供更深入的见解和决策支持。

主权项:1.一种基于探索价值和查询代价的数据库查询优化方法,其特征在于包括下述步骤:步骤1:数据库中的执行引擎将历史执行的执行计划以及执行计划所对应的真实基数数据存入缓存池中,接着利用回归模型对缓存池中的数据进行离线训练和建模,得到基数模型M;步骤2:优化器从数据库管理系统中获取当前的查询语句,优化器基于当前的查询语句生成对应的所有查询计划,并利用在步骤1训练完成的基数模型M和数据库本身的基数估计模块,对所有的查询计划进行基数估计,最后再采用数据库本身的代价估计模块对每个执行计划进行代价估计,从而得到每个查询计划的估计代价;步骤3:通过数据库管理系统执行查询操作的记录和日志,获取数据库管理系统的历史查询,历史查询包括历史执行的查询语句的代码和模板、查询操作执行所花费的时间及查询操作返回的结果数据,利用该历史查询进行未来查询的预测,得到查询模板分布P;步骤4:根据步骤2得到的所有查询计划,将每一个执行计划分解为若干个子执行计划,分别估计各个子计划节点对每个查询模板的提升度Vv1,v2,…,vi,…,vn,其中vi指子计划节点i对于查询模板pi的提升度,n是查询模版个数;步骤5:结合步骤3得到的查询模板分布Pp1,p2,…,pi,…,pn和步骤4得到的提升度Vv1,v2,…,vi,…,vn,通过得到各个子计划节点的探索价值,其中为探索价值,Plan指各个子计划节点,如同代价估计一样,累加执行计划上的所有子计划节点的探索价值,得到该执行计划的探索价值,即: ;其中,Query为执行计划;步骤6:根据最优化条件对所有查询计划进行筛选,得到最优的查询计划,即在保证所选执行计划的代价低于给定阈值的条件下,选择探索价值最大的执行计划,并将该查询计划发送给执行引擎。

全文数据:

权利要求:

百度查询: 凯美瑞德(苏州)信息科技股份有限公司;西北工业大学太仓长三角研究院 一种基于探索价值和查询代价的数据库查询优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。