申请/专利权人:杭州观远数据有限公司
申请日:2023-08-08
公开(公告)日:2024-03-19
公开(公告)号:CN117056068B
主分类号:G06F9/50
分类号:G06F9/50;G06F16/25;G06F16/2455
优先权:
专利状态码:有效-授权
法律状态:2024.03.19#授权;2023.12.01#实质审查的生效;2023.11.14#公开
摘要:本申请涉及一种ETL中JobEngine任务拆分方法,在ETL算子图出口做一个拆分,复杂的图将被拆分成两个简单的子图,以达到临时缓存的效果,减小后续原始拓扑图中每个输出节点的计算压力,带来显著的性能提升。同时保证先处理临时输出节点,再处理临时输入节点的优先级处理顺序,让第二子图中的临时输入节点能够对临时输出节点的计算结果进行获知,了解第一子图已经处理了哪些ETL算子,能够让后续第二子图中的输出节点避免重复计算算子,避免因重复计算带来的性能消耗和成本。
主权项:1.一种ETL中JobEngine任务拆分方法,其特征在于,包括如下步骤:在ETL算子图的出口k处,产生一个用作缓存的临时输出节点和对应的临时输入节点;根据所述临时输出节点和所述临时输入节点,对原始的ETL_COMBINED任务执行拓扑图进行拆分,分别生成所述ETL算子图的第一任务执行子图和第二任务执行子图;设定任务执行优先级的管理规则:所述第一任务执行子图的任务执行优先级优先于所述第二任务执行子图;在所述第一任务执行子图中的所述临时输出节点,执行完毕对应的ETL_COMBINED任务之后,生成对应的第一子图执行结果;将所述第一子图执行结果输入至所述第二任务执行子图;由所述第二任务执行子图中的所述临时输入节点,接收所述第一子图执行结果,并对所述第一子图执行结果中已被计算过的ETL输出算子进行标记;标记完毕,将ETL算子图上未标记的其余ETL输出算子,作为所述第二任务执行子图的ETL_COMBINED任务。
全文数据:
权利要求:
百度查询: 杭州观远数据有限公司 ETL中JobEngine任务拆分方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。