买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于图分割的工作流部署方法_西安电子科技大学_202210730454.9 

申请/专利权人:西安电子科技大学

申请日:2022-06-24

公开(公告)日:2024-04-16

公开(公告)号:CN115080236B

主分类号:G06F9/50

分类号:G06F9/50;G06F9/455;G06F16/901

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2022.10.11#实质审查的生效;2022.09.20#公开

摘要:本发明公开了一种基于图分割的工作流部署方法,主要解决现有基于分簇的工作流部署算法以牺牲工作流中任务并行执行效率为代价实现通信开销的最小化,导致任务并行执行效率较低的问题。其实现方案是:1建立工作流有向无环图DAG模型G;2计算工作流中任务执行时间和任务间的数据传输时间;3对工作流模型G中的串行结构进行合并,得到新工作流模型图G';4对新工作流模型图G'进行分割,得到最佳任务分区;5以执行时间最小为依据,将最佳任务分区映射到虚拟机上,完成对工作流的部署。本发明减小了工作流完成时间,提高了工作流的执行效率,可用于工作流执行过程中数据开销与任务并行执行效率的联合优化。

主权项:1.一种基于图分割的工作流部署方法,其特征在于,包括如下步骤:1根据工作流中的任务集T、任务之间的数据依赖及时序关系E、任务复杂度集合L、数据传输量集合D,建立工作流有向无环图DAG模型:G={T,E,L,D};2为工作流分配一组虚拟机S={sk|k=1,2,3,...,q},q表示虚拟机数量,每个虚拟机所对应的物理机各不相同;计算工作流中任务在不同虚拟机上的执行时间wi,k和有数据依赖关系任务之间的数据传输时间ci,j,以及任务在所有虚拟机上的平均执行时间和任务之间的平均数据传输时间3确定工作流模型G中具有串行结构的两个任务,并对其进行合并,得到新工作流模型图G':在工作流模型图中,如果一个任务中只有一个子任务且该子任务仅有一个父任务,则该子任务与其父任务构成串行结构;将拥有串行结构的任务ti和任务ti+1之间的数据传输取消,并将这两个任务相加合并为一个新任务t′i;4对串行结构合并后形成的新工作流模型图G'进行分割:4a将工作流模型图G'划分为n个子图,每个子图中包含一个顶点;4b依次搜索并尝试合并有边连接的两个子图,根据各子图中所包含的任务和任务之间的连接关系,计算每次合并后的模块度增量ΔQ:如果两个子图中存在相同层的任务,计算这两个子图合并后的新子图内同层任务平均执行时间之和sum,并将其与该层所有任务平均执行时间的最大值maxW进行比较:若sum>maxW*α,则ΔQ=-ei,j+ej,i-2aiaj=-2ei,j-aiaj;否则,ΔQ=ei,j+ej,i-2aiaj=2ei,j-aiaj;其中α为比较系数,取值为小于1的数,ei,j表示第i个子图和第j个子图之间的连边权重占图G中总连边权重之和的比例,ai表示第i个子图中所有任务的连边权重之和占图G中总连边权重之和的比例;如果两个子图中不存在相同层的任务,则ΔQ=ei,j+ej,i-2aiaj=2ei,j-aiaj;4c将ΔQ值最大的两个子图进行合并,并更新模块度Q=Q+maxΔQ;4d重复4a至4c,直至整个图G'合并为一个子图,找到模块度值最大时对应的图划分结果,即为最佳的任务分区P={p1,p2,...px,...,ph},其中px表示第x个任务分区,h表示分区数量;5将最佳任务分区映射到虚拟机上,完成对工作流的部署:5a根据任务平均执行时间和任务之间的平均数据传输时间计算每个任务的优先级rankti: 其中,succti表示任务ti的子任务集合;5b根据各任务的优先级rankti计算任务分区的优先级:rankpx=maxrankti,ti∈px5c按rankpx将所有分区降序排列,每次选取rankpx值最大且未部署的任务分区,遍历所有虚拟机并计算该任务分区在当前虚拟机上的总执行时间与该虚拟机上已部署任务的执行时间之和,找到该值最小的虚拟机sk;5d将任务分区中的所有任务作为一个整体一起部署到虚拟机sk上,将分区内的多个任务按照rankti值降序排列,虚拟机将按照顺序依次执行这些任务。

全文数据:

权利要求:

百度查询: 西安电子科技大学 基于图分割的工作流部署方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。