首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种跨节点并行计算任务局部进程迁移的方法_中国科学院计算机网络信息中心_202410186002.8 

申请/专利权人:中国科学院计算机网络信息中心

申请日:2024-02-20

公开(公告)日:2024-05-17

公开(公告)号:CN118055023A

主分类号:H04L41/084

分类号:H04L41/084;H04L41/08;H04L41/0897;H04L67/1095;G06F9/50

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.06.04#实质审查的生效;2024.05.17#公开

摘要:本发明提供一种跨节点并行计算任务局部进程迁移的方法,包括以下步骤:步骤1,计算任务的启动配置脚本的配置过程;步骤2,计算任务容器化部署过程;步骤3,容器运行时迁移过程。本发明实现MPI并行计算任务的容器化部署和单容器的跨节点迁移,相比于全部进程迁移,通过单容器实现局部进程迁移的方式,引入的存储开销和检查点开销更小,同时可以保持计算任务整体不中断运行,更加灵活的支撑容错、负载均衡、弹性调度等场景。

主权项:1.一种跨节点并行计算任务局部进程迁移的方法,其特征在于,包括以下步骤:步骤1,计算任务的启动配置脚本的配置过程:配置所述计算任务的启动配置脚本的信息,包括计算节点列表、容器镜像、单个容器对应的进程数量以及计算任务并行运行需要的进程总数量N;步骤2,计算任务容器化部署过程:步骤2.1,获得容器网络的网关地址和网络地址区间;根据所述网关地址和和所述网络地址区间,构建得到容器虚拟网络;步骤2.2,启动计算任务的启动配置脚本,根据单个容器对应的进程数量以及计算任务并行运行需要的进程总数量N,得到需要的容器总数量m;基于所述容器镜像,创建m个容器;从所述计算节点列表中选择执行本次计算任务所需的m个计算节点,向每个选择到的计算节点中部署一个容器,并向所述容器内分配对应数量的进程;步骤2.3,对每个创建的容器进行初始化,分配属于所述网络地址区间的容器网络地址,使m个容器成为所述容器虚拟网络的网络节点,具有网络拓扑结构,基于所述容器虚拟网络,m个容器之间可进行通信;步骤2.4,将每个计算节点的输入和输出文件路径挂载到对应容器中,启动各个容器,各个计算节点的进程在对应容器内并行运行,将进程间通信转化为容器间基于容器虚拟网络的通信,由此实现计算任务跨节点并行运行;步骤3,容器运行时迁移过程:步骤3.1,当容器运行时迁移模块监听到容器迁移信号时,保存被迁移容器运行时完整状态;选择目标计算节点,将所述被迁移容器运行时完整状态传输到所述目标计算节点;步骤3.2,在目标计算节点初始化创建并启动新容器,配置新容器的容器网络地址与被迁移容器的容器网络地址相同,并且,将所述被迁移容器运行时完整状态配置给所述新容器,使所述新容器的容器状态,与被迁移容器完全相同,因此,使所述新容器恢复到所述被迁移容器的运行时状态,运行所述新容器。

全文数据:

权利要求:

百度查询: 中国科学院计算机网络信息中心 一种跨节点并行计算任务局部进程迁移的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。