申请/专利权人:合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)
申请日:2022-08-26
公开(公告)日:2022-09-23
公开(公告)号:CN115102851A
主分类号:H04L41/0803
分类号:H04L41/0803;H04L67/10;H04L67/60;G06F9/50;G06F9/455
优先权:
专利状态码:有效-授权
法律状态:2022.11.08#授权;2022.10.14#实质审查的生效;2022.09.23#公开
摘要:本发明涉及融合计算系统领域,公开了一种面向HPC与AI融合计算的融合平台及其资源管理方法,使用容器化的方法将Slurm平台融合到Kubernetes平台中得到融合平台,并通过资源管理方法对融合平台的HPC集群和AI集群资源进行分配;融合平台包括客户端、控制节点、计算节点;在HPC集群和AI集群运行时,如果需要计算节点X的资源配置,通过所述的资源管理方法实现资源的重分配,改善了现有的融合平台中集群资源隔离和浪费问题,提高了集群平均资源利用率。
主权项:1.一种面向HPC与AI融合计算的融合平台,使用容器化的方法将Slurm平台融合到Kubernetes平台中,其特征在于,融合平台包括:客户端,供用户提交HPC任务和AI任务;控制节点,运行有Kubernetes平台的各控制组件,以及除节点监控进程slurmd外的Slurm平台的各控制组件;计算节点,包括属于HPC集群的pod单元A和属于AI集群的pod单元B,pod单元A内的资源属于HPC集群,pod单元B内的资源属于AI集群;HPC集群的节点监控进程slurmd以容器形式运行在pod单元A中。
全文数据:
权利要求:
百度查询: 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种面向HPC与AI融合计算的融合平台及其资源管理方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。