买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种高效的GPU资源分配优化方法和系统_苏州浪潮智能科技有限公司_202010601888.X 

申请/专利权人:苏州浪潮智能科技有限公司

申请日:2020-06-29

公开(公告)日:2022-11-29

公开(公告)号:CN111930498B

主分类号:G06F9/50

分类号:G06F9/50

优先权:

专利状态码:有效-授权

法律状态:2022.11.29#授权;2020.12.01#实质审查的生效;2020.11.13#公开

摘要:本发明提出了一种高效的GPU资源分配优化方法和系统,该方法包括调用GPU的分配接口,获取GPU分配所需的GPU资源和数据信息;数据信息包括物理拓扑图结构、NUMA分组结构和作业信息。根据物理拓扑图中GPU静态拓扑图,确定GPU拓扑通信因子;根据NUMA分组结构和作业信息,通过在GPU碎片计算时增加修正,确定GPU碎片化因子。将得到的通信因子和碎片化因子做加权计算,确定目标函数值;目标函数值最小时为GPU资源最优分配方案。基于该方法,还提出了优化系统。本发明对GPU资源的分配不仅能够保证GPU的计算性能,而且还能极大减小GPU资源碎片产生,保证每个调度作业都能使用当前可用GPU资源的最优配置。

主权项:1.一种高效的GPU资源分配优化方法,其特征在于,包括以下步骤:S1:获取GPU分配所需的GPU资源和数据信息;所述数据信息包括GPU物理拓扑图结构、NUMA分组结构和作业信息;S2:根据GPU物理拓扑图中GPU静态拓扑图,确定GPU拓扑通信因子;根据NUMA分组结构和作业信息,通过在GPU碎片计算时增加修正,确定GPU碎片化因子;所述根据GPU物理拓扑图中GPU静态拓扑图,确定GPU拓扑通信因子的表达式为: 其中,为GPU拓扑通信因子;为GPU静态拓扑图中GPU方阵的行;为GPU静态拓扑图中GPU方阵的列;n为GPU卡的数量;所述根据NUMA分组结构和作业信息,通过在GPU碎片计算时增加修正,确定GPU碎片化因子的表达式为: 其中,为GPU碎片化因子;FreeGpusSocketi为计算第i组socket中待分配gpus后,socket组剩下空闲可用gpus数量;TotalGpusSocketi是计算第i组socket中全部gpus数量;sockets为NUMA分组数量;min_frags为修正参数;S3:将得到的通信因子和碎片化因子做加权计算,确定目标函数值;所述目标函数值最小时为GPU资源最优分配方案;所述将得到的GPU通信因子和GPU碎片化因子做加权计算,确定目标函数值的表达式为:;其中,Y为目标函数;为通信因子系数;为碎片化因子;且。

全文数据:

权利要求:

百度查询: 苏州浪潮智能科技有限公司 一种高效的GPU资源分配优化方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。