买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱_郑州云海信息技术有限公司_201810824831.9 

申请/专利权人:郑州云海信息技术有限公司

申请日:2018-07-24

公开(公告)日:2021-04-27

公开(公告)号:CN109002411B

主分类号:G06F13/40(20060101)

分类号:G06F13/40(20060101);G06F1/18(20060101)

优先权:

专利状态码:有效-授权

法律状态:2021.04.27#授权;2019.01.08#实质审查的生效;2018.12.14#公开

摘要:本申请公开了一种自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱,该方法包括:建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系;主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑;根据当前GPU扩展箱的连接拓扑以及所述映射关系,对当前GPU扩展箱内PCIEswitch芯片进行配置。该系统包括映射关系建立模块、检测模块和配置模块。该可自动配置的GPU扩展箱中设置有GPU扩展箱的BMC,且主机与GPU扩展箱之间通过连接线通信连接,且主机和GPU扩展箱之间,以及多级GPU扩展箱之间的连接线上设置有I2C总线。本申请能够避免用户手动对GPU扩展箱进行配置,大大提高配置的准确性和配置效率,有利于提高计算机的性能。

主权项:1.一种自动配置GPU扩展箱的方法,所述GPU扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU,其特征在于,所述方法包括:建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系,所述GPU扩展箱的连接拓扑包括:直联模式、级联模式和上行模式;主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑;主机的BMC或GPU扩展箱的BMC根据当前GPU扩展箱的连接拓扑以及所述映射关系,对当前GPU扩展箱内PCIEswitch芯片进行配置。

全文数据:自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱1.1技术领域[0001]本申请涉及服务器系统设计技术领域,特别是涉及一种自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱。1.2背景技术[0002]随着大数据、云计算和人工智能的技术的快速发展,系统对服务器计算性能的要求越来越高,GPUGraphicsProcessingUnit,图形处理器)因其在数据计算上的优势,使其在服务器上的应用越来越广泛。为了扩展更多的GPU,通常将多个GPU集成到一个扩展箱内,形成GPU扩展箱,从而实现GPU资源的池化,便于GPU资源的调度。[0003]通常GPU扩展箱是使用PCIEswitch芯片将CPU上有限的PCIEperipheralcomponentinterconnectexpress,高速串行计算机扩展总线标准接口扩展成多个PCIE接口,从而连接更多的GPU,完成GPU的扩展和GPU资源的池化。GPU和CPU之间通过PCIE接口连接的方式就是GPU扩展箱的连接拓扑。实际应用中,由于运行的业务不同,需要针对不同的业务更换不同的连接拓扑。[0004]目前的GPU扩展箱中采用固定的连接拓扑,当业务不同需要改变连接拓扑时,用户首先需要根据需求改变机箱的物理连接关系,然后手动对GPU扩展箱进行配置,从而实现不同的拓扑连接。[0005]然而,目前的GPU扩展中,由于连接拓扑改变时,需要手动对GPU扩展箱进行配置,操作较为繁琐,容易出现配置误差,配置的准确性和配置效率不够高,从而影响计算机的性能。1.3发明内容[0006]本申请提供了一种自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱,以解决现有技术中GPU扩展箱的配置准确性和配置效率低的问题。[0007]为了解决上述技术问题,本申请实施例公开了如下技术方案:[0008]一种自动配置GPU扩展箱的方法,所述GPU扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU,其特征在于,所述方法包括:[0009]建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系,所述GPU扩展箱的连接拓扑包括:直联模式、级联模式和上行模式;[0010]主机的BMCBaseboardManagementController,基板管理控制器)或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑;[0011]根据当前GPU扩展箱的连接拓扑以及所述映射关系,对当前GPU扩展箱内PCIEswitch芯片进行配置。[0012]可选地,主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑之前,所述方法还包括:[0013]通过在主机和GPU扩展箱之间的连接线上增加I2C信号,建立主机BMC与GPU扩展箱BMC之间的通信连接;[0014]通过在上一级GPU扩展箱和下一级GPU扩展箱之间的连接线上增加I2C信号,建立上一级GPU扩展箱的BMC与下一级GHJ扩展箱的BMC之间的通信连接。[0015]可选地,所述映射关系为:[0016]GinJ扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第一配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口不连接任何主机或GPU扩展箱;[0017]GPU扩展箱的第二连接拓扑与第二配置相匹配,其中,第二连接拓扑为级联模式的第一级,第二配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口连接下一级GPU扩展箱;[0018]GPU扩展箱的第三连接拓扑与第三配置相匹配,其中,第三连接拓扑为级联模式的第N级,第三配置为:PCIEswitch芯片上第一端口连接上一级GPU扩展箱,N彡2且N为自然数;[0019]GPU扩展箱的第四连接拓扑与第四配置相匹配,其中,第四连接拓扑为上行模式,第四配置为:PCIEswitch芯片上第一端口连接一主机,第二端口连接另一主机。[0020]可选地,当GPU扩展箱的连接拓扑为:直联模式或上行模式时,所述主机的BMC或Gro扩展箱的BMC利用12C信号检测当前GPU扩展箱的连接拓扑,包括:[0021]主机的BMC利用I2C信号扫描GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的腿C或GPU扩展箱的BMC;或者,[0022]GPU扩展箱的BMC利用I2C信号扫描所述GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GHJ扩展箱的BMC。[0023]可选地,当GPU扩展箱的连接拓扑为级联模式时,所述主机的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:[0024]主机的BMC利用I2C信号扫描第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GPU扩展箱的BMC;[0025]上一级GPU扩展箱的BMC利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GHJ扩展箱的BMC。[0026]可选地,当Ginj扩展箱的连接拓扑为级联模式时,所述GPU扩展箱的腸C利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:[0027]第一级GPU扩展箱的BMC利用I2C信号扫描所述第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GRJ扩展箱的BMC;[0028]上一级GPU扩展箱的刚C利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GPU扩展箱的BMC。[0029]可选地,所述根据当前GPU扩展箱的连接拓扑以及所述映射关系,对GPU扩展箱内PCIEswitch芯片进行配置,包括:[0030]如果当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到主机的BMC,第二端口不连接任何主机或GPU扩展箱,将当前GPU扩展箱的PCIEswitch芯片设置为第一配置;[0031]如果当前GPU扩展箱的PCIEswitch芯片上第一端口检测到主机的BMC,第二端口连接下一级GPU扩展箱,将当前GPU扩展箱的PCIEswitch芯片设置为第二配置;[0032]如果当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到上一级GPU扩展箱的BMC,将当前GPU扩展箱的PCIEswitch芯片设置为第三配置;[0033]如果当前GPU扩展箱的PCIEswitch芯片上第一端口检测到一主机的BMC,第二端口检测到另一主机的BMC,将当前GPU扩展箱的PCIEswitch芯片设置为第四配置。[0034]一种自动配置GPU扩展箱的系统,所述GPU扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU,所述系统包括:[0035]映射关系建立模块,用于建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系;[0036]检测模块,用于利用I2C信号检测当前GPU扩展箱的连接拓扑;[0037]配置模块,用于根据当前GPU扩展箱的连接拓扑以及所述映射关系,对GPU扩展箱内PCIEswitch芯片进行配置。[0038]可选地,所述映射关系为:[0039]GPU扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第一配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口不连接任何主机或GPU扩展箱;[0040]GPU扩展箱的第二连接拓扑与第二配置相匹配,其中,第二连接拓扑为级联模式的第一级,第二配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口连接下一级GPU扩展箱;[0041]GPU扩展箱的第三连接拓扑与第三配置相匹配,其中,第三连接拓扑为级联模式的第N级,第三配置为:PCIEswitch芯片上第一端口连接上一级GPU扩展箱,N彡2且N为自然数;[0042]GHJ扩展箱的第四连接拓扑与第四配置相匹配,其中,第四连接拓扑为上行模式,第四配置为:PCIEswitch芯片上第一端口连接一主机,第二端口连接另一主机。[0043]一种可自动配置的GPU扩展箱,所述GHJ扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GinJ扩展箱内的GPU,[0044]所述主机中设置有主机的BMC,用于对GPU扩展箱和主机进行监控,并根据GRJ扩展箱的连接拓扑,对GPU扩展箱内PCIEswitch芯片进行配置;[0045]所述GPU扩展箱中还设置有GPU扩展箱的BMC,用于对GPU扩展箱和主机进行监控,并根据GPU扩展箱的连接拓扑,对GPU扩展箱内PCIEswitch芯片进行配置;[0046]所述主机与GPU扩展箱之间通过连接线通信连接,且所述主机和GPU扩展箱之间,以及多级GPU扩展箱之间的连接线上设置有I2C总线,所述I2C总线用于建立主机BMC与GPU扩展箱BMC之间的通信连接,以及,建立上一级GPU扩展箱的BMC与下一级GPU扩展箱的BMC之间的通信连接;[0047]所述主机的BMC和GPU扩展箱的BMC中均设置有上述的一种自动配置GPU扩展箱的系统。[0048]本申请的实施例提供的技术方案可以包括以下有益效果:[0049]本申请提供一种自动配置GPU扩展箱的方法,该方法首先建立GPU扩展箱的连接拓扑与GHJ扩展箱内PCIEswitch芯片配置之间的映射关系;然后主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GHJ扩展箱的连接拓扑;最后根据当前GPU扩展箱的连接拓扑以及所述映射关系,对当前GPU扩展箱内PCIEswitch芯片进行配置。本申请首先建立连接拓扑与GTO扩展箱内的PCIEswitch芯片的配置--对应关系,然后通过GTO扩展箱和主机内的BMC芯片控制I2C信号对GI^U扩展箱的端口进行扫描,从而实现对GPU扩展箱与主机构成的计算系统进行实时监控,当系统的连接拓扑改变时,BMC会根据实际的连接拓扑对扩展箱进行配置,从而完成整个计算系统的改配。由于本申请通过BMC控制I2C信号进行实时监控并完成自动改配,从而避免用户手动对GPU扩展箱进行配置,因此,能够大大提高配置的准确性和配置效率,有利于提高计算机的性能。[0050]本申请还提供一种自动配置GPU扩展箱的系统,该系统主要包括:映射关系建立模块、检测模块和配置模块,通过映射关系建立模块建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系;然后通过检测模块利用I2C信号检测当前GinJ扩展箱的连接拓扑;最后配置模块根据检测模块的检测结果和映射关系建立模块的映射关系,结合当前GPU扩展箱的连接拓扑,对GPU扩展箱内PCIEswitch芯片进行配置。本申请中映射关系建立模块、检测模块和配置模块的设置,能够充分利用BMC对计算系统进行实时监控并完成自动改配,从而避免用户手动对GTO扩展箱进行配置,因此,能够大大提高配置的准确性和配置效率,有利于提高计算机的性能。[0051]本申请还提供一种可自动配置的GPU扩展箱,该GPU扩展箱中设置有BMC,且主机中也设置有BMC,且GPU扩展箱的BMC和主机的BMC中均设置有如上所述的自动配置GPU扩展箱的系统,该系统包括映射关系建立模块、检测模块和配置模块。本申请的GPU扩展箱中总线的设置能够实现GPU扩展箱BMC与主机BMC的通信,从而通过BMC对计算系统进行实时监控并完成自动改配,因此能够避免用户手动对GPU扩展箱进行配置,能够大大提高配置的准确性和配置效率,有利于提高计算机的性能。_[0052]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。1.4附图说明[0053]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。[0054]图1为本申请实施例所提供的一种自动配置GPU扩展箱的方法的流程示意图;[0055]图2为本申请实施例中GPU扩展箱的连接拓扑图;[0056]图3为本申请实施例所提供的一种自动配置GPU扩展箱的系统的结构示意图;[0057]图4为本申请实施例所提供的一种可自动配置的GPU扩展箱的结构示意图。1.5具体实施方式[0058]为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。[0059]为了更好地理解本申请,下面结合附图来详细解释本申请的实施方式。[0060]实施例一[0061]参见图1,图1为本申请实施例所提供的一种自动配置Ginj扩展箱的方法的流程示意图。由图1可知,本实施例中自动配置GPU扩展箱的方法主要包括如下过程:[0062]S1:建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系。其中,GPU扩展箱的连接拓扑主要包括:直联模式、级联模式和上行模式三种类型。[0063]本实施例的GHJ扩展箱中设置有一PCIEswitch芯片,PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GRJ扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU。[0064]用户在使用GPU扩展箱时,会根据业务的实际需求对连接拓扑进行改动,这就需要在各种模式之间进行切换,通常用户会先进行物理连线的重新连接,完成GPU扩展箱的连接拓扑切换,然后再根据具体的连接拓扑进行PCIEswitch芯片的重新配置,本实施例能够通过BMC实现PCIEswitch芯片的自动配置。[0065]三种类型的连接拓扑可以参见图2。本实施中GPU扩展箱和主机能够构成一个计算系统,这个计算系统通常有三种类型的连接拓扑,也就是本实施例中所称的GPU扩展箱的连接拓扑。直联模式中,一个主机ServerA通过CPU的端口PaO与一个GPU扩展箱连接;级联模式中,主机ServerA通过CF*U的一个端口PaO与第一级GPU扩展箱GPUboxO的一个端口P0连接,第一级GPU扩展箱GPUboxO通过另一个端口P1与下一级GPU扩展箱GPUboxl的一个端口P0连接,以此类推,级联模式可以设置多级GHJ扩展箱;上行模式中,可以有双上行或多上行,以双上行模式为例,主机ServerA通过CPU的PaO端口连接GPU扩展箱的一个端口P0,主机ServerB通过CPU的PbO端口连接GPU扩展箱的另一个端口P1。[0066]本实施例中GPU扩展箱的连接拓扑与GinJ扩展箱内PCIEswitch芯片配置之间的映射关系如下:[0067]GPU扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第一配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口不连接任何主机或GPU扩展箱。GPU扩展箱的第二连接拓扑与第二配置相匹配,其中,第二连接拓扑为级联模式的第一级,第二配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口连接下一级GPU扩展箱。GPU扩展箱的第三连接拓扑与第三配置相匹配,其中,第三连接拓扑为级联模式的第N级,第三配置为:PCIEswitch芯片上第一端口连接上一级GPU扩展箱,N彡2且N为自然数。扩展箱的第四连接拓扑与第四配置相匹配,其中,第四连接拓扑为上行模式,第四配置为:PCIEswitch芯片上第一端口连接一主机,第二端口连接另一主机。[0068]进一步地,在步骤S1之前,本实施还包括步骤S01:通过在主机和ghj扩展箱之间的连接线上增加I2C信号,建立主机BMC与GPU扩展箱BMC之间的通信连接;[0069]S02:通过在上一级GRJ扩展箱和下一级GPU扩展箱之间的连接线上增加I2C信号,建立上一级GPU扩展箱的BMC与下一级GPU扩展箱的BMC之间的通信连接。[0070]通过步骤S01,在主机和GPU扩展箱之间的连接线上设置I2C总线,从而使主机BMC与GPU扩展箱BMC之间能够通过I2C信号实现通信连接。通过步骤S02,在上一级GPU扩展箱和下一级GPU扩展箱之间的连接线上设置I2C总线,从而使上一级GPU扩展箱和下一级GPU扩展箱之间能够通过I2C信号实现通信连接。[0071]继续参见图1可知,建立映射关系后,执行步骤S2:主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GRJ扩展箱的连接拓扑。[0072]本实施中由于主机的BMC和GPU扩展箱的BMC之间已经通过I2C信号实现通信连接,两者中任意一个BMC均可以对当前GHJ扩展箱中的连接拓扑进行检测。根据GRJ扩展箱的连接拓扑的不同,主机的BMC或GinJ扩展箱的BMC利用I2C信号对当前GinJ扩展箱连接拓扑的检测方法也不同。具体包括以下三种情况:[0073]S21:当GPU扩展箱的连接拓扑为直联模式或上行模式时,主机的BMC或GPU扩展箱的BMC利用12C信号检测当前GRJ扩展箱的连接拓扑的方法,包括:[0074]S211:主机的BMC利用I2C信号扫描GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC。[0075]S212:GmJ扩展箱的BMC利用UC信号扫描GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC。[OO76]本实施例中利用1况信号进行的扫描是双向通信,S卩:扫描发起端和被扫描对象之间为双向通信,只要能够扫描到,即表示两者之间可以实现双向通信。例如:如果主机扫描到了GTO扩展箱,那么主机就可以与GPU扩展箱通信,此时,主机和GPU扩展箱都可以获取到整个计算系统的拓扑信息,这个拓扑信息中包含扫描发起端自身机箱所在拓扑连接中的位置。[0077]S22:当GHJ扩展箱的连接拓扑为级联模式时,主机的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑的方法,包括:[0078]S221:主机的BMC利用I2C信号扫描第一级GRJ扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GRJ扩展箱的BMC。[0079]S222:上一级GPU扩展箱的BMC利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GPU扩展箱的BMC。[0080]在级联模式中,BMC的扫描为从主机BMC开始,一级一级向下扫描,主机扫描第一级GHJ扩展箱,第一级GPU扩展箱向下扫描下一级的GPU扩展箱。[0081]S23:当GHJ扩展箱的连接拓扑为级联模式时,GPU扩展箱的BMC利用I2C信号检测当前扩展箱的连接拓扑的方法,包括:[0082]S231:第一级GPU扩展箱的BMC利用I2C信号扫描第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GPU扩展箱的BMC;[0083]S232:上一级GPU扩展箱的BMC利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GRJ扩展箱的BMC。[0084]由以上步骤S21-S23可知,采用本实施例中的方法对BMC芯片进行软件编程,可以实现GPU扩展箱的BMC或主机的BMC自动识别GPU扩展箱的拓扑连接关系,识别当前拓扑连接关系后,后续GPU扩展箱的BMC或主机的BMC可以根据相应的拓扑结构正确配置PCIEswitch,从而完成计算系统的改配。[0085]利用BMC通过I2C信号获取到当前的拓扑连接关系后,执行步骤S3:根据当前GPU扩展箱的连接拓扑以及映射关系,对当前GPU扩展箱内PCIEswitch芯片进行配置。[0086]具体地,步骤S3又包括如下过程:[0087]S31:如果当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到主机的BMC,第二端口不连接任何主机或GPU扩展箱,将当前GPU扩展箱的PCIEswitch芯片设置为第一配置;[0088]S32:如果当前GPU扩展箱的PCIEswitch芯片上第一端口检测到主机的BMC,第二端口连接下一级GPU扩展箱,将当前GPU扩展箱的PCIEswitch芯片设置为第二配置;[0089]S33:如果当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到上一级GPU扩展箱的BMC,将当前GPU扩展箱的PCIEswitch芯片设置为第三配置;[0090]S34:如果当前GPU扩展箱的PCIEswitch芯片上第一端口检测到一主机的BMC,第二端口检测到另一主机的BMC,将当前GPU扩展箱的PCIEswitch芯片设置为第四配置。[0091]进一步地,本实施例中还可以将改配后的PCIEswitch配置进行显示,如:可在GPU扩展箱的BMC或主机的BMC的网页下显示当前的拓扑结构。[0092]下面以直联模式、双上行模式和级联模式的第一级的连接拓扑为例,说明一下主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑的方法:[0093]1GPU扩展箱的BMC通过1%信号扫描GPU扩展箱的P0和P1接口,判断是否检测到主机的BMC或GPU扩展箱的BMC。[0094]2若仅P0口检测到主机的BMC,则将PCIEswitch设置为第一配置。[0095]3若仅P0口检测到扩展箱的BMC,则将PCIEswitch设置为第三配置。[0096]4若P0及P1口检测都到主机的BMC,则将PCIEswitch设置为第四配置。[0097]5配置成功后,在BMCweb下显示实际的拓扑连接关系,并点亮LED灯告知用户改配完成。[0098]综上所述,采用本实施例中自动配置GPU扩展箱的方法,用户只需要根据应用场景进行连线关系的改动,不需要对计算系统进行重新配置,计算系统所有的配置完全由软件自动完成,能够大大提高改配效率,降低人为操作失误的影响。[00"]实施例二[0100]在图1和图2所示实施例的基础之上参见图3,图3为本申请实施例所提供的一种自动配置GPU扩展箱的系统的结构示意图。由图3可知,本实施例中自动配置GPU扩展箱的系统主要包括:映射关系建立模块、检测模块和配置模块三部分。其中,映射关系建立模块用于建立GHJ扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系;检测模块用于利用I2C信号检测当前GPU扩展箱的连接拓扑;配置模块用于根据当前GPU扩展箱的连接拓扑以及所述映射关系,对GPU扩展箱内PCIEswitch芯片进行配置。[0101]映射关系建立模块所建立的映射关系为:GPU扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第一配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口不连接任何主机或GPU扩展箱;GPU扩展箱的第二连接拓扑与第二配置相匹配,其中,第二连接拓扑为级联模式的第一级,第二配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口连接下一级GinJ扩展箱;GPU扩展箱的第三连接拓扑与第三配置相匹配,其中,第三连接拓扑为级联模式的第N级,第三配置为:PCIEswitch芯片上第一端口连接上一级GPU扩展箱,N多2且N为自然数;GPU扩展箱的第四连接拓扑与第四配置相匹配,其中,第四连接拓扑为上行模式,第四配置为:PCIEswitch芯片上第一端口连接一主机,第二端口连接另一主机。[0102]进一步地,本实施例中自动配置GI^U扩展箱的系统中还设置有I2C信号增加模块,用于在主机和GHJ扩展箱之间的连接线上增加I2C信号,建立主机BMC与GPU扩展箱BMC之间的通信连接;以及,通用于在上一级GPU扩展箱和下一级GPU扩展箱之间的连接线上增加I2C信号,建立上一级GPU扩展箱的BMC与下一级GPU扩展箱的BMC之间的通信连接。[0103]进一步地,本实施例中I2C信号增加模块为I2C总线。[0104]本实施中检测模块包括:第一检测单元、第二检测单元、第三检测单元和第四检测单元。其中,第一检测单元用于当GPU扩展箱的拓扑连接为直联模式或上行模式时,在主机的BMC中,利用I2C信号扫描GinJ扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC。[0105]第二检测单元用于当GRJ扩展箱的拓扑连接为直联模式或上行模式时,在GPU扩展箱的BMC中,利用I2C信号扫描所述扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC。[0106]第三检测单元用于当GPU扩展箱的连接拓扑为级联模式时,在主机的BMC中,利用I2C信号扫描第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GPU扩展箱的BMC;以及,在上一级GPU扩展箱的BMC中,利用I2C信号扫描下一级GHJ扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GPU扩展箱的BMC。[0107]第四检测单元用于当GPU扩展箱的连接拓扑为级联模式时,在第一级GPU扩展箱的BMC中,利用I2C信号扫描第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GPU扩展箱的BMC;以及,在上一级GPU扩展箱的BMC中,利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GPU扩展箱的BMC。[0108]进一步地,本实施中配置模块包括:第一设置单元、第二设置单元、第三设置单元和第四设置单元。其中,第一设置单元,用于检测到当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到主机的BMC,第二端口不连接任何主机或GPU扩展箱时,将当前GPU扩展箱的PCIEswitch芯片设置为第一配置。第二设置单元,用于检测到当前GHJ扩展箱的PCIEswitch芯片上第一端口检测到主机的BMC,第二端口连接下一级GPU扩展箱时,将当前GHJ扩展箱的PCIEswitch芯片设置为第二配置。第三设置单元,用于检测到当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到上一级GPU扩展箱的BMC时,将当前GPU扩展箱的PCIEswitch芯片设置为第三配置。第四检测单元,用于检测到当前GPU扩展箱的PCIEswitch芯片上第一端口检测到一主机的BMC,第二端口检测到另一主机的BMC时,将当前GPU扩展箱的PCIEswitch芯片设置为第四配置。[0109]该实施例中自动配置GPU扩展箱的系统的工作原理和工作方法,在图1和图2所示的实施例中已经详细阐述,两个实施例之间可以互相参照,在此不再赘述。[0110]实施例三[0111]在图1、图2和图3所示实施例的基础之上参见图4,图4为本申请实施例所提供的一种可自动配置的GPU扩展箱的结构示意图。由图4可知,本实施例中的GPU扩展箱中,设置有一PCIEswitch芯片,PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU。该GPU扩展箱中还设置有GPU扩展箱的腿C,用于对GPU扩展箱和主机进行监控,并根据GPU扩展箱的连接拓扑,对GPU扩展箱内PCIEswitch芯片进行配置。另外,本实施例的主机中也设置有主机的BMC,用于对GPU扩展箱和主机进行监控,并根据GTO扩展箱的连接拓扑,对GPU扩展箱内PCIEswitch芯片进行配置。主机与GHJ扩展箱之间通过连接线通信连接,且主机和GPU扩展箱之间,以及多级Ginj扩展箱之间的连接线上设置有I2C总线。主机和GPU扩展箱之间的I2C总线,用于建立主机BMC与GRJ扩展箱BMC之间的通信连接,多级GHJ扩展箱之间的I2C总线,用于建立上一级GPU扩展箱的BMC与下一级GPU扩展箱的BMC之间的通信连接。[0112]本实施例中,主机的BMC和扩展箱的BMC中均设置自动配置GPU扩展箱的系统,该系统包括:映射关系建立模块、检测模块和配置模块三部分。其中,映射关系建立模块用于建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系;检测模块用于利用I2C信号检测当前GPU扩展箱的连接拓扑;配置模块用于根据当前GPU扩展箱的连接拓扑以及所述映射关系,X寸GPU扩展箱内PCIEswitch芯片进行配置。[0113]其中,映射关系建立模块所建立的映射关系包括:GPU扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第一配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口不连接任何主机或GPU扩展箱;Ginj扩展箱的第二连接拓扑与第二配置相匹配,其中,第二连接拓扑为级联模式的第一级,第二配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口连接下一级GIU扩展箱;GPU扩展箱的第三连接拓扑与第三配置相匹配,其中,第三连接拓扑为级联模式的第N级,第三配置为:PCIEswitch芯片上第一端口连接上一级GPU扩展箱,N彡2且N为自然数;GPU扩展箱的第四连接拓扑与第四配置相匹配,其中,第四连接拓扑为上行模式,第四配置为:PCIEswitch芯片上第一端口连接一主机,第二端口连接另一主机。[0114]该实施例中未详细描述的部分可以参见图1、图2和图3所示的实施例,三者之间可以互相参照,在此不再赘述。[0115]以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

权利要求:1.一种自动配置GPU扩展箱的方法,所述GPU扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GHJ扩展箱内的GPU,其特征在于,所述方法包括:建立GPU扩展箱的连接拓扑与GPU扩展箱内PCIEswitch芯片配置之间的映射关系,所述GPU扩展箱的连接拓扑包括:直联模式、级联模式和上行模式;主机的BMC或GPU扩展箱的BMC利用UC信号检测当前GPU扩展箱的连接拓扑;根据当前GPU扩展箱的连接拓扑以及所述映射关系,对当前GPU扩展箱内PCIEswitch芯片进行配置。2.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,主机的BMC或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑之前,所述方法还包括:通过在主机和GPU扩展箱之间的连接线上增加I2C信号,建立主机BMC与GPU扩展箱BMC之间的通信连接;通过在上一级GPU扩展箱和下一级GPU扩展箱之间的连接线上增加I2C信号,建立上一级GRJ扩展箱的BMC与下一级GPU扩展箱的BMC之间的通信连接。3.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,所述映射关系为:GPU扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第一配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口不连接任何主机或GPU扩展箱;GPU扩展箱的第二连接拓扑与第二配置相匹配,其中,第二连接拓扑为级联模式的第一级,第二配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口连接下一级GPU扩展箱;GPU扩展箱的第三连接拓扑与第三配置相匹配,其中,第三连接拓扑为级联模式的第N级,第三配置为:PCIEswitch芯片上第一端口连接上一级GPU扩展箱,N彡2且N为自然数;GHJ扩展箱的第四连接拓扑与第四配置相匹配,其中,第四连接拓扑为上行模式,第四配置为:PCIEswitch芯片上第一端口连接一主机,第二端口连接另一主机。4.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,当GPU扩展箱的连接拓扑为:直联模式或上行模式时,所述主机的腿C或GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:主机的BMC利用I2C信号扫描GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC;或者,GPU扩展箱的BMC利用I2C信号扫描所述GTO扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或GPU扩展箱的BMC。5.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,当GPU扩展箱的连接拓扑为级联模式时,所述主机的BMC利用12C信号检测当前GPU扩展箱的连接拓扑,包括:主机的BMC利用I2C信号扫描第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GPU扩展箱的BMC;上一级GPU扩展箱的BMC利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GPU扩展箱的BMC。6.根据权利要求1所述的一种自动配置GPU扩展箱的方法,其特征在于,当GPU扩展箱的连接拓扑为级联模式时,所述GPU扩展箱的BMC利用I2C信号检测当前GPU扩展箱的连接拓扑,包括:第一级GPU扩展箱的BMC利用I2C信号扫描所述第一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到主机的BMC或第一级GHJ扩展箱的BMC;上一级GPU扩展箱的BMC利用I2C信号扫描下一级GPU扩展箱中PCIEswitch芯片的第一端口和第二端口,判断是否检测到下一级GPU扩展箱的BMC。7.根据权利要求3所述的一种自动配置GHJ扩展箱的方法,其特征在于,所述根据当前GPU扩展箱的连接拓扑以及所述映射关系,对GPU扩展箱内PCIEswitch芯片进行配置,包括:如果当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到主机的BMC,第二端口不连接任何主机或GPU扩展箱,将当前GPU扩展箱的PCIEswitch芯片设置为第一配置;如果当前GPU扩展箱的PCIEswitch芯片上第一端口检测到主机的BMC,第二端口连接下一级GPU扩展箱,将当前GPU扩展箱的PCIEswitch芯片设置为第二配置;如果当前GPU扩展箱的PCIEswitch芯片上仅有第一端口检测到上一级GPU扩展箱的BMC,将当前GPU扩展箱的PCIEswitch芯片设置为第三配置;如果当前GinJ扩展箱的PCIEswitch芯片上第一端口检测到一主机的服C,第二端口检测到另一主机的BMC,将当前GHJ扩展箱的PCIEswitch芯片设置为第四配置。8.—种自动配置GPU扩展箱的系统,所述GPU扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其余端口用于连接当前GPU扩展箱内的GPU,其特征在于,所述系统包括:映射关系建立模块,用于建立GPU扩展箱的连接拓扑与GHJ扩展箱内PCIEswitch芯片配置之间的映射关系;检测模块,用于利用I2C信号检测当前GPU扩展箱的连接拓扑;配置模块,用于根据当前GPU扩展箱的连接拓扑以及所述映射关系,对GPU扩展箱内PCIEswitch芯片进行配置。9.根据权利要求8所述的一种自动配置GPU扩展箱的系统,其特征在于,所述映射关系为:GPU扩展箱的第一连接拓扑与第一配置相匹配,其中,第一连接拓扑为直联模式,第一配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口不连接任何主机或GPU扩展箱;GPU扩展箱的第二连接拓扑与第二配置相匹配,其中,第二连接拓扑为级联模式的第一级,第二配置为:PCIEswitch芯片上第一端口连接一主机,且第二端口连接下一级GPU扩展箱;GHJ扩展箱的第三连接拓扑与第三配置相匹配,其中,第三连接拓扑为级联模式的第N级,第三配置为:PCIEswitch芯片上第一端口连接上一级扩展箱,N彡2且N为自然数;GPU扩展箱的第四连接拓扑与第四配置相匹配,其中,第四连接拓扑为上行模式,第四配置为:PCIEswitch芯片上第一端口连接一主机,第二端口连接另一主机。10.—种可自动配置的GPU扩展箱,所述GPU扩展箱中设置有一PCIEswitch芯片,所述PCIEswitch芯片上设置有多个端口,其中,第一端口用于连接主机或上一级GPU扩展箱,第二端口用于备用、连接下一级GPU扩展箱或连接另一主机,其佘端口用于连接当前GPU扩展箱内的GPU,其特征在于,所述主机中设置有主机的BMC,用于对GPU扩展箱和主机进行监控,并根据GTO扩展箱的连接拓扑,对GPU扩展箱内PCIEswitch芯片进行配置;所述GPU扩展箱中还设置有GPU扩展箱的BMC,用于对GPU扩展箱和主机进行监控,并根据GHJ扩展箱的连接拓扑,对GPU扩展箱内PCIEswitch芯片进行配置;所述主机与GPU扩展箱之间通过连接线通信连接,且所述主机和GF^扩展箱之间,以及多级GPU扩展箱之间的连接线上设置有I2C总线,所述I2C总线用于建立主机BMC与GPU扩展箱BMC之间的通信连接,以及,建立上一级GPU扩展箱的BMC与下一级GPU扩展箱的服C之间的通信连接;所述主机的BMC和GPU扩展箱的BMC中均设置有权利要求8或9中所述的一种自动配置GPU扩展箱的系统。

百度查询: 郑州云海信息技术有限公司 自动配置GPU扩展箱的方法、系统及可自动配置的GPU扩展箱

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。