一种可编程GPU模拟与测试系统及方法与流程

    专利2022-07-08  142


    本发明属于服务器测试技术领域,具体涉及一种可编程gpu模拟与测试系统及方法。



    背景技术:

    在服务器功耗测试中,经常会遇到例如gpu部件的功耗测试,现有gpu的测试通常需要采用购买对应版本型号的gpu部件,gpu部件通常更新换代较快,不同型号gpu功耗差距也较为明显,同时该部件价值较高,容易损坏,不方便协调与长时间占用与功耗测试,而对于一些对于gpu具体部件性能实际无需测试,现有的测试方式成本高,测试资源占用时间长,造成项目延迟与测试成本的加剧。

    此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种可编程gpu模拟与测试系统及方法,是非常有必要的。



    技术实现要素:

    针对现有技术的上述现有的服务器功耗测试中,采用gpu部件造成测试方式成本高,测试资源占用时间长,进而项目延迟与测试成本加剧的缺陷,本发明提供一种可编程gpu模拟与测试系统及方法,以解决上述技术问题。

    第一方面,本发明提供一种可编程gpu模拟与测试系统,包括定制化机壳,定制化机壳内设置有最小硬件化模块和若干可扩展功耗模块;

    最小硬件化模块包括控制模块,控制模块连接有存储模块、通讯模块以及第一pcie模拟连接端口,通讯模块连接有第二pcie模拟连接端口,通讯模块通过第一pcie模拟连接端口与主板的pcie接口连接,控制模块通过通讯模块、第二pcie模拟连接端口与可扩展功耗模块连接;

    控制模块,用于分析与调控整个gpu模拟与测试系统的模拟负载、信息采集、信息处理以及功耗调控调整策略的变更;

    存储模块,用于存储在服务器端或pc端加载的负载调控策略;

    通讯模块,用于通过第一pcie模拟连接端口与主板的pcie接口连接,负责接收服务器信息与通讯,或者连接到pc端的端口,与pc上位机通讯;

    第二pcie模拟连接端口,用于连接与调控可扩展功耗模块,实现模拟负载可调。

    进一步地,控制模块采用arm核心的处理芯片。

    进一步地,存储模块采用独立外置的存储芯片。

    进一步地,通讯模块采用i2c通讯方式。

    第二方面,本发明提供一种可编程gpu模拟与测试方法,包括如下步骤:

    s1.根据需要测试项目与测试需求制定采集模拟化方案,再根据采集模拟化方案对待模拟gpu进行模拟化信息采集,采集待模拟gpu的实际功耗以及实际散热量;

    s2.根据待模拟gpu的实际功耗及功耗调控策略选取可扩展功耗模块及确定定制化外壳,并根据待模拟gpu的实际散热量设计待模拟gpu的定制化外壳与可拓展功耗模块及最小硬件化模块之间风道,生成gpu模拟与测试系统;

    s3.比较gpu模拟与测试系统和待模拟gpu的功耗与散热情况差异,对gpu模拟与测试系统进行修正。

    进一步地,步骤s1具体步骤如下:

    s11.根据需要测试项目与测试需要制定采集模拟化方案,设定采集时间间隔、采集工具、采集参数及采集次数n,所述采集参数包括待模拟gpu各部件在某一工况下电流状况、功耗状况、温度状况、散热状况及温度分布状况;

    s12.将待模拟gpu各部件在某一工况下电流及功耗状况的n组数据生成功耗变化曲线,确定变化策略、功耗的瞬态模型、最大功耗参数及动态变化率,建立功耗曲线模型;

    s13.将待模拟gpu各部件在某一工况下温度、散热状况及温度分布状况的n组数据构建散热模型,制定该工况内待模拟gpu的最大温度与最恶劣温度分布状况。

    进一步地,步骤s2具体步骤如下:

    s21.根据待模拟gpu各部件的功耗曲线模型制定功耗调控策略;

    s22.根据待模拟gpu各部件的功耗曲线模型的峰值功耗选取可扩展功耗模块,并根据功耗调整策略对选定的可扩展功耗模块进行调整;

    s23.根据待模拟gpu各部件的功耗状况选定与待模拟gpu外形相似的定制化外壳外形,满足结构要求;

    s24.根据待模拟gpu的实际散热量及选定的定制化外壳外形调整定制化外壳的材质,再设计待模拟gpu的定制化外壳与可拓展功耗模块及最小硬件化模块之间风道,生成gpu模拟与测试系统。

    进一步地,步骤s21中功耗调整策略可从服务器端或pc端下载。

    进一步地,步骤s22具体步骤如下:

    s221.根据待模拟gpu各部件的功耗曲线模型的峰值功耗选定最大功耗配置;

    s222.根据选定的最大功耗配置选取可扩展功耗模块;

    s223.根据功耗调整策略调整可扩展功耗模块的rc模组与rr模组的比例;

    s224.根据功耗调整策略调整可扩展功耗模块内功率管的导通量,使得功率管根据负载电压调整负载电流、模拟负载短路及调整模拟负载的感性、容性及阻性,实现模拟功耗与功耗曲线模型拟合。

    进一步地,步骤s11中采集工具采用功率计及电流测试装置;

    步骤s224中,功率管采用mosfet或晶体管。

    本发明的有益效果在于,

    本发明提供的可编程gpu模拟与测试系统及方法,实现gpu模拟与测试系统作为测试治具替代需要搭配gpu进行整机测试与调控的领域,无线搭配真正的gpu部件,极大的节约了测试成本,实现需要gpu进行功耗测试的长时间压测,避免了重要gpu部件的损耗。

    此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。

    由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。

    附图说明

    为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

    图1是本发明的系统示意图;

    图2是本发明的方法流程示意图一;

    图3是本发明的方法流程示意图二;

    图中,1-定制化外壳;2-最小硬件化模块;2.1-控制模块;2.2-存储模块;2.3-通讯模块;2.4-第一pcie模拟连接端口;2.5-第二pcie模拟连接端口;3-可扩展功耗模块;4-主板;4.1-pcie接口。

    具体实施方式

    为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

    实施例1:

    如图1所示,本发明提供一种可编程gpu模拟与测试系统,包括定制化机壳1,定制化机壳1内设置有最小硬件化模块2和若干可扩展功耗模块3;

    最小硬件化模块1包括控制模块2.1,控制模块2.1连接有存储模块2.2、通讯模块2.3以及第一pcie模拟连接端口2.4,通讯模块2.3连接有第二pcie模拟连接端口2.5,通讯模块2.3通过第一pcie模拟连接端口2.4与主板4的pcie接口4.1连接,控制模块2.1通过第二pcie模拟连接端口2.5与可扩展功耗模块3连接;

    控制模块2.1,用于分析与调控整个gpu模拟与测试系统的模拟负载、信息采集、信息处理以及功耗调控调整策略的变更;

    存储模块2.2,用于存储在服务器端或pc端加载的负载调控策略;

    通讯模块2.3,用于通过第一pcie模拟连接端口2.4与主板4的pcie接口4.1连接,负责接收服务器信息与通讯,或者连接到pc端的端口,与pc上位机通讯;

    第二pcie模拟连接端口2.5,用于连接与调控可扩展功耗模块3,实现模拟负载可调。

    在某些实施例中,控制模块采用arm核心的处理芯片。

    在某些实施例中,存储模块采用独立外置的存储芯片。

    在某些实施例中,通讯模块采用i2c通讯方式。

    实施例2:

    如图2所示,本发明提供一种可编程gpu模拟与测试方法,包括如下步骤:

    s1.根据需要测试项目与测试需求制定采集模拟化方案,再根据采集模拟化方案对待模拟gpu进行模拟化信息采集,采集待模拟gpu的实际功耗以及实际散热量;

    s2.根据待模拟gpu的实际功耗及功耗调控策略选取可扩展功耗模块及确定定制化外壳,并根据待模拟gpu的实际散热量设计待模拟gpu的定制化外壳与可拓展功耗模块及最小硬件化模块之间风道,生成gpu模拟与测试系统;

    s3.比较gpu模拟与测试系统和待模拟gpu的功耗与散热情况差异,对gpu模拟与测试系统进行修正。

    实施例3:

    如图3所示,本发明提供一种可编程gpu模拟与测试方法,包括如下步骤:

    s1.根据需要测试项目与测试需求制定采集模拟化方案,再根据采集模拟化方案对待模拟gpu进行模拟化信息采集,采集待模拟gpu的实际功耗以及实际散热量;具体步骤如下:

    s11.根据需要测试项目与测试需要制定采集模拟化方案,设定采集时间间隔、采集工具、采集参数及采集次数n,所述采集参数包括待模拟gpu各部件在某一工况下电流状况、功耗状况、温度状况、散热状况及温度分布状况;采集时间间隔可设置为1ms;

    s12.将待模拟gpu各部件在某一工况下电流及功耗状况的n组数据生成功耗变化曲线,确定变化策略、功耗的瞬态模型、最大功耗参数及动态变化率,建立功耗曲线模型;

    s13.将待模拟gpu各部件在某一工况下温度、散热状况及温度分布状况的n组数据构建散热模型,制定该工况内待模拟gpu的最大温度与最恶劣温度分布状况;

    s2.根据待模拟gpu的实际功耗及功耗调控策略选取可扩展功耗模块及确定定制化外壳,并根据待模拟gpu的实际散热量设计待模拟gpu的定制化外壳与可拓展功耗模块及最小硬件化模块之间风道,生成gpu模拟与测试系统;具体步骤如下:

    s21.根据待模拟gpu各部件的功耗曲线模型制定功耗调控策略;

    s22.根据待模拟gpu各部件的功耗曲线模型的峰值功耗选取可扩展功耗模块,并根据功耗调整策略对选定的可扩展功耗模块进行调整;

    s23.根据待模拟gpu各部件的功耗状况选定与待模拟gpu外形相似的定制化外壳外形,满足结构要求;

    s24.根据待模拟gpu的实际散热量及选定的定制化外壳外形调整定制化外壳的材质,再设计待模拟gpu的定制化外壳与可拓展功耗模块及最小硬件化模块之间风道,生成gpu模拟与测试系统;

    s3.比较gpu模拟与测试系统和待模拟gpu的功耗与散热情况差异,对gpu模拟与测试系统进行修正。

    在上述实施例中,以修正后的gpu模拟与测试系统作为最终模拟测试治具,用于小批次或者多领域的测试,实现根据该完成的模拟测试治具进行小批次生成应用,用于非gpu单体测试的其他领域的模拟工况测试,例如:散热领域的设计主要是针对风扇的调控与服务器整机的散热状况的测试,在测试中需要多台机器进行数据长时间压测与信息采集,占用资源较多,而该gpu模拟与测试系统作为模拟治具可以替代该gpu部件,实现同等情况的功耗消耗与散热状况,即可,对于gpu的具体性能敏感度较低。再例如acv领域(电源兼容性及功耗测试领域)对于整机功耗的测试与长时间稳定性压测,对于gpu的具体部件性能没有要求,只要系统供电满足,测试电源的动态性能与功耗性能即可。

    在某些实施例中,步骤s21中功耗调整策略可从服务器端或pc端下载;

    步骤s11中采集工具采用功率计及电流测试装置;

    步骤s224中,功率管采用mosfet或晶体管。

    在某些实施例中,步骤s22具体步骤如下:

    s221.根据待模拟gpu各部件的功耗曲线模型的峰值功耗选定最大功耗配置;

    s222.根据选定的最大功耗配置选取可扩展功耗模块;

    s223.根据功耗调整策略调整可扩展功耗模块的rc模组与rr模组的比例;

    s224.根据功耗调整策略调整可扩展功耗模块内功率管的导通量,使得功率管根据负载电压调整负载电流、模拟负载短路及调整模拟负载的感性、容性及阻性,实现模拟功耗与功耗曲线模型拟合。

    尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。


    技术特征:

    1.一种可编程gpu模拟与测试系统,其特征在于,包括定制化机壳,定制化机壳内设置有最小硬件化模块和若干可扩展功耗模块;

    最小硬件化模块包括控制模块,控制模块连接有存储模块、通讯模块以及第一pcie模拟连接端口,通讯模块连接有第二pcie模拟连接端口,通讯模块通过第一pcie模拟连接端口与主板的pcie接口连接,控制模块通过通讯模块、第二pcie模拟连接端口与可扩展功耗模块连接;

    控制模块,用于分析与调控整个gpu模拟与测试系统的模拟负载、信息采集、信息处理以及功耗调控调整策略的变更;

    存储模块,用于存储在服务器端或pc端加载的负载调控策略;

    通讯模块,用于通过第一pcie模拟连接端口与主板的pcie接口连接,负责接收服务器信息与通讯,或者连接到pc端的端口,与pc上位机通讯;

    第二pcie模拟连接端口,用于连接与调控可扩展功耗模块,实现模拟负载可调。

    2.如权利要求1所述的可编程gpu模拟与测试系统,其特征在于,控制模块采用arm核心的处理芯片。

    3.如权利要求1所述的可编程gpu模拟与测试系统,其特征在于,存储模块采用独立外置的存储芯片。

    4.如权利要求1所述的可编程gpu模拟与测试系统,其特征在于,通讯模块采用i2c通讯方式。

    5.一种可编程gpu模拟与测试方法,其特征在于,包括如下步骤:

    s1.根据需要测试项目与测试需求制定采集模拟化方案,再根据采集模拟化方案对待模拟gpu进行模拟化信息采集,采集待模拟gpu的实际功耗以及实际散热量;

    s2.根据待模拟gpu的实际功耗及功耗调控策略选取可扩展功耗模块及确定定制化外壳,并根据待模拟gpu的实际散热量设计待模拟gpu的定制化外壳与可拓展功耗模块及最小硬件化模块之间风道,生成gpu模拟与测试系统;

    s3.比较gpu模拟与测试系统和待模拟gpu的功耗与散热情况差异,对gpu模拟与测试系统进行修正。

    6.如权利要求5所述的可编程gpu模拟与测试方法,其特征在于,步骤s1具体步骤如下:

    s11.根据需要测试项目与测试需要制定采集模拟化方案,设定采集时间间隔、采集工具、采集参数及采集次数n,所述采集参数包括待模拟gpu各部件在某一工况下电流状况、功耗状况、温度状况、散热状况及温度分布状况;

    s12.将待模拟gpu各部件在某一工况下电流及功耗状况的n组数据生成功耗变化曲线,确定变化策略、功耗的瞬态模型、最大功耗参数及动态变化率,建立功耗曲线模型;

    s13.将待模拟gpu各部件在某一工况下温度、散热状况及温度分布状况的n组数据构建散热模型,制定该工况内待模拟gpu的最大温度与最恶劣温度分布状况。

    7.如权利要求6所述的可编程gpu模拟与测试方法,其特征在于,步骤s2具体步骤如下:

    s21.根据待模拟gpu各部件的功耗曲线模型制定功耗调控策略;

    s22.根据待模拟gpu各部件的功耗曲线模型的峰值功耗选取可扩展功耗模块,并根据功耗调整策略对选定的可扩展功耗模块进行调整;

    s23.根据待模拟gpu各部件的功耗状况选定与待模拟gpu外形相似的定制化外壳外形,满足结构要求;

    s24.根据待模拟gpu的实际散热量及选定的定制化外壳外形调整定制化外壳的材质,再设计待模拟gpu的定制化外壳与可拓展功耗模块及最小硬件化模块之间风道,生成gpu模拟与测试系统。

    8.如权利要求7所述的可编程gpu模拟与测试方法,其特征在于,步骤s21中功耗调整策略可从服务器端或pc端下载。

    9.如权利要求7所述的可编程gpu模拟与测试方法,其特征在于,步骤s22具体步骤如下:

    s221.根据待模拟gpu各部件的功耗曲线模型的峰值功耗选定最大功耗配置;

    s222.根据选定的最大功耗配置选取可扩展功耗模块;

    s223.根据功耗调整策略调整可扩展功耗模块的rc模组与rr模组的比例;

    s224.根据功耗调整策略调整可扩展功耗模块内功率管的导通量,使得功率管根据负载电压调整负载电流、模拟负载短路及调整模拟负载的感性、容性及阻性,实现模拟功耗与功耗曲线模型拟合。

    10.如权利要求9所述的可编程gpu模拟与测试方法,其特征在于,步骤s11中采集工具采用功率计及电流测试装置;

    步骤s224中,功率管采用mosfet或晶体管。

    技术总结
    本发明提供一种可编程GPU模拟与测试系统及方法,所述系统包括定制化机壳,定制化机壳内设置有最小硬件化模块和若干可扩展功耗模块;最小硬件化模块包括控制模块,控制模块连接有存储模块、通讯模块以及第一PCIE模拟连接端口,通讯模块连接有第二PCIE模拟连接端口,通讯模块通过第一PCIE模拟连接端口与主板的PCIE接口连接,控制模块通过第二PCIE模拟连接端口与可扩展功耗模块连接;控制模块,用于分析与调控整个GPU模拟与测试系统的模拟负载;存储模块,用于存储在服务器端或PC端加载的负载调控策略;通讯模块,用于与主板的PCIE接口连接,负责接收服务器信息与通讯,或者连接到PC端的端口,与PC上位机通讯。

    技术研发人员:李星辰
    受保护的技术使用者:苏州浪潮智能科技有限公司
    技术研发日:2020.12.01
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-22748.html

    最新回复(0)