计算任务处理方法、电子设备和计算设备与流程

    专利2025-04-08  16


    本技术涉及人工智能芯片,特别是涉及计算任务处理方法、电子设备和计算设备。


    背景技术:

    1、伴随着信息技术的发展,在高性能计算系统或者是数据中心中采用异构计算的方式来满足日益增长的需求。在一个计算系统中通常会有多个或者是多组不同形态的芯片组成一个完整的复杂计算的系统,例如在一个计算系统中,包括cpu、gpu、fpga、asic。cpu在整个系统中主要充当控制的角色,其余芯片则是按照不同的场景或者需求来完成特定的计算任务,可以将cpu看成系统的控制中心,其他的芯片则是计算中心。

    2、在这种异构计算系统中,计算场景更加复杂,需要多个计算芯片共同完成,或者需要将一个完整的计算任务拆分成多个小的任务(task)来完成,多个芯片之间的计算或者任务之间存在相互依赖的关系,此时,由cpu对具体的计算任务进行管理,特别是在计算过程中的管理,通常情况下采用任务标识(task id)来对具体的任务来进行标识,然后host cpu和计算硬件(device)之间通过采用task id来进行同步。


    技术实现思路

    1、本技术至少提供了至少一种计算任务处理方法、电子设备和计算设备,以解决上述问题。

    2、本技术第一方面提供了一种计算任务处理方法,应用于第一设备,所述第一设备与第二设备连接,所述第一设备定义第一任务队列,所述第二设备包括第二任务队列,所述计算任务包括至少两个任务,所述至少两个任务被添加到所述第一任务队列中,且每个任务被配置有任务标识;所述方法包括:从所述第一任务队列中获取一个任务;将该任务下发给所述第二设备,以使得所述第二设备将该任务按照该任务的任务标识添加到所述第二任务队列中,以对该任务进行处理。

    3、在一些实施例中,所述第二任务队列与所述第一任务队列对应。

    4、在一些实施例中,所述方法进一步包括:在开始下发任务给所述第二设备之前,初始化所述第二设备,以使得所述第二任务队列中的任务标识清零。

    5、在一些实施例中,所述至少两个任务中的任意一个任务在所述第一任务队列中被表示为第一任务条目,其中所述第一任务条目包括与该任务对应的所述第二设备可处理的任务主体以及该任务的任务标识。

    6、在一些实施例中,将该任务添加到所述第一任务队列中,包括:将该任务组织成所述任务主体,并给该任务配置任务标识;将该任务及其任务标识组织成所述第一任务条目,并将所述第一任务条目添加到所述第一任务队列中。

    7、在一些实施例中,所述第一任务条目还包括该任务的任务状态,所述任务状态包括第一状态和第二状态,其中所述第一状态表示该任务待下发给所述第二设备,所述第二状态表示该任务已下发给所述第二设备;所述方法进一步包括:响应于将所述该任务添加所述第一任务队列中,将该任务的任务状态设置为所述第一状态;响应于将该任务下发完成,将所述任务状态修改为所述第二状态。

    8、在一些实施例中,所述任务状态还包括第三状态,所述第三状态表示所述第二设备已完成处理该任务;所述方法进一步包括:响应于从所述第二设备获取到该任务已完成;将该任务的任务状态修改为所述第三状态。

    9、在一些实施例中,所述方法进一步包括:从所述第二设备获取该任务的完成结果;响应于获取到该任务的完成结果,将该任务对应的所述第一任务条目从所述第一任务队列中移除。

    10、在一些实施例中,所述将该任务下发给所述第二设备,包括:将该任务组织成所述第二设备可识别的任务命令包,并将所述任务命令包下发到所述第二设备。

    11、本技术第二方面提供了一种计算任务处理方法,应用于第二设备,所述第二设备与第一设备连接,所述第一设备定义第一任务队列,所述第二设备包括第二任务队列,所述计算任务包括至少两个任务,所述至少两个任务被添加到所述第一任务队列中,且每个任务被配置有任务标识;所述方法包括:从所述第一设备接收所述第一任务队列中的一个任务;将该任务按照该任务的任务标识添加到所述第二任务队列中;按照所述第二任务队列,对该任务进行处理。

    12、在一些实施例中,所述第二任务队列与所述第一任务队列对应。

    13、在一些实施例中,该任务在所述第二任务队列中被表示为第二任务条目,其中所述第二任务条目包括与该任务对应的所述第二设备可处理的任务主体。

    14、在一些实施例中,将该任务按照该任务的任务标识添加到所述第二任务队列中,包括:控制所述第二设备的计数器计数;响应于所述第二设备的计数器计数到该任务的任务标识的值,将该任务添加到所述第二任务队列中。

    15、在一些实施例中,所述第二任务条目还包括该任务的任务状态,所述任务状态包括第四状态和第五状态,其中所述第四状态表示该任务由所述第二设备待完成,所述第五状态表示该任务由所述第二设备已完成;所述方法进一步包括:响应于从所述第一设备接收到该任务,将该任务的任务状态设置为所述第四状态;响应于所述第二设备已完成该任务,将所述任务状态修改为所述第五状态。

    16、在一些实施例中,所述方法进一步包括:响应于所述第一设备从所述第二设备获取该任务的完成结果,将该任务对应的所述第二任务条目从所述第二任务队列中移除。

    17、在一些实施例中,所述第二设备用于记录所述第二设备当前完成的已完成任务的任务标识;所述方法包括:响应于该任务完成,更新所述第二设备当前完成的已完成任务的任务标识。

    18、在一些实施例中,所述第二设备还用于记录所述第二设备当前接收的已接收任务的任务标识;所述方法进一步包括:响应于接收到该任务,更新所述第二设备当前接收的已接收任务的任务标识。

    19、在一些实施例中,所述方法进一步包括:响应于该任务完成,通知所述第一设备该任务完成,以使得所述第一设备获取该任务的完成结果。

    20、在一些实施例中,从所述第一设备接收该任务,包括:从所述第一设备接收该任务对应的任务命令包,其中,响应于所述任务命令包有效,则表示接收到该任务。

    21、本技术第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述第一方面中的计算任务处理方法。

    22、本技术第四方面提供了一种计算设备,所述计算设备包括可编程逻辑电路和/或程序指令,当所述计算设备运行时,用于实现上述第二方面中的计算任务处理方法。

    23、本技术第五方面提供了一种电子设备,包括处理器以及与所述处理器耦接的存储器和计算芯片,所述处理器用于执行所述存储器中存储的程序指令,以实现第一方面中的计算任务处理方法,所述计算芯片在运行时,用于实现上述第二方面中的计算任务处理方法。

    24、上述方案,计算任务处理方法应用于第一设备,第一设备与第二设备连接,第一设备定义第一任务队列,第二设备包括第二任务队列,计算任务包括至少两个任务,至少两个任务被添加到第一任务队列中,且每个任务被配置有任务标识,通过从第一任务队列中获取一个任务,并将该任务下发给第二设备,以使得第二设备按照该任务的任务标识添加到第二任务队列中,以对该任务进行处理,也就是说,基于软硬结合的方式组织和管理任务,通过优化硬件中的任务队列,减少了硬件资源的占用,以及采用统一的任务标识表示,使得软件对任务状态的感知和管理更加简洁,从而host cpu与device之间任务相关的同步更加高效。

    25、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本技术。


    技术特征:

    1.一种计算任务处理方法,其特征在于,应用于第一设备,所述第一设备与第二设备连接,所述第一设备定义第一任务队列,所述第二设备包括第二任务队列,所述计算任务包括至少两个任务,所述至少两个任务被添加到所述第一任务队列中,且每个任务被配置有任务标识;所述方法包括:

    2.根据权利要求1所述的方法,其特征在于,所述第二任务队列与所述第一任务队列对应。

    3.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:

    4.根据权利要求1所述的方法,其特征在于,所述至少两个任务中的任意一个任务在所述第一任务队列中被表示为第一任务条目,其中所述第一任务条目包括与该任务对应的所述第二设备可处理的任务主体以及该任务的任务标识。

    5.根据权利要求4所述的方法,其特征在于,将该任务添加到所述第一任务队列中,包括:

    6.根据权利要求4所述的方法,其特征在于,所述第一任务条目还包括该任务的任务状态,所述任务状态包括第一状态和第二状态,其中所述第一状态表示该任务待下发给所述第二设备,所述第二状态表示该任务已下发给所述第二设备;

    7.根据权利要求6所述的方法,其特征在于,所述任务状态还包括第三状态,所述第三状态表示所述第二设备已完成处理该任务;

    8.根据权利要求4所述的方法,其特征在于,所述方法进一步包括:

    9.根据权利要求1-8中任一项所述的方法,其特征在于,所述将该任务下发给所述第二设备,包括:

    10.一种计算任务处理方法,其特征在于,应用于第二设备,所述第二设备与第一设备连接,所述第一设备定义第一任务队列,所述第二设备包括第二任务队列,所述计算任务包括至少两个任务,所述至少两个任务被添加到所述第一任务队列中,且每个任务被配置有任务标识;所述方法包括:

    11.根据权利要求10所述的方法,其特征在于,所述第二任务队列与所述第一任务队列对应。

    12.根据权利要求10所述的方法,其特征在于,该任务在所述第二任务队列中被表示为第二任务条目,其中所述第二任务条目包括与该任务对应的所述第二设备可处理的任务主体。

    13.根据权利要求12所述的方法,其特征在于,将该任务按照该任务的任务标识添加到所述第二任务队列中,包括:

    14.根据权利要求12所述的方法,其特征在于,所述第二任务条目还包括该任务的任务状态,所述任务状态包括第四状态和第五状态,其中所述第四状态表示该任务由所述第二设备待完成,所述第五状态表示该任务由所述第二设备已完成;

    15.根据权利要求10所述的方法,其特征在于,所述方法进一步包括:

    16.根据权利要求10所述的方法,其特征在于,所述第二设备用于记录所述第二设备当前完成的已完成任务的任务标识;

    17.根据权利要求10所述的方法,其特征在于,所述第二设备还用于记录所述第二设备当前接收的已接收任务的任务标识;

    18.根据权利要求10所述的方法,其特征在于,所述方法进一步包括:

    19.根据权利要求10-19中任一项所述的方法,其特征在于,从所述第一设备接收该任务,包括:

    20.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至9任一项所述的计算任务处理方法。

    21.一种计算设备,其特征在于,所述计算设备包括可编程逻辑电路和/或程序指令,当所述计算设备运行时,用于实现如权利要求10至19任一项所述的计算任务处理方法。

    22.一种电子设备,其特征在于,包括处理器以及与所述处理器耦接的存储器和计算芯片,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至9任一项所述的计算任务处理方法,所述计算芯片在运行时,用于实现如权利要求10至19任一项所述的计算任务处理方法。


    技术总结
    本申请公开了计算任务处理方法,应用于第一设备,所述第一设备与第二设备连接,所述第一设备定义第一任务队列,所述第二设备包括第二任务队列,所述计算任务包括至少两个任务,所述至少两个任务被添加到所述第一任务队列中,且每个任务被配置有任务标识;所述方法包括:从所述第一任务队列中获取一个任务;将该任务下发给所述第二设备,以使得所述第二设备将该任务按照该任务的任务标识添加到所述第二任务队列中,以对该任务进行处理。本申请还公开了电子设备和计算设备。上述方案,基于软硬结合的方式组织和管理任务,通过优化硬件中的任务队列,使得软件对任务状态的感知和管理更加简洁。

    技术研发人员:蒋常龙,周琳,冷祥纶,李晓波,刘晨,李冰
    受保护的技术使用者:上海阵量智能科技有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-85202.html

    最新回复(0)