数据处理方法、装置、芯片、设备和存储介质与流程

    专利2025-04-19  21


    本公开涉及计算机,尤其涉及信息技术、存储器技术和芯片领域。


    背景技术:

    1、在类神经网络处理器(neural network processing unit,npu)的硬件架构中,由于npu对缓存的使用模式较为简单且单一,因此在npu访问数据时,存在对缓存利用率低的现象。


    技术实现思路

    1、本公开提供了一种数据处理方法、装置、芯片、设备、存储介质以及程序产品。

    2、根据本公开的一方面,提供了一种数据处理方法,包括确定处理器将多个指定数据分别从主存储单元读取到与计算任务关联的指定存储单元的时延,多个指定数据分别具有对应的指定数据量;根据多个指定数据的指定数据量与各自对应的时延的比值,确定目标数据量,目标数据量为多个比值中的最大比值对应的指定数据量;以及在指定存储单元内设置缓存池,缓存池的单位存储量为目标数据量;其中,缓存池用于存储计算任务的计算数据,处理器从指定存储单元读取计算数据的速率大于处理器从主存储单元读取计算数据的速率。

    3、根据本公开的另一方面,提供了一种数据处理装置,包括:第一确定模块,被配置为确定处理器将多个指定数据分别从主存储单元读取到与计算任务关联的指定存储单元的时延,多个指定数据分别具有对应的指定数据量;第二确定模块,被配置为根据多个指定数据的指定数据量与各自对应的时延的比值,确定目标数据量,目标数据量为多个比值中的最大比值对应的指定数据量;以及设置模块,被配置为在指定存储单元内设置缓存池,缓存池的单位存储量为目标数据量;其中,缓存池用于存储计算任务的计算数据,处理器从指定存储单元读取计算数据的速率大于处理器从主存储单元读取计算数据的速率。

    4、根据本公开的另一方面,提供了一种芯片,包括本公开提供的数据处理装置。

    5、本公开的另一个方面提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提供数据处理方法。

    6、根据本公开实施例的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提供的数据处理方法。

    7、根据本公开实施例的另一方面,提供了一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现本公开提供的数据处理方法。

    8、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



    技术特征:

    1.一种数据处理方法,包括:

    2.根据权利要求1所述的方法,其中,所述在所述指定存储单元内设置缓存池包括:

    3.根据权利要求1所述的方法,还包括:

    4.根据权利要求3所述的方法,其中,所述基于所述缓存池存储的所述计算数据,执行所述计算任务包括:

    5.根据权利要求4所述的方法,其中,所述在确定所述计算数据仅存储于所述主存储单元的情况下,以所述目标数据量为单位读取量,将所述计算数据从所述主存储单元读取到所述缓存池,并基于所述缓存池存储的计算数据,执行所述计算任务包括:

    6.根据权利要求4所述的方法,其中,所述在确定所述计算数据仅存储于所述主存储单元的情况下,以所述目标数据量为单位读取量,将所述计算数据从所述主存储单元读取到所述缓存池包括:

    7.根据权利要求4所述的方法,其中,所述在确定所述计算数据仅存储于所述主存储单元的情况下,以所述目标数据量为单位读取量,将所述计算数据从所述主存储单元读取到所述缓存池包括:

    8.一种数据处理装置,包括:

    9.根据权利要求8所述的装置,其中,所述第二确定模块包括:

    10.根据权利要求8所述的装置,还包括:

    11.根据权利要求10所述的装置,其中,所述执行模块包括:

    12.根据权利要求11所述的装置,其中,所述第二执行单元包括:

    13.根据权利要求11所述的装置,其中,所述第二执行单元被配置为:

    14.根据权利要求11所述的装置,其中,所述第二执行单元被配置为:

    15.一种芯片,包括:

    16.一种电子设备,包括:

    17.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

    18.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-7中任一项所述方法的步骤。


    技术总结
    本公开提供了一种数据处理方法、装置、芯片、设备、存储介质以及程序产品,涉及计算机技术领域,尤其涉及信息技术、存储器技术和芯片领域。具体实现方案为:确定处理器将多个指定数据分别从主存储单元读取到与计算任务关联的指定存储单元的时延,多个指定数据分别具有对应的指定数据量;根据多个指定数据的指定数据量与各自对应的时延的比值,确定目标数据量,目标数据量为多个比值中的最大比值对应的指定数据量;以及在指定存储单元内设置缓存池,缓存池的单位存储量为目标数据量;其中,缓存池用于存储计算任务的计算数据,处理器从指定存储单元读取计算数据的速率大于处理器从主存储单元读取计算数据的速率。

    技术研发人员:顾海仑,罗航,郝石磊,邱本章,刘梁,陈叶飞,李冀
    受保护的技术使用者:昆仑芯(北京)科技有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-85727.html

    最新回复(0)