模型处理方法、装置、电子设备和存储介质与流程

    专利2026-02-04  4


    本公开涉及人工智能,尤其涉及芯片、深度学习平台以及大模型等。更具体地,本公开提供了一种模型处理方法、装置、电子设备和存储介质。


    背景技术:

    1、随着人工智能技术的发展,深度学习模型可以应用于各种应用场景。在不同应用场景中,可以对模型进行不同的调整,以便在不同应用场景中使用模型进行高效地推理。


    技术实现思路

    1、本公开提供了一种模型处理方法、装置、设备以及存储介质。

    2、根据本公开的一方面,提供了一种模型处理方法,该方法包括:根据待处理模型的待编辑模型数据,在可视界面展示待处理模型的计算图,其中,计算图包括m个结点,m为大于或等于1的整数,待处理模型与第一深度学习框架对应;经由可视界面,获取至少一个目标操作数据,其中,目标操作数据与计算图中的n个结点相关,n为大于或等于1的整数;根据至少一个目标操作数据调整待编辑模型数据,得到目标模型数据。

    3、根据本公开的另一方面,提供了一种模型处理装置,该装置包括:展示模块,用于根据待处理模型的待编辑模型数据,在可视界面展示待处理模型的计算图,其中,计算图包括m个结点,m为大于或等于1的整数,待处理模型与第一深度学习框架对应;获取模块,用于经由可视界面,获取至少一个目标操作数据,其中,目标操作数据与计算图中的n个结点相关,n为大于或等于1的整数;调整模块,用于根据至少一个目标操作数据调整待编辑模型数据,得到目标模型数据。

    4、根据本公开的另一方面,提供了一种电子设备,包括本公开提供的模型处理装置。

    5、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。

    6、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。

    7、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据本公开提供的方法。

    8、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。



    技术特征:

    1.一种模型处理方法,包括:

    2.根据权利要求1所述的方法,还包括:

    3.根据权利要求2所述的方法,其中,所述根据所述待处理模型的待编辑模型数据,在可视界面展示所述待处理模型的计算图包括:

    4.根据权利要求1所述的方法,其中,所述可视界面还展示有至少一个控件,

    5.根据权利要求4所述的方法,其中,所述至少一个控件包括结点添加控件,所述结点添加控件与多个预设结点对应,所述结点添加控件对应的预设操作包括添加操作,所述用户输入信息包括与所述目标结点相关的至少一个待关联结点,所述至少一个待关联结点位于所述计算图中;

    6.根据权利要求5所述的方法,其中,所述根据所述目标结点的至少一个第一操作数据,得到所述目标结点的所述目标操作数据包括:

    7.根据权利要求4所述的方法,其中,所述至少一个控件包括第一结点删除控件,所述第一结点删除控件对应的预设操作包括删除操作,所述目标结点为所述计算图中的结点,

    8.根据权利要求7所述的方法,其中,所述根据所述目标结点的至少一个第一操作数据,得到所述目标结点的所述目标操作数据包括:

    9.根据权利要求4所述的方法,其中,所述至少一个控件包括第二结点删除控件,所述第二结点删除控件对应的预设操作包括删除操作,所述目标结点为所述计算图中的结点,

    10.根据权利要求4所述的方法,其中,所述至少一个控件包括结点修改控件,所述目标结点为所述计算图中的结点,

    11.根据权利要求4所述的方法,其中,所述至少一个控件包括计算子图提取控件,所述子图提取控件对应的预设操作包括计算图生成操作,所述目标结点为所述计算图中的结点,

    12.根据权利要求4所述的方法,其中,所述至少一个控件包括融合控件,所述目标结点为所述计算图中的结点,

    13.一种模型处理装置,包括:

    14.根据权利要求13所述的装置,还包括:

    15.根据权利要求2所述的方法,其中,所述展示模块包括:

    16.根据权利要求13所述的装置,其中,所述可视界面还展示有至少一个控件,

    17.根据权利要求16所述的装置,其中,所述至少一个控件包括结点添加控件,所述结点添加控件与多个预设结点对应,所述结点添加控件对应的预设操作包括添加操作,所述用户输入信息包括与所述目标结点相关的至少一个待关联结点,所述至少一个待关联结点位于所述计算图中;

    18.根据权利要求17所述的装置,其中,所述第一获得子模块包括:

    19.根据权利要求16所述的装置,其中,所述至少一个控件包括第一结点删除控件,所述第一结点删除控件对应的预设操作包括删除操作,所述目标结点为所述计算图中的结点,

    20.根据权利要求19所述的装置,其中,所述第一获得子模块包括:

    21.根据权利要求16所述的装置,其中,所述至少一个控件包括第二结点删除控件,所述第二结点删除控件对应的预设操作包括删除操作,所述目标结点为所述计算图中的结点,

    22.根据权利要求16所述的装置,其中,所述至少一个控件包括结点修改控件,所述目标结点为所述计算图中的结点,

    23.根据权利要求16所述的装置,其中,所述至少一个控件包括计算子图提取控件,所述子图提取控件对应的预设操作包括计算图生成操作,所述目标结点为所述计算图中的结点,

    24.根据权利要求16所述的装置,其中,所述至少一个控件包括融合控件,所述目标结点为所述计算图中的结点,

    25.一种电子设备,包括权利要求13至24任一项所述的装置。

    26.一种电子设备,包括:

    27.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至12中任一项所述的方法。

    28.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至12中任一项所述的方法。


    技术总结
    本公开提供了一种模型处理方法,涉及人工智能技术领域,尤其涉及芯片、深度学习平台以及大模型技术领域。具体实现方案为:根据待处理模型的待编辑模型数据,在可视界面展示待处理模型的计算图,其中,计算图包括M个结点,M为大于或等于1的整数,待处理模型与第一深度学习框架对应;经由可视界面,获取至少一个目标操作数据,其中,目标操作数据与计算图中的N个结点相关,N为大于或等于1的整数;根据至少一个目标操作数据调整待编辑模型数据,得到目标模型数据。本公开还提供了一种模型处理装置、电子设备和存储介质。

    技术研发人员:郝石磊,罗航,刘梁,顾海仑,陈叶飞,邱本章
    受保护的技术使用者:昆仑芯(北京)科技有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-94662.html

    最新回复(0)