一种集群中独占CPU核资源管理模型的研究方法与流程

    专利2026-02-05  2


    本发明属于新兴信息,具体涉及一种集群中独占cpu核资源管理模型的研究方法。


    背景技术:

    1、目前k8s将节点上的所有cpu资源视为一个大的共享资源池(未配置kube-reserved和system-reserved),调度器会将所有cpu资源视为可用资源,用于调度工作进程或线程,cpu节流、上下文切换以及cpu缓存都可能会定期抢占正在执行的进程或线程,好处是多任务处理会更有效的cpu资源利用,但对延迟敏感的工作负载非常不利,优化这些工作负载性能的解决方案是从内核调度程序隔离出一个cpu或一组cpu,和延迟敏感的工作负绑定,使其仅在该隔离的cpu集上执行,那么该业务就对隔离的这一组cpu集拥有独占访问权,就会消除线程抢占导致的上下文切换以及cpu节流。

    2、k8s虽然支持容器,pod,namespace级别资源的限制,但是存在资源超卖,共享底层cpu和内存资源,当发生资源挤兑后会影响关键类业务的稳定性;k8s也支持pod对cpu资源的独占,但也存在以下问题:

    3、1、k8s虽然给pod分配了独占核资源,但是不能够保证节点上系统服务对该cpu独占核资源的使用,没有做到彻底的隔离;

    4、2、k8s不支持一组服务或者某些pod共享几个cpu核而不受其他服务的影响。

    5、为了解决这两个问题,本专利在k8s cpu资源管理的方法上,提出了一种更彻底的资源隔离方法,能够保证对于计算资源敏感类业务对cpu资源隔离的更彻底,即能做到业务对cpu独占核的绑定做到更彻底的隔离,又能被k8s集群纳管和调度;从而避免在集群资源受到挤兑时,影响关键类业务。


    技术实现思路

    1、本发明的目的在于提供一种集群中独占cpu核资源管理模型的研究方法,用于解决背景技术中提出的技术问题。

    2、为了实现上述目的,本发明采用了如下技术方案:一种集群中独占cpu核资源管理模型的研究方法,包括如下步骤:

    3、s01:将相应的cpu核心数从对应节点隔离出来,并作为当前节点的节点cpu核资源分区池,为节点预留cpu独占核扩展资源;

    4、s02:在节点上发布新的cpu独占核扩展资源,并把cpu独占核资源注册到k8s系统中;

    5、s03:通过定义pod的资源请求和限制来实现对cpu独占核资源的分配,在节点上为业务pod分配并绑定cpu独占核资源;

    6、s04:通过patch请求将节点上的cpu独占核资源从节点的容量中清理掉。

    7、优选的,所述节点cpu核资源分区池包括隔离cpu池和kube-reserved。

    8、优选的,s01中的节点cpu核资源分区池为隔离cpu池,所述隔离cpu池是通过对每个节点预留的cpu独占核资源进行注册而实现的,cpu独占核资源被注册到k8s中,当k8s拥有节点的独占核信息后,则能够调度工作负载到该节点。

    9、优选的,所述kube-reserved为系统守护进程预留的cpu资源值,通过在k8s系统的kubelet中配置,用来给k8s系统守护进程记述其资源预留值。

    10、优选的,s02中,将cpu独占核资源注册到k8s系统中是通过cpu管理器实现的,cpu管理器还负责每个节点上cpu独占核资源的状态收集,下发和改配节点上cpu独占核资源。

    11、优选的,所述在节点上发布新的cpu独占核扩展资源,并把cpu独占核资源注册到k8s系统中的具体实现如下:当cpu独占核资源注册到k8s系统中时,k8s则拥有每个节点的cpu核信息及相应的cpu拓扑信息;用户在创建工作负载时,指定request和limit相同且为整数的isocpu独占核信息,k8s基于上步骤拥有的cpu核信息,将工作负载调度到拥有cpu独占核资源的节点上;驻守在节点上的agent则监听pod资源的创建,当有pod中指定了isocpu独占核资源时,agent通过调用容器运行时的runtime接口将未被使用的独占核isocpu按照编号从小到大分配给容器;分配独占核资源完成后,agent驻留进程会将被分配的cpu独占核资源移到已使用核列表中,并且上报cpu独占核资源使用状态给cpu管理器,cpu管理器会再次向k8s更新该节点的cpu独占核资源列表。

    12、优选的,s03中,在节点上为业务pod分配并绑定cpu独占核资源是通过agent实现的,agent负责管理每个节点上的cpu核资源分区池,并向cpu管理器上报cpu独占核资源的使用状态,并将上报的状态分配给cpu管理器。

    13、优选的,s03中,当pod被删除或重新调度,agent负责回收cpu独占核资源,并周期性的上报节点上cpu独占核资源的状态。

    14、优选的,s03中,agent负责从该隔离cpu池中获取cpu独占核资源,并编号管理,将单个或者多个cpu独占核资源分配给一个pod,将单个cpu独占核资源分配给一组pod,将多个cpu独占核资源分配给多个pod,实现单对单,单对多,多对单以及多对多的绑定关系。

    15、优选的,单对单,单对多,多对单以及多对多的绑定关系具体如下:

    16、单对单绑定就是将当前编号的cpu独占核资源只分配给与当前编号对应的pod,即在容器启动前分配绑定的cgroup cpuset,为节点上pod赋予cpu亲和性和独占性,这种独占性是使用cgroup cpuset控制器来实现的;

    17、单对多绑定是将多个cpu独占核资源与向对应编号的pod绑定;

    18、多对单绑定就是将一个cpu独占核资源和多个pod绑定,实现多个pod共享当前cpu独占核资源;

    19、多对多就是将几个cpu独占核资源和几个pod实现绑定,实现多个pod共享一组cpu独占核资源,将这一组cpu列表同时写入各个pod的cgroup cpuset。

    20、综上所述,由于采用了上述技术方案,本发明的有益效果是:

    21、1、本发明可以使得节点上被集群管理的独占核资源拥有更彻底的隔离性,节点上的系统服务和操作系统都不能使用该独占核;且k8s可以将一组服务或者pod调度到某个或者几个cpu核上,实现这一组服务或者pod针对这几个核的共享而不受其他服务的影响。

    22、2、本发明能够解决集群中延迟敏感的工作负载和cpu独占核的绑定,提升业务稳定性;同时可以实现独占cpu和业务的单对单、单对多、多对单以及多对多的绑定,可以帮助提高系统性能、效率和响应速度,并充分利用系统资源。它们可以适用于不同的场景和任务需求,从而满足不同的业务需求,可以帮助企业降低成本、提高效率、增强业务竞争力等。

    23、3、本发明能够有效的对节点上cpu核做分区池,解决各种业务对不同类型cpu的使用,既能节约计算资源,又不会影响关键业务;本发明有很强的扩展性,能够纳入管理巨页,显示核心,加密子卡,虚拟网卡等自定义资源。



    技术特征:

    1.一种集群中独占cpu核资源管理模型的研究方法,其特征在于,包括如下步骤:

    2.如权利要求1所述的一种集群中独占cpu核资源管理模型的研究方法,其特征在于,所述节点cpu核资源分区池包括隔离cpu池和kube-reserved。

    3.如权利要求2所述的一种集群中独占cpu核资源管理模型的研究方法,其特征在于,s01中的节点cpu核资源分区池为隔离cpu池,所述隔离cpu池是通过对每个节点预留的cpu独占核资源进行注册而实现的,cpu独占核资源被注册到k8s中,当k8s拥有节点的独占核信息后,则能够调度工作负载到该节点。

    4.如权利要求3所述的一种集群中独占cpu核资源管理模型的研究方法,其特征在于,所述kube-reserved为系统守护进程预留的cpu资源值,通过在k8s系统的kubelet中配置,用来给k8s系统守护进程记述其资源预留值。

    5.如权利要求1或4所述的一种集群中独占cpu核资源管理模型的研究方法,其特征在于,s02中,将cpu独占核资源注册到k8s系统中是通过cpu管理器实现的,cpu管理器还负责每个节点上cpu独占核资源的状态收集,下发和改配节点上cpu独占核资源。

    6.如权利要求5所述的一种集群中独占cpu核资源管理模型的研究方法,其特征在于,所述在节点上发布新的cpu独占核扩展资源,并把cpu独占核资源注册到k8s系统中的实现如下:

    7.如权利要求6所述的一种集群中独占cpu核资源管理模型的研究方法,其特征在于,s03中,在节点上为业务pod分配并绑定cpu独占核资源是通过agent实现的,agent负责管理每个节点上的cpu核资源分区池,并向cpu管理器上报cpu独占核资源的使用状态,并将上报的状态分配给cpu管理器。

    8.如权利要求7所述的一种集群中独占cpu核资源管理模型的研究方法,其特征在于,s03中,当pod被删除或重新调度,agent负责回收cpu独占核资源,并周期性的上报节点上cpu独占核资源的状态。

    9.如权利要求8所述的一种集群中独占cpu核资源管理模型的研究方法,其特征在于,s03中,agent负责从该隔离cpu池中获取cpu独占核资源,并编号管理,将单个或者多个cpu独占核资源分配给一个pod,将单个cpu独占核资源分配给一组pod,将多个cpu独占核资源分配给多个pod,实现单对单,单对多,多对单以及多对多的绑定关系。

    10.如权利要求9所述的一种集群中独占cpu核资源管理模型的研究方法,其特征在于,单对单,单对多,多对单以及多对多的绑定关系如下:


    技术总结
    本发明属于新兴信息技术领域,公开了一种集群中独占CPU核资源管理模型的研究方法,包括如下步骤:S01:将相应的CPU核心数从对应节点隔离出来,并作为当前节点的节点CPU核资源分区池,为节点预留CPU独占核扩展资源;S02:在节点上发布新的CPU独占核扩展资源,并把CPU独占核资源注册到k8s系统中;S03:通过定义Pod的资源请求和限制来实现对CPU独占核资源的分配,在节点上为业务Pod分配并绑定CPU独占核资源;本发明可以使得节点上被集群管理的独占核资源拥有更彻底的隔离性。

    技术研发人员:李启蒙
    受保护的技术使用者:天翼云科技有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-94722.html

    最新回复(0)