本发明涉及一种基于属性控制的大规模系统隐式并行管理方法,属于并行计算中计算资源虚拟化环境管理技术领域。
背景技术:
随着高性能计算技术的发展,大规模并行系统规模急剧扩大,呈现出系统资源种类多、数量大的特点,对系统运行控制管理的扩展性带来了较大的压力。由于应用需求不同,计算资源经常需要通过虚拟化方式在物理计算节点中构建多个虚拟机以满足应用需求,同时,由于系统规模扩大,平均无故障间隔时间降低,计算资源的虚拟化也可以实现故障的有效隔离,降低故障影响范围。但是,大规模虚拟化环境导致系统运行控制管理的压力进一步增大,同时也会增加系统管理和使用的复杂性。
在目前的高性能计算环境中,一般在计算资源上通过虚拟化技术构建虚拟化运行环境后,将虚拟机作为基本计算单元呈现给系统管理员和用户,同时运行控制管理软件也将虚拟机作为基本计算单元进行管理,不关心宿主机的虚拟化细节。在这种模式下,由于虚拟化带来了基本计算单元的大幅增加,运行控制管理的扩展性压力进一步扩大,同时也增加了系统管理和使用的复杂度。
如何解决大规模计算资源虚拟化环境带来的运行控制扩展性压力和系统管理和使用复杂度提高问题,成为本领域技术人员努力的方向。
技术实现要素:
本发明的目的是提供一种基于属性控制的大规模系统隐式并行管理方法,该基于属性控制的大规模系统隐式并行管理方法提升大规模系统分布式运行控制的可扩展性,解决了因计算资源虚拟化导致的基础计算资源数量增多带来的运行控制扩展性压力问题。
为达到上述目的,本发明采用的技术方案是:一种基于属性控制的大规模系统隐式并行管理方法,包括对计算资源内隐式的作业管理控制和对虚拟计算资源信息的属性化展示;
所述计算资源内隐式的作业管理控制具体包括以下步骤:
s11、计算资源虚拟化使用模式下,在计算资源的宿主机上自动启动运行控制域管理服务;
s12、在虚拟机内自动启动对虚拟计算资源的运行控制服务;
s13、虚拟机内的运行控制服务与宿主机内的运行控制域管理服务连接通信,构成计算资源内的独立层次运行控制域;
s14、外部管理系统将作业启动请求、运行控制请求和管理请求发送至计算资源,此时,外部管理系统不需关心计算资源的使用模式;
s15、在计算资源内,根据虚拟机的启动情况,判断计算资源是否为虚拟化使用模式,如果是虚拟化使用模式,则将外部管理系统发来的作业启动请求、运行控制请求和管理请求发送至虚拟机内的运行控制服务,在虚拟机内进行作业的启动、控制与管理;
s16、计算资源宿主机内的运行控制域管理服务接收虚拟机内的运行控制服务发回的各类管理控制结果,并将其返回给外部管理系统;
所述虚拟计算资源信息的属性化展示具体包括以下步骤:
s21、计算资源虚拟化使用模式下,在虚拟机内自动启动虚拟计算资源监测服务,并与宿主机内的资源监测服务连接通信,构建计算资源内的独立层次运行控制域;
s22、虚拟机内的虚拟计算资源监测服务将虚拟机的资源属性和状态信息发送至宿主机内的资源监测服务;
s23、宿主机内的资源监测服务收集到虚拟机管理的资源信息后,将其转换为该计算资源的属性信息,发送至外部管理系统;
s24、外部管理系统面向用户和管理员,以计算资源属性的方式,展示计算资源上的多个个性化虚拟机信息。
由于上述技术方案的运用,本发明与现有技术相比具有下列优点:
本发明基于属性控制的大规模系统隐式并行管理方法,其在计算资源宿主机上启动运行控制域管理服务,对多个虚拟机上的运行控制环境进行管理,通过节点内透明的自适应层次运行控制来实现对节点内大量资源的管理,提升大规模系统分布式运行控制的可扩展性,解决了因计算资源虚拟化导致的基础计算资源数量增多带来的运行控制扩展性压力问题;
另外,通过将多个个性化的虚拟计算节点信息以物理节点属性的方式对外呈现,大幅减少对外展示的计算资源数量和个性化信息,减少系统的管理和使用负担。
附图说明
附图1为本发明计算资源内隐式的作业管理控制方法流程图;
附图2为本发明虚拟计算资源信息的属性化展示方法流程图。
具体实施方式
实施例:一种基于属性控制的大规模系统隐式并行管理方法,基于大规模异构系统,包括对计算资源内隐式的作业管理控制和对虚拟计算资源信息的属性化展示;
所述计算资源内隐式的作业管理控制具体包括以下步骤:
s11、计算资源虚拟化使用模式下,在计算资源的宿主机上自动启动运行控制域管理服务;
s12、在虚拟机内自动启动对虚拟计算资源的运行控制服务;
s13、虚拟机内的运行控制服务与宿主机内的运行控制域管理服务连接通信,构成计算资源内的独立层次运行控制域;
s14、外部管理系统将作业启动请求、运行控制请求和管理请求发送至计算资源,此时,外部管理系统不需关心计算资源的使用模式;
s15、在计算资源内,根据虚拟机的启动情况,判断计算资源是否为虚拟化使用模式,如果是虚拟化使用模式,则将外部管理系统发来的作业启动请求、运行控制请求和管理请求发送至虚拟机内的运行控制服务,在虚拟机内进行作业的启动、控制与管理;
s16、计算资源宿主机内的运行控制域管理服务接收虚拟机内的运行控制服务发回的各类管理控制结果,并将其返回给外部管理系统;
所述虚拟计算资源信息的属性化展示具体包括以下步骤:
s21、计算资源虚拟化使用模式下,在虚拟机内自动启动虚拟计算资源监测服务,并与宿主机内的资源监测服务连接通信,构建计算资源内的独立层次运行控制域;
s22、虚拟机内的虚拟计算资源监测服务将虚拟机的资源属性和状态信息发送至宿主机内的资源监测服务;
s23、宿主机内的资源监测服务收集到虚拟机管理的资源信息后,将其转换为该计算资源的属性信息,发送至外部管理系统;
s24、外部管理系统面向用户和管理员,以计算资源属性的方式,展示计算资源上的多个个性化虚拟机信息。
实施例进一步解释如下:
本发明主要通过物理节点内虚拟计算资源隐式并行管理技术,解决计算节点虚拟化带来的系统管理扩展性压力,降低用户使用负担,提升系统扩展性和好用性。主要包括物理节点内隐式的独立运行控制域构建和虚拟计算资源信息属性化展示两部分。
构建物理节点内隐式的独立运行控制域,构建和处理流程主要如下所示:
1)计算资源虚拟化使用模式下,在计算资源宿主机上自动启动运行控制域管理服务;
2)在虚拟机内自动启动虚拟计算资源运行控制服务;
3)宿主机内的管理服务与虚拟机内的运行控制服务构成一个独立的层次运行控制域;
4)当外部管理系统将作业启动、运行控制、管理等请求发送至计算节点时,如判断为虚拟化使用模式,则运行控制管理域管理服务通过构建的节点内层次控制域对虚拟机内的作业进行相关启动与控制;
5)计算节点宿主机内域管理服务将各类管理控制结果返回给外部管理系统。
在以上管理控制模式下,底层物理节点内虚拟资源的并行化层次式管理对外部管理控制系统透明,隐式的通过控制层次的增加解决了因虚拟化导致的基础计算资源数量增多带来的运行控制扩展性压力。
虚拟计算资源信息属性化展示主要通过如下方式进行。
1)计算资源虚拟化使用模式下,自动构建节点内层次运行控制域;
2)虚拟机内的资源监测服务将虚拟机及管理的资源相关信息发送至宿主机内的资源监测服务;
3)宿主机内资源监测服务收集到节点内虚拟机相关信息后,将其转换为本节点的属性信息,发送至外部管理系统;
4)外部管理系统面向用户和管理员,以宿主机属性的方式展示物理节点上的多个个性化虚拟机信息。
通过这种属性化展示方式,在计算资源虚拟化使用模式下,可以大幅减少面向用户和系统管理员展示的计算资源的数量和个性化信息,降低系统的管理和使用负担。
采用基于属性控制的大规模系统隐式并行管理方法时,其在计算资源宿主机上启动运行控制域管理服务,对多个虚拟机上的运行控制环境进行管理,通过节点内透明的自适应层次运行控制来实现对节点内大量资源的管理,提升大规模系统分布式运行控制的可扩展性,解决了因计算资源虚拟化导致的基础计算资源数量增多带来的运行控制扩展性压力问题;另外,通过将多个个性化的虚拟计算节点信息以物理节点属性的方式对外呈现,大幅减少对外展示的计算资源数量和个性化信息,减少系统的管理和使用负担。
为了便于更好的理解本发明,下面将对本文中使用的术语进行简要的解释:
并行计算(parallelcomputing):并行计算是指同时使用多种计算资源解决计算问题的过程,通过多节点/处理器来并发协同求解同一问题,以提高计算速度和处理能力。
并行作业:一般指由mpi等并行语言编写,运行于并行计算机计算资源上的任务进程集合,由作业系统启动和控制,通过进程间协同完成同一问题求解。
并行作业系统:指运行于并行计算机中,用于进行并行作业调度、任务启动、控制与回收等功能的管理控制系统。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。
1.一种基于属性控制的大规模系统隐式并行管理方法,其特征在于:包括对计算资源内隐式的作业管理控制和对虚拟计算资源信息的属性化展示;
所述计算资源内隐式的作业管理控制具体包括以下步骤:
s11、计算资源虚拟化使用模式下,在计算资源的宿主机上自动启动运行控制域管理服务;
s12、在虚拟机内自动启动对虚拟计算资源的运行控制服务;
s13、虚拟机内的运行控制服务与宿主机内的运行控制域管理服务连接通信,构成计算资源内的独立层次运行控制域;
s14、外部管理系统将作业启动请求、运行控制请求和管理请求发送至计算资源,此时,外部管理系统不需关心计算资源的使用模式;
s15、在计算资源内,根据虚拟机的启动情况,判断计算资源是否为虚拟化使用模式,如果是虚拟化使用模式,则将外部管理系统发来的作业启动请求、运行控制请求和管理请求发送至虚拟机内的运行控制服务,在虚拟机内进行作业的启动、控制与管理;
s16、计算资源宿主机内的运行控制域管理服务接收虚拟机内的运行控制服务发回的各类管理控制结果,并将其返回给外部管理系统;
所述虚拟计算资源信息的属性化展示具体包括以下步骤:
s21、计算资源虚拟化使用模式下,在虚拟机内自动启动虚拟计算资源监测服务,并与宿主机内的资源监测服务连接通信,构建计算资源内的独立层次运行控制域;
s22、虚拟机内的虚拟计算资源监测服务将虚拟机的资源属性和状态信息发送至宿主机内的资源监测服务;
s23、宿主机内的资源监测服务收集到虚拟机管理的资源信息后,将其转换为该计算资源的属性信息,发送至外部管理系统;
s24、外部管理系统面向用户和管理员,以计算资源属性的方式,展示计算资源上的多个个性化虚拟机信息。
技术总结