一种用于云工作负载预测的生成对抗性方法和系统与流程

    专利2025-07-26  21


    本发明涉及计算机系统与网络领域,具体涉及了一种用于云工作负载预测的生成对抗性方法。


    背景技术:

    1、在计算机技术以及计算机运算能力飞速发展的背景下,工业上所需的计算需求不断增加,随之而来的是互联网任务请求连接数的剧增。然而,许多企业和单位所拥有的计算资源和基础服务设施难以支撑起日益激增的计算需求。与此同时,若不断增加硬件设备以满足日益增长的计算需求,会加大资源浪费和经济负担。云计算技术充分利用虚拟化机制,让用户随时随地按需访问云数据中心的计算资源和基础设施,从而降低企业和单位硬件维护成本。但是,随着云数据中心的长期运行,云服务的负载信息通常会表现出高波动性的特征。而且为了满足云服务的高可靠性需求,云数据中心需要预置大量冗余的计算资源,这可能会导致高能耗问题。

    2、因此,大量的研究人员提出一系列弹性伸缩方法,以提升云计算系统的资源利用率。目前弹性伸缩方法主要分为两类:(1)被动式响应策略,通过实时监测工作负载的变化情况来对云计算资源进行动态调整。但是,该方法在检测到负载信息发生变化后才进行资源调整,这可能无法及时在工作负载更改时提供合适的资源,增加了用户请求的响应时间。另外,被动式响应策略在处理负载突发变化时,会高频的增加或减少计算资源,从而导致响应时间的高波动和资源浪费。(2)负载预测方法,通过挖掘历史的负载信息序列去主动预测下一阶段的负载信息。然而,由于工作负载具有高波动性和突变性,这类方法通常在处理波动信号时表现出一定的局限性。与此同时,现有的大部分预测方法采用循环神经网络(recurrent neural network,rnn)的结构去分析隐藏在历史负载信息中的依赖关系,这类方法中的多次迭代会造成极大的计算开销,无法适用于需要实时预测的场景。

    3、近年来,深度学习在很多领域的都取得了突破性进展,2014年good fellow等人启发自博弈论中的二人零和博弈,开创性地提出了生成对抗网络(generative adversarialnetwork,gan)。生成对抗网络包含一个生成模型和一个判别模型。其中,生成模型负责捕捉样本数据的分布,而判别模型一般情况下是一个二分类器,判别输入是真实数据还是生成的样本。这个模型的优化过程是一个“二元极小极大博弈”问题,训练时固定其中一方(判别网络或生成网络),更新另一个模型的参数,交替迭代,最终,生成模型能够估测出样本数据的分布。生成对抗网络的出现对无监督学习,图片生成的研究起到极大的促进作用。生成对抗网络已经从最初的图片生成,被拓展到计算机视觉的各个领域,如图像分割、视频预测、风格迁移等。

    4、这些年来已有部分学者研究将生成对抗网络应用到各领域的时间序列生成中,如公开号为cn112835709a的专利文献公开了一种基于生成对抗网络的云负载时序数据生成方法、系统及介质,包括下述步骤:获取真实云环境下的负载时序数据;对获取的负载数据进行预处理;根据数据的复杂度,构建生成对抗网络,所述生成对抗网络包括生成器和判别器两部分,使用预处理后的负载时序数据,对构建的生成对抗网络进行训练,取生成对抗网络中的生成网络,从高斯分布中随机采样作为输入,生成仿真数据,作为真实数据的替代或补充。其中生成器使用改进的时间卷积网络(tcn),相较于使用长短时记忆神经网络(lstm)的方法,本发明的模型训练,收敛速度更快,且在长时间序列中表现更优。

    5、但目前的应用仍存在不少不足之处:

    6、(1)云工作负载为云数据中心在过去某一段时间内的资源利用率或任务到达个数,同时由于云平台的长时间运行,云工作负载通常具有波动性和突变性,这使得下一阶段的负载数据与历史负载信息所固有的全局周期性和局部波动性表现出复杂的依赖关系。目前大多数将gan应用于负载预测的算法通常使用lstm或tcn作为生成器,以提取出历史负载数据所隐藏的特征信息,但忽略了历史负载中固有的周期信号和波动信号对下一阶段负载的复杂依赖关系。不同于其他时序数据,在处理云工作负载预测数据时需要提取出历史负载信息的周期信号和波动信号,才能有效地对云工作负载进行建模。因此现有方法在处理高度可变的云工作负载时表现出一定的局限性。

    7、(2)生成对抗网络训练过程中需要不断平稳地提升生成器和判别器的网络表达能力,以提升生成器和判别器在博弈过程中的稳定性,从而生成更为准确的工作负载数据。然而,现有的相关研究在处理云工作负载预测问题时,通常仅考虑下一阶段的真实负载和所生成负载之间的差异性作为训练过程中的损失函数,而忽略了历史负载与生成负载之间的复杂依赖性,这使得模型的表达能力依然存在不足。


    技术实现思路

    1、本发明的所要解决的问题是现有的将gan应用于负载预测的方法忽略历史负载序列中周期信号和波动信号导致预测性能不佳的问题。

    2、为了解决上述问题,本发明采用了以下技术手段:

    3、本发明提供一种用于云工作负载预测的生成对抗性方法,包含以下步骤:

    4、步骤1:使用负载信息采集器收集云数据中心过去一段时间内的负载数据;

    5、步骤2:将所采集到的负载数据进行归一化处理并划分为训练集和测试集,之后再分别设置输入窗口和输出窗口大小,以滑动窗口的方式将训练集和测试集中的负载数据序列化,分别构成样本序列和标签序列;

    6、步骤3:建立用于云工作负载预测的生成对抗模型,所述模型包含了负载生成模块和负载判别模块,其中负载生成模块主要使用多头注意力机制和三层卷积神经网络组成;

    7、步骤4:使用训练集中的样本序列对模型进行训练,用测试集中的样本序列对模型进行测试;

    8、步骤5:将当前云数据中心的负载序列输入到已训练好的负载生成模块中,即生成下一阶段的负载信息。

    9、本发明主要使用卷积神经网络和多头注意力机制联合作为生成对抗网络中的生成器,多头注意力机制和卷积神经网络对历史负载序列中所隐藏的全局周期信息和局部波动信息分别进行特征提取,以深度解析出历史负载序列中的复杂依赖关系,从而实现云工作负载的准确表示。

    10、作为进一步优化的技术方案,所述步骤3中,负载判别模块主要由四个全连接层组成。

    11、作为进一步优化的技术方案,所述步骤4中使用训练集中的样本序列对模型进行训练具体包括:首先对于负载生成模块,将样本序列同时输入多头注意层和卷积神经网络层中,分别得到所生成的全局周期信息和局部波动信息;其次将所得到的周期信息和波动信息进行加和作为模型下一阶段的负载信息;之后将所生成的负载信息和真实的标签序列同时输入负载判别模块;最后根据生成负载信息和标签序列分别计算生成器损失函数和判别器损失函数,并利用梯度下降法对模型参数进行反向传播更新,直到达到预设迭代次数或损失函数最小化收敛时为止,将负载生成模块最后一次生成的负载信息作为最终结果。

    12、本发明负载生成模块和负载判别模块所使用的损失函数不仅考虑了下一阶段的真实负载和所生成负载之间的差异性,还考虑了历史负载与生成负载之间的复杂依赖性,使得模型的表达能力在生成对抗性的方式下不断提升,进一步确保了云工作负载环境下的预测准确性。

    13、作为进一步优化的技术方案,所述步骤4中用测试集中的样本序列对模型进行测试具体包括:首先将样本序列输入负载生成模块得到下一阶段的负载信息,之后将所生成的负载与真实的标签负载同时输入负载判别模块,最后使用平均绝对值损失作为评价指标。

    14、本发明还提供了一种用于云工作负载预测的生成对抗性系统,包括下述模块:

    15、负载信息采集模块:被配置用于收集云数据中心过去一段时间内的负载数据;

    16、数据预处理模块:被配置用于将所采集到的负载数据进行归一化处理并划分为训练集和测试集,之后再分别设置输入窗口和输出窗口大小,以滑动窗口的方式将训练集和测试集中的负载数据序列化,分别构成样本序列和标签序列;

    17、对抗模型生成器:被配置用来建立用于云工作负载预测的生成对抗模型,所述模型包含了负载生成模块和负载判别模块,其中负载生成模块主要使用多头注意力机制和三层卷积神经网络组成;

    18、训练模块:被配置用于使用训练集中的样本序列对模型进行训练,使用测试集中的样本序列对模型进行测试;

    19、负载信息生成模块:被配置用于将当前云数据中心的负载序列输入到已训练好的负载生成模块中,即生成下一阶段的负载信息。

    20、作为进一步优化的技术方案,所述对抗模型生成器中,负载判别模块主要由四个全连接层组成。

    21、作为进一步优化的技术方案,所述训练模块中用测试集中的样本序列对模型进行测试具体包括:首先对于负载生成模块,将样本序列同时输入多头注意层和卷积神经网络层中,分别得到所生成的全局周期信息和局部波动信息;其次将所得到的周期信息和波动信息进行加和作为模型下一阶段的负载信息;之后将所生成的负载信息和真实的标签序列同时输入负载判别模块;最后根据生成负载信息和标签序列分别计算生成器损失函数和判别器损失函数,并利用梯度下降法对模型参数进行反向传播更新,直到达到预设迭代次数或损失函数最小化收敛时为止,将负载生成模块最后一次生成的负载信息作为最终结果。

    22、作为进一步优化的技术方案,所述训练模块中用测试集中的样本序列对模型进行测试具体包括:首先将样本序列输入负载生成模块得到下一阶段的负载信息,之后将所生成的负载与真实的标签负载同时输入负载判别模块,最后使用平均绝对值损失作为评价指标。

    23、本发明的优点在于:

    24、本发明所设计的生成器可以深度解析出历史负载信息所隐藏的周期信息和残差信息分别进行特征表示,有效地捕获到全局周期性和局部波动性,从而实现对云工作负载的准确预测。另外,本发明使用历史负载和生成负载之间的关联性以及真实负载和生成负载之间的差异性作为模型训练过程中的损失函数,使得模型的表达能力能以生成对抗性的方式不断提升。通过对云服务器负载信息的精准预测,云计算系统可以对虚拟机进行有序部署和迁移管理,使得在保障服务质量的同时有效提升云计算系统的资源利用率,从而进一步降低云数据中心的能耗。


    技术特征:

    1.一种用于云工作负载预测的生成对抗性方法,其特征在于:包含以下步骤:

    2.如权利要求1所述的用于云工作负载预测的生成对抗性方法,其特征在于:所述步骤3中,负载判别模块主要由四个全连接层组成。

    3.如权利要求1所述的用于云工作负载预测的生成对抗性方法,其特征在于:所述步骤4中使用训练集中的样本序列对模型进行训练具体包括:首先对于负载生成模块,将样本序列同时输入多头注意层和卷积神经网络层中,分别得到所生成的全局周期信息和局部波动信息;其次将所得到的周期信息和波动信息进行加和作为模型下一阶段的负载信息;之后将所生成的负载信息和真实的标签序列同时输入负载判别模块;最后根据生成负载信息和标签序列分别计算生成器损失函数和判别器损失函数,并利用梯度下降法对模型参数进行反向传播更新,直到达到预设迭代次数或损失函数最小化收敛时为止,将负载生成模块最后一次生成的负载信息作为最终结果。

    4.如权利要求3所述的用于云工作负载预测的生成对抗性方法,其特征在于:所述步骤4中用测试集中的样本序列对模型进行测试具体包括:首先将样本序列输入负载生成模块得到下一阶段的负载信息,之后将所生成的负载与真实的标签负载同时输入负载判别模块,最后使用平均绝对值损失作为评价指标。

    5.如权利要求1所述的用于云工作负载预测的生成对抗性方法,其特征在于:具体包括下述步骤:

    6.一种用于云工作负载预测的生成对抗性系统,包括下述模块:

    7.如权利要求6所述的用于云工作负载预测的生成对抗性系统,其特征在于:所述对抗模型生成器中,负载判别模块主要由四个全连接层组成。

    8.如权利要求6所述的用于云工作负载预测的生成对抗性系统,其特征在于:所述训练模块中用测试集中的样本序列对模型进行测试具体包括:首先对于负载生成模块,将样本序列同时输入多头注意层和卷积神经网络层中,分别得到所生成的全局周期信息和局部波动信息;其次将所得到的周期信息和波动信息进行加和作为模型下一阶段的负载信息;之后将所生成的负载信息和真实的标签序列同时输入负载判别模块;最后根据生成负载信息和标签序列分别计算生成器损失函数和判别器损失函数,并利用梯度下降法对模型参数进行反向传播更新,直到达到预设迭代次数或损失函数最小化收敛时为止,将负载生成模块最后一次生成的负载信息作为最终结果。

    9.如权利要求7所述的用于云工作负载预测的生成对抗性系统,其特征在于:所述训练模块中用测试集中的样本序列对模型进行测试具体包括:首先将样本序列输入负载生成模块得到下一阶段的负载信息,之后将所生成的负载与真实的标签负载同时输入负载判别模块,最后使用平均绝对值损失作为评价指标。

    10.如权利要求6所述的用于云工作负载预测的生成对抗性系统,其特征在于:具体包括下述模块:


    技术总结
    本发明公开了一种用于云工作负载预测的生成对抗性方法,包括下述步骤:采集云数据中心的历史负载序列;对获取的负载序列进行预处理;构建相应的云工作负载预测模型,包括生成器和判别器;使用生成器对训练集中样本序列所隐藏的复杂依赖关系进行提取,同时生成下一阶段的负载信息;以生成对抗性的方式不断训练模型,直到达到预设条件或期望的评估标准停止训练;使用测试集中的样本序列对模型进行测试,最后将当前云数据中心的负载序列输入模型得到下一阶段负载信息。本发明提出的生成对抗性方法不仅可以拟合真实负载的数据分布,而且可以使得生成负载和历史负载序列实现强耦合,从而实现云服务器负载信息的精准预测,进一步使得云计算系统可以对虚拟机进行有序部署和迁移管理。

    技术研发人员:王雷
    受保护的技术使用者:中电信量子信息科技集团有限公司
    技术研发日:
    技术公布日:2024/4/29
    转载请注明原文地址:https://wp.8miu.com/read-89979.html

    最新回复(0)