一种基于零和博弈的多准则决策方法与流程

    专利2022-07-08  107


    本发明涉及多准则决策技术领域,更具体的是,本发明涉及一种基于零和博弈的多准则决策方法。



    背景技术:

    目前常用的多准则决策方法分为主观方法和客观方法。对于主观方法,决策者根据调查和先验给出各决策目标属性的权重并进行决策选择。对于客观方法,如信息熵法,借用信息论中熵的概念进行多准则决策。在解决多准则决策问题时,需要面对多个互相冲突的属性或者目标进行决策,决策的目的是调和多属性之间的冲突。

    而博弈论是一种研究解决、调和冲突的科学理论。通过对现有多准则决策技术的调研,发现尚未有从博弈论的角度对多准则决策进行求解。



    技术实现要素:

    本发明设计开发了一种基于零和博弈的多准则决策方法,根据多目标优化问题,确定pareto解集进行零和博弈模型重构并求解,即为多准则决策的解,快速准确找到最佳多准则决策。

    本发明提供的技术方案为:

    一种基于零和博弈的多准则决策方法,包括如下步骤:

    步骤一、根据多目标优化问题,抽取多个样本点并采集相应的响应值,建立近似模型;

    步骤二、根据所述近似模型,确定优化后的pareto解集以及n个目标函数;

    步骤三、确定所述n个目标函数的最优解;

    步骤四、构建零和博弈模型:

    式中,θi为第一参与者的混合策略,i=1,2,…,n,为第二参与者的混合策略,j=1,2,…,n,g为第一参与者支付矩阵的解;

    步骤五、根据第一参与者的混合策略确定所对应的目标函数,将所述目标函数在坐标系内映射到所述优化后的pareto解集得到最佳多准则决策。

    优选的是,所述零和博弈包括:第一参与者和第二参与者作为博弈参与者。

    优选的是,所述第一参与者的策略集为目标函数fi∈{f1,f2,…,fn},所述第二参与者的策略集为目标函数最优解的集合xi∈{x1,x2,…,xn}。

    优选的是,所述零和博弈模型的博弈支付为fi(xi),-fi(xi)。

    优选的是,所述第一参与者支付矩阵的解满足:

    式中,fi(xj)为自变量为xj时的目标函数的最优解。

    优选的是,所述第一参与者的混合策略满足:

    θn=1-θ1-θ2-…-θn-1,i=n;

    式中,αi为系数,且所述系数通过所述零和博弈模型转化得到。

    优选的是,所述系数满足:

    s.t.αi≥0;

    优选的是,所述步骤五中的映射是通过目标函数与优化后的pareto解集在同一坐标轴内的最值得到:

    ri=θi(resultmax-resultmin) resultmin;

    式中,ri为基于坐标轴的解,resultmax为优化后的pareto解集在坐标轴内的最大值,resultmin为优化后的pareto解集在坐标轴内的最小值。

    本发明所述的有益效果:

    本发明提供的基于零和博弈的多准则决策方法,运用零和博弈思想,根据多目标优化问题,确定各个目标函数以及多目标优化后的pareto解集,并将各单目标函数的最优解近似为pareto解集中使其最优的解,对该问题进行零和博弈模型重构并求解,即为多准则决策的解,能快速从多目标优化中根据pareto解集找到最佳多准则决策方法,求解速度快,使用简便,求解精度高。

    附图说明

    图1为本发明所述实施例中的pareto解集示意图。

    具体实施方式

    下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。

    本发明提供了一种基于零和博弈的多准则决策方法,具体包括:

    1、对于某优化问题,利用拉丁超立方方法抽取b个样本点a1,a2,…,ab,并采集这些样本点所对应的响应值o(a1),o(a2),…,o(ab)、p(a1),p(a2),…,p(ab)等等,来建立优化所需的近似模型。

    2、针对具体问题结合优化的近似模型,确定优化后的pareto解集以及问题的n个目标函数,且各目标函数分别为f1(x),f2(x),…,fn(x);

    3、确定各目标函数的最优解f1(x1),f2(x2),…,fn(xn),所述最优解的选取依据为:将各单目标函数的最优解近似为pareto解集中使其最优的解,其中f1(x)的最优解为f1(x1),其对应的自变量取值为x1;f2(x)的最优解为f2(x2),其对应的自变量取值为x2;…;fn(x)的最优解为fn(xn),其对应的自变量取值为xn;

    4、构建零和博弈模型:

    1)、博弈参与者:第一参与者(主要参与者),第二参与者(虚拟参与者);

    2)、博弈策略集:第一参与者的策略集为各目标函数fi∈{f1,f2,…,fn},第二参与者的策略集为各目标函数最优解的集合xi∈{x1,x2,…,xn};

    3)、博弈支付:fi(xi),-fi(xi)

    4)、如表一所示为第一参与者的支付矩阵:

    表一第一参与者的支付矩阵

    由于采用混合nash均衡确定参数,且第一参与者的支付策略为各目标函数,故第一参与者的混合策略为θ1,θ2,…,θn;由于第二参与者为虚拟参与者,定义第二参与者的混合策略为故,第一参与者支付矩阵的解为:

    式中,g为第一参与者支付矩阵的解,fi(xj)为自变量为xj时的目标函数的最优解,θi为第一参与者的混合策略,i=1,2,…,n,为第二参与者的混合策略,j=1,2,…,n。

    故所述零和博弈模型为:

    5、求解所述零和博弈模型:

    其中,多准则决策的系数由所述零和博弈的混合nash均衡确定,为了便于求解,将上述博弈论问题转化为线性规划问题,则系数α可通过下式求解:

    s.t.αi≥0;

    则第一参与者的混合策略为:

    θn=1-θ1-θ2-…-θn-1,i=n;

    6、计算出第一参与者在nash均衡下的混合策略元素θi,并确定θi所对应的第i个目标函数,之后将该值在坐标系内映射到优化后的pareto解集。

    其中,具体的映射方法为:针对某一目标函数,取pareto解集在同一坐标轴内的最值,则基于坐标轴的解为:

    ri=θi(resultmax-resultmin) resultmin;

    式中,ri为基于坐标轴的解,resultmax为优化后的pareto解集在坐标轴内的最大值,resultmin为优化后的pareto解集在坐标轴内的最小值。

    基于坐标轴解ri,向pareto解集做垂直映射即是最佳多准则决策方法。

    本发明设计开发的一种基于零和博弈的多准则决策方法,运用零和博弈思想,能快速从多目标优化中根据pareto解集找到最佳多准则决策方法。

    实施例

    本实施例是在汽车安全领域,进行基于碰撞安全性的铝合金吸能盒多目标轻量化的优化设计。

    通过拉丁超立方抽样方法,变量范围的全覆盖。采用拉丁超立方采样方法,将抽样厚度区间设置为[0.5,5],抽取样本数设定为30,测取每一组数据的t(厚度)、m(质量)、e(吸能量)、fmax(峰值碰撞力)以及faver(平均碰撞力)等响应值以及计算出的sea(比吸能),具体如表二所示:

    表二样本的参数值

    利用表二中得到的样本数据即可建立优化所需的近似模型,同时该问题的多目标优化设计目标函数为:

    maximumsea(x),faver(x)

    subjecttofmax(x)≤30kn

    1mm≤x≤5mm

    式中,sea(x)为吸能盒比吸能量,faver(x)为吸能盒截面平均碰撞力,fmax(x)为碰撞过程中吸能盒最大峰值力(峰值碰撞力),eb为防撞梁能量吸收值,ec为吸能盒能量吸收值,x为吸能盒壁厚;

    该问题的目标函数为实现吸能盒比吸能量与吸能盒截面平均碰撞力最大,即:maxsea(x)与maxfaver(x)。

    约束函数为碰撞过程中吸能盒最大峰值力不超过30kn,以及保证防撞梁能量吸收值至少是吸能盒能量吸收值的30倍,即:

    fmax(x)≤30kn;

    该问题的设计变量为吸能盒壁厚,且变量取值范围为:1mm≤x≤5mm,如图1所示,通过优化可得其pareto解集。

    现求在该pareto解集中找到最优多准则决策解:

    1、找到该问题得各目标函数:

    目标函数f1(x)为吸能盒比吸能量最大,目标函数f2(x)为平均碰撞力最大;其中目标函数吸能盒比吸能量以及吸能盒截面平均碰撞力由kriging模型构建,无显式函数公式。

    2、在pareto解集中取最优解时,f1(x)可取的最大值为57.12,其自变量对应的解取x1=4.5mm;

    在pareto解集中取最优解时,f2(x)可取的最大值为13.63,其自变量对应的解取x2=2.3mm;

    3、构建零和博弈模型:

    博弈参与者:第一参与者,第二参与者(虚拟参与者);

    博弈策略集:第一参与者的策略集为各目标函数fi∈{f1,f2},第二参与者的策略集为各目标函数最优解的集合xi∈{x1,x2};

    博弈支付:fi(xi),-fi(xi);

    对第一参与者的支付矩阵如表三所示:

    表三第一参与者的支付矩阵

    5:将问题重构为零和博弈模型并转化为线性规划问题,求解过程如下:

    maxα1 α2;

    s.t.α1>0

    α2>0;

    57.12α1 13.59α2≤1

    56.15α1 13.63α2≤1。

    求解上式线性规划问题,可得系数:

    α1=0.0027;

    α2=0.0623;

    则第一参与者的混合策略为:

    θ2=1-θ1=1-0.0102=0.9898。

    令θ等于最大值θ2,取pareto解集在坐标轴内的最值:

    resultmax=13.63

    resultmin=13.59;

    则基于坐标轴的解r2为:

    r2=θ2(resultmax-resultmin) resultmin

    =0.9898*(13.63-13.59) 13.59

    =13.6296

    故此时f2为13.6296,f1为56.1597;

    pareto解集的最佳多准则决策为f1=56.1597,f2=13.6296,此时自变量取值为x=2.33mm。

    尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。


    技术特征:

    1.一种基于零和博弈的多准则决策方法,其特征在于,包括如下步骤:

    步骤一、根据多目标优化问题,抽取多个样本点并采集相应的响应值,建立近似模型;

    步骤二、根据所述近似模型,确定优化后的pareto解集以及n个目标函数;

    步骤三、确定所述n个目标函数的最优解;

    步骤四、构建零和博弈模型:

    式中,θi为第一参与者的混合策略,i=1,2,…,n,为第二参与者的混合策略,j=1,2,…,n,g为第一参与者支付矩阵的解;

    步骤五、根据第一参与者的混合策略确定所对应的目标函数,将所述目标函数在坐标系内映射到所述优化后的pareto解集得到最佳多准则决策。

    2.如权利要求1所述的基于零和博弈的多准则决策方法,其特征在于,所述零和博弈包括:第一参与者和第二参与者作为博弈参与者。

    3.如权利要求2所述的基于零和博弈的多准则决策方法,其特征在于,所述第一参与者的策略集为目标函数fi∈{f1,f2,…,fn},所述第二参与者的策略集为目标函数最优解的集合xi∈{x1,x2,…,xn}。

    4.如权利要求3所述的基于零和博弈的多准则决策方法,其特征在于,所述零和博弈模型的博弈支付为fi(xi),-fi(xi)。

    5.如权利要求4所述的基于零和博弈的多准则决策方法,其特征在于,所述第一参与者支付矩阵的解满足:

    式中,fi(xj)为自变量为xj时的目标函数的最优解。

    6.如权利要求5所述的基于零和博弈的多准则决策方法,其特征在于,所述第一参与者的混合策略满足:

    θn=1-θ1-θ2-…-θn-1,i=n;

    式中,αi为系数,且所述系数通过所述零和博弈模型转化得到。

    7.如权利要求6所述的基于零和博弈的多准则决策方法,其特征在于,所述系数满足:

    s.t.αi≥0;

    8.如权利要求7所述的基于零和博弈的多准则决策方法,其特征在于,所述步骤五中的映射是通过目标函数与优化后的pareto解集在同一坐标轴内的最值得到:

    ri=θi(resultmax-resultmin) resultmin;

    式中,ri为基于坐标轴的解,resultmax为优化后的pareto解集在坐标轴内的最大值,resultmin为优化后的pareto解集在坐标轴内的最小值。

    技术总结
    本发明公开一种基于零和博弈的多准则决策方法,包括如下步骤:步骤一、根据多目标优化问题,确定优化后的Pareto解集以及n个目标函数;步骤二、确定所述目标函数的最优解;步骤三、构建零和博弈模型并将其转化为线性规划问题,计算得到第一参与者的混合策略;步骤四、根据第一参与者的混合策略确定所对应的目标函数,将所述目标函数在坐标系内映射到所述优化后的Pareto解集得到最佳多准则决策。本发明求解速度快、精度高。

    技术研发人员:陈静;唐傲天;刘震;徐森;崔晓凡;胡金旭
    受保护的技术使用者:吉林大学
    技术研发日:2020.11.25
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-18085.html

    最新回复(0)