本发明涉及多智能体系统在欺骗攻击情况下实现一致性的方法,属于网络化多智能体系统技术领域。
背景技术:
近年来多智能体系统显示出许多独特的优点,如灵活的体系结构、安装和维护成本第以及资源可以全球融合和共享,因此,多智能体系统在交通管理、机器人控制、移动传感器网络、远程手术、无人驾驶飞行器和远程控制等领域得到了广泛的应用。
然而,由于网络共享,特别是有线和无线网络具有很强的开放性,在没有安全保护的情况下,多智能体系统中通过网络交换的控制数据面临着网络安全问题。例如,工业间谍远程获取关键设备的机密信息。恶意黑客拦截、篡改、伪造和转发敏感信息通过网络传输的数据。特别是对于水、电、核和化工厂等关键基础设施的多智能体网络控制系统,任何一种多智能体网络控制系统的中断都可能导致严重的后果,从生产损失到环境破坏,甚至是人身伤害或生命损失。这些针对多智能体系统的网络攻击是真实存在的,如何保证多智能体系统在欺骗攻击的情况下实现一致性,是一个新兴的问题。
技术实现要素:
本发明提出了一个对欺骗攻击的处理方法,将状态估计方法与门限阈值方法相结合,解决了多智能体系统在遭受欺骗攻击时的安全一致性的问题。
本发明所述一种多智能体系统在欺骗攻击情况下实现一致性的方法,应用以下技术方案:
步骤一、建立网络化多智能体系统的离散时间动态模型;
步骤二、针对网络化多智能体系统的欺骗攻击的模型进行建模;
步骤三、针对网络化多智能体系统的离散时间动态模型构造状态观测器,进行状态预测;
步骤四、根据步骤三设计一致性控制协议,得到状态误差方程的紧凑表达形式,达到状态一致;
步骤五、利用门限阈值比较方法,将预测估计得到的状态与直接接收的状态进行比较,完成状态的安全更新,保证在欺骗攻击下多智能体的一致性;
对以上步骤进行说明:
所述步骤一多智能体系统的离散时间状态方程为:
xi(k 1)=aixi(k) biui(k) wi(k)
yi(k)=cixi(k) vi(k)
式中,xi(k)为网络化多智能体系统中第i个智能体在k时刻的离散时间动态模型状态向量,xi(k 1)为第i个智能体在k 1时刻的离散时间动态模型状态向量,yi(k)为第i个智能体在k时刻的测量输出函数ui(k)表示第i个智能体的一致性控制协议,wi(k)∈rn是系统噪声,vi(k)∈rn是测量噪声,ai,bi和ci均为系统矩阵。
所述步骤二针对多智能体系统的欺骗攻击的模型进行建模:
xia(k)=xi(k) pij(k)aij(k)
aij(k)是任意有界实数,欺骗攻击服从条件概率,设计pij(k)表示作用于智能体i与智能体j通信的决策变量:
所述步骤三所述构造的状态观测器及其状态预测,具体形式如下:
设计如下形式观测器:
其中,
因为智能体i获得智能体j的信息存在时滞τ,为了克服网络时滞的影响,基于智能体j直到i=1,2,...,n,时刻的数据,构造智能体j从k-τ时刻到k时刻的状态:
……
通过计算,得到:
所述步骤四设计一致性控制协议,得到状态误差方程的紧凑表达形式,具体形式如下:
对于智能体i设计了如下一致性协议:
其中k状态反馈增益矩阵;
当且仅当
令状态误差可表示为:
δi(k)=xi(k)-x1(k),
从而,状态误差系统紧凑式方程为:
其中
所述步骤五所述的门限阈值比较方法设计的安全机制,具体形式为:
其中门限阈值机制为:
在存在欺骗攻击的情况下,多智能体系统的状态表达式:
当k时刻智能体i和智能体j之间的通信受到欺骗攻击时,如果
附图说明
图1是本发明的流程图;
图2是实例中多智能体系统通信拓扑图;
图3是实例中多智能体系统受到欺骗攻击时的状态分量的曲线图;
图4是实例中多智能体系统在发生欺骗攻击情况下采用门限阈值机制的状态分量曲线图。
具体实施方式
下面结合附图与具体实施方式对本发明进行进一步阐述。
建立网络化多智能体系统的离散时间动态模型:
结合图1,由本发明的流程图,具体如下:
建立网络化多智能体系统的离散时间动态模型;
xi(k 1)=aixi(k) biui(k) wi(k)
yi(k)=cixi(k) vi(k)
式中,xi(k)为网络化多智能体系统中第i个智能体在k时刻的离散时间动态模型状态向量,xi(k 1)为第i个智能体在k 1时刻的离散时间动态模型状态向量,yi(k)为第i个智能体在k时刻的测量输出函数,ui(k)表示第i个智能体的一致性控制协议,wi(k)∈rn是系统噪声,vi(k)∈rn是测量噪声,ai,bi和ci均为系统矩阵。
针对欺骗攻击进行建模:
xia(k)=xi(k) pij(k)aij(k)
其中pij(k)表示作用于智能体i与智能体j通信的决策变量:
设计状态观测器:
其中,
基于智能体j在k-τ时刻的状态,预测智能体j在k时刻状态:
对于智能体i设计了如下一致性协议:
当且仅当
定义状态误差表现形式为:
δi(k)=xi(k)-x1(k),i=1,2,...,n,
得状态误差系统的紧凑式方程为:
其中
设计门限阈值机制为:
其中门限阈值机制为:
当k时刻智能体i和智能体j之间的通信受到欺骗攻击时,如果
采用以下实例验证本发明的成果:
一个包含4个智能体的网络,其通信拓扑图如图2所示。
系统参数为:
邻接矩阵为:
欺骗攻击的概率为pij(k)=0.2,强度aij(k)=1.5,误差ε=0.005。
图3是多智能体系统受到欺骗攻击时的状态分量的曲线图。
图4是多智能体系统在欺骗攻击情况下采用门限阈值机制的状态分量曲线图。
以上所述仅为本发明的一个实施方式而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
1.一种多智能体系统在欺骗攻击情况下实现一致性的方法,其特征在于,具体包括以下步骤:
步骤一、建立网络化多智能体系统的离散时间动态模型;
步骤二、针对网络化多智能体系统的欺骗攻击的模型进行建模;
步骤三、针对网络化多智能体系统的离散时间动态模型构造状态观测器,进行状态预测;
步骤四、根据步骤三设计一致性控制协议,得到状态误差方程的紧凑表达形式,达到状态一致;
步骤五、利用门限阈值比较方法设计安全机制,将预测估计得到的状态与直接接收的状态进行比较,完成状态的安全更新,保证在欺骗攻击下多智能体的一致性。
2.根据权利要求1所述一种多智能体系统在欺骗攻击情况下实现一致性的方法,其特征在于,所述步骤一多智能体离散时间动态模型具体为:
xi(k 1)=aixi(k) biui(k) wi(k)(1)
yi(k)=cixi(k) vi(k)(2)
式中,xi(k)为网络化多智能体系统中第i个智能体在k时刻的离散时间动态模型状态向量,xi(k 1)为第i个智能体在k 1时刻的离散时间动态模型状态向量,yi(k)为第i个智能体在k时刻的测量输出函数,ui(k)表示第i个智能体的一致性控制协议,wi(k)∈rn是系统噪声,vi(k)∈rn是测量噪声,ai,bi和ci均为系统矩阵。
3.根据权利要求2所述一种多智能体系统在欺骗攻击情况下实现一致性的方法,其特征在于,所述步骤二所述的欺骗攻击的攻击模型为:
xia(k)=xi(k) pij(k)aij(k)(3)
欺骗攻击服从条件概率,令aij(k)是任意有界实数,其中pij(k)表示作用于智能体i与智能体j通信的决策变量:
4.根据权利要求3所述一种多智能体系统在欺骗攻击情况下实现一致性的方法,其特征在于,所述步骤三所述构造的状态观测器及其状态预测为:
设计如下形式观测器:
其中,
因为智能体i获得智能体j的信息存在时滞τ,为了克服网络时滞的影响,基于智能体j直到i=1,2,...,n,时刻的数据,构造智j从k-τ时刻到k时刻的状态为:
……
通过计算,得到:
5.根据权利要求4所述一种多智能体系统在欺骗攻击情况下实现一致性的方法,其特征在于,所述步骤四所述的设计的一致性协议与状态误差的紧凑式方程为:
对于智能体i设计了如下一致性协议:
其中k状态反馈增益矩阵;
当且仅当
令状态误差可表示为:
δi(k)=xi(k)-x1(k),i=1,2,...,n,
从而,状态误差系统的紧凑式方程为:
其中
6.根据权利要求5所述一种多智能体系统在欺骗攻击情况下实现一致性的方法,其特征在于,所述步骤五所述的安全机制为:
其中门限阈值机制为:
在存在欺骗攻击的情况下,多智能体系统的状态表达式:
当k时刻智能体i和智能体j之间的通信受到欺骗攻击时,如果