基于RRT与OSPA距离的多智能体静止多目标围捕方法与流程

    专利2022-07-08  105


    本发明属于对智能体系统技术领域,尤其是对智能体围捕与路径规划技术领域,涉及一种基于rrt(rapidly-exploringrandomtrees,快速探索随机树算法)与ospa(optimalsub-pattenassignment,最优次模式分配)距离的多智能体静止多目标围捕方法。



    背景技术:

    路径规划问题是一类让目标对象在指定区域的范围内找到一条从起点到终点的无碰撞安全路径问题,其在机场拖航、物流仓储、交通控制、机器人、电子游戏等领域都有广泛的应用。目前已有许多成熟的算法,如:势场法、d和a*算法、双侧凸包扩张模型算法和蚁群算法等,快速搜算随机树算法(rrt)就是其中之一,它是一种高效搜索非凸高维空间的数据结构和算法。在分布式系统中,建立多智能体之间的相互协作,使分布式智能体系统能够高效地完成复杂的任务。围捕控制问题应用主要包括在军用领域中的无人车辆围捕、空中目标围捕、水面/水下目标的围捕等。



    技术实现要素:

    本发明的目的是针对现有技术的不足,提供一种基于rrt与ospa距离的多智能体静止多目标围捕方法。

    本发明方法包括:

    (1)多智能体系统编队:

    n个智能体组成的围捕体集合s={s1,s2,…,sn},s1为领导者,sn为跟随者,n=2,3,…,n;

    领导者的一阶lipschitz非线性动态方程为:

    跟随者的一阶lipschitz非线性动态方程为:λn∈rn,为第n个智能体的位置向量;un∈rn,为第n个智能体的控制输入参数,rn表示n维向量;t为时刻,a、b、c为系统参数,f(λn,t)为连续可微的函数,且满足利普希茨条件。

    对于每个跟随者,其控制协议为:

    un(t)=-z(r(t))∑anm[λn(t)-λm(t-τ(t))]-z(r(t))∑anm[λn(t)-λ1(t-τ(t))],m=2,3,…,n,m≠n;

    式中,λm(t-τ(t))表示第n个跟随者sn从第m个跟随者sm获取的信息,λ1(t-τ(t))表示第n个跟随者从领导者s1获取的信息;τ(t)是时变的时滞函数,且满足表示时滞上界、为时滞导数、h为时滞导数上界,z表示控制增益,r(t)为t时刻模态,anm为跟随者sn和sm连接权重值。

    (2)路径规划:

    (2.1)在可行区域内,相对一随机生成的点qrand,选择树中最接近qrand的节点qnear,将qnear扩展到具有指定步长的qrand,生成新节点qnew,连接qnear和qnew的路径并加入扩展树,采用rrt算法进行迭代计算,直到qnew到达目标点qgoal或是目标点区域,在扩展树找到基础路径。

    (2.2)在基础路径上进行了贝塞尔曲线化:当k阶贝塞尔曲线在k维空间中时,曲线由k 1个控制点pe组成,e=0,1,…,k;k阶贝赛尔曲线表示为:bk(t)为贝赛尔曲线k阶输出,γ为路径的控制输入参数,0≤γ≤1;fk,e(γ)为伯恩斯坦多项式的k阶混合函数,为二项系数,表示阶乘,hk∈rk×k,为恒等矩阵。

    (3)确定围捕区域:

    待捕获目标坐标集g={(x1,y1),(x2,y2),…,(xj,yj)},(xj,yj)为第j个待捕获目标的坐标,j=1,2,…,j,j为待捕获目标数量;将j个待捕获目标围成不规则多边形,多边形形心o坐标各待捕获目标与形心o的距离围捕圆半径r=max{dj};以形心o为圆心,半径r的区域即为围捕区域。

    (4)n个智能体向围捕区域运动,当领导者s1到达围捕区域边界时,开始进行任务分配:

    式中,表示v时刻的传感器w真实目标状态,表示v时刻的传感器w估计目标状态,xv,w为真实多目标状态集,为估计多目标状态集;p为范数阶数,μ和ρ分别为真实目标个数和估计的目标个数;πn表示排列集合,π(l)表示第l种排列,l=n!;c为水平距离参数,表示每个误差势的平均圆距离误差,d为距离。

    将各智能体进入围捕区域前的最后一刻位置作为起始点集合η={η1,η2,…,ηn},并将目标作为最终点集合g={g1,g2,…,gj},则ospa距离即为ospa(p,c,η,g)。

    (5)组成围捕队形:

    n个智能体以一个待捕获目标为圆心组成静态圆周队形,相邻智能体间的距离相等,智能体与待捕获目标保持相同的距离,且以同等的间隔角度θn分布在待捕获目标周围,0<θn<π,单个目标所需围捕体数量[]表示取整,围捕点σ={σ1,1,…,σ1,β,σ2,1,…,σ2,β,…,σα,β},α=1,2,…,j,β=1,2,…,ε。

    (6)优先围捕离领导者距离最近的目标,然后根据距离由近到远依次进行围捕。

    本发明方法在面对多静态目标围捕问题时,路径规划与ospa算法结合的方式可以给智能体分配最优的围捕点并可以自行路径规划,在多目标相对聚集的情况下,能够有效缩短围捕时间。

    附图说明

    图1为本发明的实现流程图;

    图2为多智能体系统编队队形示意图;

    图3为rrt路径规划示意图;

    图4为围捕区域示意图;

    图5为期望围捕队形图。

    具体实施方式

    以下结合附图对本发明作进一步说明。

    如图1所示,基于rrt与ospa距离的多智能体静止多目标围捕方法,该方法首先使智能体保持领导-跟随编队,对领导者进行路径规划路径规划,领导者领导跟随者移动,在进入围捕区域后,进行ospa距离计算分配围捕点。最后,各智能体分别进行路劲规划,移动到围捕点并形成对静态目标的围捕。在路径规划方面,通过rrt算法对智能体与围捕点之间进行路径规划,并通过缩小其采样范围加快路径规划时间,最后通过贝塞尔曲线进行路径优化。

    该方法包括:

    (1)多智能体系统编队:

    如图2所示,在十六个智能体组成的多智能体系统中,围捕体集合s={s1,s2,…,s16},其中s1为领导者,s2~s16为跟随者,跟随者保持一定的角度和速度来跟踪领导者。

    领导者的一阶lipschitz非线性动态方程为:

    跟随者的一阶lipschitz非线性动态方程为:n=2,3,…,16;λn∈r16,为第n个智能体的位置向量;un∈r16,为第n个智能体的控制输入参数;t为时刻,a、b、c为系统参数,f(λn,t)为连续可微的函数,且满足利普希茨条件;

    对于每个跟随者,其控制协议为:

    un(t)=-z(r(t))∑anm[λn(t)-λm(t-τ(t))]-z(r(t))∑anm[λn(t)-λ1(t-τ(t))],m=2,3,…,16,m≠n;

    式中,λm(t-τ(t))表示第n个跟随者sn从第m个跟随者sm获取的信息,λ1(t-τ(t))表示第n个跟随者从领导者s1获取的信息;τ(t)是时变的时滞函数,且满足表示时滞上界、为时滞导数、h为时滞导数上界,z表示控制增益,r(t)为t时刻模态,anm为跟随者sn和sm连接权重值。

    (2)路径规划:

    (2.1)如图3所示,在可行区域内,相对一随机生成的点qrand,选择树中最接近qrand的节点qnear,将qnear扩展到具有指定步长的qrand,生成新节点qnew,连接qnear和qnew的路径并加入扩展树,采用rrt算法进行迭代计算,直到qnew到达目标点qgoal或是目标点区域,在起始点qinit和目标点qgoal的扩展树找到基础路径。

    (2.2)由于rrt算法生成的路径不够平滑,故在基础路径上进行了贝塞尔曲线化。贝塞尔曲线是平滑路径生成的典型参数曲线之一。

    在基础路径上进行了贝塞尔曲线化:当k阶贝塞尔曲线在k维空间中时,曲线由k 1个控制点pe组成,e=0,1,…,k;k阶贝赛尔曲线表示为:bk(t)为贝赛尔曲线k阶输出,γ为路径的控制输入参数,0≤γ≤1;fk,e(γ)为伯恩斯坦多项式的k阶混合函数,为二项系数,

    (3)确定围捕区域:

    待捕获目标为四个g1、g2、g3和g4,其坐标集g={(x1,y1),(x2,y2),(x3,y3),(x4,y4)}。如图4所示,由于围捕区域的不确定性,通过不规则多边形的形心构成一个围捕圆区域,将四个待捕获目标围成不规则多边形,多边形形心o坐标各待捕获目标与形心o的距离围捕圆半径r=max{dj};以形心o为圆心,半径r的区域即为围捕区域。

    (4)n个智能体向围捕区域运动,当领导者s1到达围捕区域边界时,开始进行任务分配。

    由于智能体与目标的数量问题,需要进行任务分配以保证智能体能够到达最优的围捕点,因为ospa的距离一致性好,故采用该算法。引入如下ospa距离,解决了当集合为空时,wasserstein距离没定义的问题。

    式中,表示v时刻的传感器w真实目标状态,表示v时刻的传感器w估计目标状态,xv,w为真实多目标状态集,为估计多目标状态集;p为范数阶数,μ和ρ分别为真实目标个数和估计的目标个数;πn表示排列集合,π(l)表示第l种排列,l=n!;c为水平距离参数,表示每个误差势的平均圆距离误差,d为距离。

    将各智能体进入围捕区域前的最后一刻位置作为起始点集合η={η1,η2,…,ηn},并将目标作为最终点集合g={g1,g2,…,gj},则ospa距离即为ospa(p,c,η,g);

    (5)组成围捕队形:

    十六个智能体以一个待捕获目标为圆心组成静态圆周队形,相邻智能体间的距离相等,(xn,yn)第个智能体坐标。期望围捕队形如图5所示,智能体与待捕获目标保持相同的距离,且以同等的间隔角度θn分布在待捕获目标周围,0<θn<π,单个目标所需围捕体数量

    围捕点σ={σ1,1,…,σ1,β,σ2,1,…,σ2,β,…,σα,β},α=1,2,3,4,β=1,2,3,4。

    (6)围捕:优先围捕离领导者距离最近的目标,然后根据距离由近到远依次进行围捕,各智能体按照给定的起始点与围捕点按照(2)规划路径。


    技术特征:

    1.基于rrt与ospa距离的多智能体静止多目标围捕方法,其特征在于,该方法包括:

    (1)多智能体系统编队:

    n个智能体组成的围捕体集合s={s1,s2,…,sn},s1为领导者,sn为跟随者,n=2,3,…,n;

    领导者的一阶lipschitz非线性动态方程为:

    跟随者的一阶lipschitz非线性动态方程为:λn∈rn,为第n个智能体的位置向量;un∈rn,为第n个智能体的控制输入参数,rn表示n维向量;t为时刻,a、b、c为系统参数,f(λn,t)为连续可微的函数,且满足利普希茨条件;

    对于每个跟随者,其控制协议为:

    un(t)=-z(r(t))∑anm[λn(t)-λm(t-τ(t))]-z(r(t))∑anm[λn(t)-λ1(t-τ(t))],m=2,3,…,n,m≠n;

    式中,λm(t-τ(t))表示第n个跟随者sn从第m个跟随者sm获取的信息,λ1(t-τ(t))表示第n个跟随者从领导者s1获取的信息;τ(t)是时变的时滞函数,且满足表示时滞上界、为时滞导数、h为时滞导数上界,z表示控制增益,r(t)为t时刻模态,anm为跟随者sn和sm连接权重值;

    (2)路径规划:

    (2.1)在可行区域内,相对一随机生成的点qrand,选择树中最接近qrand的节点qnear,将qnear扩展到具有指定步长的qrand,生成新节点qnew,连接qnear和qnew的路径并加入扩展树,采用rrt算法进行迭代计算,直到qnew到达目标点qgoal或是目标点区域,在扩展树找到基础路径;

    (2.2)在基础路径上进行了贝塞尔曲线化:当k阶贝塞尔曲线在k维空间中时,曲线由k 1个控制点pe组成,e=0,1,…,k;k阶贝赛尔曲线表示为:bk(t)为贝赛尔曲线k阶输出,γ为路径的控制输入参数,0≤γ≤1;fk,e(γ)为伯恩斯坦多项式的k阶混合函数,为二项系数,!表示阶乘,hk∈rk×k,为恒等矩阵;

    (3)确定围捕区域:

    待捕获目标坐标集g={(x1,y1),(x2,y2),…,(xj,yj)},(xj,yj)为第j个待捕获目标的坐标,j=1,2,…,j,j为待捕获目标数量;将j个待捕获目标围成不规则多边形,多边形形心o坐标各待捕获目标与形心o的距离围捕圆半径r=max{dj};以形心o为圆心,半径r的区域即为围捕区域;

    (4)n个智能体向围捕区域运动,当领导者s1到达围捕区域边界时,开始进行任务分配:

    式中,表示v时刻的传感器w真实目标状态,表示v时刻的传感器w估计目标状态,xv,w为真实多目标状态集,为估计多目标状态集;p为范数阶数,μ和ρ分别为真实目标个数和估计的目标个数;πn表示排列集合,π(l)表示第l种排列,l=n!;c为水平距离参数,表示每个误差势的平均圆距离误差,d为距离;

    将各智能体进入围捕区域前的最后一刻位置作为起始点集合η={η1,η2,…,ηn},并将目标作为最终点集合g={g1,g2,…,gj},则ospa距离即为ospa(p,c,η,g);

    (5)组成围捕队形:

    n个智能体以一个待捕获目标为圆心组成静态圆周队形,相邻智能体间的距离相等,智能体与待捕获目标保持相同的距离,且以同等的间隔角度θn分布在待捕获目标周围,0<θn<π,单个目标所需围捕体数量[]表示取整,围捕点σ={σ1,1,…,σ1,β,σ2,1,…,σ2,β,…,σα,β},α=1,2,…,j,β=1,2,…,ε;

    (6)优先围捕离领导者距离最近的目标,然后根据距离由近到远依次进行围捕。

    技术总结
    本发明公开了基于RRT与OSPA距离的多智能体静止多目标围捕方法。本发明方法首先使智能体保持领导‑跟随编队,对领导者进行路径规划路径规划,领导者领导跟随者移动,在进入围捕区域后,进行OSPA距离计算分配围捕点。最后,各智能体分别进行路劲规划,移动到围捕点并形成对静态目标的围捕。在路径规划方面,通过RRT算法对智能体与围捕点之间进行路径规划,并通过缩小其采样范围加快路径规划时间,最后通过贝塞尔曲线进行路径优化。本发明方法可以给智能体分配围捕点并自行路径规划,通过加入模态判定,在多目标相对聚集的情况下,能够有效缩短围捕时间。

    技术研发人员:汤佳伟;刘伟峰;李建宁
    受保护的技术使用者:杭州电子科技大学
    技术研发日:2020.11.02
    技术公布日:2021.03.12

    转载请注明原文地址:https://wp.8miu.com/read-18475.html

    最新回复(0)