General second-order multi-agent system fixed time tolerance control method and application

07-04-2023 дата публикации
Номер:
CN115933379A
Контакты:
Номер заявки: 43-11-20225149.3
Дата заявки: 16-11-2022

一种通用二阶多智能体系统固定时间包容控制方法及应用

附图说明

[0075]

图1为实施例2中1-5秒的正常通信下多智能体系统拓扑;

[0076]

图2为实施例2中5-10秒局部通信中断下多智能体系统拓扑图;

[0077]

图3为实施例2中各跟随者受到的多源不匹配干扰的观测结果。

[0078]

图4为实施例2中不匹配干扰的估计误差。

[0079]

图5为实施例2中各智能体受到的匹配干扰的观测值。

[0080]

图6为实施例2中各智能体受到的匹配干扰的的观测误差图。

[0081]

图7为实施例2中各跟随者的实际位置变化图。

[0082]

图8为实施例2中跟随者的位置观测图。

[0083]

图9为实施例2中跟随者的位置观测误差图。

[0084]

图10为实施例2中跟随者的速度观测误差图。

[0085]

图11为实施例2中跟随者与领导者的关系演化图。

技术领域

[0001]

本发明涉及多智能体系统控制技术领域,更具体地,涉及一种通用二阶多智能体系统固定时间包容控制方法及应用。

具体实施方式

[0086]

下面结合实施例进一步解释和阐明,但具体实施例并不对本发明有任何形式的限定。

[0087]

实施例1

[0088]

本实施例提供一种通用二阶多智能体系统固定时间包容控制方法,包括以下步骤:

[0089]

一种通用二阶多智能体系统固定时间包容控制方法,包括以下步骤:

[0090]

S1.建立通用二阶多智能体动力学模型为:

[0091]

[0092]

[0093]

其中,xi是第i个跟随者的位置,vi是第i个跟随者的速度,xj是第j个领导者的位置,vj是第j个领导者的速度i=1,2,…,n,j=n+1,n+2,…,n+m,n为跟随者的个数..,m为领导者个数,di1和di2分别指不匹配干扰和匹配干扰,t为时间。

[0094]

S2.构建观测器对系统中的匹配扰动和不匹配进行直接估计;

[0095]

S21.针对每一个跟随者的位移、速度、匹配干扰、不匹配干扰的观测器为:

[0096]

[0097]

其中,和分别指代第i个跟随者的位置和速度的观测值,和分别是匹配干扰和非匹配干扰的观测值,zi1,zi2为中间变量。参数定义为σ∈(1-ζ,1),ζ是一个大于零但比较小的常数,σ1=σ,σ2=2σ-1,σ3=3σ-2;ε∈(1,1+ζ),ε1=ε,ε2=2ε-1,ε3=3ε-2;η>0,λi为大于零的常数;

[0098]

S22.定义观测误差则观测误差为:

[0099]

[0100]

S3.根据S2中观测器的估计值设计多智能体系统固定时间包容控制律;

[0101]

S31.定义多智能体系统包容控制过程中跟随者与领航者的跟踪误差为:

[0102]

[0103]

其中,和分别代表第i个跟随者与领航者之间的位移和速度跟踪误差。

[0104]

定义跟随者的位置跟踪误差为速度跟踪误差则跟踪误差的矩阵形式为:

[0105]

[0106]

[0107]

S32.基于观测器与跟踪误差,针对每一个跟随者设计固定时间包容控制律为:

[0108]

[0109]

其中,ki>0,i=1,…,4,α1∈(0,1),

[0110]

S33.根据S32中的控制律,选择滑模面为:

[0111]

[0112]

S4.利用Lyapunov稳定性定理和双极限齐次定理求解固定时间包容控制充分条件:多智能体系统中至少包含一条有向生成树;领导者之间独立通信,从领导者到跟随者是单项通讯,跟随者之间双向通讯,智能体共享相邻节点的状态信息和干扰估计信息。

[0113]

S41.利用Lyapunov稳定性定理求解S1中通用二阶多智能体模型在S3中所提的控制律作用下能够实现闭环渐近稳定充分条件;

[0114]

S411.对S33中滑模面求导可得:

[0115]

[0116]

S412.构造李雅普诺夫函数S=[s1,s2,…,sn]T,对其求导可得:

[0117]

[0118]

其中,由S2可知,exi是有界的,因此δ一定存在。一旦满足k0>δ,系统状态将会在有限时间tmax内收敛至滑模面。

[0119]

S413.根据有限时间收敛引理,计算tmax如下:

[0120]

[0121]

因此,多智能体系统状态是固定时间收敛至滑模面的,且时间为零,即初始时刻系统就在滑模面上。

[0122]

S414.结合步骤S31中跟踪误差的矩阵形式和S32中的控制律,速度跟踪误差的动态方程可以写为

[0123]

[0124]

S415.构造Lyapunov函数:

[0125]

[0126]

对其求导可得:

[0127]

[0128]

系统在平衡点ex=ev=0处是渐进稳定的,即误差满足下式:

[0129]

[0130]

可推出实现闭环渐近稳定充分条件:

[0131]

[0132]

即在本发明所提控制策略下,给定通用二阶智能体系统能够实现渐进包容控制。

[0133]

S42、求解闭环系统满足双极限齐次定理的充分条件。

[0134]

S421.将S1中的通用二阶多智能体动力学模型改写成:

[0135]

[0136]

S422.设观测器收敛时间为Tob,当系统时间t≥Tob时,edi1=edi2=evi=0,将固定时间包容控制律带入可得:

[0137]

[0138]

其中,

[0139]

S423.对系统的标称系统一进行齐次性分析,所述标称系统一为:

[0140]

[0141]

取κ0=α1-1,有

[0142]

[0143]

[0144]

由上式可知,S1中通用二阶多智能体动力学模型关于(2,2,…,2,1+α1,1+α1,…,1+α1)是齐次的,齐次度κ0=α1-1<0。

[0145]

S424.再对标称系统二进行齐次度分析,所述标称系统二为

[0146]

[0147]

取κ=1,则有

[0148]

[0149]

由上式可知,标称系统二是关于

[0150]

齐次的,齐次度κ=1>0。

[0151]

实施例2

[0152]

本实施例提供一种通用二阶多智能体系统固定时间包容控制方法的仿真实验。

[0153]

如图1,本实施例设置4个跟随者和3个领导者组成的多智能体网络,探究在拓扑不变的情况下的包容控制演化规律。

[0154]

上述拓扑的Laplacian矩阵为:

[0155]

[0156]

假设4个跟随者都受到扰动,以di,1表示第i个跟随者受到的不匹配干扰,以di,2表示第i个跟随者受到的匹配干扰。实验参数设置为:d1,1=2sin(2t),d1,2=3;d2,1=4cos(t),d2,2=2;d3,1=sigmoid(t),d3,2=2sigmoid(t);d4,1=3sigmoid(t),d4,2=-tan(t)。控制律关键参数为k0=10,k1=20,k2=30,α1=0.8。扰动观测器参数为λi,1=24,λi,2=32,λi,3=12,λi,4=11,σ1=0.8,ε=1.2。各智能体的初始坐标设置为x1=(5,0),x2=(0,5),x3=(0,2.5),x4=(2.5,0),x5=(6,8),x6=(8,8),x7=(8,6)。跟随者初始速度为零,领导者初始速度为v5=(1,1),v6=(1.1,1.1),v7=(1,1),仿真时长为5秒。

[0157]

实施例3

[0158]

如图2,本实施例设置4个跟随者和3个领导者组成的多智能体网络,探究在跟随者部分拓扑链接失效下的包容控制演化规律。

[0159]

上述拓扑的Laplacian矩阵为:

[0160]

[0161]

实验参数设置为:d1,1=2sin(2t),d1,2=3;d2,1=4cos(t),d2,2=2;d3,1=sigmoid(t),d3,2=2sigmoid(t);d4,1=3sigmoid(t),d4,2=-tan(t)。控制律关键参数为k0=10,k1=20,k2=30,α1=0.8。扰动观测器参数为λi,1=24,λi,2=32,λi,3=12,λi,4=11,σ1=0.8,ε=1.2。各智能体的初始坐标设置为x1=(5,0),x2=(0,5),x3=(0,2.5),x4=(2.5,0),x5=(6,8),x6=(8,8),x7=(8,6)。跟随者初始速度为零,领导者初始速度为v5=(1,1),v6=(1.1,1.1),v7=(1,1)。在实施例2中图1所示多智能体系统拓扑仿真前5秒后,在5秒-10秒期间,多智能体拓扑切换为图2,模拟跟随者之间发生通讯故障的情形。

[0162]

结果分析

[0163]

由图3-4可知,不匹配干扰的观测误差在0.4秒内收敛至0,说明本发明设计的观测器可以快速且准确地估计不匹配干扰。由图5-6可知,匹配干扰观测误差在0.2秒左右收敛到0。由图7-9可知,本发明所述设计的位置观测器能够在0.4秒内准确观测跟随者位置状态。由图10可知,跟随者的速度观测误差也能在0.3秒左右收敛到0。由图11可知,在3秒左右所有的跟随者成功进入领导者形成的凸包范围内,实现了包容控制;在5秒时刻,多智能体系统拓扑发生突变,但各跟随者仍然保持在了领导者形成的凸包内直至数值仿真结束。

[0164]

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

背景技术

[0002]

包容控制是多智能体系统一致性问题在多领导者情况下的拓展,其控制目标是让多跟随者在控制协议作用下最终收敛到多领导者围成的区域内,包容控制目前被广泛应用于无人机合围、导弹追踪等领域。

[0003]

目前相关研究的关注点是多智能体系统的渐进包容控制,即假设收敛时间没有上限的前提下跟随者收敛至领导者形成的凸包内。在CN202210777662.4一种非线性偏差分多智能体系统的迭代学习包容控制方法公开通过由偏差分方程来构建该多智能体系统的动态模型,将智能体划分为领航者和跟随者两类,并根据系统的通讯拓扑结构确定对于每个跟随者至少存在一条由某个领航者出发且连接它的通路。给定所有智能体的初边值、外部状态扰动、非线性条件以及包容控制目标的定义。为跟随者智能体构造具有初态学习的D型迭代学习方法将它们收敛到由领导者形成的凸包中,并在有限时间内实现对系统的包容控制。该发明通过上述方法,解决了具有离散时空动态行为的非线性偏差分多智能体系统的包容控制问题,且能较快的实现对系统的包容控制。在CN201711265791.0基于事件触发的二阶时变时延多智能体系统包容控制方法公开所述的包容控制方法利用积分不等式,LMI技术与时延自身及其变化率的上下界信息,得到了在通讯时延下实现包容控制的充分条件,以及最大可允许时延上界,通过构造一种自适应的事件触发机制,更有效的反应系统的实时性,降低了智能体处理器的计算处理负荷和多智能体之间的通信频次。

[0004]

在实际系统中,控制需求往往是有限时间或固定时间的。与渐进收敛相比,多智能体系统的固定时间收敛更具备实际意义。除收敛性之外,另一个是多智能体系统面临不匹配干扰时的控制问题。匹配干扰由于其输入通道与控制量平行,可以通过反馈控制直接消除,而不匹配干扰通常无法直接消除并且广泛存在于各类实际系统中,因此研究不匹配干扰下的多智能体系统固定时间包容控制问题有着重大现实意义。

发明内容

[0005]

本发明要解决的主要技术问题是针对现有技术中的多智能体系统包容控制策略存在收敛速度慢、对不匹配干扰鲁棒性不强的不足,提供一种通用二阶多智能体系统固定时间包容控制方法。

[0006]

本发明要解决的另一技术问题是提供通用二阶多智能体系统固定时间包容控制方法的应用。

[0007]

本发明的目的通过以下技术方案予以实现:

[0008]

一种通用二阶多智能体系统固定时间包容控制方法,包括以下步骤:

[0009]

S1.建立通用二阶多智能体动力学模型为:

[0010]

[0011]

[0012]

其中,xi是第i个跟随者的位置,vi是第i个跟随者的速度,xj是第j个领导者的位置,vj是第j个领导者的速度i=1,2,…,n,j=n+1,n+2,…,n+m,n为跟随者的个数,m为领导者个数,di1和di2分别指不匹配干扰和匹配干扰,t为时间。

[0013]

S2.构建观测器对系统中的扰动进行直接估计,所述观测器为:

[0014]

[0015]

其中,和分别指代第i个跟随者的位置和速度的观测值的导数,和分别是匹配干扰和非匹配干扰的观测值导数,zi1,zi2为中间变量。参数定义为σ∈(1-ζ,1),ζ是一个大于零但比较小的常数,σ1=σ,σ2=2σ-1,σ3=3σ-2;ε∈(1,1+ζ),ε1=ε,ε2=2ε-1,ε3=3ε-2;η>0,λi为大于零的常数。

[0016]

S3.根据S2中观测器的估计值设计多智能体系统固定时间包容控制律,所述固定时间包容控制律为:

[0017]

[0018]

其中,ki>0,i=1,…,4,α1∈(0,1),

[0019]

S4.利用Lyapunov稳定性定理和双极限齐次定理求解固定时间包容控制充分条件为:

[0020]

多智能体系统中至少包含一条有向生成树;领导者之间独立通信,从领导者到跟随者是单项通讯,跟随者之间双向通讯,智能体共享相邻节点的状态信息和干扰估计信息。

[0021]

进一步地,S2中所述的观测器的误差表达式为:

[0022]

[0023]

其中,

[0024]

进一步地,S3中多智能体系统固定时间包容控制的过程中,其跟随者与领航者的跟踪误差为:

[0025]

[0026]

其中,和分别代表第i个跟随者与领航者之间的位移和速度跟踪误差。aij为智能体i与智能体j间的连接权重。

[0027]

进一步地,跟踪误差的矩阵形式为:

[0028]

[0029]

[0030]

其中,跟随者的位置跟踪误差为速度跟踪误差为,Lf、Ld为多智能体系统Laplacian矩阵的分块矩阵,

[0031]

进一步地,多智能体系统固定时间包容控制律的滑模面为:

[0032]

[0033]

进一步地,S4中的求解分析步骤包括:

[0034]

S41、利用Lyapunov稳定性定理求解S1中通用二阶多智能体模型在S3中所提的控制律作用下能够实现闭环渐近稳定充分条件;

[0035]

S42、求解闭环系统满足双极限齐次定理的充分条件。

[0036]

进一步地,S41中的求解步骤包括:

[0037]

S411.对多智能体系统固定时间包容控制律的滑模面求导,得到:

[0038]

[0039]

S412.构造李雅普诺夫函数S=[s1,s2,…,sn]T,对其求导可得:

[0040]

[0041]

其中,

[0042]

S413.根据有限时间收敛引理,计算tmax如下:

[0043]

[0044]

S414.结合跟踪误差的矩阵形式和控制律,速度跟踪误差的动态方程为:

[0045]

[0046]

S415.构造Lyapunov函数:

[0047]

[0048]

对其求导可得:

[0049]

[0050]

系统在平衡点ex=ev=0处是渐进稳定的,即误差满足下式:

[0051]

[0052]

可推出实现闭环渐近稳定充分条件:

[0053]

[0054]

进一步地,S42中的求解步骤包括:

[0055]

S421.将步骤S1中通用二阶多智能体动力学模型改写成:

[0056]

[0057]

S422.设观测器收敛时间为Tob,当系统时间t≥Tob时,edi1=edi2=evi=0,将固定时间包容控制律带入可得:

[0058]

[0059]

其中,

[0060]

S423.对系统的标称系统一进行齐次性分析,所述标称系统一为:

[0061]

[0062]

取κ0=α1-1,有

[0063]

[0064]

[0065]

由上式可知,S1中通用二阶多智能体动力学模型关于(2,2,…,2,1+α1,1+α1,…,1+α1)是齐次的,齐次度κ0=α1-1<0;

[0066]

S424.再对标称系统二进行齐次度分析,所述标称系统二为:

[0067]

[0068]

取κ=1,则有

[0069]

[0070]

由上式可知,标称系统二是关于齐次的,齐次度κ=1>0。

[0071]

进一步地,S412中,当满足k0>δ时,系统状态将会在有限时间tmax内收敛至滑模面。

[0072]

进一步地,上述一种通用二阶多智能体系统固定时间包容控制方法应用于无人机合围、导弹追踪。

[0073]

与现有技术相比,有益效果是:

[0074]

本发明通过设计不匹配干扰的观测器,采用双极限齐次定理和Lyapunov稳定性理论设计控制律,有效实现二阶多智能体系统在不匹配干扰下的固定时间包容控制。通过本发明所述方法,二阶多智能体系统的跟随者在任意初始条件下都能够快速进入领导者形成的凸包内。并且,在某些通讯拓扑存在故障的情形时,本发明所述的控制算法也能够实现多智能体系统的包容控制。本发明所述方法可用于受扰动或理想二阶多智能体控制系统中,收敛速度更快,能够直接估计干扰,设计更加合理。



The invention discloses a fixed time containment control method for a universal second-order multi-agent system. According to the method, an observer is designed to directly estimate matching disturbance and mismatching disturbance in the system, then a multi-agent system fixed time tolerance control law is constructed according to an estimated value of the observer, and a double-limit homogeneous theorem and a Lyapunov stability theory are utilized to obtain a fixed time tolerance control sufficient condition. The follower of the second-order multi-agent system can quickly enter the convex hull formed by the leader under any initial condition. Moreover, when the communication topology has a fault, the control algorithm provided by the invention can also realize the containment control of the multi-agent system. According to the method, the convergence speed is higher, interference can be directly estimated, the design is more reasonable, and the problems that in the prior art, the convergence speed is low, and the robustness to mismatched interference is not high are solved.



1.一种通用二阶多智能体系统固定时间包容控制方法,其特征在于,包括以下步骤:

S1.建立通用二阶多智能体动力学模型为:

其中,xi是第i个跟随者的位置,vi是第i个跟随者的速度,xj是第j个领导者的位置,vj是第j个领导者的速度i=1,2,…,n,j=n+1,n+2,…,n+m,n为跟随者的个数,m为领导者个数,di1和di2分别指不匹配干扰和匹配干扰,t为时间;

S2.构建观测器对系统中的扰动进行直接估计,所述观测器为:

其中,和分别指代第i个跟随者的位置和速度的观测值,和分别是匹配干扰和非匹配干扰的观测值,zi1,zi2为中间变量。参数定义为σ∈(1-ζ,1),ζ是一个大于零但比较小的常数,σ1=σ,σ2=2σ-1,σ3=3σ-2;ε∈(1,1+ζ),ε1=ε,ε2=2ε-1,ε3=3ε-2;η>0,λi为大于零的常数;

S3.根据S2中观测器的估计值设计多智能体系统固定时间包容控制律,所述固定时间包容控制律为:

其中,ki>0,i=1,…,4,α1∈(0,1),和分别代表第i个跟随者与领航者之间的位移和速度跟踪误差;

S4.利用Lyapunov稳定性定理和双极限齐次定理求解固定时间包容控制充分条件为:多智能体系统中至少包含一条有向生成树;领导者之间独立通信,从领导者到跟随者是单项通讯,跟随者之间双向通讯,智能体共享相邻节点的状态信息和干扰估计信息。

2.根据权利要求1所述一种通用二阶多智能体系统固定时间包容控制方法,其特征在于,S2中所述的观测器的误差表达式为:

其中,

3.根据权利要求1所述一种通用二阶多智能体系统固定时间包容控制方法,其特征在于,S3中多智能体系统固定时间包容控制的过程中,其跟随者与领航者的跟踪误差为:

其中,和分别代表第i个跟随者与领航者之间的位移和速度跟踪误差。

4.根据权利要求3所述一种通用二阶多智能体系统固定时间包容控制方法,其特征在于,跟踪误差的矩阵形式为:

其中,跟随者的位置跟踪误差为速度跟踪误差为Lf、Ld为多智能体系统Laplacian矩阵的分块矩阵。

5.根据权利要求1所述一种通用二阶多智能体系统固定时间包容控制方法,其特征在于,多智能体系统固定时间包容控制律的滑模面为:

6.根据权利要求1所述一种通用二阶多智能体系统固定时间包容控制方法,其特征在于,S4步骤包括:

S41、利用Lyapunov稳定性定理求解S1中通用二阶多智能体模型在S3中所提的控制律作用下能够实现闭环渐近稳定充分条件;

S42、求解闭环系统满足双极限齐次定理的充分条件。

7.根据权利要求6所述一种通用二阶多智能体系统固定时间包容控制方法,其特征在于,S41中的求解步骤包括:

S411.对多智能体系统固定时间包容控制律的滑模面求导,得到:

S412.构造李雅普诺夫函数S=[s1,s2,…,sn]T,对其求导可得:

其中,

S413.根据有限时间收敛引理,计算tmax如下:

S414.结合跟踪误差的矩阵形式和控制律,速度跟踪误差的动态方程为:

S415.构造Lyapunov函数:

对其求导可得:

系统在平衡点ex=ev=0处是渐进稳定的,即误差满足下式:

可推出实现闭环渐近稳定充分条件:

8.根据权利要求6所述一种通用二阶多智能体系统固定时间包容控制方法,其特征在于,S42中的求解步骤包括:

S421.将步骤S1中通用二阶多智能体动力学模型改写成:

S422.设观测器收敛时间为Tob,当系统时间t≥Tob时,edi1=edi2=evi=0,将固定时间包容控制律带入可得:

其中,

S423.对系统的标称系统一进行齐次性分析,所述标称系统一为:

取κ0=α1-1,有

由上式可知,S1中通用二阶多智能体动力学模型关于(2,2,…,2,1+α1,1+α1,…,1+α1)是齐次的,齐次度κ0=α1-1<0;

S424.再对标称系统二进行齐次度分析,所述标称系统二为:

取κ=1,则有

由上式可知,标称系统二是关于齐次的,齐次度κ=1>0。

9.根据权利要求7所述一种通用二阶多智能体系统固定时间包容控制方法,其特征在于,S412中,当满足k0>δ时,系统状态将会在有限时间tmax内收敛至滑模面。

10.根据权利要求1-9任一所述一种通用二阶多智能体系统固定时间包容控制方法应用于无人机合围、导弹追踪。