基于事件触发的离散MIMO系统自适应评判容错控制
2022-04-28 16:53阅读:
引用本文
王敏, 黄龙旺, 杨辰光. 基于事件触发的离散 MIMO 系统自适应评判容错控制. 自动化学报, 2022, 48(5):
1234−1245 doi: 10.16383/j.aas.c200721
Wang Min, Huang Long-Wang, Yang Chen-Guang. Event-triggered
adaptive critic fault-tolerant control for a class of discrete-time
MIMO systems. Acta Automatica Sinica, 2022, 48(5): 1234−1245 doi:
10.16383/j.aas.c200721
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200721?viewType=HTML
文章简介
关键词
事件触发控制, 自适应评判设计, 神经网络, 离散非线性系统
摘 要
本文针对具有执行器故障的一类离散非线性多输入多输出(Multi-input multi-output,
MIMO
)系统, 提出了一种基于事件触发的自适应评判容错控制方案. 该控制方案包括评价和执行网络. 在评价网络里,
为了缓解现有的非光滑二值效用函数可能引起的执行网络跳变问题, 利用高斯函数构建了一个光滑的效用函数,
并采用评价网络近似最优性能指标函数. 在执行网络里, 通过变量替换将系统状态的将来信息转化成关于系统当前状态的函数,
并结合事件触发机制设计了最优跟踪控制器. 该控制器引入了动态补偿项, 不仅能够抑制执行器故障对系统性能的影响,
而且能够改善系统的控制性能. 稳定性分析表明所有信号最终一致有界且跟踪误差收敛于原点的有界小邻域内.
数值系统和实际系统的仿真结果验证了该方案的有效性.
引 言
随着现代工业的快速发展, 无线通信技术被广泛用于各类控制系统中, 以解决工业过程的远程控制问题,
同时提高设备安装和配置的灵活性. 例如, 地面站对高空无人机的控制,
以及控制台对作业车间中工业机器人的远程控制等都是借助无线通信技术来实现的. 然而, 在网络资源受限的情况下,
传统的周期性数据传输和执行的控制方式很容易引发网络拥塞. 针对该问题, 文献[3]提出了事件触发的控制策略.
该策略通过仅在满足触发机制要求时进行数据传输, 从而有效地减少了控制系统中网络资源的占用. 结合事件触发策略,
自适应控制和万能逼近器等技术, 大量针对不确定非线性系统的事件触发控制方案相继被提出. 需要指出的是,
上述方案极少考虑系统存在非匹配的不确定非线性动态情况, 即不确定非线性动态出现在非控制输入通道. 事实上,
非匹配的非线性动态普遍存在于各种实际系统, 如无人车, 机械臂和飞行器等. 针对嵌入了“控制器−执行器网络”的非匹配非线性系统,
国内外学者们提出了大量具有相对或绝对事件触发条件的控制方案. 由于事件触发条件设计与系统稳定性的强耦合特性,
导致上述方案很难拓展到嵌入“传感器−控制器网络”的不确定非匹配非线性系统. 为了解决该难题,
文献[16]结合脉冲动力系统和死区算子等技术, 提出了具有自适应事件触发条件的控制方案. 需要说明的是,
上述方案仅适合于连续系统.
相比于连续系统, 离散系统更适用于描述数字化系统的控制过程. 然而, 离散系统事件触发控制方面的研究成果寥寥无几.
造成这一现象的主要原因是直接利用反步法对离散非匹配系统进行控制器设计时, 通常会产生非因果问题[17],
故而难以将连续系统的研究成果直接推广到对应的离散系统上. 为了克服该问题, 文献[18]先将原系统转化成一个n步向前预测模型,
并在该模型上进行反步控制设计. 在假设网络资源充足的前提下, 大量基于n步预测器的离散非匹配非线性系统的控制方案相继被提出.
考虑到远程控制中网络资源受限问题, 文献[23]尝试提出了基于n步预测模型的事件触发自适应神经网络控制方案. 然而,
文献[23]设计的控制器存在n步滞后现象, 且触发条件复杂不便于实施.
在此基础上,文献[24-25]探讨了随机噪声情况下离散非匹配非线性系统的事件触发控制问题. 值得注意的是,
上述的方案都没有考虑事件触发下系统的最优控制问题和可能出现的执行器故障现象.
众所周知, 在资源受限的情况下考虑如何利用有限的资源来优化系统性能以及减少资源浪费是非常有必要的.
动态规划是常用的解决最优化问题的有效方法之一, 但是控制动态规划后向寻优的求解过程的矛盾以及系统维数较高时所导致的“维数灾”问题,
使得动态规划难以在系统的最优化控制中得到大规模的应用. 为了解决此问题, 文献[27]通过采用“执行−评价”结构,
提出了自适应评判设计方法. 该方法使得执行网络能够根据评价结果适时调整控制策略, 从而达到实时寻优的目的. 目前,
自适应评判设计被广泛应用于解决离散和连续系统的最优控制问题.
如何将该方法推广到具有网络资源受限的离散非匹配非线性系统控制中是亟待解决的问题. 此外, 执行器故障广泛存在于工业生产过程中.
执行器故障会导致系统性能下降, 甚至导致系统不稳定. 因此, 在执行器故障下,
研究离散非匹配非线性系统的事件触发自适应评判容错控制具有重要意义.
基于上述分析, 本文着重研究具有非匹配结构的离散多输入多输出(Multi-input multi-output,
MIMO)非线性系统的事件触发自适应评判容错控制问题. 与现有的结果相比, 本文的贡献可归纳如下:
1)构造光滑的效用函数来构建系统的长期性能指标函数,
从而避免了现有的非光滑二值效用函数切换过程中可能引起的评价网络和执行网络跳变现象;
2)采用变量替换法将系统的将来信息表示成关于系统当前状态的函数, 从而避免了控制设计过程中的非因果问题和控制信号的n步时延问题;
3)通过在控制器中引入动态补偿项, 并结合自适应评判设计方法,
从而改善了系统控制性能和进一步降低了事件触发次数.

图 1 网络控制系统框图
作者简介
王
敏
华南理工大学自动化科学与工程学院教授. 主要研究方向为智能控制与学习, 机器人控制和网络控制系统.
本文通信作者.
E-mail: auwangmin@scut.edu.cn
黄龙旺
华南理工大学自动化科学与工程学院博士研究生.
主要研究方向为智能控制和网络控制系统.
E-mail: longwang_huang@126.com
杨辰光
华南理工大学自动化科学与工程学院教授.
主要研究方向为人机交互和智能系统设计.
E-mail: cyang@ieee.org
相关文章
[1] 陈世明, 邵赛, 姜根兰. 基于事件触发二阶多智能体系统的固定时间比例一致性. 自动化学报,
2022, 48(1): 261-270. doi: 10.16383/j.aas.c190128
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190128?viewType=HTML
[2] 杨彬, 周琪, 曹亮, 鲁仁全. 具有指定性能和全状态约束的多智能体系统事件触发控制.
自动化学报, 2019, 45(8): 1527-1535. doi:
10.16383/j.aas.c190252
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190252?viewType=HTML
[3] 闵惠芳, 段纳. 基于神经网络的高阶随机非线性系统的状态反馈控制. 自动化学报, 2014,
40(12): 2968-2972. doi: 10.3724/SP.J.1004.2014.02968
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2014.02968?viewType=HTML
[4] 李靖, 李俊民, 陈为胜. 随机非线性严格反馈系统的自适应神经网络输出反馈镇定. 自动化学报,
2010, 36(3): 450-453. doi:
10.3724/SP.J.1004.2010.00450
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2010.00450?viewType=HTML
[5] 陈杰, 李志平, 张国柱. 变结构神经网络自适应鲁棒控制. 自动化学报, 2010, 36(1):
174-178. doi: 10.3724/SP.J.1004.2010.00174
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2010.00174?viewType=HTML
[6] 王良勇, 柴天佑, 方正. 考虑驱动系统动态的机械手神经网络控制及应用. 自动化学报, 2009,
35(5): 622-626. doi: 10.3724/SP.J.1004.2009.00622
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2009.00622?viewType=HTML
[7] 魏庆来, 张化光, 崔黎黎. 基于数据自适应评判的离散2-D系统零和博弈最优控制. 自动化学报,
2009, 35(6): 682-692. doi:
10.3724/SP.J.1004.2009.00682
http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2009.00682?viewType=HTML
[8] 石宇静, 柴天佑. 基于神经网络与多模型的非线性自适应广义预测控制. 自动化学报, 2007,
33(5): 540-545. doi: 10.1360/aas-007-0540
http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-0540?viewType=HTML
[9] 戴先中, 刘国海. 两变频调速电机系统的神经网络逆同步控制. 自动化学报, 2005,
31(6): 890-900.
http://www.aas.net.cn/cn/article/id/15925?viewType=HTML
[10] 张天平. 基本积分型李亚普诺夫函数的直接自适应神经网络控制. 自动化学报, 2003,
29(6): 996-1001.
http://www.aas.net.cn/cn/article/id/16336?viewType=HTML
[11] 胡寿松, 周川, 胡维礼. 基于神经网络的模型跟随鲁棒自适应控制. 自动化学报, 2000,
26(5): 623-629.
http://www.aas.net.cn/cn/article/id/16568?viewType=HTML
[12] 佟绍成, 李庆国, 柴天佑. 基于神经网络的一类非线性系统自适应输出跟踪. 自动化学报,
2000, 26(3): 296-302.
http://www.aas.net.cn/cn/article/id/14737?viewType=HTML
[13] 王福利, 李明忠. 基于线性化神经网络的一类非线性系统优化迭代控制. 自动化学报, 1999,
25(3): 421-424.
http://www.aas.net.cn/cn/article/id/16701?viewType=HTML
[14] 孙富春, 孙增圻, 张钹. 基于观测器的机械手神经网络自适应控制. 自动化学报, 1999,
25(3): 295-302.
http://www.aas.net.cn/cn/article/id/16725?viewType=HTML
[15] 戴先中, 刘军, 冯纯伯. 连续非线性系统的神经网络α阶逆系统控制方法. 自动化学报,
1998, 24(4): 463-468.
http://www.aas.net.cn/cn/article/id/16841?viewType=HTML
[16] 汪镭, 周国兴, 吴启迪. 基于人工神经网络在线参数跟踪的自适应交流传动系统. 自动化学报,
1997, 23(4): 543-546.
http://www.aas.net.cn/cn/article/id/16982?viewType=HTML
[17] 李银国, 张邦礼, 曹长修. 非线性控制系统线性化与极点配置的神经网络方法. 自动化学报,
1996, 22(6): 708-712.
http://www.aas.net.cn/cn/article/id/17107?viewType=HTML
[18] 孙富春, 孙增圻, 张戎军. 采样非线性系统的神经网络稳定自适应控制. 自动化学报, 1996,
22(6): 648-656.
http://www.aas.net.cn/cn/article/id/17099?viewType=HTML
[19] 苗振江, 袁保宗. 非线性连续联想记忆神经网络的分析和优化设计. 自动化学报, 1995,
21(3): 333-340.
http://www.aas.net.cn/cn/article/id/13963?viewType=HTML
[20] 倪先锋, 陈宗基, 周绥平. 基于神经网络的非线性学习控制研究. 自动化学报, 1993,
19(3): 307-315.
http://www.aas.net.cn/cn/article/id/14238?viewType=HTML