严格反馈型非线性系统的输出反馈控制
- 格式:pdf
- 大小:699.51 KB
- 文档页数:32
具有输出限制的纯反馈系统的神经网络控制史昱;尹丽子【摘要】为了研究一类具有输出限制的不确定非线性纯反馈系统的自适应神经网络追踪控制问题,利用神经网络的非线性逼近能力与自适应控制的反推法给出该系统的自适应控制器;利用障碍Lyapunov函数与隐函数存在定理进行控制器的设计.结果表明,该控制方法保证了闭环系统所有信号的半全局一致最终有界性.%To investigate the adaptive neural network tracting control problem of a class of uncertain nonlinear pure-feedback systems with output constraints, an adaptive controller of the systems was provided by using the ability of Neural Network approximation and the adaptive backstepping techniques.The controller was designed by the barrier Lyapunov function and the implicit function theorem.The results show that the developed control scheme guarantees semiglobally uniform ultimate boundedness of all the signals in the closed-loop systems.【期刊名称】《济南大学学报(自然科学版)》【年(卷),期】2017(031)005【总页数】7页(P394-400)【关键词】纯反馈系统;输出限制;障碍Lyapunov函数;隐函数定理;自适应控制【作者】史昱;尹丽子【作者单位】山东交通学院理学院,山东济南250357;济南大学数学科学学院,山东济南250022【正文语种】中文【中图分类】O231.2多层神经网络、径向基(RBF)神经网络、高阶神经网络可以在紧集内以任意精度逼近非线性函数,具有良好的函数逼近能力,被广泛应用于系统函数未知的控制工程[1-2]。
摘要对于几类严格反馈的非线性系统, 本文依据模糊逻辑系统、Backstepping技术、command滤波和Nussbaum函数等方法对其进行控制器设计, 并且进行了稳定性分析. 具体内容如下:1.针对一类具有状态约束的严格反馈非线性系统, 构造了一个模糊跟踪控制器, 借助于模糊逻辑系统来近似非线性函数, 所提出的控制方案解决了有限时间跟踪控制问题.2.针对一类具有不确定参数的随机非线性系统, 构造了一个有限时间跟踪控制器. 通过构造一个tan−型的障碍Lyapunov函数, 证明了闭环系统是有限时间稳定的;跟踪误差在有限时间内收敛到零的一个足够小的邻域内.3.针对一类具有不确定扰动的非线性系统, 讨论了基于command滤波的有限时间自适应模糊控制问题. 通过用误差补偿信号和模糊逻辑系统, 提出了一个模糊控制方案, 保证了输出跟踪误差在有限时间内收敛到零的一个足够小的邻域内, 并且闭环系统中的所有信号都是有界的.4.为了处理一类具有未知控制方向的非线性系统, 提出了一个基于command滤波的自适应控制方案. 在控制方案中, 用模糊逻辑系统来处理非线性函数、用command滤波来解决由重复可导的虚拟函数引起的复杂性问题、用Nussbaum函数来解决未知控制方向问题.关键词:非线性系统; 模糊逻辑系统; 障碍Lyapunov函数;command滤波; 误差补偿信号;Nussbaum函数.ABSTRACTFor several classes of strict-feedback nonlinear systems, the controller is designed and stability is analyzed in this paper based on fuzzy logic system, backstepping technique, command filter and Nussbaum function. The specific contents are as follows:1. A fuzzy tracking controller is constructed for a class of strict-feedback nonlinear systems with full state constraints. Because fuzzy logic system is used to approximate the unknown nonlinear functions, the proposed control scheme addresses the finite-time tracking control problem.2. A finite-time tracking controller is constructed for a class of stochastic nonlinear systems with parametric uncertainties. By constructing a tan-type Barrier Lyapunov Function, the proposed control scheme ensures that the closed-loop system is finite-time stable and the output tracking errors converge to a sufficiently small neighborhood of the origin in finite-time.3. A command filter-based finite-time adaptive fuzzy control problem is discussed fora class of nonlinear systems with uncertain disturbance. By using the error compensation signals and fuzzy logic system, a fuzzy control scheme is proposed to ensure that the output tracking errors converge to a sufficiently small neighborhood of the origin in finite-time and all signals in the closed-loop systems are bounded.4. To deal with a class of nonlinear systems with unknown control directions, a command filter-based adaptive control scheme is proposed. In the design process, fuzzy logic system is required to handle nonlinear functions, command filter is employed to settle the explosion of complexity problem arose from repeated differentiation of virtual control function and Nussbaum function is introduced to deal with the problem of unknown control directions.Key words:nonlinear systems; fuzzy logic system; Barrier Lyapunov Function; command filter; error compensation signals; Nussbaum function.目录第一章前言 (1)1.1论文研究背景 (1)1.2本文的主要研究内容和安排 (3)第二章一类状态约束非线性系统的有限时间自适应模糊控制 (5)2.1模型描述及基本假设 (5)2.2控制器设计和稳定性分析 (7)2.3仿真结果 (12)2.4本章小结 (14)第三章一类状态约束随机非线性系统的有限时间跟踪控制 (15)3.1模型描述及基本假设 (15)3.2控制器设计和稳定性分析 (16)3.3仿真结果 (23)3.4本章小结 (25)第四章一类未知扰动非线性系统的有限时间自适应模糊控制 (26)4.1模型描述及基本假设 (26)4.2控制器设计和稳定性分析 (27)4.3仿真结果 (32)4.4本章小结 (33)第五章一类未知控制方向非线性系统的自适应跟踪控制 (34)5.1模型描述及基本假设 (34)5.2控制器设计和稳定性分析 (35)5.3仿真结果 (41)5.4本章小结 (42)第六章总结与展望 (43)参考文献 (44)致谢 (49)攻读硕士学位期间参与的科研项目和发表的学术论文 (50)第一章前言1.1 论文研究背景在工业、生活和生产中, 几乎所有系统都可以用非线性系统来描述, 例如机器人控制设计、无人机飞行器设计和网络信号传输控制设计等. 研究非线性系统为解决实际问题提供了理论帮助. 不像线性系统因其数学模型比较简单和容易建立, 非线性系统中包含了各种未知因素和扰动, 并且其系统不满足叠加原理. 所以研究非线性系统具有非常重要的意义.在之前的研究中, 可以用泰勒展式等处理非线性函数, 将其转化为线性问题, 从而应用线性系统完善的理论和方法解决非线性问题. 但是随着科技、计算机技术的发展和非线性系统的进一步研究, 应用线性系统来解决非线性问题显得捉襟见肘. 为了在研究中保证实际系统的良好性能和稳定性, 需要对实际系统建立精确的模型. 而实际系统存在不确定性和扰动等因素, 例如实际系统中能量消耗、重心转移引起的误差因素和系统本身的时滞性等. 这些因素难以测量, 不被我们熟知, 所以对非线性系统的研究比线性系统的研究更加困难和具有挑战性. 为了使非线性系统更加接近实际问题, 考虑非线性系统的不确定性是十分必要的.由于许多被控对象的数学模型随时间、能量消耗、环境等的变化而变化. 针对这类变化, 研究者们提出了许多解决方案. 当其数学模型变化的范围较小时, 可用反馈控制、最优控制等来消除或减弱对控制性能的不利影响. 而数学模型的变化范围较大时, 以上方法不可用, 从而引发了人们对自适应控制问题的研究. 在50年代末, Whitaker首次在飞机自动驾驶问题上提出了自适应控制方案, 但是没有进行实际应用. 1966 年, Parks根据Lyapunov方法提出了自适应算法, 保证了系统的全局渐近稳定. 但是该算法降低了自适应对干扰的抑制能力. Landau把超稳定性理论应用到自适应控制中, 使得系统是全局渐近稳定的, 并且增强了系统的抗干扰能力. 由于自适应控制对系统有良好的控制性能, 到目前为止自适应控制理论被广泛应用在线性系统理论、非线性系统理论、计算机控制、航空航天、空间飞行器的控制等各个方面[1]-[2].20世纪90年代初, 非线性系统自适应控制的研究引起越来越多的关注.Kanellakopoulos,Kokotovic和Morse等对部分线性的严格反馈系统提出了自适应反推(backstepping)方法. 在此基础上, [3]首次介绍了非线性系统的自适应backstepping设计方法. 但是, 由于自适应理论刚刚发展, 早期的backstepping方法还不成熟, 即存在过度参数化问题. Jiang和Praly将推广的匹配条件应用到高阶非线性系统, 成功的将估计参数减少了一半.Krsti在文[6]中通过引入调节函数处理了估计参数, 彻底地解决了过度参数化问题. 由于自适应backstepping设计方法不要求非线性系统满足匹配条件, 因此, 该方法在近年来引起了广泛的应用[4]-[10]. 但是backstepping设计方法Ge S S和存在局限性, 那就是针对的系统是严格反馈的非线性系统. 在2002年, .. Wang C用均值定理和隐函数定理, 通过设计backstepping方法, 解决了纯反馈系统.的自适应跟踪控制问题. 但到目前为止, 对于非严格反馈系统的控制器设计还没有得到解决.backstepping设计方法采用反向递推的设计思想, 对于严格反馈的系统, 将其分解成不超过系统阶数的子系统, 在每一个子系统中设计相应的Lyapunov函数和虚拟控制信号, 使得其具有一定的收敛性. 在下一个子系统中, 将上一个虚拟控制律作为跟踪目标, 获得该子系统的虚拟控制信号. 以此类推, 完成了整个backstepping设计, 构造了跟踪控制器, 并且实现系统的全局调节或跟踪.L A Zadeh在为了用数学方法解决自然界中不精确的信息, 1965年, 美国科学家..论文Fuzzy Set中提出了模糊理论. 模糊理论是建立在模糊集合和模糊逻辑的基础上,用于描述模糊信息, 处理模糊现象的一种新的数学工具. 至此, 模糊集理论得到了飞跃性的发展. 模糊控制是以模糊集理论、模糊语言变量、模糊逻辑推理为基础的一种智能控制, 是智能控制的重要组成部分. 同时, 模糊控制也是控制领域中非常有前景的一个分支, 并且已经得到了成功的应用. 1974年, Mamdani利用模糊语言构成模糊控制器, 首次在蒸汽机和锅炉的控制中应用模糊控制理论.当模糊控制应用于复杂的非线性系统时, 为了得到更好的控制效果, 需要有更完善的控制策略. 由于系统本身的性质、外界扰动等影响, 造成了原有的模糊机制不完善. 为了弥补这一问题, 自适应模糊控制被提出[11]. 自适应在处理和分析过程中, 能够自动的调节处理方法、参数等, 通过在线辨识, 使其达到最佳的效果, 使模型越来越接近实际系统. 将自适应控制和模糊控制相结合, 形成具有自我调节能力的更完善的控制系统. 根据控制对象的动态变化, 实时地调整对应的模糊控制器, 从而更有效的解决了非线性问题. 由于该控制系统能够不断的调节自己的控制机制来改变其性能, 因此越来越多的控制方案应用到工业、电力系统、航空航天等实际性问题中, 并且取得了令人瞩目的结果[12]-[17].在实际系统中, 我们常常需要在有限的时间内实现收敛. 因此, 有限时间控制问题已成为一个重要的研究课题. 随着有限时间稳定性理论的发展, 近年来有限时间控制问题得到了研究, 并给出了非线性系统的有限时间控制结果[18]-[27]. 随机现象在制造过程、机器人操作系统等实际系统中经常发生, 它会引起系统的不稳定性. 因此, 随机是需要考虑的另一个重要因素, 对随机非线性系统的研究近年来也受到越来越多的关注[28]-[38].此外, 以上文献中的控制方法都存在计算复杂性问题. 因为backstepping技术在α进行重复求导, 导致较高阶虚拟控制器和最终实际控每一步中都要对虚拟控制器i制器所含项随着系统阶数的增加呈现爆炸性增长, 使得控制器的计算复杂程度剧增, 从而限制了这种方法在实际工程中的应用. 庆幸的是, 文献[39]首次提出了一种动态面控制技术, 解决了以上复杂性问题. 随后, Levant[40]提出了Command滤波, 用来解决重复可导的虚拟控制器引起的复杂性问题. 之后, 各种非线性系统的动态面自适应控制方案[41]-[44]和Command滤波自适应控制方案[45]-[50]被提出.控制方向代表了系统在任意控制下的运动方向, 在控制设计中具有重要意义. 但是控制方向很难检测或从物理意义上决定, 这使得控制设计更加困难. 连续Nussbaum增益法在控制设计中易于实现, 是解决控制方向未知问题的一种常用方法. 该方法的关键是利用Nussbaum函数去估计控制系数的符号, 从而解决非线性系统中未知控制方向的问题[51]-[58].总的来说, 本文在有关不确定非线性系统的自适应控制方面已经取得了一定的研究成果, 但是还需要进一步的讨论与研究. 本文对几类严格反馈的非线性系统进行了稳定性分析及控制器设计, 对进一步研究基于自适应backstepping方法的非线性不确定系统控制问题具有一定的参考价值.1.2 本文的主要研究内容和安排本文主要对于几类严格反馈的非线性系统, 进行了控制器的设计, 并且以自适应控制、backstepping设计方法和模糊控制为理论基础进行了稳定性分析. 全文内容安排如下:第一章: 前言. 介绍了论文的研究背景以及本文的主要研究内容和安排.第二章: 针对一类状态约束的严格反馈非线性系统, 构造了一个模糊跟踪控制器, 证明了输出跟踪误差信号在有限时间收敛到零的任意小的领域内, 同时闭环系统中所有的信号都是有界的.第三章: 针对一类具有不确定参数的随机非线性系统, 研究了状态约束严格反馈随机非线性系统的稳定性问题, 证明了系统输出能够有效地跟踪参考信号, 并且闭环系统中所有的信号都是有界的.第四章: 针对一类具有不确定扰动的非线性系统, 构造了一个命令滤波模糊控制器, 保证了误差收敛于零的任意小邻域内, 而且系统中闭环信号均有界.第五章: 对于一类控制方向未知的非线性系统, 提出了一个command滤波跟踪控制方案. 保证了误差信号收敛到原点附近, 并且所有闭环信号都是有界的.第六章: 对全文的工作做了总结, 并指出了以后的工作中需要解决的问题.以上章节均给出仿真实例, 并且验证了所提出的方法的有效性.第二章 一类状态约束非线性系统的有限时间自适应模糊控制针对一类严格反馈的非线性系统, 本章设计了一个有限时间模糊跟踪控制器. 将tan −型障碍Lyapunov 函数、模糊逻辑系统和backstepping 技术灵活地结合起来, 给出了控制器的设计步骤. 所提出的控制方案保证了输出跟踪误差在有限时间内收敛到零的任意小的领域内, 同时系统中的所有信号均有界. 仿真实例说明了该方法的有效性.2.1 模型描述及基本假设2.1.1 模型描述:考虑如下严格反馈非线性系统:11,11,()()((,),)i i i i i i n n n n n i x f x g x x x f x g x n x u y +=≤≤−+==+ (2-1)其中12[,,,],,T n n x x x x R y R u R ∈∈∈ 分别为系统状态、输出和输入; 12[,,,]T i i x x x x = ; ()i i f x 是未知的光滑非线性函数并且满足(0)0i f =; ()i i g x 是已知的光滑非线性函数; 内, i c k 是正常数. 本章的目的是针对系统(2-1), 设计一个有限时间模糊跟踪控制器, 使得:(1)输出在有限时间内能够很好地跟踪参考信号;(2)闭环系统中所有信号均有界;(3)所有的状态都不能违反其约束边界.2.1.2 基本假设:模糊逻辑系统的基本原理:IF-THEN 规则: i R : 如果1x 属于1i F , ..., n x 属于i n F , 则y 属于,1,,i B i N = , 其中12[,,,],T n n x x x x R y R ∈∈ 分别为系统状态和输出; i j F 和i B 是模糊集; ()j i j F x µ和()iB y µ是模糊隶属度函数. 通过模糊系统规则, 可以将模糊逻辑系统表示为1111()()[()]i j i j nN i j F i j n N j F i j x y x x µµ====Φ=∑∏∑∏, 其中()i i y R B max y µ∈Φ=. 令111(()[)()]i j i j n j F j i n N j F i j x p x x µµ====∏∑∏, 12()[(),(),,()]T N P x p x p x p x = ,1[,,]T N Φ=ΦΦ , 则上式可写成()()T y x P x =Φ. (2-2)引理 2.1[16]. ()f x 是定义在紧集Ω上的一个连续函数, 则对于任何给定的常数0ε>, 存在模糊逻辑系统(2-2), 使得()()T x sup f x P x ε∈Ω−Φ≤.引理2.2[18]. 对于任何实数1,,n x x …和01b <<, 以下不等式成立:n 11(++)b n b bx x x x …≤…++. 定义2.1[19]. 如果对于任意00()t ζζ=, 存在正常数ε和驻留时间0(,)T εζ<∞, 对任意1120210()ln (1)1T V x λλµµµµ−+−≤.推论2.1.对于任何实数12,00µµ>>, 01λ<<, 01β<<和0τ<<∞, 如果存在一个21102011122()1ln (1)()(1)V x T λλλµβµµλτµβµβµ−−+≤−+−. 证明: 从(2-3)可知, 对于任意01β<<, 有122()()()(1)().V x V x V x V x λλµβµβµτ≤−−−−+定义集合2{()}(1)x x V x λτβµΩ=≤−∣和2{()}(1)x x V x λτβµΩ=>−∣. 以下分两种情形进行讨论: 情形1: 如果()x x t ∈Ω, 则12()()()V x V x V x λµβµ≤−− , 所以假设1. 对于连续函数)(i i g x , 存在正常数0g , 满足00()i i g g x <≤. 不失一般性, 假2.2 控制器设计和稳定性分析在这一部分中, 对于系统(2-1), 构造了一个有限时间自适应模糊跟踪控制器. 首先, 定义111,,id i i x y x ξξα−=−=− (2-5) 其中i ξ是状态跟踪误差, i α是虚拟控制器并且满足i i αα<, i α是正常数. 定义2i i θΦ. 给出以下tan −型的候选障碍Lyapunov 函数:22*2tan()2ii i b i b k V k πξπ=,其中:{,,1,,}i i i i b R k i n ξξξξ∈Ω=∈<=…, 11010,0i ib c b c i k k Y k k α−=−>=−>.第1步: 由(2-5)可得11112.d d x y f g x yξ−+==−选择如下障碍Lyapunov 函数:*121112V V θ=+ , 其中111ˆθθθ=− , 并且1ˆθ为1θ的估计. 定义222cos ()2iiiib k ξξϑπξ=, 计算1V 的导数:11122111111221112111ˆ(())cos ()2ˆ()),(d b V f g y k f g ξαθθπξϑξαξξθθ=−−=++−++ (2-6)其中11d f f y =− . 由引理2.1可知, 对于任何10τ>, 存在模糊逻辑系统111()TP X Φ, 使得以下式子成立:111111111()(),,()Tf P X X X δδτ=Φ+≤11)(X δ为近似误差. 通过使用'Young s 不等式, 可以得到:1111122221111111111121()()2222TTP P a f P X X a ξξξξξϑθϑτϑϑϑδ=Φ+≤+++, (2-7)1a 是一个给定的正常数. 设计虚拟控制器1α如下:11111122221111,1222111121111sin()cos()cos ()ˆ2221[]22tan Tb b b K K S k k k P P g aαξξπξπξπξϑθϑαξξ=−−−−, (2-8)其中1100,K K α>>是常数, ,tan i S 定义为:22,2221222tan ta (),0,2()(),,t 22n an i i i i i i b tan ii i i i b b if k S l l else k k απξξεπξπξ ≥> = +(2-9) 2212122251(),(),01,tan tan 04422i i i ii i i b b l l k k ααπεπεαε−−==−<<>. 根据洛必达法则可得 11221112211sin()cos()220,0.b b K k k πξπξξξ→→当这意味着奇点不会出现在1α的第一项中. 构造(2-9)是为了避免奇点发生在1α的第二项中. 根据洛必达法则, 有11221,1211cos ()20,0tan b K S k απξξξ→→当.将(2-7), (2-8)代入(2-6), 得到1111111111111122221111111211121222222221111111111112112222112211122ˆ()2222ˆˆ()(tan )22222222()(2tan tan tan 2TT T b b b b P P a V g a P P P P a K K g k k a a K K k k ξξξξξξξααξααϑθϑτϑξαθθϑθϑϑθϑπξπξτϑξθθπξπξ+++++−≤−−−−+++++−−−≤≤ 112221111121121ˆ)().222T P P a g a ξξϑτϑξθθ++++− (2-10)第i 步: 从(2-5), 可以得到111()ii i i i i i i x f g ξαξαα−+−=−=++− . 其中111(1)11111()101ˆ()ˆi i i j i i i j j jj i j d j j j j jd f g x y x y ααααθθ−−−+−−−−+===∂∂∂=+++∂∂∂∑∑∑ . 定义候选障碍Lyapunov 函数: 2112i i i i V V V θ∗−=++ , 其中ˆi i i θθθ=− , 并且ˆiθ是i θ的估计. 计算i V 的导数, 则有1111111ˆ(())ˆ(()),i iii i i i i i i i i i i i i i i i i i i V V f g g V f g ξξξξϑξααθθϑξϑξαθθϑ−−+−−−+=+++−−=+++−− (2-11) 其中111ii i ii i i g f f ξξϑξαϑ−−−=−+ . 根据引理 2.1, 对于任意0i τ>, 存在模糊逻辑系统()i i T i P X Φ, 使得下式成立:()(),,()i i i i i i i i T i f P X X X δδτ=Φ+≤)(i i X δ是近似误差. 利用'Young s 不等式, 以下不等式成立22222()(),2222iiiii i i i i i i i T i ii i i Tf P X X P P a a ξξξξξϑϑϑδϑθϑτ=Φ+≤+++ (2-12)i a 是一个给定的正常数. 设计控制器i α为2222,2222sin()cos()cos ()ˆ2221[]22i iiiiitan iT b i i i i i i ii ii b b iiK K S k k k P P g aαξξπξπξπξϑθϑαξξ=−−−−, (2-13)0,0i i K K α>>是常数. 相似于1α, 奇异点将不会发生在i α中, 将(2-10)、(2-12)和(2-13)代入(2-11), 可得1122222222222211122122112ˆ()222ˆˆtan()tan ()222222222i i i i i i i ii i i i i i i ii i i i i i i i iT T i i i i i i i i i i i i i i i i i b b i T i i i i P P P P a V K K P P a g g k k a V g a a V g ξξξξξξξααξξξϑθϑϑθϑθϑτϑξαϑξθθϑπξπξτϑξϑξθ−−−++−−−≤++++≤−−−−+++++−−++−− 2222212221111ˆ()()()().2222tan tan 2j j i j j i iiii j j j j j jj i j j T i j j j j b b j P g a P a K K k k ξααξϑπξπξτϑθθξθ+====≤−−++++−∑∑∑∑ (2-14)第n 步: 从(2-5), 可以得到11n n n n n n xf g u ξαα−−=−=+− , 其中111(1)11111()101ˆ()ˆn n n j n n n j j j jn j d j j j j jdf g x y x y ααααθθ−−−+−−−−+===∂∂∂=+++∂∂∂∑∑∑ . 定义候选障碍Lyapunov 函数: 2112n n n n V V V θ∗−++ , ˆn n nθθθ=− , 并且ˆn θ是n θ的估计. 计算n V 的导数, 可得11111ˆ()ˆ(),n n nnn n n n n n nn n n n n n n V V f g u g V f g u ξξξξϑαθθϑξϑθθϑ−−−−−=++−−=++−− (2-15)其中111n nn n nn n g f f ξξϑξαϑ−−−=−+ . 根据引理 2.1, 对于任意0n τ>, 存在模糊逻辑系统()n n T n P X Φ, 使得下式成立:()(),,()T n n n n n n n n n f P X X X δδτ=Φ+≤)(n n X δ是近似误差. 利用'Young s 不等式, 以下不等式成立22222()(),2222nnnnn T n n n n n n T n n nnn nf P X X P P a a ξξξξξϑϑϑδϑθϑτ=Φ+≤+++ (2-16)n a 是一个给定的正常数. 设计控制器u 为2222,2222sin()cos()cos ()ˆ2221[]22nnnnnnn n nn tan nT b b b n n n n n n nK K S k k k P P u g a αξξπξπξπξϑθϑξξ=−−−−, (2-17)0,0n n K K α>>是常数. 相似于1α, 奇异点将不会发生在n α中, 将(2-14)、(2-16)和(2-17)代入(2-15), 可得112222222212222111222122ˆˆtan()tan ˆ222()22222222ta 2n(n n n n n n n n nn n n T T n n n n n n n n n n n n n n n n b T n n nn n n n nn n n n nnb ni n i P P P P a V K K g k k a a P P a V V g u g a K ξξξξξααξξξξϑθϑϑθϑπξπξτϑξθϑθϑτϑϑξθθπξθ−−−−−−=≤+++++−≤−−−−++++−−−≤−∑ 22222222111ˆ)()()().2222tan 2iiiiT n n n i i i i i i i i i i i b b i P P a K k k a ξααϑπξτθθ===−+++−∑∑∑ (2-18) 设计自适应率为22ˆˆ2i T i i i i ii P P a ξϑθσθ=− , 则(2-18)能够写成 2222221111ta ˆ()()n t 22a )n (22i i i n n n ni i i i n i i i i i i i b b ia V K K k k ααπξπξτσθθ====≤−−+++∑∑∑∑ . (2-19) 由'Young s 不等式, ˆi i i σθθ 满足2222222222222ˆ222222(1)22222(1)(1).2222i i i i i i i i i i i i i i ii i i i i i i i ii i i i i i iαααασθσθσθθσθσθσθσθσθσθσθασθασσθασθσθασ≤−=−−+−≤−−++−−≤−−+ (2-20)将(2-20)代入(2-19), 有22222222211(1)(tan tan 1)(()())().22222222i i i n ni i i i i i i i i i i n i i i b b a V K K k k αααπξπξτσθασθσθασ=−−≤−−+++−−+∑∑(2-21) 定义111122min{,,,(1),,(1)}nn n b b K K k k ππησασα=…−…−, 11112122}min{,,,2,,2n n n b b K K k k ααααααααππησσ−−=……, 则(2-21)能够写成222222122211tan tan 11[()][()]2222ii i inn b b i ini i i i b b k k V C k k αααααπξπξηθηθππ==≤−+−++∑∑ , 其中2221(1)()2222ni i i i i ia C τσθασ=−=+++∑. 由引理2.2可知:12n n nV V V C αηη≤−−+ . (2-22)定理: 在满足假设1和假设2的条件下考虑系统(2-1). 如果设计的控制器是(2-17),虚拟控制信号是(2-13)和自适应律是22ˆˆ2i T i i i i ii P P a ξϑθσθ=− , 则有: (1)未违反状态约束的条件;(2)闭环系统中的所有信号都是有界的; (3) 误差信号()i t ξ将收敛到max{i i ξε<内,并且驻留时间满足: 110111222((0))1ln (1)()(1)n V T Cαααηξβηηαηβηβη−−+≤−+−.证明: 从(2-22)中可得1n nV V C η≤−+ , 解不等式可得111((0))t n n CCV V e ηηη−≤−+. 因此n V 是有界的. 根据2112n n n n V V V θ∗−++ 可知, i V 和i θ 都是有界的. 因此ˆi i iθθθ=+ 也是有界的. 根据122211()(ta (n 0))2iib t i n n b k CV V e kCηπξπηη−≤≤−+可知ii b k ξ<成立. 由(2-5)和假设2可得11110d b c x y k Y k ξ≤+<+=. 从模糊逻辑系统的定义可知111TP P <. 根据假设1可得11i g g ≤, 所以1ig 是有界的. 因此1α是有界的并且满足11αα≤. 从(2-25)和11αα≤可知222211b c x k k ξαα≤+<+=. 所以2α是有界的并且满足22αα≤. 同理可知,3,,i i c x k i n <=…. 因此, 未违反状态约束的条件.因为控制器u 中的所有信号都是有界的,所以控制器u 是有界的, 由以上分析可知闭环系统中的所有信号都是有界的.根据推论 2.1可知, n V 将在有限时间内收敛到紧集12()(1)n n CV V αβη−≤内. 因为21222()()tan (1)2iib i n b k C V kαπξπβη≤≤−,所以max{ii ξε<, 并且收敛时间满足110111222((0))1ln (1)()(1)nV T Cαααηξβηηαηβηβη−−+≤−+−.证明完毕.2.3 仿真结果:考虑以下非线性系统:11221221,.,xx x x x x u y x =+=+= 参考信号是()0.5sin()d y t t =. 初始条件是12(0)=0.1,(0)=0.1x x , 状态约束在12=1.5,=1.5c c k k 内.在状态区间[-1.5,1.5]中定义了7个模糊集. 并且给出了隶属度函数:222123222456270.5( 1.5)0.5(1)0.5(0.5)0.5()0.5(0.5)0.5(1)0.5( 1.5),,,,,,.i i i iiii i i iiiii x x x F F F x x x F F F x F e e e e e e e µµµµµµµ−+−+−+−−−−−−−=======参数设计为121212122,2,1,1,0.75,0.01,0.01,0.01,0.01K K K K ααασσττ=========. 仿真结果如图2-1至2-5.图2-1 输出y 和参考信号d y 图2-2 系统状态1x 和2x图2-3 自适应率1ˆθ和2ˆθ 图2-4 系统输入u图2-5误差信号1S 和2S2.4 本章小结:针对一类具有状态约束的严格反馈非线性系统, 本章提出了一个自适应有限时间模糊控制方案. 在该方案中, 跟踪误差在有限时间内收敛到零的任意小邻域内. 闭环系统中的信号均有界, 并且不违反状态约束的条件.第三章 一类状态约束随机非线性系统的有限时间跟踪控制本章研究了状态约束随机非线性系统的稳定性问题. 采用反推技术设计了基于tan −型障碍Lyapunov 函数的非线性系统有限时间跟踪控制器. 保证了系统输出能够有效地跟踪参考信号, 并且闭环系统中所有信号都是有界的. 最后, 仿真结果说明了所提出的有限时间控制方案的有效性.3.1 模型描述及基本假设3.1.1 模型描述:考虑如下严格反馈非线性系统:11(()())(),1,,1,(()(),)(),T i i i i i i i i Tn n n n n n n dx f x g x x dt x d i n dx f x g x u dt x d y x φωφω+=++=…−=++= (3-1)其中12[,,,],,T n n x x x x R y R u R ∈∈∈ 分别为系统状态、输出和输入; 12[,,,]T i i x x x x = ;()i i f x 是未知的光滑非线性函数并且满足()()T i i i i f x x θϕ=; i ϕ是光滑函数向量, θ是不确定的常数向量满足{,,}m M M R R θθθθθθ+∈Ω=∈≤∈; ()i i g x 是已知的光滑非线性函数;()i i x φ是已知的非线性函数向量; ω是标准维纳过程.所有的状态都严格约束在紧集, 其中ic k 是正常数.本章的控制目标是针对系统(3-1), 设计一个有限时间跟踪控制器, 使得: (1)输出在有界误差范围内跟踪参考信号; (2)闭环系统中的所有信号都有界; (3)并且所有状态都满足约束条件. 3.1.2 基本假设:考虑如下随机系统:()()dxf x dtg x d ω=+,其中x 为状态向量; ()f x R ∈和()n r g x R ×∈满足局部李普希茨条件和线性增长条件, 并且满足(0)0,(0)0f g ==; ω是一个r 维的标准维纳过程.定义3.1[32] . 对于任何给定的正函数2,1(,)V x t C ∈, 我们定义微分算子L 如下:221[(,)]{}2T V V V L V x t f Tr g g t x x ∂∂∂=++∂∂∂, 其中(.)Tr 是矩阵的迹.引理3.1[33]. ()f x R ∈和()n r g x R ×∈满足局部李普希茨条件和线性增长条件, 如果存在一个2C 上的函数V , K ∞类函数12,µµ, 两个常数0c >和01γ<<, 满足12()()(),()(),x V x x LV x cV x γµµ≤≤≤−则系统是有限时间随机稳定的, 并且驻留时间满足:1001[()]()(1)E T x V x c γγ−≤−.引理3.2[34]. 存在一个2C 上的函数V , K ∞类函数12,µµ, 两个常数0γ>和0ρ>, 满足0[()]()/t E V x V x e γργ−≤+.3.2 控制器设计和稳定性分析在这一部分中, 对于系统(3-2), 构造了一个自适应有限时间控制器. 首先, 定义111,,i d i i x y x ξξα−=−=− (3-2) 其中i ξ是虚拟状态跟踪误差, i α是虚拟控制器并且满足i i αα<, i α是正的常数. 给出以下tan −型的候选障碍Lyapunov 函数:444tan()4iib i i b k V k πξπ∗=,其中:{,,1,,}ii i i b R k i n ξξξξ∈Ω=∈<=…, 11010,0iib c b c i k k Y k k α−=−>=−>.第1步: 由11d x y ξ=−和221x ξα=−可得 11112111211()(())T T T T d d d d dx dy g x y dt d g y dt d ξθϕφωθϕξαφω=−=+−+=++−+ .选择如下障碍Lyapunov 函数:1112T V V θθ∗=+ ,其中ˆθθθ=− 并且ˆθ为θ的估计. 定义3442cos ()4i ii ib k ξξϑπξ=, 由定义3.1可知: 111111444261111443211112114423411443cos()2sin()44(())cos ()2cos ()44b b b T T d b b b k k k LV g y k k kπξπξξπξξθϕξαφθθπξπξ+=++−++. (3-3) 令11ωϕ=和111ˆξθτωϑσθ=−. 设计虚拟控制器1α如下: 1111111144421111,144411331114411433322114441144),sin()cos()cos ()4441ˆ(2sin()41(3)cos()cos()44tan b b b T d b b b b K K S k k k y g k k kkαπξπξπξαθωξξπξπξφπξπξ=−−−++ (3-4)其中1100,K K α>>是常数, ,tan i S 定义为:44,4421244tan ta (),0,4()(),,t 44n an i i i i i i b tan ii i i i b b if k S l l else k k απξξεπξπξ ≥> = +(3-5) 4412124451(),()444t n n 4a ta i ii i i i b b l l k k ααπεπε−−==−. 根据洛必达法则可得 114411144131sin()cos()440,0.b b K k k πξπξξξ→→当这意味着奇点不会出现在1α的第一项中. 构造(3-5)是为了避免奇异发生在1α的第二项中. 根据洛必达法则, 有11421,14131cos ()400tan b K S k απξξξ→→当.通过使用'Young s 不等式, 以下不等式成立:1111111114444264111111444333231221114443343411114443cos()2sin()2sin()4441(3)32cos ()cos ()cos()444b b b b b b b b b k k k k S k k kkk πξπξπξξπξπξξφφπξπξπξ+≤++. (3-6)将(3-4)和(3-6)代入(3-3), 得到11111111144421111,1444311112433211144411433322111444114433121431sin()cos()cos ()444(cos ()42sin()41ˆ(3))cos()cos()44cos (4tan b b bT d bbT d b b b K K S k k k LV g y k k y k k k k απξπξπξξθϕξπξξξπξπξθωφπξπξξπξ≤+−−−−++ 111111111114411433214344411111214431144441114431111ˆˆtan()tan ()()442sin()41(3)3)cos()41ˆˆ()()()43tan tan 43bT b b bT T T b T T b bb K K k S k k g k k S K K k k S αξαθξααπξπξθϕξθωθπξπξφθθπξϑπξπξθθτσθθθϑ≤−−++−+−+++≤−−−−+++ 112.g ξ(3-7)第2步: 从221x ξα=−和332x ξα=−可得 22122312223212()(())T T T Td dx d g x dt d g dt d ξαθϕαφωθϕξααφω=−=+−+=++−+ ,其中1111211()Tg x x ααθϕη∂=++∂ ,22()11111111(1)2111ˆ()()ˆ2i Td i i d y x x y x αααηθφφθ−=∂∂∂=++×∂∂∂∑ . 上式可写为 12,2,223212121(())T Tr r d g dt d g x dt x αξθϕξαηφω∂=++−+−∂,其中1,2,2211[,],[,]TT T Tr r x αθθθϕϕϕ∂==−∂, 选择候选障碍Lyapunov 函数:212V V V ∗=+. 由定义3.1可得22222244426222244322121,2,2232112244234122443cos()2sin()44(())cos ()2cos ()44.b b b Tr r b b b k k k LV LV g g x x k k k πξπξξπξξαθϕξαηφπξπξ+∂=+++−−+∂(3-8) 令212212121,x ξαωϕϕττωϑ∂=−=+∂. 设计控制器2α为222221222244422222,2444221332224422433312122221244412244sin()cos()cos()4441ˆ[2sin()41(3)],cos()cos()44tanb b b Tbbb bK K Sk k kgk gg xxkk kαξξπξπξπξαθωηξξπξπξϑξαφϑπξπξ=−−−+∂++−∂(3-9) 220,0K Kα>>是常数. 通过使用'Young s不等式, 下列不等式成立:2222222224444264222222444333232222224443343422224443cos()2sin()2sin()4441(3)32cos()cos()cos()444bb b bb bb b bkk k kSk kk k kπξπξπξξπξπξξφφπξπξπξ+≤++. (3-10) 将(3-7), (3-9)和(3-10)代入(3-8), 得到2222221222244422222,24443221,2,2234332222444224333122222244422443222sin()cos()cos()444(cos()42sin()41ˆ(3))cos()cos()44tanb b bTr rbbTbb bK K Sk k kLV LV gkk gkk kαξξπξπξπξξθϕξπξξξπξπξϑξθωφϑπξπξξ≤++−−−+−2222221222442243332244334222444422122312244324422244112sin()41(3)3cos()cos()441tan()tan()443ˆtan()tan()()44ii ibbb bTb bTi iii ib bkSkk kLV K K g gk k SK Kk kααξξξααπξπξφπξπξπξπξϑξϑξϑθωπξπξθθτ==++≤−−++−≤−−−+−+∑∑2223311ˆ.3Ti igSθξσθθϑξ=++∑(3-11)第i步: 从1i i ixξα−=−和11i i ixξα++=−, 可得111(())Ti i i i iTi i iid dx d g dt dξαθϕξααφω−+−=−=++−+,其中111111()iTii jj jj jig xxααθϕη−−−+−=∂=++∂∑, 21()1111(1)1,11ˆ()()ˆ2ij Ti i ii d kij jjkjj j k kdy x xx xyαααηθφφθ−−−−−−==∂∂∂=++×∂∂∂∂∑∑. 上式能够写成11,,1111(())i iiT T ir i r iji i ji jjid g dt d g x dtxαξθϕξαηφω−−+−+=∂=++−+−∂∑,其中11,,1111[,,],[,,,]T T T Ti ir i r ii iix xααθθθϕϕϕϕ−−−−∂∂=…=−…−∂∂. 选择候选障碍Lyapunov函数:1i iiV V V∗−=+.根据定义3.1可得444264431211,,111441234443cos()2sin()44(())cos ()2cos ()44.i i iiiii i ii i i i i j b i b b Ti i r i r i i j ii i j i j b b b k k k LV LV g g x x k k kπξπξξπξξαθϕξαηφπξπξ−−−+−+=+∂=+++−−+∂∑(3-12)令1111,ii i j i i ji i i j x ξαωϕϕττωϑ−−−=∂=−=+∂∑. 设计控制器i α为14442,444133444331311221441444sin()cos()cos ()4441ˆ[2sin()41(3)],cos()cos()44i i i i ii i i i ii i ii i i i i ta ii ii ij n ib b b T i i b i i i j j b b b j i i K K S k k k g k g g x x k k k αξξπξπξπξαθωηξξπξπξϑξαφϑπξπξ−−−−−+==−−−+∂++−∂∑ (3-13)0,0i i K K α>>是常数.通过使用'Young s 不等式, 以下不等式成立:44442644443332322444334344443cos()2sin()2sin()4441(3)32cos ()cos ()cos()444i iiiiiii ii i i ib b bbii b b b b i ii ii i i ibk k k k S k k kk k πξπξπξξπξπξξφφπξπξπξ+≤++. (3-14) 将(3-11), (3-13)和(3-14)代入(3-12), 得到14442,44431,,14332444433312244444sin()cos()cos ()444(cos ()42sin()41ˆ(3))cos()cos()44i iiii i iii iita i i i i i i i ii i i n ib b b T i r i r i i b b i T ib b b iiiii i K K S k k k LV LV g k k g k kkαξξπξπξπξξθϕξπξξξπξπξϑξθωφϑπξπξ−−+−≤++−−−+−14443333224433444441114434444112sin()41(3)3cos ()cos()441tan()tan ()443tan()tan ()44iii ii i i iiji jj i i iii i i i i i i b it b b b T i i i b b i iij j j b j j b k S k k k LV K K g g kkS K K kk ααξξξααπξπξξφπξπξπξπξϑξϑξϑθωπξπξ−−+−==++≤−−+−++≤−−∑ 1311ˆˆ()3.i iii i jT T i j g S θξθθτσθθϑξ+=−++−+∑∑(3-15)第n 步: 从1nn n x ξα−=−可得 11()T Tn n n n n n n d dx d g u dt d ξαθϕαφω−−=−=+−+ ,其中2111()11111111(1)111,11ˆ()()()ˆ2,n nn n T i Tn n n n n i n n d k k i i i i i k k d i i i i i i g y x x x x x y x αααααθϕηηθφφθ−−−−−−−−+−−−====∂∂∂∂=++=++×∂∂∂∂∂∑∑∑∑ . 上式能够写成11,,111()n TT n nr nr n n n ni i i id g u dt d g x dt x αξθϕηφω−−−+=∂=+−+−∂∑, 其中11,,1111[,,],[,,,]T T T T n n r n r nn n n x x ααθθθϕϕϕϕ−−−−∂∂=…=−…−∂∂. 选择候选障碍Lyapunov 函数: 1n n n V V V ∗−=+. 根据定义3.1可得444264431211,,11441234443cos()2sin()44()cos ()2cos ()4.4nnnnnni n n b nn n b bTn n n n r n r n n n i n i nn b i bb k k k LV LV g u g x x k k kπξπξξπξξαθϕηφπξπξ−−−−+=+∂=++−−+∂∑(3-16)令1111,ni in n n n n n n i x ξαωϕϕττωϑ−−−=∂=−=+∂∑. 设计控制器u 为14442,444133444331311221441444sin()cos()cos ()4441ˆ[2sin()41(3)],cos()cos()44n nnnnn n nnnn n n n tan nb b b T n n nnnn i nn b n n n nni i n n b b ib K K S k k k u g k g g x x k kkαξξπξπξπξθωηξξπξπξϑξαφϑπξπξ−−−−−+==−−−+∂++−∂∑(3-17)0,0n n K K α>>是常数.通过使用'Young s 不等式, 以下不等式成立:44442644443332322444334344443cos()2sin()2sin()4441(3)32cos ()cos ()cos()444nnnnnnnn nn n n b nn nb bbn nnn n n n n bb b b bk k k k S k k kk k πξπξπξξπξπξξφφπξπξπξ+≤++. (3-18)将(3-15), (3-17)和(3-18)代入(3-16), 得到14442,44431,,433244443331224444432sin()cos()cos ()444ˆ(cos ()42sin()41(3))cos()cos()44n n n nnnn nn n nn n nn tan nb b b T T n n n r n r n nn n nb n nb n n nn n nb b b nK K S k k k LV LV k k g k k k αξξπξπξπξξθϕθωπξξξπξπξϑξφϑπξπξξ−−−≤+−−−+−14443332443344444114434444112sin()41(3)3cos ()cos()441tan()tan ()443ˆtan()tan ()()44nnn nn n n n n i i i n nb n n n n n b b b T n nn n n n nb b nnn T i ii n i i b b k S k k k LV K K g k k S K K k k ααξξααθπξπξφπξπξπξπξϑξϑθωπξπξθθτσ−−−==++≤−−+−≤−−−+−+∑∑ 311ˆ.3n T i i S θθ=+∑(3-19)。
无人水面艇模型辨识及其航向非线性控制的研究江立军;慕东东;范云生;王国峰;赵永生【摘要】无人水面艇是一种智能化海洋装备平台,有航速快、机动性强、自动化程度高等特点,可以执行各种危险以及不适合人员参与的任务;航向控制不仅关乎到航行的安全性与经济性,更是实现其无人行驶的基础;为了实现航向的自动控制,首先进行无人艇模型辨识,模型是控制的基础,控制效果的好坏不仅与控制策略有关,更与模型的精度有关;为了提高模型精度,采集Z型和回转实验以数据,通过递推最小二乘对无人艇的数学模型进行辨识;然后将模型的仿真实验与实船数据进行对比,验证了模型的正确性和合理性;基于Backstepping方法设计非线性航向控制器,借助Lyapunov函数证明了闭环系统的稳定性;仿真结果表明系统的实际航向能实时跟踪设定航向,控制器具有良好的动静态特性和鲁棒性.【期刊名称】《计算机测量与控制》【年(卷),期】2016(024)007【总页数】5页(P133-136,161)【关键词】无人艇;航向;递推最小二乘;模型辨识;Backstepping【作者】江立军;慕东东;范云生;王国峰;赵永生【作者单位】海军驻大连地区军代表室,辽宁大连116026;大连海事大学信息科学技术学院,辽宁大连116026;大连海事大学信息科学技术学院,辽宁大连116026;大连海事大学信息科学技术学院,辽宁大连116026;大连海事大学信息科学技术学院,辽宁大连116026;大连海事大学信息科学技术学院,辽宁大连116026【正文语种】中文【中图分类】TP273无人水面艇(unmanned surface vehicle, USV)拥有体积小、机动性能强、航速快等特点,它主要用来执行危险及不适合人工操作的任务,己成为了国内外智能化海洋装备的研究热点。
USV的自主航行一直是船舶控制领域的研究热点与重点[1]。
其中航向控制更是运动控制的重要研究课题之一,因为它不仅关系到航行的经济性与安全性,更是自动避碰、航迹跟踪、轨迹跟踪以及镇定问题等的基础。
几类不确定非线性系统的智能控制问题研究在实际中,大多数系统都是非线性系统,而且通常受到不确定性,时滞以及随机扰动等因素的影响。
自适应控制因其具有辨识对象和在线修改参数的能力,能够有效抑制不确定性的影响,另一方面模糊逻辑系统以及神经网络能以任意精度逼近未知连续函数,因此是处理不确定性特别有效的方法。
近年来,通过将反步递推设计方法与模糊逻辑系统理论或神经网络相结合的反步递推自适应智能控制得到了充分发展,而且取得了很多重要的研究成果,然而仍然存在着很多问题需要进一步研究。
本文将深入研究几类不确定非线性系统的智能控制问题,如具有严格反馈形式的不确定非线性系统,随机非线性系统,以及非线性互联大系统等,并且研究在系统存在时滞情况下的处理方法。
主要研究内容如下:1.针对一类具有严格反馈形式的单输入单输出不确定非线性系统,研究基于滤波器的自适应模糊跟踪控制问题。
首先设计滤波器估计不可测状态,在此基础上结合反步递推设计方法和模糊逻辑系统理论,逐步设计出虚拟控制信号和实际的控制律。
基于Lyapunov函数理论,证明了闭环系统所有信号半全局最终一致有界而且跟踪误差收敛到零的一个小邻域内。
最后通过仿真算例,验证了该方法的有效性。
2.针对一类带有未知时滞且具有严格反馈形式的单输入单输出不确定非线性系统,给出了自适应模糊输出反馈控制方法。
首先设计滤波器估计不可测状态,通过结合反步递推设计方法和动态面控制技术,避免了对虚拟控制器中自变量重复求导,从而降低了计算量,简化了所要设计的控制器。
基于Lyapunov-Krasovskii泛函,证明了闭环系统的所有信号半全局最终一致有界,而且跟踪误差收敛到零的一个小邻域内。
最后通过仿真算例验证了所提方法的有效性。
3.针对一类带有未知时滞且具有严格反馈形式的单输入单输出随机非线性系统,研究了基于观测器的自适应神经网络控制方法。
首先设计状态观测器估计不可测状态,结合反步递推设计方法和动态面控制技术,给出基于观测器的输出反馈控制方法。
一类纯反馈非线性系统的动态面控制刘勇华【摘要】针对一类非仿射输入纯反馈非线性系统,提出了一种动态面控制算法.不同于运用中值定理,该算法通过引入一个辅助系统,将原系统转化为输入仿射系统,结合动态面控制与反推设计法,消除了反推法中“计算膨胀”问题.所设计控制器保证了闭环系统所有信号半全局一致最终有界,且通过选择合适的设计参数可使跟踪误差收敛到原点的一个小邻域内.一个仿真实例进一步验证了所提控制算法的有效性.【期刊名称】《控制理论与应用》【年(卷),期】2014(031)009【总页数】6页(P1262-1267)【关键词】纯反馈非线性系统;非线性系统;动态面控制;反推设计【作者】刘勇华【作者单位】湖南科技大学机械设备健康维护湖南省重点实验室,湖南湘潭411201【正文语种】中文【中图分类】TP273近几十年来,非线性系统控制研究受到了国内外学者的广泛关注,取得了许多卓有成效的成果,如精确线性化技术[1]、反推控制技术[2]和智能控制技术[3]等.然而,在大多数研究中,通常假定被控系统为仿射系统(如严格反馈非线性系统),但在工程实践中,很多系统都具有非仿射特性,如机械系统[4]、化学系统[5]和飞行器系统[6]等.作为一类典型的非仿射非线性系统,近年来,纯反馈系统控制受到了越来越多的关注. 纯反馈系统是一类较严格反馈系统更一般的下三角型非线性系统.由于系统的非仿射结构,传统适合于严格反馈系统的控制器设计方法很难直接用于纯反馈系统控制.文献[7]较早研究了一类仿射输入纯反馈系统的控制问题,根据反推设计思想,给出了严格反馈条件下系统全局调节和全局跟踪的自适应控制器设计方法.然而,在非仿射条件下,该方法仅能保证闭环系统局部稳定.在此基础上,文献[8]直接从仿射输入纯反馈系统本身出发,在无须进行坐标变换情况下,给出了一种保证系统全局调节或全局跟踪的控制器设计方法.文献[9]讨论了一类特殊的非仿射输入高阶非线性系统全局镇定问题,通过引入增加幂次积分器技术,提出了一个光滑状态反馈控制器.针对一类仿射输入纯反馈系统,文献[10]提出了一种新的反推控制设计方法,与标准反推法将状态xi视为第i个子系统的虚拟控制不同,为克服纯反馈系统中非仿射结构给控制器设计带来的困难,该方法将第i个子系统的非仿射光滑函数视为该子系统虚拟控制.对模型完全未知的纯反馈非线性系统控制问题,通常采用的方法是基于智能通用逼近器的反推设计法,如文献[11–14].上述基于反推法的控制方法都存在一种缺陷,即在每一步反推设计中都需要对虚拟控制律进行重复求导,使得所设计控制器的计算复杂度随着系统阶数的增加爆炸性膨胀.为克服反推法中的“计算膨胀”问题,文献[15]首先提出了一种动态面控制技术,通过在每一步设计中引入一阶低通滤波器,从而避免了对虚拟控制律的反复求导.然而,由于纯反馈系统结构的非仿射性,使得动态面控制很难直接用于纯反馈系统.目前常用的方法是利用中值定理将纯反馈系统转化为严格反馈系统,然后结合隐函数定理和动态面控制技术给出控制器设计,如文献[16–20].不同于运用中值定理的动态面控制,本文尝试直接从纯反馈系统本身来设计控制器.按文献[10]中的反推设计法,在每一步设计中引入一阶低通滤波器,给出了一个控制输入初始状态可以任意选择的动态面控制器.该控制器可保证闭环系统所有信号半全局一致最终有界,且通过适当调整设计参数可使跟踪误差收敛到原点的一个小邻域内.最后,仿真结果进一步验证了本文所提控制算法的有效性.考虑如下一类纯反馈非线性系统:其中:=(x1,···,xi)T∈ℝi,i=1,···,n; (x1,···,xn)T∈ℝn为系统状态向量;u和y分别为系统的输入和输出;fi(·)为已知光滑函数,i=1,···,n.控制目标:设计控制器u,使系统输出y跟踪一个给定的参考轨迹yd,且保证闭环系统的所有信号一致最终有界.为了达到控制目标,对上述系统作如下假设:假设1 光滑函数满足其中:为已知正常数,xn+1=u.注1 假设1是系统(1)全局可控的一个充分条件[21]. 仅为约束正常数,不出现在后面设计的控制器中.假设2 参考轨迹yd连续有界,且存在二阶有界导数.即,其中:紧集 B0为已知正常数. 引理1 若光滑函数满足假设1且有界,则xi+1亦有界,i=1,···,n.证为光滑函数,由中值定理,至少存在一点ζ(ζ∈(min(0,xi+1),max(0,xi+1))),使得由假设1可知,存在>0,使得由于为有界光滑函数,则等式(3)左边亦有界.故xi+1有界.为解决系统(1)控制器设计中的非仿射输入问题,引入辅助子系统=v,则增广系统可表示为其中v为辅助控制输入.不同于标准反推法设计[2],本文采用如下坐标变换[10]:其中si−1为第i−1个子系统的虚拟控制律.结合动态面控制技术,引入如下一阶低通滤波器:且定义边界层误差为其中:αi为第i个子系统实际需设计的虚拟控制律, τi为滤波时间常数,i=1,···,n.步骤1 由式(5)(7)−(8)和式(10),可得选择实际虚拟控制律α1为其中c1为正的设计常数.由式(11)−(12),可得其中c1为正的设计常数.步骤2 对z2=f1−s1沿时间t求导,可得选择实际虚拟控制律α2为其中c2为正的设计常数.根据式(14)−(15)可得步骤i(3≤i≤n) 对zi=fi−1−si−1求导,可得选择实际虚拟控制律αi为其中ci为正的设计常数.根据式(17)−(18)可得步骤n+1 这一步将得到实际控制输入u.对zn+1=fn−αn求导,可得选择辅助控制律v为其中cn+1为正的设计常数.选择任意初始控制输入u(0),将式(21)代入式(6),可得到实际控制律u.注2 初始控制输入u(0)可以任意给出或按要求选定,这可视为本文所提控制算法的一个优势.根据式(20)−(21)可得根据式(9)−(10)和式(12),可得其中B1(z1,e1,yd,)=是一个连续函数.类似地,可得其中Bi(·)==2,···,n是连续函数.为估计闭环系统的稳定性,选择如下Lyapunov函数:定理1 在假设1和2条件下,考虑由非线性系统(1),一阶低通滤波器(9)、控制律(6)和(21)组成的闭环系统,对任意给定的正常数p,如果V(0)≤p,则存在正的设计参数c1,···,cn+1,τ1,···,τn,使得闭环系统的所有信号半全局一致最终有界,且通过适当调整设计参数,可以使系统跟踪误差收敛到原点附近的一个小邻域内.证对V沿时间t求导,可得定义集合由假设2和定理1条件知,对任意B0>0和p>0,集合Ωd和Ωi分别是ℝ3和ℝ2i+1内的紧集,则Ωd×Ωi亦是ℝ2i+4内的紧集,故连续函数Bi(·)在集合Ωd×Ωi 内存在一个最大值Mi,则由式(24)可得根据Young不等式,可得则其中:α0为可任意选取的正常数,设计参数满足当V(t)=p时,若α0>∆/p,则有≤0,因此, V(t)≤p为一个不变集,即当初始条件V(0)≤p时, V(t)≤p,∀t≥0.将式(30)两边同时乘以eα0t,可得式(32)两边沿[0,t]积分可得则有因此,z1,···,zn+1,e1,···,en都是半全局一致最终有界的.同时,由式(7)−(8)和式(10),z1,e1有界可得x1,s1,α1,f1有界,由引理1可得x2亦有界,随之f1的各个偏导数亦有界;结合z2,e2有界可得到s2,α2有界,从而f2亦有界,由引理1可推得x3有界,进而f2的各个偏导数亦有界.以此类推,可得x1,···,xn,α1,···, αn,v,u,s1,···,sn均是半全局一致最终有界的.另外,由|y−yd|2=≤2V可知,通过适当调整设计参数(增大α0),可使系统跟踪误差收敛到原点附近的一个小邻域内.注3 上述控制器设计中要求设计参数满足式(31).显然,假设1中正常数仅起到了约束设计参数的作用.注4 与文献[10]中反推设计法相比,本文采用动态面控制技术,无须每一步对所得到的虚拟控制进行求导,使得控制算法的计算量大为减少,易于在工程中实现.缺点是进一步要求(文献[10]中仅需≤且仅能保证闭环系统半全局稳定.注5 本文所提控制算法同样适合于严格反馈非线性系统控制器设计,相较于文献[15]中的动态面控制,其优点是可以任意选择控制输入初始值u(0).注6 与文献[20]中方法相比,本文第i步中剩余项zizi−1均由第i+1步进行补偿,减小了设计参数ci的取值,从而降低了所需的控制代价.此外,文献[20]中控制器设计参数含有正常数而本文所得控制器设计参数仅受限于正常数注7 文献[20]中控制器要求Mi为已知常数,然而,由于Mi为连续函数Bi(·)在紧集Ωd×Ωi内的一个最大值,在实际中很难取得.本文通过合理的不等式放缩,避免了这一问题.考虑如下二阶SISO非线性系统:其中:系统初始条件期望参考轨迹选择设计参数c1=3,c2=2,c3=4,初始控制输入u(0)=2,滤波时间参数τ1=τ2=0.01.所得仿真结果如图1−2,图1为系统输出跟踪误差,图2为系统输入u;图3−4分别为不同滤波时间条件下系统输出跟踪误差与输入;图5−6分别为不同初始控制输入u(0)条件下系统输出跟踪误差与输入.本文解决了一类非仿射输入纯反馈系统的动态面控制问题.通过引入一个积分辅助系统,将原系统转化为n+1维的仿射输入增广系统,结合动态面控制技术和文献[10]中的反推设计法,克服了反推法中所固有的“计算膨胀”问题.理论分析与仿真结果表明,该控制器保证了闭环系统所有信号半全局一致最终有界,通过选择合适的设计参数,可使系统跟踪误差收敛到原点的一个小邻域内.刘勇华 (1986–),男,博士,研究方向为非线性控制及其在机电系统中的应用,E-mail:***********************.【相关文献】[1]ISIDORI V.Nonlinear Control Systems[M].New York:Springer-Verlag,1989.[2]KRSTIC M,KANELLAKOPOULOS I,KOKOTOVIC P V.Nonlinear and Adaptive Control Design[M].New York:John Wiley& Sons,1995.[3]FARRELL J A,POLYCARPOU M M.Adaptive Approximation Based Control:Unifying Neural,Fuzzy,and Traditional Adaptive Approximation Approaches[M].NewJersey:Wiley,2006.[4]FERRARA A,GIACOMINI L.Control of a class of mechanical systemswithuncertaintiesviaaconstructiveadaptive/secondorderVSC approach[J].Journal of Dynamic Systems,Measurement,and Control,2000,122(1):33–39.[5]GE S S,HANG C C,ZHANG T.Nonlinear adaptive control using neural networks and its application to CSTR systems[J].Journal of Process Control,1998,9(4):313–323.[6]HUNT L R,MEYER G.Stable inversion for nonlinear systems[J].Automatica,1997,33(8):1549–1554.[7]KANELLAKOPOULOS I,KOKOTOVIC P V,MORSE A S.Systematic design of adaptive controllers for feedback linearizable systems[J].IEEE Transactions on Automatic Control,1991,36(11): 1241–1253.[8]SETO D,ANNASWAMY A M,BAILLIEUL J.Adaptive control of nonlinear systems with a triangular structure[J].IEEE Transactions on Automatic Control,1994,39(7):1411–1428. [9]LIN W,QIAN C.Adding one power integrator:a tool for global stabilization of high-order lower-triangular systems[J].Systems&Control Letters,2000,39(5):339–351.[10]刘勇华.一类纯反馈非线性系统的反推控制[J].控制理论与应用, 2014,31(6):801–804. (LIU Yonghua.Backstepping control for a class of pure-feedback nonlinear systems[J].Control Theory&Applications,2014,31(6): 801–804.)[11]WANG D,HUANG J.Adaptive neural network control for a class of uncertain nonlinear systems in pure-feedback form[J].Automatica, 2002,38(8):1365–1372.[12]WANG C,HILL D J,CHEN G.An ISS-modular approach for adaptive neural control of pure-feedback systems[J].Automatica,2006, 42(5):723–731.[13]DU H,SHAO H,YAO P.Adaptive neural network control for a class of low-triangular-structured nonlinear systems[J].IEEE Transactions on Neural Networks,2006,17(2):509–514.[14]REN B,GE S S,SU C Y,et al.Adaptive neural control for a class of uncertain nonlinear systems in pure-feedback form with hysteresis input[J].IEEE Transactions onSystems,Mans,and Cybernetics, Part B:Cybernetics,2009,39(2):431–443.[15]SWAROOP D,HEDRICK J K,YIP P P,et al.Dynamic surface control for a class of nonlinear systems[J].IEEE Transactions on Automatic Control,2000,45(10):1893–1899.[16]ZHANG T P,GE S S.Adaptive dynamic surface control of nonlinear systems with unknown dead zone in pure feedback form[J].Automatica,2008,44(7):1895–1903.[17]WANG M,LIU X,SHI P.Adaptive neural control of pure-feedback nonlinear time-delay systems via dynamic surface technique[J]. IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2011,41(6):1681–1692.[18]ZHANG X Y,LIN Y.Adaptive tracking control for a class of purefeedback non-linear systems including actuator hysteresis and dynamic uncertainties[J].IET Control Theory and Applications,2011, 5(16):1868–1880.[19]ZHANG T P,ZHU Q,YANG Y Q.Adaptive neural control of nonaffne pure-feedback non-linear systems with input nonlinearity and perturbed uncertainties[J].International Journal of Systems Science, 2012,43(4):691–706.[20]GAO D X,SUN Z Q,LIU J H.Dynamic inversion control for a class of pure-feedback systems[J].Asian Journal of Control,2012,14(2): 605–611.[21]KOROBOV V I.Controllability and stability of certain nonlinearsystems[J].Differentsial’nye Uravneniya,1973,4(4):614–619.。
纯反馈非线性系统的鲁棒自适应跟踪控制左仁伟;董新民;刘棕成【摘要】针对一类非仿射函数不连续的纯反馈非线性系统,提出了一种鲁棒自适应控制方法.放宽了对非仿射函数的连续性条件和边界条件,非仿射函数的边界均为未知连续函数,利用动态面控制技术避免了对虚拟控制律反复求导而导致的计算复杂性问题.从理论上证明了所设计的方法能够保证闭环系统所有信号半全局一致终结有界,且通过选择合适的设计参数使系统输出能渐近收敛到原点的任意小邻域内.仿真结果表明了所提出方法的有效性.【期刊名称】《电光与控制》【年(卷),期】2018(025)010【总页数】7页(P17-23)【关键词】非仿射纯反馈;自适应控制;动态面控制【作者】左仁伟;董新民;刘棕成【作者单位】空军工程大学,西安710038;空军工程大学,西安710038;空军工程大学,西安710038【正文语种】中文【中图分类】TP2730 引言近年来,非线性系统的控制设计问题引起了各国学者的广泛关注,在严格反馈系统控制领域取得了很多成果[1-6]。
但实际中存在很多非仿射纯反馈结构的非线性系统,如生化处理系统、飞行控制系统、Duffing振荡器以及机械系统等,因此研究非仿射纯反馈系统的控制理论具有一定的实际意义。
由于非仿射纯反馈系统的控制问题更复杂且更具挑战性,取得的成果还比较少见[7-19]。
已有研究成果中对非仿射纯反馈非线性系统控制设计方法主要依靠均值定理与隐函数定理[10-15]。
文献[10-14]针对具有下三角结构的纯反馈非线性系统讨论了自适应神经网络backstepping控制方案;文献[15]针对具有非仿射函数和未知死区的纯反馈系统,结合均值定理和backstepping技术,提出了一种直接自适应控制方法。
上述文献都假定非仿射函数对于输入变量是可导的,甚至导数必须是严格为正或负。
针对非仿射函数不可导的纯反馈非线性系统的控制问题,文献[16]提出了能保证非仿射纯反馈非线性系统可控性的连续性函数条件,取消了非仿射非线性函数必须可导的假设;文献[17]在文献[16]的基础上进一步放宽了非仿射函数连续性条件。
控制方向未知的不确定系统预设性能自适应神经网络反演控制耿宝亮;胡云安【摘要】对一类控制方向未知的不确定严格反馈非线性系统的预设性能自适应神经网络反演控制问题进行了研究.系统中含有时变非匹配不确定项且控制方向未知.首先,提出了一种新的误差转化方法,放宽了对初始误差已知的限制;随后,利用径向基函数(radial basis function,RBF)神经网络及跟踪微分器分别实现了对未知函数和虚拟控制量导数的逼近,并综合运用Nussbaum函数和反演控制技术设计了控制器.所设计的控制器能保证系统内所有信号有界且输出误差满足预设的瞬态和稳态性能要求.最后的仿真研究验证了控制器设计方法的有效性.【期刊名称】《控制理论与应用》【年(卷),期】2014(031)003【总页数】7页(P397-403)【关键词】预设性能;神经网络;Nussbaum函数;反演【作者】耿宝亮;胡云安【作者单位】海军航空工程学院控制工程系,山东烟台264001;海军航空工程学院控制工程系,山东烟台264001【正文语种】中文【中图分类】TP273近年来,科研工作者对不确定非线性系统的稳定控制问题进行了大量的研究,最初系统的不确定性仅限于某些不确定的参数,研究成果包括自适应反馈线性化[1]、自适应反演[2]、控制Lyapunov函数[3]等;神经网络的出现使得更为复杂的不确定系统的稳定控制成为可能,神经网络由于其逼近特性而被用于对未知函数进行逼近,将神经网络与自适应技术相结合成为最近的一个研究热点[4–5].上述文献虽不要求控制增益精确已知,但是却要求控制方向已知,Nussbaum增益法[6]的出现为解决控制方向未知的不确定非线性系统的稳定控制问题提供了一条途径,将自适应技术与Nussbaum函数相结合也取得了一系列的研究成果[7–9].另外一个研究热点是系统的跟踪性能问题,包括稳态性能和瞬态性能两个方面.现有的控制方法大多将注意力放在系统稳态性能的研究上,即保证系统的跟踪误差收敛到一个有界的区域或渐近收敛到原点,而对系统的瞬态性能(包括超调量和收敛速度)缺乏系统的分析和设计工具.Bechlioulis等[10]提出了预设性能的概念,同时兼顾了系统的稳态和瞬态性能.所谓预设性能是指在保证跟踪误差收敛到一个预先设定的任意小的区域的同时,保证收敛速度及超调量满足预先设定的条件.文献[10]针对一类单输入单输出反馈线性化系统进行了预设性能控制器的设计,文献[11]将模型进一步推广到多输入多输出反馈线性化系统,文献[12–14]将预设性能的概念与输出反馈相结合,提出了一种预设性能输出反馈控制器的设计方法;但上述方法并不能简单推广到严格反馈系统,控制方向未知也使问题变得更为复杂,对于控制方向未知的严格反馈非线性系统的预设性能控制问题还没有发现相关报道,并且现有预设性能方法都要求初始跟踪误差已知,使预设性能控制的应用领域受到很大限制.针对上述问题,本文提出一种新的误差转化方法,放宽了对初始误差已知的限制,并针对一类具有非匹配不确定项且控制方向未知的严格反馈非线性系统进行研究,综合运用backstepping技术、Nussbaum增益、自适应控制技术和跟踪微分器解决了此类系统的预设性能控制问题.2.1 问题描述(Problem description)考虑如下具有一般形式的严格反馈非线性系统:其中:x=[x1x2...xn]T∈ℝn,u∈ℝ和y∈ℝ分别为系统的状态量、输入量和输出量;定义¯xi= [x1x2...xi]T∈ℝi,fi(.)和gi(.)为未知连续光滑函数,∆i(t,¯xi)为非匹配不确定项.控制目标如下:1)输出误差e(t)=y(t)−yr(t)满足预先设定的瞬态和稳态性能;2)闭环系统中的所有信号有界.对系统的基本假设[15]如下:假设1存在一个紧集Ω,使得x∈Ω.假设2函数gi(¯xi)及其符号未知,且存在未知正常数和使得0注1假设2表明光滑函数为严格正或严格负.假设3存在未知正常数和已知非负函数,使得假设4期望轨迹yr(t)及其高阶导数yir(t)(i= 1,2,...,n)均连续有界.2.2 性能函数(Performance function)定义1连续函数ρ∶ℝ+→ℝ+为性能函数,满足:1)ρ(t)是正的且严格递减;为满足控制目标(2),文献[10]在假设e(0)已知的情况下给出如下形式:显然,假设e(0)已知具有很大的局限性,在很多系统中是不满足的,本文给出一种变参数约束方案:其中光滑函数和α¯(t)满足下面的性质:且严格递减;注2上面的性质(2)表明,在初始误差e(0)未知的情况下,(0)ρ(0)<e(0)<−(0)ρ(0)始终满足,因此也就放宽了对初始误差已知的限制,本文选取和为如下形式:其中λ,γ,µ,ν为选取的正常数.性能函数选取为其中:ρ0,ρ∞,l>0为预先设定的常数,max{γ/λ, ν/µ}.ρ∞表示预先设定的稳态误差的上界,误差收敛速度及最大超调量可以通过系数λ,µ,l进行调节,上述过程可借助图1进行说明.2.3 误差转化(Error transformation)对于系统中存在形如式(2)的不等式约束的情况,直接处理的难度很大,为将其转化为等式约束,定义误差转化函数S(ε):其中:ε为转化误差,S(ε)满足下述性质:1)S(ε)光滑且严格递增;注3结合性质(2)和ρ(t)>0,得到S(ε)ρ(t)<(t),代入式(5)可得(t)ρ(t)<e(t)<α¯(t)ρ(t),式(2)所示的不等式约束得到满足.本文选取误差转化函数(如图2所示)为由误差转化函数的性质可知,S(ε)可逆(T= S−1),因此转化误差ε可表示为注4如果ε∈ℓ∞,∀t≥0,则不等式约束(2)满足,进一步,考虑到性能函数ρ(t)的衰减特性,对应的跟踪误差将被限制在以下区域:2.4 神经网络逼近(Neural approximation)假设系统中的不确定函数可表示为f(x),其中: x∈ℝn.对于自治型的不确定性,径向基函数(RBF)神经网络的逼近引理如下:引理1对于定义在紧子集Ω∈ℝn上的连续函数f∶Ω→ℝ,存在最优权值向量θ∗f∈ℝm和对应的高斯基函数φf(.)∶ℝn→ℝm,使得[16]其中:m为神经元节点数;x∈ℝn为神经网络的输入向量;ωf(x)为网络重构误差.且存在未知常数Wf>0,使得为解决增益函数及其符号未知的问题,引入Nussbaum增益法.Nussbaum函数的基本定义如下:定义2任意的连续函数N(.)∶ℝ→ℝ,称为Nussbaum函数,如果满足[6]显然,N(ζ)=ζ2cosζ是一个典型的Nussbaum函数,且具有如下的性质[17]:引理2设V(.)和N(.)为定义在[0,tf)上的连续函数,V(t)≥0,∀t∈[0,tf);如果N(.)满足[17]式中:c1,c0>0为适当的常数,g(x(τ))严格正或严格负,则V(t)及ζ(t)在[0,tf)上有界. Step 1对于模型(1)中的第1个子系统,选择虚拟状态量由式(6)可得转化误差ε1为式(9)两边对时间求导可得其中:为关于状态和参数的已知函数,选取Lyapunov函数为其中:=−为估计误差,为对未知参数的估计值.式(11)对时间求导并结合式(10)可以得到选择虚拟控制量x2d为其中=r1ε1η1,η1为待设计的光滑函数.将式(13)代入式(12)得其中z2=x2−x2d为虚拟状态量.结合式(7)–(8)以及假设3得到选择其中k1,nf1,nφ1,ng1,σ1>0.又有将式(15)–(17)代入式(14)得如果|z2(t)|≤Wz2,Wz2>0为未知常数,结合假设2,进一步得到其中:常数p1,q1>0,且定义为式(18)两侧同时乘以ep1t,得到在[0,t)上对式(19)积分,得到由引理2可得,ζ1,V1有界,进一步得到ε1和˜θf1有界.因此,问题转化为z2(t)的有界问题.Step 2对于模型(1)中的第2个子系统,虚拟状态量转化误差式(22)两边对时间求导,得到其中:为关于状态的已知函数.由于˙x2d非常难以计算,本文采用二阶非线性跟踪微分器对其进行光滑逼近.对于跟踪微分器的性能,作如下假设[18]:假设5合理设计跟踪微分器,可以使得跟踪微分器的输出和其输入信号x2d的微分之间的误差一致有界,即存在未知常数εx2d>0,使得|−注5假设5同样适用于其他子系统的设计过程,即存在常数Wxi,d>0,使得|˙xi,d−ˆ˙xi,d|≤Wxi,d,i=3,4,...,n.选取Lyapunov函数为其中:为估计误差,为对未知参数的估计值.式(24)对时间求导并结合式(23)可以得到选择虚拟控制量x3d为其中:˙ζ2=r2ε2η2,η2为待设计的光滑函数.将式(26)代入式(25)得其中z3=x3−x3d为虚拟状态量.结合式(7)–(8)以及假设3和假设5得到选择其中:k2,nf2,nφ2,ng2,nx2d,σ2>0.将式(29)代入式(28)得接下来的步骤与Step1中对应的过程类似,这里不再赘述,最终得到结合引理2可得,ζ2,V2有界,进一步得到ε2和˜θf2有界.采用递归的思想,得到Stepn对于模型(1)中的第n个子系统,选择虚拟状态量误差转化方程为选取Lyapunov函数为其中:=−为估计误差,为对未知参数的估计值.控制量u选择为其中:为待设计的光滑函数.选择最终得到ζn,Vn有界,进一步得到εn和有界.定理1对于式(1)所描述的控制方向未知的不确定严格反馈非线性系统,以假设1–5为前提,采用误差转化方程(33),设计控制器(35)–(36)和自适应律(37),可得到如下结论:1)输出信号y(t)跟踪期望信号yr(t)的同时,闭环系统中的所有信号有界;2)输出误差e(t)=y(t)−yr(t)满足预先设定的瞬态和稳态性能.平面上的双连杆机械手具有强非线性,其动力学方程可以写成如下形式:其中:二维向量q=(q1,q2)T表示关节角,二维力矩向量u=(u1,u2)T为机械手关节处的执行器输入,为机械手惯性矩阵,C(q)=为向心力和科氏力矩阵,G(q)=为重力矩,∆(q,˙q,t)为非匹配不确定项. 2由于上述模型是多输入多输出系统,令q2=˙q2= 0,将其转化为单输入单输出系统,参考信号设置为qr1(t)=π/2+π/6cos(t).具体参数设置为质量/kg:m1=3.2,m2=2.长度/m:l1=0.5,l2=0.4,r1=l1/2,r2=l2/2.转动惯量/(kg.m2):Iz1=0.96,Iz1=0.81.摩擦力系数/(N.m):km1=1,km2=1.性能函数参数:l=0.2,ρ0=1,ρ∞=5×10−3.初值:[q1(0)˙q1(0)]T=[80π/180 0]T.控制器参数:k1=1.0,k2=5.0,nf=1.0,nφ=3.0,ng=0.6,nx2d=5.0.引入二阶非线性跟踪微分器对x2d的导数进行光滑逼近,其数学表达式如下[19]: 其中设计跟踪微分器的参数为R=3.0,δ=0.1.用一个RBF神经网络对系统中的不确定函数进行逼近,选取25个节点,权值向量的初值设为零向量,仿真结果如图3–6所示.图3为跟踪误差随时间的变化情况(左图为整个时间区间的仿真情况,右图为最后10s的仿真情况),图中的点划线表示预先设定的上界和下界,其包围的区域便为跟踪误差的限制区域,可以看出,跟踪误差始终没有超出这个预设的区域,系统响应速度快,超调量小,稳态误差最终控制在5×10−3以内,因此满足文中所提到的预设性能的要求.图4为RBF神经网络的权值变化情况,可以看出25维的权值向量是收敛的,图5为RBF神经网络对未知函数的逼近情况,可以看出不论是逼近速度还是逼近精度都达到了很好的效果,图6为控制量u的变化情况,控制曲线连续平滑,而且幅值较小,易于工程实现.另外,在整个仿真过程中,系统的所有信号有界(限于篇幅,没有一一列出),充分验证了定理1的正确性.本文针对一类含非匹配不确定项及控制方向未知的严格反馈系统进行研究,提出了一种新的误差转化方法,将预设性能这种新型控制方式的应用对象进一步拓宽,并将其与backstepping技术、Nussbaum增益、自适应控制技术和跟踪微分器相结合,完成了控制器的设计,解决了此类系统的预设性能控制问题.耿宝亮(1984–),男,博士研究生,目前研究方向为智能控制、自适应控制等,E-mail:********************;【相关文献】[1]KANELLAKOPOULOS I,KOKOTOVIC P V,MARINO R.An extended direct scheme for robust adaptive nonlinear control[J].Automatica,1991,27(2):247–255.[2]KOJIC A,ANNASWAMY A M.Adaptive control of nonlinearly parameterized systems with a triangular structure[J].Automatica,2002, 38(1):115–123.[3]LIN Y,SONTAG E D.Control-Lyapunov universal formulas for restricted inputs[J].Control Theory and Advanced Technology,1995, 10(4):1981–2004.[4]CHEN F C,KHALIL H K.Adaptive control of nonlinear systems using neuralnetworks[J].International Journal of Control,1992, 55(6):1299–1317.[5]ROVITHAKIS G A.Stable adaptive neuro-control design via Lyapunov function derivative estimation[J].Automatica,2001,37(8): 1213–1221.[6]NUSSBAUM R D.Some remarks on the conjecture in parameter adaptivecontrol[J].Systems and Control Letters,1983,3(5):242–246.[7]YE X.Asymptotic regulation of time-varying uncertain nonlinear systems with unknown control directions[J].Automatica,1999, 35(5):929–935.[8]GE S S,WANG J.Robust adaptive neural control for a class of perturbed strict feedback nonlinear systems[J].IEEE Transactions on Neural Networks,2002,13(6):1409–1419.[9]GE S S,HONG F,LEE T H.Adaptive neural control of nonlinear time-delay systems with unknown virtual control coeff i cients[J]. IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2004,34(1):499–516.[10]BECHLIOULIS C P,ROVITHAKIS G A.Prescribed performance adaptive control of SISO feedback linearizable systems with disturbances[C]//The 16th Mediterranean Conference on Control and Automation.Ajaccio,France:IEEE,2008:1035–1040.[11]BECHLIOULIS C P,ROVITHAKIS G A.Robust adaptive control of feedback linearizable MIMO nonlinear systems with prescribed performance[J].IEEE Transactions on Automatic Control,2008,53(9): 2090–2099.[12]KOSTARIGKA A K,ROVITHAKIS G A.Prescribed performance output feedback control:an approximate passivation approach[C] //The 18 th Mediterranean Conference on Control and Automation. Marrakech,Morocco:IEEE,2010:11–16.[13]KOSTARIGKA A K,ROVITHAKIS G A.Prescribed performance outputfeedback/observer-free robust adaptive control of uncertain systems using neural networks[J].IEEE Transactions on Systems, Man,and Cybernetics,PartB:Cybernetics,2011,41(6):1483–1494.[14]KOSTARIGKA A K,ROVITHAKIS G A.Adaptive dynamic output feedback neural network control of uncertain MIMO nonlinear systems with prescribed performance[J].IEEE Transactions on Neural Networks and Learning Systems,2012,23(1):138–149.[15]胡云安,晋玉强,李海燕.非线性系统鲁棒自适应反演控制[M].北京:电子工业出版社,2010. (HU Yun’an,JIN Yuqiang,LI Haiyan.Robustness of Adaptive Backstepping Control forNonlinear Systems[M].Beijing:Publishing House of Electronics Industry,2010.)[16]PARK J,SANDBERG I W.Universal approximation using radial basis function networks[J].Neural Computation,1991,3(2):246–257.[17]XU J X,YAN R.Iterative learning control design without a priori knowledge of the control direction[J].Automatica,2004,40(11): 1802–1809.[18]韩京清,王伟.非线性跟踪–—微分器[J].系统科学与数学,1994, 14(2):177–183. (HAN Jingqing,WANG Wei.Nonlinear tracking differentiator[J]. System Science and Mathematics,1994,14(2):177–183.)[19]李静,胡云安,耿宝亮.控制方向未知的二阶时变非线性系统自适应迭代学习控制[J].控制理论与应用,2012,29(6):730–740. (LI Jing,HU Yun’an,GENG Baoliang.Adaptive iterative learningcontrol for second-order time-varying nonlinear system with unknown control directions[J].Control Theory and Applications,2012, 29(6):730–740.)。
执行器有故障的多输入单输出系统的自适应输出反馈控制毛骏;张天平;夏晓南;沈启坤;裔扬【摘要】对一类控制增益符号未知且执行器有故障的输出反馈多输入单输出非线性系统,提出了一种后推容错控制方案.该方案在系统状态不可量测的情况下,利用Nussbaum函数处理符号未知的常数增益,并通过构造K-滤波器来估计了系统不可量测的状态.在容错控制器设计过程中,引入变能量函数来处理利用虚拟控制律所无法抵消的部分.与现有研究成果相比,放宽了未知增益需要上下界均为已知的假设条件.最后,通过选取合适的李雅普诺夫函数,证明了闭环系统所有信号半全局一致终结有界,且跟踪误差收敛到原点的一个小邻域内.仿真结果表明了所提控制方法的有效性.【期刊名称】《控制理论与应用》【年(卷),期】2016(033)004【总页数】11页(P512-522)【关键词】后推控制;未建模动态;输出反馈;变能量函数【作者】毛骏;张天平;夏晓南;沈启坤;裔扬【作者单位】扬州大学信息工程学院,江苏扬州225127;扬州大学信息工程学院,江苏扬州225127;扬州大学信息工程学院,江苏扬州225127;扬州大学信息工程学院,江苏扬州225127;扬州大学信息工程学院,江苏扬州225127【正文语种】中文【中图分类】TP13随着人类社会的发展与科学技术水平的进步,控制理论与控制工程在工业生产、军工、航空航天、经济学与统计学等专业领域内获得了空前广泛的应用,并且取得了丰硕的研究成果与令人瞩目的科技成就.一方面,精密复杂控制仪器的应用使得控制系统能够完成日趋复杂的控制目标,但另一方面也使得系统发生故障的概率大大增加.因此,如何增强动态系统的安全性与可靠性来使得系统的稳定性能够不受故障的影响便成为了人们所急需解决的问题.文献[1-3]对几类具有执行器故障的输出反馈非线性系统,提出了若干种基于后推的容错控制方案,并通过选取适当的李雅普洛夫函数证明了系统的稳定性.然而,文献[1]与文献[2-3]相比并不需要未知控制增益符号已知的假设条件,并在基于后推的容错控制器设计过程中,引入Nussbaum函数处理了符号未知的常数增益.但文献[2]与文献[1,3]相比:考虑了未知常数k1,r的数值在故障发生的每个时间间隔[tk,tk+1)内均有所不同,因此,需要在[tk,tk+1)内对李雅普诺夫函数求导并逐段分析其稳定性.而文献[1,3]将参数k1,r的数值视为恒定不变.文献[4-6]研究了若干类输出反馈系统的跟踪控制问题,其利用K--滤波器估计了系统不可量测的状态.文献[7-8]在文献[6]的基础上,讨论了两类控制增益符号未知的输出反馈随机非线性系统的稳定性问题.文献[9]对一类严格反馈非线性系统,提出了一种基于后推的容错控制方案.文献[10-11]针对具有执行器故障的分散控制系统,提出了两种容错控制方案,但文献[11]需要系统状态可量测.文献[12]在文献[10-11]的基础上,将后推控制策略拓展到具有执行器故障的随机分散系统中,并拓展了文献[5-6]中关于未建模动态的假设条件.文献[14-15]将文献[13]中的研究对象扩展为多输入多输出(multipleinputmultipleoutput,MIMO)系统,但文献[15]状态方程中的未知函数需要满足局部利普希茨条件.文献[16]研究了一类随机纯反馈系统的跟踪控制问题,文献[17-18]通过引入变能量函数,巧妙地设计了系统的控制器.文献[19-20]相比于文献[1-3],通过对神经网络未知理想权向量的模值进行估计来代替直接对权向量进行估计,减少了在线调节参数的个数,简化了系统设计.文献[21-23]将小增益定理与后推控制方案结合起来,得出了若干种控制领域的新成果.本文在文献[1-3]的基础上,对一类具有“常数值故障”与“衰减故障”的输出反馈非线性系统,提出了一种基于后推的容错控制方案.其主要贡献如下:1)在故障发生时刻与类型均为未知的情况下,利用K-滤波器估计了系统不可量测的状态,并在稳定性分析过程中,考虑到未知参数k1,r的数值在每两个故障发生的时间间隔内均有所不同,从而采用对李雅普诺夫函数逐段求导与分析的方法完善了文献[1,3]的不足.2)利用非负且单调不减的变能量函数抵消了系统虚拟控制律所无法抵消的部分.3)将研究对象由文献[5]中的SISO系统拓展为MISO系统,并利用中间控制变量v0将系统模型简化为SISO系统进行研究,降低了设计系统正常控制输入的难度.考虑如下一类MISO非线性系统:其中为系统不可量测的状态向量;y∈R为系统可量测的输出;fi(y)(i=1,2,···,n)为未知光滑非线性函数;βj(y)/=0(j=1,2,···,m)为已知光滑非线性函数;∆i(z,y,t)(i=1,2,···,n)为系统的外界扰动,其为未知的光滑函数;brj,r=0,1,···,γ(j=1,2,···,m)为系统未知的常数控制增益,且bγj的符号未知;uj(j=1,2,···,m)为系统可能发生故障的控制输入;˙=q(z,y)为系统的未建模动态.本文所考虑的故障为“常数值故障”与“衰减故障”,系统控制输入uj(j=1,2,···,m)既可能发生“常数值故障”,也可能发生“衰减故障”.“常数值故障”的数学表达式为其中:故障值,故障发生的时刻tj以及下标j未知,vj为系统正常的控制输入,R为发生“常数值故障”的控制输入的个数.“衰减故障”的数学表达式为其中为“衰减故障”中的“衰减系数”,其为未知正常数.为ρi的下界,当ρi=1时,等价于系统的控制输入ui不发生故障.故障发生的时刻ti以及下标i未知,vi 为系统正常的控制输入.故综合式(2)-(3),系统输入uj(j=1,···,m)可写为如下形式:其中:1)当ρj=1,σj=1时,系统控制输入uj发生“常数值故障”;2)当ρj/=1,σj=0时,系统控制输入uj发生“衰减故障”;3)当ρj=1,σj=0时,系统控制输入uj不发生故障.假设1系统(1)至多有m-1个执行器发生故障,并且其余的执行器能够达到所期望的控制性能.假设2bγj,j=1,2,···,m为系统未知的常数增益,且其符号也为未知.假设3B(s)为Hurwitz多项式,其中:B(s)=稍后定义.假设4参考信号都是有界且可量测的.假设5外界动态扰动∆i(z,y,t)(i=1,2,···,n)满足:其中:φi1(·)为已知非负光滑函数,φi2(·)为已知非负光滑增函数,并且为未知常数.假设6[5]z称为指数输入状态实用稳定(exp-ISpS),即对于,若存在李雅普诺夫函数V0(z)满足其中:α1(·),α2(·),γ(·)为K∞类函数且γ(·)已知,c,d为已知正常数.定义1[1]如果连续函数N(k):R→R满足则称为Nussbaum函数.本文中,取N(k)=k2sin k.引理1[5]若V0是指数输入状态实用稳定的(exp-ISpS)函数,即式(6)-(7)成立,则对于任意常数∈(0,c),任意初始时间t0>0,任意初始状态z0=z(t0),υ0>0和任意,存在有限时间:对于非负函数D(t0,t),定义动态信号:,当t≥t0+T0时,有D(t0,t)= 0,使得:V0(z)≤υ(t)+D(t0,t).不失一般性,取引理2[1]已知V(·),k(·)都是[0,tf)上的光滑函数,且V(t)≥0,∀t∈[0,tf),N(·)是Nussbaum函数,如果下列不等式成立:其中:g是非零常数,c0是常数,那么V(t),k(t)和一定在[0,tf)上有界. 引理3[1]已知V(·),k(·)都是[0,tf)上的光滑函数,且V(t)≥0,∀t∈[0,tf),N(·)是Nussbaum函数,如果下列不等式成立:其中:常数c1≥0,g(x(τ))是取值在闭区间I=[l-1,l+1],0/∈I上的时变参数,c0是常数,那么V(t),k(t)和一定在[0,tf)上有界.引理4[5]h(Z)为紧集ΩZ⊂Rn内的任意连续函数,则对于∀ε∗>0存在RBF 神经网络使得式中:h(Z)-W∗Tξ(Z)为神经网络的逼近误差,最优权值向量W∗定义如下:假设系统(1)在tk(k=1,2,···,q,且t0<t1<t2<···<tq<∞)时刻有pk个执行器发生故障,即对于系统(1),当t∈[tk,tk+1)(tq+1=∞)时,共有个执行器发生故障.其中为发生故障的控制输入.uj(t)=vj(j/=j1,j2,···,jp)为正常的控制输入,其为所需要设计的控制输入.那么对于系统(1),当t∈[tk,tk+1),可写为如下形式:控制目标:对于系统(1)在tk(k=1,2,···,q)时刻有p≤m-1个执行器发生故障时,设计系统正常的控制输入vj(j∈{1,2,···,m}),使得系统输出y能够尽可能好的跟踪参考信号yr,闭环系统半全局一致终结有界,跟踪误差收敛到原点的一个小邻域内.为了便于设计系统(1)正常的控制输入vj,参考文献[1]的设计方案,由βj(y)已知且βj(y)/=0.令其中v0为所需要设计的控制律,其稍后定义.同理,为了便于系统(1)的参数化设计,令并且令综合式(14)-(16),令则式(1)可写为如下向量形式:本文采用径向基神经网络在紧集y∈Ωy⊂R上逼近未知函数fi(y),其中:y∈Ωy表示神经网络的输入表示神经网络的权向量,Ni>1表示神经元的节点个数,Si(y)=[Si1(y),Si2(y),···,SiNi(y)]T∈RNi为第i个神经元网络的径向基函数向量,一般取为高斯函数,形式为其中:vij为径向基函数的中心,σij>0为高斯函数的宽度,i=1,2,···,n,j=1,2,···,Ni.令未知理想权向量其中δi(·)为神经网络的逼近误差.将式(19)代入式(17),可写为如下形式:其中:为了便于设计系统(1)基于神经网络的滤波器,令故利用式(21),式(20)最终可写为如下形式:其中:由于系统的状态不可量测,故利用如下的滤波器与观测器来重构系统状态.滤波器设计为其中为Hurwitz多项式,设矩阵ΩT的前(γ+1)(m+1)的列向量依次为:故由式(23)可得,列向量µγ,µγ-1,···,µ0满足下式:由于.令故利用式(25),式(24)可改写为如下形式:令µr,i(r=0,1,···,γ,i=1,2,···,n)为列向量µr的第i个分量.λk表示列向量λ的第k个分量.根据文献[8]的讨论,可知其中:∗是关于l1,l2,···,ln的某一个多项式.由于l1,l2,···,ln是设计参数,所以∗代表的多项式是有界的.综合式(23)-(26),可得到用于系统状态估计的K--滤波器:定义系统(1)的状态估计,观测器误差,故则利用式(28)-(29),可得系统的状态估计误差方程:本文采用后推控制技术设计系统的控制律v0,整个系统的控制器设计分为ρ步,设计过程基于如下坐标变换:z1=y-yr,zi=µγ,i-αi-1(i=2,3,···,ρ).第1步定义系统(1)的跟踪误差为z1=y-yr,对z1求导并综合式(1)与式(29),可得其中表示Ξ的第2行的第1行.考虑到z2=µγ,2-α1,将其代入式(31),可得由假设2与式(16)可知的符号未知,故通过在虚拟控制律α1中引入Nussbaum函数处理其符号未知的问题.选取虚拟控制律α1为选取Nussbaum参数为其中:c1>0,d1>0,ε∗>0,其为系统的设计常数.为θ的估计值,ˆp为p的估计值,其为未知正常数,为θ0的估计值,θ0稍后定义,Q(y,υ)为非负辅助函数,形式如下所示:选取如下李雅普诺夫函数:对V1求导,并综合式(32),可得综合假设5与式(37),利用Young’s不等式放缩,可得第2步考虑到z2=µγ,2-α1,并将z3=µγ,3-α2代入式(24),对z2求导可得选取虚拟控制律α2为其中:c2>0,d2>0,η1>0为设计常数.τ2,π2为调节函数,其稍后定义.为θ0的估计,θ0稍后定义.选取如下李雅普诺夫函数:对V2求导,利用Young’s不等式并综合式(39)与式(40),可得选取调节函数τ2为选取调节函数π2为第i步(3≤i≤ρ-1)考虑到zi=µγ,i-αi-1,并将zi+1=µγ,i+1-αi代入式(24),对zi求导可得选取虚拟控制律αi为其中:ci>0,di>0为设计常数.τi,πi为调节函数,稍后定义.选取如下李雅普诺夫函数:对Vi求导,由Young’s不等式,综合式(45)-(46),可得选取调节函数τi为选取调节函数πi为第ρ步考虑到zρ=µγ,ρ-αρ-1,对zρ求导可得选取系统的控制律v0为其中:虚拟控制律αρ由式(46)确定,i=ρ,cρ>0,dρ>0为设计常数,τρ,πρ为调节函数,稍后定义.选取如下李雅普诺夫函数:其中:η2>0为设计常数;参数估计误差为对Vε求导,综合假设5、式(30)与Young’s不等式,可得由式(16)与式(21)可知:θ在时间段[tk,tk+1)内为常数,故对Vρ在时间段[tk,tk+1)内求导,综合式(51)与式(52),并利用Young’s不等式放缩,可得选取调节函数τρ为选取调节函数πρ为将式(37)(43)(48)代入式(56),可得由引理4可知,存在未知正常数δ∗i,满足:令未知正常数根据式(59),令未知正常数θ0为选取参数自适应律:为了处理式(59)中利用虚拟控制律所无法抵消的部分,引入非负且单调不减的变能量函数ϱ(·),选取如下李雅普诺夫函数:对Vs在时间段[tk,tk+1)内求导并综合引理1可得由式(59),综合假设5、假设6和引理1,可得由引理1可知,D(t,t0)为有界函数,故可设令(2υ)],由于Π(·)为单调不减的非负光滑连续函数,且Π(0)=0,故存在非负单调不减光滑函数Φ(υ)使得:Π(υ)=υ Φ(υ).综合式(66)-(67),式(65)可写为如下形式:由式(68),选取变能量函数为由于ϱ(·)为非负单调不减函数,由文献[17]可知:将式(69)-(71)代入式(68),可得定理1考虑非线性系统(1)在时刻tk发生执行器故障的情况下,由其与控制律(52),参数自适应律(61)-(63)以及变能量函数ϱ(υ)所组成的系统,若假设1-6成立,则闭环系统是半全局一致终结有界的,且跟踪误差收敛到原点的一个小邻域内.证定义李雅普诺夫函数对V在[tk,tk+1)内求导,综合以上分析,可得其中:其为未知正常数.根据式(74)可知不确定,故当t∈[tk,tk+1)时,对其分两种情况进行讨论:1)z1∈Ωz1={z1:|z1|<ε∗}.由z1=y-yr可知z1∈L∞.由假设5可知yr∈L∞,故y∈L∞.由假设6可知¯γ(‖y‖)∈L∞.利用BIBO稳定性,由引理1中的动态信号方程由于φi1(‖y‖)为非负光滑函数,故φi1(‖y‖)∈L∞.由于变能量函数ϱ(υ)为光滑连续函数,故ϱ(υ)∈L∞.则综上所述,可得辅助函数Q(y,υ)∈L∞,令则由式(74)可得将式(76)两边同时乘以eλ0t,并对其在区间[tk,t]上求定积分可得利用引理3,可知k∈L∞,V∈L∞.2)时,可得知Q(y,υ)≤0,故由式(74)可知与情况1)处理过程类似,可得:k∈L∞,V∈L∞.综合两种情况,可得L∞.由假设4可知,故y∈L∞.利用BIBO稳定性,由式(28)可知ξ0,Ξ,ξrj∈L∞,且由引理1可知υ∈L∞.利用式(26),可得其中:由假设3可得G(s)为稳定的多项式,由于y∈L∞,且fi(y)与∆i(z,y,t)为光滑函数,则由式(79)知:λγ+1,···,λ2,λ1∈L∞.由于,可得L∞.考虑到其中i=3,4,···,ρ.由于故由式(80)可知µγ,2∈L∞.则由式(27)可得λγ+2∈L∞,利用式(81)与假设4,可得µγ,3∈L∞.重复利用式(27)与式(81),可得λ∈L∞.通过利用式(24)-(25),可知µr∈L∞,v0∈L∞.由于βj(y)/=0,j=1,2,···,m,为光滑非线性函数,故βj(y)∈L∞.由于βj(y)∈L∞,可得vj∈L∞.由于ξ0,Ξ,ξrj,µr,ε∈L∞,则由式(29)可知x∈L∞.综上所述,闭环系统半全局一致终结有界,且跟踪误差能够收敛到原点的一个小邻域内.为了验证控制策略的有效性,考虑如下2阶非线性系统:其中:跟踪信号:yr=sin(2t)cos(2t)=0.5×sin(4t),控制增益控制输入u1,u2,u3发生故障,形式如下所示:设计常数初值动态信号仿真结果如图1-5所示.本文对一类控制增益符号未知且具有执行器故障的输出反馈MISO系统,提出了一种后推容错方案.结合变能量函数与辅助函数处理了系统虚拟控制律所无法抵消的部分.最终,选取合适的李雅普诺夫函数证明了所设计的控制律能够在系统控制输入发生故障的情况下,闭环系统半全局一致终结有界,且跟踪误差能够收敛到原点的一个小邻域内.毛骏(1988-),男,硕士研究生,主要研究方向为自适应控制、非线性控制等,E-mail:****************;张天平(1964-),男,博士,教授,博士生导师,目前主要从事自适应控制、模糊控制理论、智能控制及非线性控制等研究工作,E-mail:***************.cn;夏晓南(1970-),女,博士研究生,讲师,目前主要从事复杂系统的鲁棒自适应控制及非线性系统的控制等研究工作,E-mail:*************.cn;沈启坤(1971-),男,博士,副教授,目前主要从事自适应控制及非线性系统的冗错控制等研究工作,E-mail:**************.cn;裔扬(1980-),男,博士,副教授,目前主要从事自适应控制及迭代学习控制等研究工作,E-mail:*********************.【相关文献】[1]ZHANG Z,XU S,WANG B.Adaptive actuator failures compensation with unknown control gain signs[J].IET Control Theory and Applications,2011,5(16):1859-1867. [2]TAO G,CHEN S H,TANG X D,et al.Adaptive Control of Systems with Actuator Failures[M].Berlin:Springer,2004.[3]ZHANG Z Q,CHEN W S.Adaptive output feedback control of nonlinear systems with actuator failure[J].Information Sciences,2009,179(24):4249-4260.[4]AMEZQUITA S K,BUTT W,LIN Y.An adaptive dynamic surface control scheme for a class of output feedback nonlinear systems with actuator failures[C]//Proceedings ofthe 8th World Congress on Intelligent Control and Automation.New York:IEEE,2010:750-755.[5]KRSTIC M,KANELLAKOPOULOUS I,KOKOTOVIC P.Nonlinear and Adaptive Control Design[M].New York:John Wiley,1995.[6]XIA X N,ZHANG T P.Adaptive output feedback dynamic surface control of nonlinear systems with unmodeled dynamics and unknown high-frequency gain sign [J].Neurocomputing,2014,143(16):312-321.[7]YU Z X,LI S G.Neural-network-based output-feedback adaptive dynamic surface control for a class of stochastic nonlinear time-delay systems with unknown control directions[J].Neurocomputing,2014,129(5):540-547.[8]WANG T,TONG S C,LI Y M.Robust adaptive fuzzy output feedback control for stochastic nonlinear systems with unknown control direction[J].Neurocomputing,2013,106(6):31-41.[9]XU Y Y,TONG S C,LI Y M.Observer-based fuzzy adaptive control of nonlinear systems with actuator faults and unmodeled dynamics[J].Neural Computation and Applications,2013,23(1):391-405.[10]XU Y Y,TONG S C,LI Y M.Adaptive fuzzy fault-tolerant dencentralized control for uncertain nonlinear large-scale systems based on dynamic surface control technique [J].Journal of the Franklin Institute,2014,351(1):456-472.[11]WANG C L,WEN C Y,LIN Y.Dencentralized adaptive backstepping control for a class of interconnected nonlinear systems with unknown actuator failures[J].Journal of the Franklin Institute,2014,351(1):1-13.[12]TONG S C,SUN S,LI Y M.Adaptive fuzzy decentralized tracking fault-tolerantcontrol for stochastic nonlinear large-scale systems with unmodeled dynamics[J].Informance Sciences,2014,289:225 -240.[13]WANG W,WEN C Y.Adaptive actuator failure compensation control of uncertain nonlinear systems with guaranteed transient performance[J].Automatica,2010,46(12):2082-2091.[14]ZHANG S J,QIU X W,LIU C S.Neural adaptive compensation control for a class of MIMO uncertain nonlinear systems with actuator failures[J].Circuits Systems and Signal Process,2013,10(7):250-263.[15]SUI S,TONG S C,LI Y M.Fuzzy adaptive fault-tolerant tracking control of MIMO stochastic pure-feedback nonlinear systems with actuator failures[J].Journal of the Frankin Institute,2014,351(6):3424-3444.[16]GAO Y,TONG S C,LI Y M.Adaptive fuzzy backstepping output feedback control for a class of uncertain stochastic nonlinear system in pure-feedback form[J].Neurocomputing,2013,122:126-133.[17]WU Z J,XIE X J,ZHANG S Y.Stochastic adaptive backstepping controller design by introducing dynamic signal and changing supply function[J].International Journal of Control,2006,79(12):1635-1646.[18]JIANG Z P.A combined backstepping and small-gain approach to adaptive output feedback control[J].Automatica,199,35(7):1131-1139.[19]ZHU Q Q,ZHANG T P.Adaptive control of nonlinear time-varying delay systems with unknown control gain signs[C]//Proceedings of the 2012 International Conference on Applied Physics and Industrial Engineering,New York:IEEE,2012:1807-1814. [20]ZHANG T P,XIA X N.Adaptive output feedback tracking control of stochastic nonlinear systems with dynamic uncertainties[J].International Journal of Robust and Nonlinear Control,2015,25(9):1282-1300.[21]MA Y J,JIANG B,TAO G,et al.Actuator failure compensation and attitude control for rigid satellite by adaptive control using quaternion feedback[J].Journal of the Franklin Institute,2014,351(2):296-314.[22]WANG T,TONG S C.Adaptive fuzzy robust control for nonlinear system with dynamic uncertainties based on backstepping[C]//Proceedings of the 3rd International Conference on Innovative Computing Information and Control.New York:IEEE,2008:125-129.[23]TONG S C,HE X L,LI Y M.Adaptive fuzzy backstepping robust control for uncertain nonlinear systems based on small-gain approach[J].Fuzzy Sets and Systems,2010,161(6):771-796.。
现代控制理论_哈尔滨工程大学中国大学mooc课后章节答案期末考试题库2023年1.已知线性定常系统如下所示,下面说法错误的是()【图片】参考答案:引入状态反馈后,不改变系统的能观测性。
2.串联组合系统的传递函数矩阵为各串联子系统的传递函数矩阵之和。
参考答案:错误3.在最优控制问题中,如果系统的性能指标是状态变量和控制变量的二次型函数,则称为线性二次型最优控制问题,简称LQ(Linear Quadratic)问题。
参考答案:错误4.用不大的控制能量,使系统输出尽可能保持在零值附近,这类问题称为输出调节器问题。
参考答案:正确5.研究系统控制的一个首要前提是建立系统的数学模型,线性系统的数学模型主要有两种形式,即时间域模型和频率域模型。
参考答案:正确6.现代控制理论以多变量线性系统和非线性系统作为研究对象,以时域法,特别是状态空间方法作为主要的研究方法。
参考答案:正确7.1892年俄国数学家李亚普诺夫发表了论文《运动稳定性的一般问题》,用严格的数学分析方法全面地论述了稳定性问题。
参考答案:正确8.经典控制理论以单变量线性定常系统作为主要的研究对象,以时域法作为研究控制系统动态特性的主要方法。
参考答案:错误9.下述描述中哪些作为现代控制理论形成的标志()参考答案:用于系统的整个描述、分析和设计过程的状态空间方法._最优控制中的Pontriagin极大值原理和Bellman动态规划。
_随机系统理论中的Kalman 滤波技术。
10.内部稳定性表现为系统的零初态响应,即在初始状态恒为零时,系统的状态演变的趋势。
参考答案:错误11.系统矩阵A所有特征值均具有负实部是线性时不变系统渐近稳定的充要条件。
参考答案:正确12.从物理直观性看,能观测性研究系统内部状态“是否可由输入影响的问题”。
参考答案:错误13.由系统结构的规范分解所揭示,传递函数矩阵一般而言只是对系统结构的不完全描述,只能反映系统中的能控能观测部分.参考答案:正确14.下面论述正确的是()参考答案:李亚普诺夫意义下渐近稳定等同于工程意义下稳定。
非线性系统控制方法之Backstepping 反步法考虑如下二阶系统:121122121()(,)x x f x x u f x x y x =+⎧⎪=+⎨⎪=⎩(1)其中1x ,2x 为系统状态,y 为系统输出,u 为系统控制输入,12,f f 为光滑的非线性函数。
要求设计Backstepping 控制器,使系统稳定。
注1:系统(1)称为严格反馈系统或者下三角系统或者倒三角系统,是实际生活中非常常见的系统类型,一般含有电机的控制系统都会出现严格反馈这种系统形式,比如直流电机调速系统,四旋翼飞行器控制系统等等,所以研究这种系统的控制方法十分重要,而反步法或者反推法就是专门用来为这种系统设计控制器的。
注2:在设计Backstepping 控制器的时候,思路是非常重要的,第一点就是要把系统分成一个一个子系统,如系统(1)就由两个子系统构成,第一个子系统不直接含有控制器,第二个子系统直接含有控制器,那么对于第一个子系统咱们就要虚拟一个控制器出来,我们把它叫做虚拟控制函数,用于使第一个子系统稳定的,所以第一步就是要设计出虚拟控制器。
注3:对于系统(1),我们除了考虑它在平衡点(零点)的稳定性(即12,x x 收敛到零),还要考虑系统的输出跟踪性能,所谓输出跟踪,就是要让系统输出y 跟踪一个给定的时变参考信号()d y t 。
咱们的目标当然是希望误差d y y -趋于零。
下面我们将分别考虑两类控制器的设计方法,第一类是系统镇定控制器,第二类是系统输出跟踪控制器。
一、系统镇定控制器设计过程如下:第一步,令11221,z x z x α==-,其中1α为待设计的虚拟控制函数。
考虑Lyapunov 函数2110.5V z =,则有1111211211()()V z z z x f z z f α==+=++ (2)。
严格反馈非线性系统的自适应神经网络输出反馈控制孙国法;田宇;王素珍【摘要】基于非线性反馈函数,文章设计神经网络状态观测器,解决一类非线性系统的输出反馈控制问题.非线性反馈神经网络观测器在系统存在不确定性函数的情况下实时估计系统状态.利用所获得的状态信号,设计了自适应神经网络动态面控制器,同时保证了闭环系统的稳定性和所有信号的有界性.通过调节设计参数的取值能够达到期望的闭环跟踪性能.数值仿真表明,所设计的状态观测器不需要对原系统做状态变换,能够克服输出反馈滑模控制器带来的抖震问题.%Based on nonlinear feedback function, this paper investigates output feedback control problem for a class of nonlinear systems. In the case of systems with uncertain functions, nonlinear feedback neural network observer estimates system states in real time. Employing the obtained state signals, an adaptive neural network controller is designed to guarantee the stability of the closed-loop system and the boundedness of all signals. The desired closed-loop tracking performance can be achieved by adjusting the value of the design parameters. Numerical simulation results show that, without state transformation, the state observer overcomes the chattering problem caused by the output feedback sliding mode controller.【期刊名称】《控制理论与应用》【年(卷),期】2017(034)003【总页数】8页(P375-382)【关键词】状态观测器;动态面控制;自抗扰控制;神经网络【作者】孙国法;田宇;王素珍【作者单位】青岛理工大学自动化工程学院,山东青岛 266520;北京航天自动控制研究所宇航智能控制技术国家级重点实验室,北京 100854;青岛理工大学自动化工程学院,山东青岛 266520【正文语种】中文【中图分类】TP273非线性系统的反步法控制由Polycarpou等[1]提出以来,成为一种设计非线性不确定性系统自适应[2]鲁棒控制策略的有力工具.在过去几十年中,学者们基于反步法控制思想,解决了许多复杂的非线性系统控制问题,提出了一些自适应控制策略.例如,自适应神经网络控制器[3]、模糊逻辑反步法[4]等.在此基础上,Ren等[5]研究了带有输入端滞环的一类纯反馈形式非线性系统的自适应神经网络控制.针对自适应反步法的“复杂性爆炸”问题,Swaroop等[6]提出动态面控制算法[7],避免了对虚拟控制信号的重复微分,从而简化了反步法控制器的设计过程.这些神经网络与自适应反步法控制相结合的控制策略解决了多种非线性系统的反馈控制问题.然而,状态观测问题一直阻碍着这类控制算法的实际应用.于是,在解决输出反馈控制问题上,又涌现出很多有创意的成果.输出反馈控制需要设计一个合适的状态观测器[8–10],实现在系统状态未测量情况下的反馈控制.伴随着自适应反步法控制的深入研究,基于状态观测器的研究工作也逐步展开.此处,列举其中的一些代表性成果.利用高增益观测器来估计系统输出的高阶导数,Ge等[8]对一类一般化的非线性系统提出了一种自适应神经网络输出反馈控制器.同样基于神经网络,Hua和Guan[9]研究了一类带有输入端时延的耦合非线性系统动态输出反馈控制问题,首次提出了独立于时延的解耦观测器.针对不确定性飞行器的姿态控制问题,Zou等[10]应用四元数法提出了两种基于切比雪夫神经网络(Chebyshev neural networks,CNN)的自适应输出反馈控制器.非线性降阶观测器被用来估计飞行器输出的微分信号.从上述已有的结果来看,状态观测器的性能受到系统的结构不确定性和外部干扰信号的影响.同时,观测效果直接影响闭环系统的控制性能.而扩张状态观测器能够同时观测系统的状态信号和总扰动信号,在实际应用中获得了很好的控制效果.扩张状态观测器是自抗扰控制(active disturbance rejection control,ADRC)的核心部分之一,直接影响到非线性反馈的能否实现及闭环系统的稳定性.在自抗扰控制算法中,从传统PID控制原理出发并分析其优缺点,韩京清[11]利用非线性机制开发了具有特殊功能的非线性函数,提出了最速非线性反馈函数来实现快速无超调信号跟踪.扩张状态观测器同时观测系统状态和扰动信号形成符合控制反馈信号来保证闭环系统的控制性能.然而,在不确定性非线性系统中,扩张状态观测器[12]很难观测系统的实际状态,观测状态变换之后的状态又会出现高增益反馈的弊端.本文将采用自抗扰算法中的非线性反馈函数设计自适应神经网络观测器,避免高增益观测器由于反馈参数取值过高而产生的抖震问题.由此,设计自适应输出反馈动态面控制器,提高控制系统的闭环跟踪性能.本文的组织结构如下:在第2节中,给出一类严格反馈控制非线性的系统的数学模型及其控制目标;在第3节中,针对非线性系统直接设计神经网络观测器,给出网络权值调节律;在第4节中,基于神经网络观测器,设计输出反馈自适应动态面控制器;第5节对所设计的输出反馈控制信号及整个闭环系统的稳定性做了分析;第6节中,数值算例结果及其分析验证了本文所提出方法的有效性;第7节对本文的工作做了总结. 考虑如下形式的严格反馈不确定性系统:其中:fp(xp)(p=1,···,n)是光滑的未知非线性函数,y=x1是系统输出信号,u表示系统控制输入信号,xp代表p维状态向量.注1 式(1)能够表示更广泛的一类实际系统.事实上,由传递函数描述的时延线性系统通过选取合适的状态变量,能够化为由式(1)描述的被控对象.因此,在接下来的控制器设计中,本文将针对由模型(1)描述的非线性系统设计输出反馈自适应动态面控制器,设计的控制同样适用于由传递函数描述的线性时变系统.如图1所示,对于含有未知非线性函数的非线性系统(1),本文的控制目标是设计一个自适应输出反馈动态面控制器,使得系统的输出信号y=x1能够跟踪给定的参考信号xd,整个闭环系统在李雅普诺夫意义下是稳定的,且跟踪误差e1能够在有限时间内收敛到原点附近一个邻域中,通过调节设计参数可以使得该邻域的任意小.另外,调节控制器设计参数,能够保证输出信号y具有很好的跟踪性能.引理1 径向基函数神经网络(radical basis function neuralnetworks,RBFNN)[3,5,13]能够逼近未知光滑连续非线性函数f(X):,形式如下:其中:X=[X1X2···Xq]T∈Rq为神经网络的输入向量,Θ∈Rq是神经网络的权值向量,Φ(X)= [Φ1(X)Φ2(X)···Φq(X)]T∈Rq为神经网络的基函数向量;ε为估计误差且满足|ε|<;其中为估计误差的上界.在下述观测器设计中,用来表示对神经网络权值向量θ的估计,估计误差用来表示.而在控制器设计中,用来表示对神经网络权值向量Θ的估计,估计误差用来表示.定义状态观测器的形式为其中:表示对系统状态xp的估计,表示采用神经网络对未知函数fp(xp)(p=1,···,n)的估计,非线性反馈项选为式中:βp(p=1,···,n)为反馈增益.韩京清教授在自抗扰控制算法文献[11]中提出的非线性函数fal(η,δ,κ)的表达式为其中:κ是一个正的设计参数,δ>0表示误差的边界,η代表扩张状态观测器的跟踪误差.神经网络权值调节律选为定义观测器的跟踪误差为由式(1)(3)可得,观测误差满足的动态方程为考虑如下形式的李雅普诺夫候选泛函:对李雅普诺夫泛函求时间的导数,可得在上式中,不难证明下列不等式成立:其中参数ci>0.将不等式(11)代入式(10)得式中ρe和γe定义为其中i=2,···,n−1.对式(12)左右两边同时乘以eρet并在区间[0,t]上积分得上式表明,通过神经网络权值调节律的设计参数,能够保证观测器系统的观测误差和神经网络权值的估计误差是有界的,改变参数值能够提高观测性能.基于本节中设计的神经网络观测器(8),在下面一节中,将设计自适应输出反馈动态面控制信号并给出稳定性分析.本节中,将应用反步法并结合神经网络函数逼近器,研究系统(1)的自适应神经网络控制器.反步法设计过程将分为n步,并且包含如下坐标变换:其中αj(j=1,···,n−1)是针对第j个子系统设计的基于合适的李雅普诺夫泛函Vj的虚拟控制信号.控制信号u在最后一步设计,来稳定整个闭环系统并实现输出反馈控制. Step1 既然有,那么e1的微分信号可以写为其中:的输入向量为.为了补偿未知函数Q1(X1),在紧集ΩX1,采用神经网络来逼近该函数如下:其中:分别表示网络权值和基向量,l是结点的个数.函数逼近误差ε1满足不等式为正常数.把式(17)代入式(16)得选取虚拟控制信号及参数自适应律为其中:,k1>0和ϱ1>0是设计参数.考虑如下形式的李雅普诺夫候选泛函:对上述函数求时间的微分,并考虑式(16)(19)得在上式中,可以证明下列不等式成立:其中参数c11>0.把式(22)代入式(21)得其中γ1和ρ1是正常数,定义为上述不等式两边同乘以eρ1t得对式(25)两端在时间域[0,t]上积分,得到上式最后一项具有如下性质:因此,如果e2能够在一个有限时间[0,tf]之内保持有界,就能得到式(27)最后一项的有界性.那么,式就可以写为其中Stepi 由式(9)的第2式直接对时间t求导可得式(29)可以改写为其中:是一个能够被神经网络来逼近的未知的光滑非线性函数,神经网络的输入向量为.于是,在紧集ΩXi上有其中,函数逼近误差满足,εi为正常数.将式(31)代入式(30)可得此时,考虑如下的虚拟控制信号以及神经网络参数调节律:其中:,ki和ϱi都是正常数.定义新的李雅普诺夫候选泛函为对V2求导数可得类似于步骤1中的推导过程,利用Young不等式,可得Vi的微分为其中正常数ρi和γi定义为不等式(36)两边同乘以eρit然后在区间[0t]上得与第1步中的分析类似,上式中最后一项可以表示为因此,如果ei+1能够在有限时间[0,tf]后保持有界,就能保证式其中.Stepn 在这一步骤中,本文将设计实际控制信号u(t).考虑跟踪误差,其对时间的微分为其中:用来在紧集上逼近未知函数,输入向量为].函数逼近误差(为正常数).实际控制信号选为其中神经网络参数自适应律为式中:,kn,ϱn为正常数.考虑如下形式的李雅普诺夫候选泛函:对Vn求时间的导数,得到把式(42)–(43)代入式(45)有在此利用Young不等式,得到其中常数ρn和γn定义为对不等式(47)两边同乘以eρnt并在区间[0,t]上积分得考虑不等式(28)(40)和(49),下节中将给出整个闭环系统的稳定性证明及所有信号的有界性.定理1 考虑由被控对象(1),虚拟控制律(19) (33),控制律(42)和参数自适应律(43)组成的闭环系统.给定任意的初始状态(0)属于集合Ω0,整个闭环神经网络控制系统所有信号都是有界的.系统状态和网络权值将保持在一个紧集Ω中,Ω定义为并逐渐收敛到紧集Ωs,Ωs定义为其中将在定理证明中给出定义.证考虑Vn的定义(44)及其满足的不等式(49).在式(49)中,令µn=γn/ρn+V(0),得到类似地,在Step(n−1)到Step 1,令µj=ρj/γj+V(0),有对不等式两边取极限,在t→∞时,有,其中.因此,根据Vn的定义式(44),可以判定当t→∞时,下列不等式是成立的:因此,误差en是最终一致有界的.同样可以得到关于的如下结论:由此可知,误差ej是最终一致有界的.从式(50)–(51)对紧集Ω和Ωs边界的定义以及γi,ρi的定义式,可以看出紧集Ω和Ωs的大小依赖于控制器设计参数ki和λmin(Γi)的选择.特别的,当增加ki时,能够减小,紧集Ω和Ωs的大小随之减小.因此,只要系统初始状态起始于Ω0,存在控制参数取值,使得状态和权值向量保持在一个紧集Ω中,并最终收敛到紧集Ωs中. 证毕. 本节采用数值仿真验证本文所提出输出反馈控制算法的有效性.考虑如下形式的不确定严格反馈系统:其中系统的不确定性函数取为仿真中,参考信号取为观测器,控制器以及神经网络参数取值如表1所示.仿真结果如图2–6所示.图2–3给出的是神经网络观测器的两个状态信号.图4中的曲线表示输出信号的跟踪效果.图5给出的是观测器中采用的两个神经网络的权值范数,而图6中给出的是自适应控制信号中采用的两个神经网络的权值范数.从图2中的估计状态曲线可以看出,系统状态估计及观测误差是有界的.其中,系统的第2个状态x2的跟踪误差稍大,这归因于神经网络没有达到持续激励条件而导致的较大的函数逼近误差.然而,从图4可以看出,系统的输出信号依然具有很好的跟踪效果.为进一步提高跟踪性能,还需要对神经网络的持续激励条件做深入研究.另外,从图5–6可以看出,仿真中所采用的神经网络的权值范数也是有界的.作为对比,同时对被控对象(57)设计了基于高增益观测器的滑模控制算法.高增益观测器的形式取为其中L1和L2是反馈增益.由于观测器的第2个微分方程也采用观测误差e1作为反馈信号,提高观测精度就要求L2的取值很高.从图7–8中的曲线可以看出,虽然状态对z1=x1具有较高精度的观测,但是状态z2的观测值出现了明显的抖动.这是由于观测器(59)的第2个状态采用高增益反馈形式产生的结果.在本文中,针对一类非线性系统状态未测量反馈控制问题,在输出反馈自适应控制框架下对系统分别设计了神经网络观测器和自适应动态面控制器.该输出反馈控制算法不需要对系统原模型作状态变换,避免了采用系统输出信号作反馈时的高增益问题,从而克服了高增益观测的抖震问题.闭环系统稳定性分析和数值仿真结果验证了这种方法的有效性.下一步的工作是如何通过对神经网络施加持续激励信号,提高非线性函数逼近精度从而提高系统状态观测精度.孙国法 (1985–),男,博士,讲师,目前研究方向为非线性系统智能自适应控制、自抗扰控制研究及应用、动态面、观测器设计等,E-mail:*******************;【相关文献】[1]POLYCARPOUS M M,IOANNOUQ P A.A robust adaptive nonlinear controldesign[J].Automatica,1996,32(3):423–427.[2]CHEN Hai,HE Kaifeng,QIAN Weiqi.Attitude control of flight vehicle based on a nonlinearL1adaptive dynamic inversion approach [J].ControlTheory&Applications,2016(8):1111–1118. (陈海,何开锋,钱炜祺.基于非线性L1自适应动态逆的飞行器姿态角控制[J].控制理论与应用,2016(8):1111–1118.)[3]WANG D,HUANG J.Adaptive neural network control for a class of uncertain nonlinear systems in pure-feedback form[J].Automatica,2002,38(8):1365–1372.[4]ZOU A M,HOU Z G,TAN M.Adaptive control of a class of nonlinear pure-feedback systems using fuzzy backstepping approach[J].IEEE Transactions on FuzzySystems,2008,16(4):886–897.[5]REN B B,GE S S,SU C Y,et al.Adaptive neural control for a class of uncertain nonlinear systems in pure-feedback form with hysteresis input[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,2009,39(2):431–443.[6]SWAROOP D,HEDRICK J K,YIP P P,et al.Dynamic surface control for a class of nonlinear systems[J].IEEE Transactions on Automatic Control,2000,45(10):1893–1899.[7]Liu Yonghua.Dynamic surface control for pure-feedback nonlinear systems[J].Control Theory&Applications,2014,31(9):801–804. (刘勇华.一类纯反馈非线性系统的反推控制[J].控制理论与应用,2014,31(9):801–804.)[8]GE S S,HANG C C,ZHANG T.Adaptive neural network control of nonlinear systems by state and output feedback[J].IEEE Transactions on Systems,Man,and Cybernetics,Part B:Cybernetics,1999,29(6):818–828.[9]HUA C C,GUAN X P.Output feedback stabilization for time-delay nonlinear interconnected systems using neural networks[J].IEEE Transactions on Neural Networks,2008,19(4):673–688.[10]ZOU A M,KUMAR K D,HOU Z G.Quaternion-based adaptive output feedback attitude control of spacecraft using Chebyshev NeuralNetworks[J].IEEE Transactions on Neural Networks,2010,21(9): 1457–1471.[11]HAN Jingqing.From PID technology to“active disturbance rejectioncont rol”[J].Control Engineering of China,2002,9(3):13–18. (韩京清.从PID技术到“自抗扰控制”技术[J].控制工程,2002,9(3):13–18.)[12]ZENG Zhezhao,WU Liangdong,YANG Zhenyuan,et al.Selflearning sliding-mode disturbance rejection control for non-af fine systems[J].ControlTheory&Applications,2016,33(7):980–987. (曾喆昭,吴亮东,杨振源,等.非仿射系统的自学习滑模抗扰控制[J].控制理论与应用,2016,33(7):980–987.)[13]FAN Jiahua,MA Lei,ZHOU Pan,et al.Modeling and control of piezoelectric actuator based on radial basis function neural network.ControlTheory&Applications,2016,33(7):856–862. (范家华,马磊,周攀,等.基于径向基神经网络的压电作动器建模与控制[J].控制理论与应用,2016,33(7):856–862.)。
现代控制理论的若干进展及展望(一)控制理论是关于各种系统的一般性控制规律的科学。
它研究如何通过信号反馈来修正动态系统的行为和性能,以达到预期的控制目的。
实际系统往往含有许多未知的不确定性因素,为了对它进行有效的控制,就要对它进行辨识、建模或跟踪,对量测信号进行包括滤波、预测、状态估计在内的现代控制理论的若干进展及展望各种科学处理,然后设计反馈控制规律,使系统的某些性能达到预期的最优指标。
自动控制的历史可分为下列4个时期:1)早期(-1900);2)预古典期(1900-1940);3)古典期(1935-1960);4)现代时期(1955-)。
古典控制理论主要讨论单输入单输出线性系统,代表性的理论和方法包括Routh_Hurwitz稳定性判据,Nyquist分析、Bode图、Ziegler_Nichols调节律和Wiener滤波等。
单复变函数论和平稳过程理论等是古典时期重要的数学工具。
进入现代时期后,随着研究范围及深度的扩大,控制理论几乎涉及到所有的数学分支,以至作为自动控制技术基础的控制理论,也被认为是应用数学的分支之一。
现代控制理论诞生的标志包括前苏联数学家Понтрягин的极大值原理,美国数学家Bellman的动态规划和Kalman的递推滤波以及能控性、能观测性、反馈镇定等代数理论的出现等。
本文拟对近期国内外控制理论的若干进展与热点,以及它的特色与趋势进行简要介绍。
由于篇幅和作者的知识面及研究兴趣所限,难以做到面面俱到,不周之处望读者谅解。
一、进展与热点近年来,控制理论在非线性系统控制、分布参数系统控制、系统辨识、随机与自适应控制、稳健控制与分析、离散事件动态系统、智能化控制等几个主要方向上取得了重要进展。
预计今后若干年内,这些方向仍将是控制理论发展的中心。
下面分别对它们的主要进展、热点及问题进行简要介绍:1、非线性系统控制在非线性控制方面,对仿射非线性系统,证明了用状态非线性反馈及局部微分同胚把它线性化的充分必要条件,它是用Lie代数、分布等来表达的,并且在机械臂、直升飞机与电力系统控制等一些实际工程问题中得到应用。
具有指定性能和全状态约束的多智能体系统事件触发控制杨彬;周琪;曹亮;鲁仁全【摘要】针对一类非严格反馈的非线性多智能体系统一致性跟踪问题,在考虑全状态约束和指定性能的基础上提出了一种事件触发自适应控制算法.首先,通过设计性能函数,使跟踪误差在规定时间内收敛于指定范围.然后,在反步法中引入Barrier Lyapunov函数使所有状态满足约束条件,结合动态面技术解决传统反步法产生的“计算爆炸”问题,并利用径向基函数神经网络(Radial basis function neural networks,RBF NNs)处理系统中的未知非线性函数.最后基于Lyapunov稳定性理论证明系统中所有信号都是半全局一致最终有界的,跟踪误差收敛于原点的有界邻域内且满足指定性能.仿真结果验证了该控制算法的有效性.【期刊名称】《自动化学报》【年(卷),期】2019(045)008【总页数】9页(P1527-1535)【关键词】指定性能;全状态约束;事件触发控制;多智能体系统【作者】杨彬;周琪;曹亮;鲁仁全【作者单位】广东工业大学自动化学院广州510006;广东省智能决策与协同控制重点实验室广州510006;广东工业大学自动化学院广州510006;广东省智能决策与协同控制重点实验室广州510006;广东工业大学自动化学院广州510006;广东省智能决策与协同控制重点实验室广州510006;广东工业大学自动化学院广州510006;广东省智能决策与协同控制重点实验室广州510006【正文语种】中文随着工业和军事应用的发展,愈来愈多的工作需要多个智能体协同完成,因此多智能体协同控制迅速成为学界的热门课题[1−8].由于多智能体协同控制只需接收智能体之间的局部信息,从而大大降低了系统的通讯成本和能耗,且具有更好的灵活性和鲁棒性,所以广泛应用于多机器人协同控制、无人机编队和传感器网络等领域.多智能体协同控制主要包括一致性问题[1−6]、集群问题[7]、编队问题[8]等.其中一致性跟踪问题作为协同控制的一项基本问题,受到了学者们的广泛关注[1−5].在多智能体系统中,每个智能体的微处理器一般会受到计算能力和通信带宽的限制,因此如何在多智能体的一致性跟踪控制过程中降低通讯成本、减小计算压力成为了亟需解决的问题.针对这一问题,有学者在控制器中加入了事件触发机制,并获得了显著的成果[9−12].但是,事件触发机制可能发生奇诺现象,即触发事件会在有限时间内被无数次触发.为了解决这一问题,文献[13]研究了几种不同事件触发机制的最小事件触发时间间隔的基本性质.文献[14]则结合自适应控制解决了事件触发控制中输入状态稳定性的问题.将事件触发机制加入到控制器设计中显著降低了控制过程的能耗和成本,因此,事件触发控制成为了多智能体一致性跟踪控制的一种重要方法. 由于受到物理器件和运行条件的限制,系统通常需要对其状态进行约束,否则将会导致系统不稳定、性能急剧下降等现象,甚至会造成重大的安全事故.因此,解决系统的状态约束问题意义重大.全状态约束作为一种常见的状态约束形式,一直是控制领域的研究热点与难点.文献[3,15−16]均使用Barrier Lyapunov 函数对具有全状态约束的系统进行了研究.文献[15]研究了一类具有参数不确定性的非线性系统的全状态约束问题,文献[16]进一步研究了一类随机非线性系统的全状态约束问题,文献[3]则研究了一类具有全状态约束和未知扰动的多智能体一致性跟踪问题.此外,系统在保证稳定运行的同时,通常还会对收敛速率,最大超调量,稳态误差等性能指标提出要求.因此,在控制器的设计过程中结合指定性能具有重要意义[17−21].基于以上讨论,本文针对一类具有全状态约束的非严格反馈多智能体系统一致性跟踪控制问题进行了研究,改进了控制算法.与现有结果相比,本文的优势在于考虑了指定性能,对跟踪误差进行了指定性能变换,从而获得了更小的稳态误差.此外,在控制器设计过程中加入了固定阈值的事件触发机制,设计了一个基于事件触发的自适应控制算法,降低了智能体之间的通讯成本以及控制成本.在控制算法的设计过程中,用径向基函数神经网络(Radial basis function neural networks,RBF NNs)对系统中的未知非线性函数进行处理,从而解决了控制器设计中不满足匹配条件和未知非线性函数的问题.除此之外,在反步法中引入动态面技术,有效地避免了传统反步法中“计算爆炸”的问题.1 预备知识与问题描述1.1 代数图论本文用图论来描述智能体之间的通信拓扑.智能体之间的有向图记为ζ=(V,E,A),其中, V=(1,2,···,N)是节点数,表示系统中含有N 个智能体. E ⊆V×V 为节点的边,A=[ai,j] ∈RN×N 为邻接矩阵.节点j 到i 的边记为(Vj,Vi) ∈E,表示智能体i 能够接收到智能体j 的信息,智能体i 的邻居节点的集合定义为Ni={Vj|(Vj,Vi) ∈E,i≠j}.对于邻接矩阵A,如果节点j 的信息能被节点i 接收到,那么ai,j > 0,否则ai,j=0.定义节点i的度为对角矩阵D=diag{d1,d2,···,dN}.有向图ζ 的拉普拉斯矩阵为L=D −A.定义拓展图其中=(0,1,2,···,N),0 表示领导者,同样的,当节点i 能够接收领导者0 的信号时ai,0 >0,否则ai,0 <0.引理1[22].如果存在一条路径能够从根节点到达所有其他节点,那么称有向图ζ 具有一个生成树.定义B=diag{a1,0,···,aN,0},其中节点0 称为生成树的根,则矩阵L+B 是非奇异的.1.2 系统描述对于具有N 个同构智能体的多智能体系统,第i 个智能体可以用以下n 阶非严格反馈的非线性系统描述其中, xi=[xi,1,xi,2,···,xi,n]T ∈Rn 表示第i 个智能体的状态向量, yi ∈R 和ui ∈R 分别表示第i个智能体的输出和控制器输入, fi,m(xi)和fi,n(xi)是未知光滑的非线性函数, i=1,2,···,N.假设1[1].有向图ζ 具有一个生成树.节点0 的期望轨迹yd 是一个虚拟的领导者,且只能被部分智能体直接获取. yd 已知, yd 及其n 阶导数都是连续且有界的.定义1[23].如果对于任意一个先验紧集Ω ∈Rn, x(0) ∈Ω,存在有界的ε > 0 以及常数N(ε,x(0)),使得则系统(1)的解是半全局一致最终有界的.1.3 径向基函数神经网络在本文中,RBF NNs 用于逼近系统中的非线性函数[24−25]其中, S(Z)=[S1(Z),S2(Z),···,Sk(Z)]T 表示基函数向量,k 为RBF NNs 的节点数,W=[W1,W2,···, Wk]T ∈Rk 为权重向量.存在一个恒定的理想权重向量W∗,使以下方程成立其中,逼近误差δ(Z)满足|δ(Z)|≤ε, ε > 0.本文使用的高斯基函数如下其中, ιi=[ιi1,ιi2,···,ιiq]T 和ωi(i=1,2,···,k),分别表示高斯函数的中心和宽度.引理2[26].令为RBF NNs 的基函数向量,其中,···, xq]T,对于任意的正整数p≤q,则有2 事件触发自适应控制算法设计本文使用反步法和动态面技术设计了一个事件触发自适应控制算法使多智能体系统达到以下控制目标:1)所有智能体的输出都能对期望轨迹进行跟踪并满足指定性能;2)系统中所有的信号都是半全局一致最终有界的.定义以下坐标变换其中,表示跟踪误差, si,m 表示虚拟误差面,zi,m 表示一阶滤波器的输出信号, λi,m 为滤波误差,αi,m−1为虚拟控制信号.指定性能可以用以下不等式进行描述:其中, δmin和δmax是可调节的参数,性能函数µ(t)有界且严格单调递减,其形式为µ(t)=(µ0−µ∞)e−vt+ µ∞,式中, v, µ0和µ∞都是正实数, µ0= µ(0),选取适当的µ0,使得µ0 >µ∞,为了满足指定性能,进行如下等效变换:其中,为变换误差,由于函数是严格单调递增的,且则有其导数为其中,定义坐标变换其导数为定义自适应参数为其中,为RNF NNs 理想权重向量,的估计,且定义kbl 为误差si,l 的约束,即|si,l|<kbl, i=1,2,···,N; l=1,2,···,n.引理3[27].对于任意正常数kbl,若满足不等式|si,l|<kbl, si,l ∈R,则有引理4[4].定义s1=[s1,1,s2,1,···,sN,1]T, y=[y1, y2,···,yN]T,=[yd,yd,···,yd]T,其中, yd的个数为N.则有其中,是矩阵L+B 的最小奇异值.引理5(Young′s 不等式)[26].对于∀(x,y) ∈Rn,有以下不等式成立其中, p>0, a>1, b>1,(a −1)(b −1)=1.事件触发自适应控制算法的具体设计步骤如下:步骤1.反步法第1 步选取的Barrier Lyapunov 函数为由式(1)∼(4),可得用RBF NNs 逼近可得其中, Zi,1=[xi,xj]T,δ(Zi,1)为逼近误差且|δ(Zi,1)|≤由引理2 和引理5,可得设计反步法第1 步的虚拟控制信号αi,1和自适应律分别为其中, pi,1, ci,1, σi,1都是正的设计参数.将式(6)∼(9)代入式(5),可得步骤2.基于动态面技术[28],定义如下一阶滤波器用于解决反步法的“计算爆炸”问题其中, τi,2是正的设计参数,由λi,2= zi,2 −αi,1可得则有其中,为连续函数.注1.由步骤1 推导出αi,1后,在下一步的虚拟控制信号设计过程中必须对其求导,并且在之后的每一步中都要对虚拟控制信号进行反复求导,从而产生“计算爆炸”问题.引入动态面技术将虚拟控制信号通过一阶低通滤波器得到其估计值zi,2,在下一步设计过程中用估计值代替虚拟控制信号可以避免对其进行求导,简化了控制器结构.选取第m(m=2,3,···,n −1)步的Barrier Lyapunov 函数为由式(1),(2),(11),可得由引理2 和引理5,可得设计第m 步的虚拟控制信号αi,m 和自适应律分别为其中, pi,m, c i,m, σi,m 都是正的设计参数.基于递归的思想,将式(10),(13)∼(16)代入式(12),可得步骤3.与步骤2 相同,定义滤波器其中, τi,m+1是正的设计参数,由λi,m+1=zi,m+1 −αi,m,可得则有其中,为连续函数.选取第n 步的Barrier Lyapunov 函数为则Vi,n 的导数为由引理5 可得自适应控制器设计为如下形式事件触发机制定义为如下形式其中, ei(t)=wi(t)−ui(t)表示测量误差, pi,n, ci,n,σi,n, ϵi, mi 以及都是正的设计参数,且mi <事件触发时刻定义为tk,k ∈Z+.即当式(22)条件被触发时,控制信号将更新为ui(tk+1),当t ∈[tk,tk+1)时,控制信号为wi(tk)保持不变.于是存在一个连续的时变常数ς(t),满足ς(tk)=0, ς(tk+1)=±1,|ς(t)|≤1, ∀t ∈[tk,tk+1),使得wi(t)=ui(t)+ς(t)mi.参考文献[14]可得由引理5 可得由引理3 可得存在一个标量>0 满足则将式(24)∼(26)代入式(23),可得其中,定理1.在假设1 成立的条件下,考虑虚拟控制信号(8),(15),(19),自适应律(9),(16),(20)及事件触发自适应控制器(18),(21),(22),能够保证式(1)所描述的多智能体系统满足以下条件:1)系统中所有的信号都是半全局一致最终有界的;2)跟踪误差收敛于原点的有界邻域内且满足指定性能.此外,事件触发的时间间隔{tk+1 −tk} 存在一个下界t∗, t∗> 0.即该事件触发自适应控制器不会发生奇诺现象.证明.Lyapunov 函数定义为由式(27)可得其导数为选择设计参数使得取则式(28)可以写为则所有的信号都是半全局一致最终有界的,由式(29),得基于引理4,可得由式(30)可知,通过选择合适的设计参数可以使跟踪误差收敛于以原点为中心的有界邻域内.由ei(t)=wi(t)−ui(t), ∀t ∈[tk,tk+1),可得其中,是wi 的导数,因为系统中所有信号都是有界的,所以必然存在一个正常数κ,使得基于ei(tk)=0,可以得出事件触发时间间隔的下界t∗满足t∗≥mi/κ.由此可以证明本文所提出的事件触发机制不发生奇诺现象.3 仿真实例考虑有向拓扑图下由4 个跟随者和1 个虚拟领导者组成的多智能体系统,如图1 所示.其中第i 个子系统的动态模型为图1 通信拓扑图Fig.1 Communication topology作为虚拟领导者的期望轨迹为yd=0.5 sin t.设计的性能函数为µ(t)=0.97e−0.3t+0.03.数值仿真程序中设计参数的值分别设置为ci,1=ci,2=80,σi,1= σi,2=0.001, pi,1= pi,2=10,τi,2=0.02,δmin=0.999, δmax=1,kb1=kb2=2,=8, mi=0.6, ϵi=1.5.初始值设置为: xi,1(0)=[0.2,0.3,0.3,0.4],xi,2(0)=[1.0,−1.5,1.2,−0.6],=0, zi,2(0)=0.1.图2 参考信号yd 和输出信号yiFig.2 Reference signal yd and output yi图3 具有指定性能的跟踪误差Fig.3 Tracking errors with prescribed performance图4 不具有指定性能的跟踪误差Fig.4 Tracking errors without prescribed performance图5 控制信号uiFig.5 Control signal ui图6 u1, u2的事件触发时间间隔Fig.6 Time interval of event-triggered for u1, u2图7 u3, u4的事件触发时间间隔Fig.7 Time interval of event-triggered for u3, u4图2 ∼7 为仿真结果,图2 表示虚拟领导者的期望轨迹yd 和每个跟随者的输出信号yi 的响应曲线,由图可以看出各跟随者在较短的时间内实现了对期望轨迹的跟踪,表明本文提出的控制算法快速实现了多智能体的一致性跟踪.图3 和图4 分别表示具有指定性能的跟踪误差和不具有指定性能的跟踪误差,虽然跟踪误差均能快速收敛于以原点为中心的有界邻域内,但通过对比可得,在不具有指定性能的条件下,稳态误差接近0.03,而具有指定性能时稳态误差小于0.003,因此通过指定性能变换可以显著减小多智能体一致性跟踪控制的稳态误差.控制器输入ui 由图5 表示,控制器输入的数值除了在起始阶段的瞬间有较大的波动,在其余时间均小于7,表明该控制器性能良好,能耗较低.图6 和图7 是ui 的事件触发时间间隔和事件触发次数,横坐标为事件触发时间,纵坐标为事件触发的时间间隔.控制器u1, u2, u3, u4在40 s 内的事件触发次数分别为1 400,399,1 055,386,表明事件触发控制器具有减少控制信号更新次数和降低控制成本的优点,且没有发生奇诺现象.4 结论本文研究了一类具有全状态约束的非严格反馈多智能体一致性跟踪问题.在控制算法设计过程中考虑了指定性能,获得了期望的稳态误差.此外,还设计了一个固定阈值的事件触发机制,降低了智能体之间的通讯成本和计算压力.本文给出了控制算法的详细推导过程和稳定性证明过程.最后通过仿真结果验证了本文所设计的控制算法的有效性.在未来的研究中,我们将考虑更为复杂的应用环境,提高多智能体系统的抗干扰能力.References【相关文献】1 Wang F,Chen B,Lin C,Li X H.Distributed adaptive neural control for stochastic nonlinear multiagent systems. IEEE Transactions on Cybernetics,2017,47(7):1795−18032 Wang F,Liu Z,Zhang Y,Chen B.Distributed adaptive coordination control for uncertain nonlinear multi-agent systems with dead-zone input.Journal of the FranklinInstitute,2016,353(10):2270−2289.3 Zhang Y H,Liang H J,Ma H,Zhou Q,Yu Z D.Distributed adaptive consensus tracking control for nonlinear multi-agent systems with state constraints. Applied Mathematics and Computation,2018,326:16−324 Zhang H W,Lewis F L.Adaptive cooperative tracking control of higher-order nonlinear systems with unknown dynamics. Automatica,2012,48(7):1432−14395 Zhao Jun,Liu Guo-Ping.Position time-varying consensus control for multiple planar agents with non-holonomic constraint. Acta Automatica Sinica,2017,43(7):1169−1177(赵俊,刘国平.非完整性约束的平面多智能体位置时变一致性控制.自动化学报,2017,43(7):1169−1177)6 Wang A J,Liao X F,He H B.Event-triggered differentially private average consensus for multi-agent network. IEEE/CAA Journal of Automatica Sinica,2019,6(1):75−837 Su H S,Wang X F,Lin Z L.Flocking of multi-agents with a virtual leader. IEEE Transactions on Automatic Control,2009,54(2):293−3078 Li T S,Zhao R,Chen C L P,Fang L Y,Liu C.Finite-time formation control of under-actuated ships using nonlinear sliding mode control. IEEE Transactions onCybernetics,2018,48(11):3243−32539 Cheng Y,Ugrinovskii V.Event-triggered leader-following tracking control for multivariable multi-agent systems. Automatica,2016,70:204−21010 Ding D R,Wang Z D,Shen B,Wei G L.Event-triggered consensus control for discrete-time stochastic multi-agent systems:the input-to-state stability in probability. Automatica,2015,62:284−29111 Yang Ruo-Han,Zhang Hao,Yan Huai-Cheng.Eventtriggered cooperative output regulation of heterogeneous multi-agent systems with switching topology. Acta Automatica Sinica,2017,43(3):472−477(杨若涵,张皓,严怀成.基于事件触发的拓扑切换异构多智能体协同输出调节.自动化学报,2017,43(3):472−477)12 Yu M,Yan C,Xie D M,Xie G M.Event-triggered tracking consensus with packet losses and time-varying delays.IEEE/CAA Journal of Automatica Sinica,2016,3(2):165−17313 Borgers D P,Heemels W P M H.Event-separation properties of event-triggered controlsystems. IEEE Transactions on Automatic Control,2014,59(10):2644−265614 Xing L T,Wen C Y,Liu Z T,Su H Y,Cai J P.Eventtriggered adaptive control for a class of uncertain nonlinear systems. IEEE Transactions on AutomaticControl,2017,62(4):2071−207615 Liu Y J,Tong S C.Barrier Lyapunov functions for Nussbaum gain adaptive control of full state constrained nonlinear systems. Automatica,2017,76:143−15216 Liu Y J,Lu S M,Tong S C,Chen X K,Chen C L P,Li D J.Adaptive control-based barrier Lyapunov functions for a class of stochastic nonlinear systems with full state constraints. Automatica,2018,87:83−9317 Bechlioulis C P,Rovithakis G A.A low-complexity global approximation-free control scheme with prescribed performance for unknown pure feedback systems. Automatica,2014,50(4):1217−122618 Li Y M,Tong S C,Liu L,Feng G.Adaptive output-feedback control design with prescribed performance for switched nonlinear systems. Automatica,2017,80:225−23119 Zhou Q,Li H Y,Wang L J,Lu R Q.Prescribed performance observer-based adaptive fuzzy control for nonstrictfeedback stochastic nonlinear systems. IEEE Transactions on Systems,Man,and Cybernetics:Systems,2018,48(10):1747−175820 Li Y M,Tong S C.Adaptive fuzzy control with prescribed performance for block-triangular-structured nonlinear systems. IEEE Transactions on FuzzySystems,2018,26(3):1153−116321 Li Y M,Tong S C.Adaptive neural networks prescribed performance control design for switched interconnected uncertain nonlinear systems. IEEE Transactions on Neural Networks and Learning Systems,2018,29(7):3059−306822 Zhang H W,Lewis F L,Qu Z H.Lyapunov,adaptive,and optimal design techniques for cooperative systems on directed communication graphs. IEEE Transactions on Industrial Electronics,2012,59(7):3026−304123 Yang C G,Ge S S,Xiang C,Chai T Y,Lee T H.Output feedback NN control for two classes of discrete-time systems with unknown control directions in a unified approach.IEEE Transactions on Neural Networks,2008,19(11):1873−188624 Chen M,Shao S Y,Jiang B.Adaptive neural control of uncertain nonlinear systems using disturbance observer. IEEE Transactions on Cybernetics,2017,47(10):3110−312325 Bai W W,Zhou Q,Li T S,Li H Y.Adaptive reinforcement learning NN control for uncertain nonlinear system with input saturation, IEEE Transactions onCybernetics,2019.DOI:10.1109/TCYB.2019.292105726 Sun Y M,Chen B,Lin C,Wang H H,Zhou S W.Adaptive neural control for a class of stochastic nonlinear systems by backstepping rmationSciences,2016,369:748−76427 Ren B B,Ge S S,Tee K P,Lee T H.Adaptive neural control for output feedback nonlinear systems using a Barrier Lyapunov function.IEEE Transactions on NeuralNetworks,2010,21(8):1339−134528 Li T S,Wang D,Feng G,Tong S C.A DSC approach to robust adaptive NN tracking control for strict-feedback nonlinear systems. IEEE Transactions on Systems,Man,and Cybernetics,Part B(Cybernetics),2010,40(3):915−927。