第1章随机迭代学习控制
- 格式:pdf
- 大小:540.92 KB
- 文档页数:32
论述物料称量系统的迭代学习控制算法的研究1 迭代学习控制的概述早在上世纪初,就有人提出了迭代学习控制的概念,这个概念是出现在一篇有关控制机器人的文章上面。
当时文章以日文发表,但未能引起人们的重视。
到了20世纪80年代Arimoto和他的合作者们将Uchiyama的初步研究思想进一步完善,建立了实用算法,在理论上证明了迭代学习控制算法的可行性,正是由于这篇论文的发表,这个概念才开始被人们知晓,渐渐人们开始关注迭代学习控制这方面的问题。
由于这个控制算法的目标在于将跟踪任务能在有限的区域内完成,利用的就是运动重复的性质,通过控制信号的原理对被控制系统完整精密控制。
迭代学习控制算法就是首先尝试对被操控系统发送信号,测量与期许目标值有多少偏差,通过修正这些之前没设计到的偏差修正信号,这样才能提升跟踪的可靠性与准确性。
这种控制算法的特征就是测量精度高,对于目前难以建立模型的情况和一些高精度轨迹、非线性耦合的跟踪都有着很好地跟踪效果,目前已经被多领域使用。
2 迭代学习控制算法的数学模型从整个迭代学习控制算法过程来看,被控制的计量系统中的向量函数在一次又一次相同的运动情况下函数关系是确定并相同的,我们应当根据以往控制经验,准确测量期许目标值和输出信号的参数值,这样方便过后对比调整,从中找到最合适的一条输入特性曲线,这样才能尽量符合期望值。
可以说寻找输入特性曲线的整个过程就是被控制系统不断调整尝试的过程。
在数学上可以这样表示,有限时间用t∈(0,T)表示,对于被控制系统的期望值用r(t)表示,利用有限时间和最初的期望值解出uk(t)和t∈(0,T),通过响应修改,调整t∈(0,T),设迭代学习次数为k。
我们可以将这些连续控制的模型这样表示:模型公式中第一个公式x(t)指的是系统的状态向量,属于n维;第二个公式y(t)是系统的输出向量,属于m维,f和g为x(t)和y(t)相互对应的向量函数,控制系统中的变量是u(t)。
迭代学习控制 1、前言迭代学习控制(Iterative Learning Control ,简称ILC )是指不断重复一个同样的轨迹的控制尝试,并以此修正控制律,以得到非常好的控制效果的控制方法[1]。
迭代学习控制是学习控制的一个重要分支,是一种新型学习控制策略。
它通过反复应用先前试验得到的信息来获得能够产生期望输出轨迹的控制输入,以改善控制质量。
与传统的控制方法不同的是,迭代学习控制能以非常简单的方式处理不确定度相当高的动态系统,且仅需较少的先验知识和计算量,同时适应性强,易于实现;更主要的是,它不依赖于动态系统的精确数学模型,是一种以迭代产生优化输入信号,使系统输出尽可能逼近理想值的算法。
它的研究对那些有着非线性、复杂性、难以建模以及高精度轨迹控制问题有着非常重要的意义。
最初的学习控制-迭代学习控制(ILC ),由日本学者首倡于1978年。
不像其他的的控制方法从线性受控对象起步,迭代学习控制开门见山就把非线性系统作为研究对象,且要在有限区间[0,T]上实现输出完全追踪的控制任务。
这里完全追踪(perfect tracking )指系统的输出自始至终,无论是暂态还是稳态,都和目标轨道保持一致。
显然,迭代学习控制的起点要比其它控制方法高出一截可是,从二十年的发展历程看,起点过高也有不利的一面:发展空间不足以及难以和主流控制方法相融合。
而事实上,只要任务是可重复的,或系统干扰是周期性的,都可用ILC 来解决实际问题。
从迭代学习控制方法的产生至今已有二十多年的历史它已经发展成为智能控制领域的一个新的发展方向,它的研究对那些有着非线性、强耦合、难以建模以及高精度轨迹控制的问题有非常重要的意义。
迭代学习控制适用于具有重复运动性质的被控系统,它的目标是实现有线区间上的完全跟踪任务。
它通过对被控系统进行控制尝试,以输出信号与给定目标的偏差修正不理想的控制信号,使得系统的跟踪性能得以提高。
迭代学习控制的研究对具有较强的非线性耦合、较高的位置重复精度、难以建模和高精度轨迹跟踪控制要求的动力学系统有着非常重要的意义。
第33卷第6期自动化学报Vol.33,No.6 2007年6月ACTA AUTOMATICA SINICA June,2007一类广义系统的迭代学习控制朴凤贤1,2张庆灵1王哲峰2摘要在对广义系统进行标准分解的基础上,研究了含脉冲快子系统的迭代学习控制问题.通过Frobenius范数给出了快子系统在P型学习律作用下收敛的充分性条件,同时通过梯度法给出求解增益矩阵的方法.其次,讨论了单输入单输出不确定广义系统的迭代学习控制问题,通过优化方法给出该系统在P型学习律作用下,系统实际输出尽可能快地收敛到理想输出的增益矩阵的选择方法.关键词广义系统,脉冲,不确定性,迭代学习控制,收敛中图分类号TP13Iterative Learning Control for a Class ofSingular SystemsPIAO Feng-Xian1,2ZHANG Qing-Ling1WANG Zhe-Feng2 Abstract In this paper,the problem of iterative learning con-trol for fast subsystem with impulse is investigated based on the Weierstrass canonical form,the sufficient condition that guar-antees the convergence of P-type learning law is derived by the Frobenius norm,and the approach to choose the gain matrix is given by gradientflow approach.Then,the uncertain single input single output singular system is discussed,the method to choose the gain matrix such that the actual output converge to desired trajectory as quickly as possible is given by optimization. Key words Singular system,impulse,uncertainty,iterative learning control,convergence.1引言迭代学习控制方法[1]自提出以来吸引了国内外许多学者的注意力,同时也取得了很多研究成果[2∼5],但广义系统[6]的迭代学习控制文献并不多见.文献[7]研究了时滞广义系统的状态跟踪问题.工业机器人中很多在重复作业时,都或多或少的受到环境的限制,如弧焊机器人,打毛刺机器人等都要受到终端轨迹限制.从广泛意义来说,工业机器人大多数都是由广义系统模型来刻画的,所以有必要研究广义系统的迭代学习控制问题.本文在对广义系统进行标准分解的基础上,研究含脉冲快子系统的迭代学习控制问题.通过Frobenius范数给出了快子系统的迭代学习控制在P型学习律收敛的充分性条件,同时给出求解增益矩阵的方法.其次,讨论了单输入单输出广义系统前馈项中含有区间不确定性的迭代学习控制问题,通过优化方法给出该系统在P型学习律作用下,系统实际输出尽可能快地收敛到理想输出的学习增益的选择方法.收稿日期2005-11-27收修改稿日期2006-4-21Received November27,2005;in revised form April21,2006国家自然科学基金(60574011),辽宁省科技基金(200140104)和辽宁省普通高校学科带头人基金(124210)资助Supported by National Natural Science Foundation of P.R.China (60574011),Science Foundation of Liaoning Province(200140104) and Academic Leaders Foundationn of College and University of Liaoning Province(200140104)1.东北大学系统科学研究所沈阳1100042.沈阳航空工业学院理学系沈阳1100341.Institute of Systems Science,Northeastern University,Shenyang 1100042.Department of Science,Shenyang Institute of Aeronau-tical Engineering,Shenyang110034DOI:10.1360/aas-007-06582问题描述在Weierstrass标准分解基础上[8]考虑含脉冲的快子系统N˙x(t)=x(t)+Bu u(t)y(t)=Cx x(t)+Du u(t)(1)其中t∈[0,T],x(t)∈R n,u(t)∈R m,y(t)∈R q,分别是系统的状态向量、控制输入向量及输出向量,N∈R n×n 是幂零阵(N h−1=0,N h=0),B∈R n×m,C∈R q×n, D∈R q×m均为实矩阵.有时简记为(N,I,B,C,D),它的状态响应为x(t)=−h−1Xi=1δ(i−1)(t)N i x0−h−1Xi=0N i Bu u(i)(t)(2)其中δ(t)为狄拉克脉冲函数.系统(1)满足下列假设.假设1.系统是脉冲能控的.假设2.系统是输出无脉冲的[9].假设3.对给定的理想轨迹yd(t),存在一控制输入u d(t)满足N˙x d(t)=x d(t)+Bu u d(t)yd(t)=Cx x d(t)+Du u d(t)t∈[0,T]假设4.系统的初始定位操作满足x k(0)=x d(0)= 0,k=0,1,2,···动态系统在有限时间区间t∈[0,T]内是可重复的,在迭代学习过程中,重写系统(1)N˙x k(t)=x k(t)+Bu u k(t)yk(t)=Cx x k(t)+Du u k(t),t∈[0,T](3)学习控制的目的是找到适当的学习律,使得迭代学习序列u k(t)一致收敛于理想的控制输入u d(t),∀t∈[0,T],yk(t)一致收敛于理想的输出yd(t),即limk→∞δu u k(t)F=0⇒limk→∞e k(t)F=0(4)其中,δu u k(t)=u d(t)−u k(t),e k(t)=yd(t)−yk(t),δu u k(t)F∆`Tr`δu u k(t)δu u T k(t)´´12.为了估计迭代学习的次数,我们给出收敛速度定义.定义设ρ<1为迭代学习过程的收敛条件,则该学习律收敛速度定义为v=ρ−k−1,其中k为迭代次数.注 1.由迭代速度定义可以得到迭代次数为k≥‰−ln vlnρ−1ı,其中 · 表示向右取整.3收敛分析首先讨论快子系统(1)在P型学习律下收敛问题.考虑P型学习律u k+1(t)=u k(t)+Γe k(t)(5)其中Γ∈R m×q为学习增益矩阵,e k(t)=yd(t)−yk(t)为迭代学习误差,由此得到如下定理:定理1.如果ρ= I−ΓD+ΓCBF<1,满足假设1∼4的系统(1)在P型学习律(5)作用下是收敛的,即yk(t)→yd(t),(k→∞).6期朴凤贤等:一类广义系统的迭代学习控制659证明略.下面给出如何确定增益矩阵Γ,由于I −ΓD +ΓCB F <1⇔ I −ΓD +ΓCB 2F <1(6)根据Frobenius 范数定义,γ= I −ΓD +ΓCB 2F =Tr h (I −ΓD +ΓCB )(I −ΓD +ΓCB )Ti=Tr “I −2Γ(D −CB )+Γ(D −CB )(D −CB )T ΓT”上式两端同时对τij 求偏导得∂γ∂τij =Tr “2∂Γ∂τij (D −CB )+2∂Γ∂τij(D −CB )×(D −CB )T ΓT”其中∂Γij=ζi ηTj (i =1,2,···,m ;j =1,2,···,q ),Γ=(τij )m ×q ,ζi ∈R m (i =1,2,···,m )和ηj ∈R r (j =1,2,···,q )为标准正交基,通过梯度法[10]求解出Γ.注2.此方法给出了如何确定增益矩阵的方法,但也存在着局限性,这种方法不能求时变的增益矩阵,对时变增益矩阵的求法还需探讨.其次,考虑具有如下形式的广义系统N ˙x(t )=x (t )+bu u (t )y (t )=cxx (t )+d u u (t )(7)其中b ∈R n ×1,c ∈R 1×n ,d u ∈[µ1,µ2],µ1,µ2为实数,其它符号定义如前.对此系统采用P 型学习律u k +1(t )=u k (t )+pee k (t )(8)p 为学习增益,在假设1∼4情况下得到收敛条件ρ=|1−pd u +pcb |<1(9)由于前馈项中含有区间不确定性,鲁棒设计通常考虑系统最坏的情况下是收敛的,这样会影响迭代学习控制过程的收敛速度.为了提高学习的收敛速度,所以有必要对它优化设计.从收敛速度定义可知,系统的收敛速度取决于ρ的大小,也就是说,ρ越小,收敛速度越快,反之ρ越大收敛速度越慢,所以,应该设计满足收敛条件的p 使得ρ越小越好.这个问题就归结为如下的min–max 问题:ρ∆min p ∈R max d ∈d u|1−pd +pcb |s.t.0≤|1−pd +pcb |<1(10)由于|1−pd +pcb |是d 的凸函数,它的最大值在边界上达到,即d =µ1及d =µ2.所以可知,它的最小值在顶点达到,即|1−pµ1+pcb |=|1−pµ2+pcb |(11)上式的解为p 1=0,p 2=2µ1+µ2−2cb,可以得出,p 1=0时,ρ=1不满足收敛条件,故舍去,所以p 2为最优解,ρ=|µ2−µ1||µ2+µ1−2cb |.由此得到下面结论.定理2.满足假设1∼4的系统(7)在学习律(8)作用下是收敛的,如果ρ=|1−pd +pcb |<1,而且当p =212,ρ=|µ2−µ1|21时收敛速度最快.4结束语本文主要讨论了广义系统的迭代学习控制问题,给出含脉冲广义系统在P 型学习律下收敛的充分性条件.同时探讨了单输入单输出不确定广义系统的迭代学习控制问题,并给出了如何确定增益矩阵的方法.References1Arimoto S,Kawamura S,Miyazak F.Bettering operation of robots by learning.Journal of Robot Systems ,1984,1(2):123∼1402Xu J X,Tan Y.Robust optimal design and convergence properties analysis of iterative learning control approaches.Automatica ,2002,38(11):1867∼18803Xu Jian-Xin,Hou Zhong-Sheng.On learning control:the state of the art and perspective.Acta Automatica Sinica ,2005,31(6):943∼955(许建新,侯忠生.学习控制的现状与展望.自动化学报,2005,31(6):943∼955)4Sun Ming-Xuan,Huang Bao-Jian.Iterative Learning Con-trol.Beijing:National Defense Industrial Press,1999(孙明轩,黄宝健.迭代学习控制.北京:国防工业出版社,1999)5Lin Hui,Wang Lin.Iterative Learning Control Theory .Xi’an:Northwest University of Technology Press,1998(林辉,王林.迭代学习控制理论.西安:西北工业大学,1998)6Rosenbrock H H.Structural properties of linear dynami-cal systems.International Journal of Control ,1974,20(2):191∼2027Xie S L,Xie Z D,Liu Y Q.Learning control algorithm for state tracking of singular systems with delay.Journal of Sys-tems Engineering and Electronics ,1999,21(5):10∼168Dai L Y.Singular System Control.Lecture Notes in Control and Information Sciences .New York:Springer,19899Zhang Q L,Yang D M.Analysis and Synthesis for Uncer-tain Descriptor Systems .Shenyang:Northeastern University Press,2003(张庆灵,杨冬梅.不确定广义系统的分析和综合.沈阳:东北大学出版社.2003)10Yan W Y,Teo K L,Moore J B.A gradient flow approachto computing LQ optimal feedback gains.Optimal Control Application and Methods ,1994,15(1):67∼75朴凤贤2003年获东北大学应用数学理学硕士学位,现为东北大学控制理论与控制工程专业博士研究生,主要研究方向为广义系统的鲁棒控制和迭代学习控制.本文通信作者.E-mail:fxpiao ln@ (PIAO Feng-Xian Received her M.S.degree from North-eastern University in 2003.She is currently a Ph.D.candidate in control theory and control engineering of Northeastern Uni-versity.Her research interest covers robust control,and iterative learning control of descriptor systems.Corresponding author of this paper.)张庆灵东北大学教授.主要研究方向为广义系统,鲁棒控制和迭代学习控制.E-mail:qlzhang@ (ZHANG Qing-Ling Professor in College of Science at Northeastern University.His research interest covers robust con-trol theory and descriptor systems,iterative learning control.)王哲峰2006年获东北大学博士学位,现为沈阳航空工业学院副教授,主要研究方向为材料成形和自动控制.(W ANG Zhe-Feng Received his Ph.D.degree from North-eastern University in 2006.He is currently an associate professor at Shenyang Institute of Aeronautical Engineering.His research interest covers material forming and automatic control.)。
摘要本文首先分析了迭代学习控制的特点及其应用场合:迭代学习控制(Iterative Learning Control简称ILC)是智能控制理论的一个重要分支,其结构简单,跟踪效果好,不需要模型,或对模型的先验知识要求不高。
对诸如:具有非线性、强耦合、难建模且对控制精度要求高的机器人、注塑等周期性运动或间歇重复生产过程的对象,迭代学习控制的研究具有重要的意义。
其次,基于Matlab软件,进行了迭代学习控制系统仿真实验。
以注塑机生产过程为背景,进行了注射速度迭代学习控制实际应用仿真;最后,对离散系统的迭代学习控制系统进行了PID参数的优化、对迭代学习控制系统的学习律PID参数整定问题进行了研究,探讨了两种整定方法:利用广义逆阵拟合PID参数、利用神经网络拟合PID参数。
关键词:迭代学习控制;注塑机;注射速度;PID参数整定ABSTRACTThis paper first analyzes the characteristics of iterative learning control and its applications:iterative learning control(ILC) is an important branch of the intelligent control.Its main strategies are simple structure,perfect trajectory tracking,less prior knowledge of model.The research of ILC is significant for plants which are nonlinear, strong coupling, difficult to model,and the remand of high speed and high accuracy for motion control.such as robotic manipulators and so on.Secondly based on the Matlab software, do some simulation work about ILC and injection ram velocity of injection modeling machine; Finally study the tuning of iterative learning controller PID parameters using linear discrete-time systems and PID parameter tuning law of ILC, we use two methods: the generalized inverse matrix and neural network to fitting PID parameters.Keywords: iterative learning control;injection ram velocity;injection modeling machine;PID parameters tuning目录第一章前言 (1)1.1课题研究的背景 (1)1.2注塑机注射速度问题的研究 (1)1.3PID参数整定 (1)1.4课题研究的意义 (1)1.5本文研究的主要内容 (1)第二章迭代学习控制研究 (3)2.1迭代学习控制综述 (3)2.2.迭代学习控制研究现状 (5)2.3迭代学习控制仿真研究 (6)2.3.1 开环迭代学习控制 (6)2.3.2 闭环迭代学习控制 (8)2.4小结 (14)第三章注塑机注射速度仿真研究 (15)3.1注塑机控制 (15)3.1.1 注射阶段 (16)3.1.2 保压阶段 (17)3.1.3 预塑阶段 (17)3.2注射速度数学模型 (18)3.2.1 伺服阀 (18)3.2.2 阀控缸 (19)3.2.3 注射速度模型 (20)3.3注射速度迭代学习控制 (21)第四章迭代学习控制与PID参数整定 (23)4.1PID型离散系统迭代学习控制器参数的优化设计 (23)4.2基于迭代学习控制的PID参数整定 (29)4.2.1 利用广义逆阵拟合PID参数 (29)4.2.2 利用神经网络拟合PID参数 (32)第五章结论 (35)致谢 (36)参考文献 (37)第一章前言1.1 课题研究的背景1984年,Arimoto等人提出了迭代学习控制的概念,迭代学习控制 (I LC,iterative learning control是智能控制中具有严格数学描述的一个分支[1]。
题目迭代学习控制理论的初值和加速学习问题研究作者兰天一学科、专业控制科学与工程指导教师林辉教授申请学位日期2017年 6月西北工业大学博士学位论文(学位研究生)题目:迭代学习控制理论的初值和加速学习问题研究作者:兰天一学科专业:控制科学与工程指导教师:林辉教授二零一七年六月A Dissertation Submitted for the Doctor Degreeof Northwestern Polytechnic UniversityResearch of the Initial Values and Accelerated Learning based on Iterative LearningControl TheoryByLan TianyiControl Science and EngineeringSupervised byProf. Lin HuiJune, 2017摘要迭代学习控制(Iterative Learning Control,ILC)是一种人的学习过程和自动控制相结合的控制策略,其特点在于不依赖精确数学模型,且控制结构简单,在线计算量小,经过足够多次的往复学习,便可对给定轨迹在有限区间上完全跟踪。
正是由于该学习算法具有以上优势,易于工程实现,成为近年来控制领域的研究热点,并已应用于运动控制、间歇过程控制、电气系统、生物系统、交通系统等。
初始状态偏差对控制律的收敛性有非常大的影响,它是迭代学习控制研究的核心问题之一。
此外,收敛速度是评判算法优劣的关键标准,在实际工程应用中有着重要意义。
本文研究了迭代学习控制理论的初始值、收敛速度等问题,工作如下:(1)对于一类线性和非线性系统,在Lebesgue-p范数意义下,研究了在含有内部扰动和测量误差影响下的初始值问题。
采用PD型迭代学习控制律,针对随机有界初态,在每次学习周期中构造出一个修正区间,该区间随学习次数变大而缩短。
在该段内,此算法改善了状态偏差对系统影响,使之在该区间段外实现系统输出跟踪期望轨迹;在修正区间外,算法等同于无初始误差修正学习律;并对其在PD型学习律下的鲁棒收敛性进行严格数学证明。