基于BP神经网络的PID参数自适应整定
- 格式:doc
- 大小:751.50 KB
- 文档页数:18
1 基于BP神经网络的PID参数自适应整定
曾正1,蔡容容2,詹立新2
1 武汉大学电气工程学院,430072
2 武汉大学动力与机械学院,430072
联系方式:zengerzheng@
摘 要:针对简单单入单出(SISO)系统中PID控制的参数整定问题进行了仿真研究,利用BP神经网络进行PID参数自适应整定。
首先,得到了问题的传递函数模型,并建立了对应的离散化传递函数模型作为仿真研究的对象,并对未校正系统进行了相关的理论分析。
然后,利用BP神经网络算法在线进行PID参数自适应整定。同时,为了形成参照,给出了运用模拟退火算法离线整定PID参数的仿真过程。建立了3层BP网络结构,以规则为学习规则,控制器算法为有监督的Hebb算法,教师信号为给定与被控对象的输出间的偏差信号。
最后,针对系统在多工况下的复杂情况,从静态稳定和动态稳定的角度,对系统稳定性进行了仿真分析。
仿真结果表明,所设计的基于BP神经网络参数自适应PID控制系统,控制品质高、鲁棒性强。
为了支持更加复杂情况下的仿真,还搭建GUI仿真界面。
关键字:PID控制;参数整定;BP神经网络;稳定分析;GUI;
1 问题背景分析
1.1 准备知识
1.1.1 控制系统的性能指标
当系统的时间响应()yt中的瞬态分量较大而不能忽视时,称系统处于动态或过渡过程中,这时系统的特性称为动态特性。动态特性指标通常根据系统的阶跃响应曲线定义。设系统的阶跃响应曲线如图1所示,图中()lim()xyyt称为稳态值。动态性能指标主要有以下几种[1]。 2 图1 系统的阶跃响应曲线
(1)上升时间rt:阶跃响应曲线从零第一次上升到稳态值所需的时间为上升时间。若阶跃曲线不超过稳态值(称为过阻尼系统),则定义阶跃响应曲线从稳态值的10%上升到90%所对应的时间为上升时间。
(2)最大超调p:设阶跃响应曲线的最大值为()pyt,则对大超调p为
()()100%()ppytyy (1)
p大,称系统阻尼小。
(3)调节时间st:阶跃响应曲线进入并保持在允许的误差范围内所对应的时间称为调节时间。这个误差范围通常为稳态值的倍,称为误差带,为5%或2%。
当系统t时,系统的响应趋于稳定,此时系统跟踪阶跃信号的误差
()lim()lim(()())sssstteetrtyt (2)
定义为稳态误差,它反映了系统跟踪阶跃信号的能力,也是最重要静态性能指标。
1.1.2 系统的数学模型
系统的数学模型在经典控制理论中有微分方程、传递函数、动态框图和信号流图,在现代控制理论中广泛采用状态空间模型。
在初始条件为零时,线性定常系统或元件输出信号的拉氏变换()Ys与输入信号的拉氏变换()Rs之比,称为该系统或元件的传递函数,通常记为()Gs。因此,有
()()()YsGsRs (3)
同时,应注意到在已知系统传递函数的情况下,由()()()YsGsRs,经过反拉氏变换,可以很容易地知道系统在给定输入信号()rt下的响应()yt。
在现代控制理论中,系统的数学模型是用状态空间法来表示的,对于一个简单的单输入单输出系统来说,可以描述为
xAxBuyCxDu (4)
其中,y为输出变量,x为n维状态向量。
状态空间模型和传递函数模型是统一的,它们之间可以相互转换。在本问题中,我们将用到将状态空间模型转换为传递函数模型的方法,其逆转换在本文中不涉及,可参考任何一本控制理论相关的书籍。
由状态空间模型转换为传递函数模型的公式为
1()()[]()YsGsCsIABRs (5) ptrtstOt()yt()y()pyt2()y 3
1.2 问题分析
对于SISO系统
12212256.56.5xxxxxu (6)
输入为u,输出为1yx,用PID控制方法进行设计,并用数值仿真确定控制器参数,使系统输出跟踪期望的输出:3refy。
由1.1可知,系统的传递函数模型为
11210()6.5()[][10]256.56.5()6.525sCsGsCsIABsRsss (6)
在MATLAB的Simulink工具箱中建立如图2所示的仿真模型,系统跟踪给定阶跃输入信号的结果如图3所示。
图2 系统在Simulink下的仿真模型
从图3可以看出:系统是稳定的,但是不能够实现对给定阶跃信号的跟踪。稳态响应为0.78,模型的稳态误差为2.22。
012345600.511.522.53time(s)rin,yout 图3 校正前系统跟踪给定阶跃输入信号的结果
模型的稳态误差也可以通过理论计算得到
2006.53()lim()lim()()lim0.786.525tssyytsGsRsssss (7) 4 ()()30.782.22ssrefeyy (8)
理论的分析结果与仿真结果完全一致。
为了实现对给定阶跃信号的跟踪,必须对系统进行校正或控制。对这样一个本身稳定的系统,可以采用预测控制、模糊控制、自适应控制等先进控制技术,也可以采用传统的PID控制(或称为校正)技术。问题要求采用PID控制,且整定合适的PID参数。我们将采用BP神经网络自适应的方法给出PID参数的整定值,这些参数必须是使得控制系统的性能最优的,我们拭目以待。
为了便于计算机数值仿真,我们将模型进行了离散化。采用零阶保持的方法将模型离散化,采样周期为0.01s。离散化的仿真模型为
-3-320.31810 z + 0.311210()z - 1.935 z + 0.9371Gz (9)
1.3 PID基本原理
在模拟控制系统中,控制器最常用的控制规律是PID控制。模拟PID控制系统原理框图如图4所示。系统由模拟PID控制器和被控制对象组成。
图4 模拟PID控制系统原理框图
PID控制器是一种线性控制器,它根据给定值rin与实际输出值yout构成控制偏差
()()refetyyt (10)
PID的控制律为
0()1()(()())tdpiTdetutketetdtTdt (11)
或写成传递函数的形式
()1()(1)()pdiUsGskTsEsTs (12)
式中,pk为比例系数,iT为积分常数,dT为微分时间常数。
简单说,PID控制器各校正环节的作用为
(1)比例环节:成比例地反映控制系统的偏差信号()et,偏差一旦产生,控制器立即产生控制作用,减少偏差;
(2)积分环节:主要用于消除静差,提高系统的无差度。积分作用的强弱取决于积分时间常数iT,iT越大,积分作用越弱,反之则越强。
(3)微分环节:反映偏差信号的变化趋势(变化速率),并且能在偏差信号变化太大之前,在系统中引入一个有效的早期修正信号,从而加快系统的动作速度,减少调节时间。
2 符号说明
()yt:系统的输出;
refy:系统待跟踪的信号;
()y:系统稳态输出; 比例
微分
积分 被控对象 ()ytrefy 5 ()Gs:系统的传递函数;
()sse:控制系统稳态的输入、输出之差(稳态静差);
pk:PID控制的比例系数;
ik:PID控制的积分系数;
dk:PID控制的微分系数;
iT:PID积分常数;
dT:PID微分时间常数。
注:还有一些局部变量,在使用时加以说明。
3 PID控制参数整定原理
本文采用基于BP神经网络PID参数自适应整定,为了形成对比。给出了利用模拟退火算法整定的结果,作为参照。
本文给出的整定方法是一种在线的自适应调整方法,与离线整定的方法相比,具有超调小、控制量变化小、抗干扰能力强的优点。特别是在模型参数摄动或控制量存在扰动时,控制系统的鲁棒性体现得尤为明显。在后面的仿真中,我们将看到,基于该方法的PID参数整定对提高控制系统的静态和动态稳定具有很好的作用。
3.1 模拟退火算法参数整定原理
从图5可看出,要获取满意的过渡过程动态特性和稳态特性,可采用误差绝对值积分性能指标作为参数选择的最小日标函数(即图中阴影部分的面积)。
0|()|Jetdt (13)
式中,()et为系统误差。当误差的绝对值积分小时,系统的调节时间、超调和稳态误差均会是最优的,系统性能的优化过程正好是误差绝对值积分极小的过程。
图5 误差绝对值积分的示意图
由于PID参数的整定是一个复杂的非线性优化过程,采用常规的方法很难达到目的。在本文中,先利用模拟退火算法整定其参数。模拟退火算法来源于固体退火原理,用固体退火模拟组合优化问题,将内能E模拟为目标函数f,温度T演化为控制参数t,即得到解组合优化问题的模拟退火算法:由初始解0S和控制参数初值t开始,对当前解重复“产生新解—计算目标函数差—接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解,即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。
模拟退火算法可以分解为解空间、目标函数和初始解三部分(程序流程图见附录)。模拟退火算法的基本步骤如下: Ot()yt()y 6 Step1:初始化:初始温度050t(充分大),末温0.1ft,退火系数0.86。初始解0[120 0.3 1.9]S(是算法迭代的起点,其中1.9kp,120iT,0.3dT),马氏链长度1000L,联合图6所示的Simulink仿真模型,得到在该组参数下的目标函数值()fS;
图6 利用模拟退火算法整定PID参数时的Simulink模型
Step2:对k=1,2,…,L做Step3至Step6;
Step3:随机产生新解S;
Step4:计算目标函数值增量()()ffSfS ,其中()fS为新解的目标函数值;
Step5:若0f,则接受S作为新的当前解,否则以概率exp(/)fT接受S作为新的当前解;
Step6:如果满足终止条件则输出当前解作为最优解,结束程序;
Step7:t逐渐减少,若ftt,然后转Step2;否则,转Step8;
Step8:程序结束,输出PID参数的整定结果。
3.2 BP神经网络PID参数自适应整定原理
PID控制要取得较好的控制效果,就必须通过调整比例、积分和微分三种控制作用,形成控制量中既相互配合又相互制约的关系,这种关系不一定是简单的“线性组合”,从变化无穷的非线性组合中可以找出最佳的关系。但是,这仅仅是离线状态下的最优整定结果而已,且一旦确定就不可变化了。设想有这样一种PID控制器,它输出的控制作用不仅与偏差大小有关,而且与被控对象的状态有关。在偏差较大时,采用一组PlD参数,增强控制作用,使对象较快地趋于给定值:当偏差较小时,自动调整为另一组参数,削弱控制作用,避免出现过大的超调量。显然,这样的控制器可以较好地解决稳定性和快速性的矛盾。更进一步,当对象模型摄动时,控制器参数也自动修正,保证模型变化后系统的稳定和控制品质。
BP神经网络具有高度的并行分布式、联想记忆、自组织、自学习、容错能力强的非线性映射能力,体现了人工神经网络最为精华的部分,得到了广泛的应用[3~5]。
神经网络所具有的任意非线性表达能力,可以通过对系统性能的学习来实现具有最佳组合的PID控制。采用BP网络,可以建立dipkkk,,参数自学习的PID控制器。
基于BP网络的PID控制系统机构图如图7所示,控制器由两部分组成
(1)经典的PID控制器,直接对被控对象进行闭环控制,并且三个参数dipkkk,,为在线调整方式;
(2)神经网络,根据系统的运行状态,调整PID控制器的参数,以期达到某种性能指