神经网络动态系统辨识与控制
- 格式:docx
- 大小:441.23 KB
- 文档页数:24
试论述神经网络系统建模的几种基本方法。
利用BP 网络对以下非线性系统进行辨识。
非线性系统22()(2(1)1)(1)()1()(1)y k y k y k u k y k y k -++=+++-1)首先利用u(k)=sin(2*pi*k/3)+1/3*sin(2*pi*k/6),产生样本点500,输入到上述系统,产生y(k), 用于训练BP 网络;2)网络测试,利用u(k)=sin(2*pi*k/4)+1/5*sin(2*pi*k/7), 产生测试点200,输入到上述系统,产生y(k), 检验BP/RBF 网络建模效果。
3)利用模型参考自适应方法,设计NNMARC 控制器,并对周期为50,幅值为+/- 的方波给定,进行闭环系统跟踪控制仿真,检验控制效果(要求超调<5%)。
要求给出源程序和神经网络结构示意图,计算结果(权值矩阵),动态过程仿真图。
1、系统辨识题目中的非线性系统可以写成下式:22()(2(1)1)(1)()();()1()(1)y k y k y k f u k f y k y k -++=•+•=++- 使用BP 网络对非线性部分()f •进行辨识,网络结构如图所示,各层神经元个数分别为2-8-1,输入数据为y(k-1)和y(k-2),输出数据为y(k)。
图 辨识非线性系统的BP 网络结构使用500组样本进行训练,最终达到设定的的误差,训练过程如图所示图网络训练过程使用200个新的测试点进行测试,得到测试网络输出和误差结果分别如下图,所示。
从图中可以看出,相对训练数据而言,测试数据的辨识误差稍微变大,在±0.06范围内,拟合效果还算不错。
图使用BP网络辨识的测试结果图使用BP网络辨识的测试误差情况clear all;close all;%% 产生训练数据和测试数据U=0; Y=0; T=0;u_1(1)=0; y_1(1)=0; y_2(1)=0;for k=1:1:500 %使用500个样本点训练数据U(k)=sin(2*pi/3*k) + 1/3*sin(2*pi/6*k);T(k)= y_1(k) * (2*y_2(k) + 1) / (1+ y_1(k)^2 + y_2(k)^2); %对应目标值Y(k) = u_1(k) + T(k); %非线性系统输出,用于更新y_1if k<500u_1(k+1) = U(k); y_2(k+1) = y_1(k); y_1(k+1) = Y(k); endendy_1(1)=; y_1(2)=0;y_2(1)=0; y_2(2)=; y_2(3)=0; %为避免组合后出现零向量,加上一个很小的数X=[y_1;y_2];save('traindata','X','T');clearvars -except X T ; %清除其余变量U=0; Y=0; Tc=0;u_1(1)=0; y_1(1)=0; y_2(1)=0;for k=1:1:200 %使用500个样本点训练数据U(k)=sin(2*pi/4*k) + 1/5*sin(2*pi/7*k); %新的测试函数Y(k) = u_1(k) + y_1(k) * (2*y_2(k) + 1) / (1+ y_1(k)^2 + y_2(k)^2); if k<200u_1(k+1) = U(k); y_2(k+1) = y_1(k); y_1(k+1) = Y(k); endendTc=Y; Uc=u_1;y_1(1)=; y_1(2)=0;y_2(1)=0; y_2(2)=; y_2(3)=0; %为避免组合后出现零向量,加上一个很小的数Xc=[y_1;y_2];save('testdata','Xc','Tc','Uc'); %保存测试数据clearvars -except Xc Tc Uc ; %清除其余变量,load traindata; load testdata; %加载训练数据和测试数据%% 网络建立与训练[R,Q]= size(X); [S,~]= size(T); [Sc,Qc]= size(Tc);Hid_num = 8; %隐含层选取8个神经元较合适val_iw =rands(Hid_num,R); %隐含层神经元的初始权值val_b1 =rands(Hid_num,1); %隐含层神经元的初始偏置val_lw =rands(S,Hid_num); %输出层神经元的初始权值val_b2 =rands(S,1); %输出层神经元的初始偏置net=newff(X,T,Hid_num); %建立BP神经网络,使用默认参数 %设置训练次数= 50;%设置mean square error,均方误差,%设置学习速率{1,1}=val_iw; %初始权值和偏置{2,1}=val_lw;{1}=val_b1;{2}=val_b2;[net,tr]=train(net,X,T); %训练网络save('aaa', 'net'); %将训练好的网络保存下来%% 网络测试A=sim(net,X); %测试网络E=T-A; %测试误差error = sumsqr(E)/(S*Q) %测试结果的的MSEA1=sim(net,Xc); %测试网络Yc= A1 + Uc;E1=Tc-Yc; %测试误差error_c = sumsqr(E1)/(Sc*Qc) %测试结果的的MSEfigure(1);plot(Tc,'r');hold on;plot(Yc,'b'); legend('exp','act'); xlabel('test smaple'); ylabel('output') figure(2); plot(E1);xlabel('test sample'); ylabel('error')2、MRAC 控制器被控对象为非线性系统:22()(2(1)1)(1)()();()1()(1)y k y k y k f u k f y k y k -++=•+•=++- 由第一部分对()f •的辨识结果,可知该非线性系统的辨识模型为:(1)[(),(1)]()I p y k N y k y k u k +=-+可知u(k)可以表示为(1)p y k +和(),(1)y k y k -的函数,因此可使用系统的逆模型进行控制器设计。
控制系统中的系统辨识技术研究随着科技的进步和社会经济的发展,控制系统成为现代工业自动化领域的重要组成部分,它将机电一体化、计算机技术、机器人技术和控制理论有机结合,已经在现代制造业、冶金、石油化工和交通运输等领域得到了广泛的应用。
由于控制系统模型的精确和参数难以确定的原因,导致了控制系统的设计和调试比较复杂,为此,系统辨识技术应运而生。
但是,系统辨识技术的正确性和可靠性很大程度上影响了控制系统的性能和效果。
因此,控制系统中的系统辨识技术研究就显得很重要。
本文将从控制系统中的系统辨识方法、应用和研究进展三个方面来阐述系统辨识技术在控制系统中的重要性和意义。
一、控制系统中的系统辨识方法系统辨识技术是指通过一系列的试验、观察和测量,对系统的动态特性和参数进行估计和辨识的过程。
在控制系统中,常用的系统辨识方法有最小二乘法、组合辨识法和神经网络辨识法等。
最小二乘法是一种常用的线性系统辨识方法,它通过与测量数据最接近的方式来估计系统的参数,从而把非线性问题转化为线性问题。
最小二乘法已广泛应用于控制系统中的系统辨识,如机器人控制、汽车控制和航空控制等领域,一般适用于动态性能要求不高而精度要求较高的系统。
组合辨识法是将多种模型结合在一起,通过对比不同模型的优缺点来提高系统的辨识效果,它在控制系统的非线性、时变等复杂环境下发挥着良好的作用。
组合辨识法对系统性质不可知、动态不稳定等问题,具有较好的预测性和适应性,因此,在控制系统的设计和调试过程中,组合辨识法也被广泛应用。
神经网络辨识法是一种新兴的非线性辨识技术,具有很强的适应性,尤其在大规模、复杂的非线性系统中具有优势。
在控制系统中,神经网络辨识法可以减少系统的结构假设和参数选择,提高控制精度,这也是目前研究的热点之一。
二、控制系统中的系统辨识应用控制系统中的系统辨识技术被广泛应用于各种控制系统和工业领域,如机器人控制、航空控制、汽车控制、生物信息学、智能化建筑等。
摘要:介绍了智能控制理论的发展概况、研究对象与工具、功能特点,简要列举了智能控制的集中应用。
关键词:智能控制;神经网络;应用0前言自从美国数学家维纳在20世纪49年代创立控制论以来,智能控制理论与智能化系统发展十分迅速。
智能控制理论被誉为最新一代的控制理论,代表性的理论有模糊控制、神经网络控制、基因控制即遗传算法、混沌控制、小波理论、分层递阶控制、拟人化智能控制、博弈论等。
应用智能控制理论解决工程控制系统问题,这样一类系统称为智能化系统。
他广泛应用于复杂的工业过程控制、机器人与机械手控制、航天航空控制、交通运输控制等。
他尤其适用于被控对象模型包含有不确定性、时变、非线性、时滞、耦合等难以控制的因素。
采用其它控制理论难以设计出合适与符合要求的系统时,都有可能期望应用智能化理论获得满意的解决。
科学技术高度发展导致了被控对象在结构上的复杂化和大型化。
在许多系统中,复杂性不仅仅表现在高维性上,更多则是表现在系统信息的模糊性、不确定性、偶然性和不完全性上。
此时,人工智能得益于计算机技术的飞速发展,已逐渐成为一门学科,并在实际应用中显示出很强的生命力。
同时,国际学术界对智能控制的研究也十分活跃,到了20世纪90年代,各种智能控制的国际学术会议日益频繁。
国内也在20世纪80年代初开始进行智能控制研究。
1智能控制理论的发展阶段虽然智能控制理论只有几十年的历史,尚未形成较完整的理论体系,蛋其已有的应用成果和理论发展表明它已成为自动控制的前沿学科之一。
智能控制主要经历了以下几个发展阶段:1.1 自动控制的发展与挫折上世纪40~50年代,以频率法为代表的单变量系统控制理论逐步发展起来,并且成功地用在雷达及火力控制系统上,形成了“古典控制理论”。
上世纪60~70年代,数学家们在控制理论发展中占据了主导地位,形成了以状态空间法为代表的“现代控制理论”。
他们引入了能控、能观、满秩等概念,使得控制理论建立在严密精确的数学模型之上,从而造成了理论与实践之间巨大的分歧。
人工神经网络系统辨识综述摘要:当今社会,系统辨识技术的发展逐渐成熟,人工神经网络的系统辨识方法的应用也越来越多,遍及各个领域。
首先对神经网络系统辨识方法与经典辨识法进行对比,显示出其优越性,然后再通过对改进后的算法具体加以说明,最后展望了神经网络系统辨识法的发展方向。
关键词:神经网络;系统辨识;系统建模0引言随着社会的进步,越来越多的实际系统变成了具有不确定性的复杂系统,经典的系统辨识方法在这些系统中应用,体现出以下的不足:(1)在某些动态系统中,系统的输入常常无法保证,但是最小二乘法的系统辨识法一般要求输入信号已知,且变化较丰富。
(2)在线性系统中,传统的系统辨识方法比在非线性系统辨识效果要好。
(3)不能同时确定系统的结构与参数和往往得不到全局最优解,是传统辨识方法普遍存在的两个缺点。
随着科技的继续发展,基于神经网络的辨识与传统的辨识方法相比较具有以下几个特点:第一,可以省去系统机构建模这一步,不需要建立实际系统的辨识格式;其次,辨识的收敛速度仅依赖于与神经网络本身及其所采用的学习算法,所以可以对本质非线性系统进行辨识;最后可以通过调节神经网络连接权值达到让网络输出逼近系统输出的目的;作为实际系统的辨识模型,神经网络还可用于在线控制。
1神经网络系统辨识法1.1神经网络人工神经网络迅速发展于20世纪末,并广泛地应用于各个领域,尤其是在模式识别、信号处理、工程、专家系统、优化组合、机器人控制等方面。
随着神经网络理论本身以及相关理论和相关技术的不断发展,神经网络的应用定将更加深入。
神经网络,包括前向网络和递归动态网络,将确定某一非线性映射的问题转化为求解优化问题,有一种改进的系统辨识方法就是通过调整网络的权值矩阵来实现这一优化过程。
1.2辨识原理选择一种适合的神经网络模型来逼近实际系统是神经网络用于系统辨识的实质。
其辨识有模型、数据和误差准则三大要素。
系统辨识实际上是一个最优化问题,由辨识的目的与辨识算法的复杂性等因素决定其优化准则。
基于神经网络的机电传动系统参数辨识与自适应控制研究机电传动系统是现代工程中重要的组成部分,其参数的辨识与自适应控制在系统优化与控制策略设计中具有重要意义。
本研究基于神经网络的方法,旨在对机电传动系统的参数进行辨识,并应用自适应控制策略实现系统性能的优化。
一、神经网络在机电传动系统参数辨识中的应用神经网络具有非线性映射和逼近能力强的特点,能够有效地对复杂系统进行建模和辨识。
在机电传动系统参数辨识中,神经网络可以用于识别系统的传递函数、时滞、非线性参数等。
1.1 神经网络的结构与训练神经网络由输入层、隐藏层和输出层组成,通过调整连接权值和偏置来拟合系统的输入输出关系。
传统的训练方法包括误差反向传播算法和逐步逼近算法。
而近年来,基于深度学习的方法,如卷积神经网络和循环神经网络,在参数辨识任务中也取得了较好的效果。
1.2 参数辨识算法常用的参数辨识算法包括最小二乘法、极大似然估计法和粒子群优化算法等。
这些算法可以用于确定神经网络的连接权值和偏置,从而实现对机电传动系统参数的准确辨识。
二、基于神经网络的机电传动系统自适应控制研究机电传动系统自适应控制是指根据实时反馈信息,自动地调整控制策略以实现对系统性能的优化。
神经网络的非线性映射能力使其成为机电传动系统自适应控制的理想工具。
2.1 神经网络控制器设计基于神经网络的自适应控制器可以根据实时反馈信号对系统进行辨识和建模,从而实现对控制策略的自适应调整。
控制器的设计主要包括神经网络结构的选择、损失函数的定义以及参数更新策略的确定。
2.2 自适应控制策略自适应控制策略包括模型参考自适应控制、输出反馈自适应控制和直接自适应控制等。
这些策略可根据实际情况和系统需求进行选择,通过调整神经网络控制器的参数,实现对机电传动系统的自适应调节。
三、机电传动系统参数辨识与自适应控制应用实例为验证基于神经网络的机电传动系统参数辨识与自适应控制方法的有效性,我们给出一个应用实例。
系统辨识的常用方法系统辨识是根据系统的输入输出时间函数来确定描述系统行为的数学模型,是现代控制理论中的一个分支。
对系统进行分析的主要问题是根据输入时间函数和系统的特性来确定输出信号。
传统的系统辨识方法(1)脉冲响应脉冲响应一般是指系统在输入为单位冲激函数时的输出(响应)。
对于连续时间系统来说,冲激响应一般用函数h(t)来表示.对于无随机噪声的确定性线性系统,当输入信号为一脉冲函数δ(t)时,系统的输出响应 h(t)称为脉冲响应函数。
辨识脉冲响应函数的方法分为直接法、相关法和间接法。
①直接法:将波形较理想的脉冲信号输入系统,按时域的响应方式记录下系统的输出响应,可以是响应曲线或离散值。
②相关法:由著名的维纳—霍夫方程得知:如果输入信号u(t)的自相关函数R(t)是一个脉冲函数kδ(t), 则脉冲响应函数在忽略一个常数因子意义下等于输入输出的互相关函数,即 h(t)=(1/k)Ruy(t)。
实际使用相关法辨识系统的脉冲响应时,常用伪随机信号作为输入信号,由相关仪或数字计算机可获得输入输出的互相关函数Ruy(t),因为伪随机信号的自相关函数 R(t)近似为一个脉冲函数,于是h(t)=(1/k)Ruy(t).这是比较通用的方法。
也可以输入一个带宽足够宽的近似白噪声信号,得到h (t)的近似表示。
③间接法:可以利用功率谱分析方法,先估计出频率响应函数H(ω),然后利用傅里叶逆变换将它变换到时域上,于是便得到脉冲响应h(t)。
(2)最小二乘法最小二乘法(LS)是一种经典的数据处理方法, 但由于最小二乘估计是非一致的、有偏差的, 因而为了克服它的不足, 形成了一些以最小二乘法为基础的辨识方法:广义最小二乘法(GLS)、辅助变量法(IVA)和增广矩阵法(EM),以及将一般的最小二乘法与其它方法相结合的方法,有相关分析——-最小二乘两步法(COR —LS)和随机逼近算法.(3)极大似然法极大似然法(ML)对特殊的噪声模型有很好的性能,具有很好的理论保证;但计算耗费大, 可能得到的是损失函数的局部极小值。
系统辨识综述一、系统辨识概述辨识、状态估计和控制理论是现代控制理论三个互相渗透的领域。
辨识和状态估计离不开控制理论的支持,控制理论的应用又几乎不能没有辨识和状态估计技术。
随着控制过程复杂性的提高,控制理论的应用日益广泛,但其实际应用不能脱离被控对象的数学模型。
然而在大多数情况下,被控对象的数学模型是不知道的,或者在正常运行期间模型的参数可能发生变化,因此利用控制理论去解决实际问题时,首先需要建立被控对象的数学模型。
系统辨识正是适应这一需要而形成的,他是现代控制理论中一个很活跃的分支。
社会科学和自然科学领域已经投入相当多的人力和物力去观察、研究有关的系统辨识问题。
系统辨识是建模的一种方法,不同的学科领域,对应着不同的数学模型。
从某种意义上来说,不同学科的发展过程就是建立他的数学模型的过程。
辨识问题可以归结为用一个模型来表示客观系统(或将要构造的系统)本质特征的一种演算,并用这个模型把对客观系统的理解表示成有用的形式。
当然也可以有另外的描述,辨识有三个要素:数据,模型类和准则。
辨识就是按照一个准则在一组模型类中选择一个与数据拟合得最好的模型。
总而言之,辨识的实质就是从一组模型类中选择一个模型,按照某种准则,使之能最好地拟合所关心的实际过程的静态或动态特性。
通过辨识建立数学模型的目的是估计表征系统行为的重要参数,建立一个能模仿真实系统行为的模型,用当前可测量的系统的输入和输出预测系统输出的未来演变,以及设计控制器。
对系统进行分析的主要问题是根据输入时间函数和系统的特性来确定输出信号。
对系统进行控制的主要问题是根据系统的特性设计控制输入,使输出满足预先规定的要求。
而系统辨识所研究的问题恰好是这些问题的逆问题。
通常,预先给定一个模型类μ={M}(即给定一类已知结构的模型),一类输入信号u和等价准则J=L(y,yM)(一般情况下,J是误差函数,是过程输出y和模型输出yM的一个泛函);然后选择使误差函数J达到最小的模型,作为辨识所要求的结果。
122自动化控制Automatic Control电子技术与软件工程Electronic Technology & Software Engineering1 概述过程控制常常遇到大惯性与纯滞后、多变量与耦合且对象模型时变不确定系统,控制系统结构和参数需要依靠经验和现场调试来确定。
PID 控制使用可靠、参数整定方便,成为过程控制常用的控制规律。
PID 控制三个控制参数其整定是控制系统设计的核心,往往参数整定完成后,整定好参数并不具有自适应能力,因生产环境发生改变,参数又需要重新整定。
利用神经网络多输入多输出以适应多变量与耦合、神经网络模型辨识以适应对象模型时变不确定性监测,使得控制具有良好在线自学习和自适应能力,可以很好发挥PID 比例、积分、微分控制优势。
2 系统设计2.1 总体设计设被控对象为:y(k)=g s [y(k-1),y(k-2),…,y(k-n),u(k-1),u(k-2),…u(k-m)]n>m (1)式(1)中被控对象的非线性特性g s (•)未知,需要神经网络辨基于神经网络系统辨识PID 控制的设计与仿真李建新(广州工商学院工学院 广东省广州市 528138)识器在线辨识以确定被控系统的模型。
PID 控制要取得较好的控制效果,关键在于调整好比例、积分和微分三种控制作用的关系。
在常规PID 控制器中,这种关系只能是简单的线性组合,因此难以适应复杂系统或复杂环境下的控制性能要求。
摘 要:本文为了实现生产过程有效控制,将神经网络、模型辨识和PID 控制技术结合,研究神经网络及系统辨识PID 控制。
该控制利用BP 神经网络学习技术实现PID 参数在线调整,同时采用BP 神经网络对被控对象在线辨识。
所设计的算法通过MATLEB 进行大量数据仿真,结果表明该控制实现了传统的PID控制算法无法适应的要求和对所开发的目标机良好移植性。
关键词:PID 控制;BP 神经网络;模型辨识;参数整定;权值调整图1:基于神经网络系统辨识PID 控制系统结构提高分类器的分类速度,达到了优化的目的。
系统辨识及自适应控制实验报告实验报告:系统辨识及自适应控制1.引言系统辨识和自适应控制是现代自动控制领域中的重要研究内容。
系统辨识是通过采集系统输入输出数据,建立数学模型描述系统的动态行为。
自适应控制则是根据系统辨识得到的模型,调整控制器参数以适应系统的变化和外部干扰。
本实验旨在通过实际操作,掌握系统辨识和自适应控制的基本原理和方法。
2.实验目的1)了解系统辨识的基本原理和方法;2)掌握常见的系统辨识方法,包括参数辨识和频域辨识;3)理解自适应控制的基本原理和方法;4)熟悉自适应控制的实现过程;5)通过实验验证系统辨识和自适应控制的有效性。
3.实验原理3.1系统辨识原理系统辨识的目标是通过采集系统输入输出数据,建立数学模型来描述系统的动态特性。
常见的系统辨识方法包括参数辨识和频域辨识两种。
参数辨识是通过拟合实际测量数据,找到最佳的模型参数。
常用的参数辨识方法有最小二乘法、极大似然法和最小误差平方等。
频域辨识则是通过对输入输出信号的频谱分析,得到系统的频率响应特性。
常用的频域辨识方法有傅里叶变换法、相关分析法和谱估计法等。
3.2自适应控制原理自适应控制是根据系统辨识得到的模型,调整控制器参数以适应系统的变化和外部干扰。
自适应控制分为基于模型的自适应控制和模型无关的自适应控制。
基于模型的自适应控制利用系统辨识得到的模型参数,设计相应的控制器来实现自适应控制。
常见的基于模型的自适应控制方法有模型参考自适应控制和模型预测自适应控制等。
模型无关的自适应控制则不依赖于系统辨识的模型,而是根据实际测量数据直接调整控制器参数。
常见的模型无关的自适应控制方法有自适应滑模控制和神经网络控制等。
4.实验内容4.1系统辨识实验在实验中,我们通过采集系统输入输出数据,根据最小二乘法进行参数辨识。
首先设置系统的输入信号,如阶跃信号或正弦信号,并记录对应的输出数据。
然后根据采集到的数据,选取适当的模型结构,通过最小二乘法求解最佳的模型参数。
存储神经网络对动态系统的辨识研究绪论人工神经网络用于非线性动力学系统的辨识,已经有人做了大量的研究,提出的方案主要集中在前馈网络上,但前溃网络本身没有内部存储单元,网络的输出仅仅是当前输入的函数,在许多情况下,要被模拟的物理系统的输出是过去输入和输出的函数,如果系统的阶已知,可以利用“外部抽头延迟线”实现,但是如果系统的阶或延迟不知道,这时辨识问题就变得比较复杂。
为此,需要一种简单易学习的递归神经网络结构作为“阶未知的系统”的辨识模型。
在这篇文章里,我把存储神经网络这类递归网络作为非线性动态系统辨识的通用模型。
存储神经网络是通过给前馈网络增加可训练的临时神经单元而构成的。
这类网络的主要引人之处是,它们有可训练的内部存储神经单元,不需要对过去的输入和输出进行反馈,能直接模拟动态系统。
这样,在辨识和控制应用中,该递归网络能够直接将系统的动力学信息包含在网络结构中,而不用假定系统的阶或延迟就能学习动力学系统。
二、网络结构存储神经网络(MNN)的结构如图1图1 存储神经网络的结构Fig .1.Architecture of a Memory Neuron Network .Network neuron are shown as big open circles and memory neurons are shown as small shaded circles. Every network neuron, except those in the output layer , has one corresponding memory neuron . The expanded box shows the actual connections between a network neuron and a memory neuron .如果除开与每一个网络神经元(在图1中用大的圆圈表示)联系的存储神经元(在图1中用小的圆圈表示),网络的结构就退化成了一个前馈的人工神经网络。
神经网络动态系统的辨识与控制摘要:本论文表明神经网络对非线性动态系统进行有效的辨识与控制。
本论文的侧重点是辨识与控制模型,并论述了动态反向传播以及静态反向传播方法在参数调节中的作用。
在所介绍的模型中,加法器与重复网络结构的内部相连很独特,所以很有必要将他们统一起来进行研究。
由仿真结果可知辨识与自适应控制方案的提出是可行的。
整篇论文中都介绍到基本的概念和定义,也涉及了必须提出的学术性问题,简介用数学系统理论处理动态系统的分析与合成在过去的五十年里已经被列为应用广泛的权威科学原理了。
权威系统理论最先进的地方定义于基于线性代数以及复合变量理论的先进技术线性操作器以及线性常微分方程。
由于动态系统的设计技术与它们的稳定特性密切相关,线性时间不变系统的充分必要条件在上世纪已经产生了,所以已经建立了动态系统的著名设计方法。
相反,只要在系统对系统基础上就可以基本上建立非线性系统的稳定性,因此对于大部分系统没有同时满足稳定性、鲁棒性以及良好动态响应的设计程序并不希奇。
过去三十年来,对线性、非时变和具有不确定参数的对象进行辨识与自适应控制的研究已取得了很大的进展。
但是在这些研究中辨识器和控制器的结构选取和保证整个系统全局稳定性的自适应调参规律的构成等,都是建立在线性系统理论基础上的[1]。
在本论文中,我们感兴趣的是神经网络非线性动态系统的控制与辨识。
由于很少有可以直接应用的非线性系统理论结果存在,所以必须密切关注这个问题以及辨识器和控制器结构的选择和调整参数适应性规则的通用性问题。
在人工神经网络领域里,有两类网络今年来最引人注目:它们是(1)多层神经网络(2)回归神经网络。
多层神经网络被证实在解决模式辨识问题[2]-[5]上非常成功。
而回归神经网络则经常用于联想记忆以及制约优化问题的解决[[6]-[9]。
从系统理论的观点来看,多层网络呈现静态非线性映射,而回归网络则通过非线性动态反馈系统显现。
尽管两种网络存在外观上的不同外,但是很有必要将他们用统一成更一般化的网络。
事实上,笔者确信将来会越来越多的用到动态因素以及反馈,这导致包括两种网络的复杂系统的产生。
这样,将两个网络统一起来就成为必要。
在本文的第三章,这个观点会得到进一步的阐述。
本文用了三个主要目标。
第一个也是最重要的一个目标是在未知非线性动态系统中为自适应控制利用神经网络提出辨识以及控制器结构。
当未知参数线性系统的自适应控制器设计有了主要的提高,这种控制器就不能用于非线性系统的整体控制。
因此所提出的这个模型在表现这个方向的第一步。
第二个目标是为基于反向传播的参数动态调整提出规定的方法这项反相传播算法将在这节中加以介绍。
第三个最后的目标是明确规定必须假定的方法论设想以提出问题。
在整个论文中运用了经常用于系统理论的系统方框图、电脑仿真来对不同概念进行阐述。
本文的结构如下:第二章讲述的是贯穿全文的基本概念和标记性细节。
第三章多层网络和回归网络的统一。
第四章讲述的是神经网络参数调整的静态和动态方法。
第五章讲述辨识模型,第六章讲述自适应控制问题。
最后在第七章指明未来工作的方向。
第二章栏目基本概念标记这章集中讲述与辨识和控制问题相关的概念供参考。
尽管只有部分概念直接在第四和第六章讨论的过程中应用到,但是所有这些概念都与广泛认识神经网络动态系统的作用密切相关。
A 系统辨识与特征化系统辨识与特征化是系统理论最基本的问题。
对系统进行特征化是指对系统进行数学表示:即以一个算子 P: U—>Y作为系统的模型,并确定P所属的算子群,其中和分别是输入空间和输出空间。
而系统的辨识则可描述为在已知和的前提下,确定一个子群和一个元素,以使在某个要求(精确指标)意义下逼进。
于静态系统,U和Y分别是和的子集。
而对于动态系统,它们通常被假定为区间[0,T]或[0,∞]上的有界勒贝格可积函数空间。
算子P则以输入-输出对的形式加以定义。
如果选取以及的形式(即辨识模型)则需要依据精度要求并综合考虑数学处理的简易性及对象被辨识的简易性,而且与离线辨识或在线辨识等因素有关。
1.静态系统和动态系统的辨识:模式识别问题是静态系统识别的一个典型例子,在这里,紧集通过决策函数P映射到输入空间其中表示与类别对应的模式矢量。
在动态系统中,算子P则以定义一个给定对象,该对象用输入-输出函数对U(t),Y(t),t∈[0,T]隐含定义。
无论哪种识别,其目的都是定义Pˆ使其满足:其中ε是一个理想的小正数,是某种适当的范数。
为辨识模型输出,因此是与对象输出观测值Y之间的误差。
动态系统的辨识问题将在Ⅱ-C章节中得到更详细的阐述。
2.Weierstrass定理与Stone-Weierstrass定理:让C([a, b])定义在闭区间[a, b]的实值函数连续函数空间,对于f∈C([a, b])具有范数定义为:著名的Weierstrass近似定理表明,当满足条件时,C([a, b])中的任何函数均可被多项式任意逼近。
自然的,它在多项式估计连续函数的问题中(例如模式识别问题)得到广泛的应用。
基于Stone的Weierstrass定理的推广称为 Stone-Weierstrass 定理,在动态系统的近似过程中具有重要的理论价值。
Stone-Weierstrass 定理:设U是一个紧密度量空间,若是的子函数,它包含常值函数和U中的分离点,那么在中是稠密的。
使我们感兴趣的使可以假定P定义在有界、连续、非时变随机算子空间范围内。
根据Stone-Weierstrass 定理,当满足该定理条件时,可以选择近似于任何特定算子的并递属于的模型。
非线性函数的推论在很多文献中得到了广泛的应用,包括一系列著作如:维他里、威纳、Barret、Urysohn。
运用Stone-Weierstrass 定理,可以知道在某个条件下的给定非线性函数可以用维他里级数和威纳级数等一系列相应的级数来表述。
虽然理论上这种表述给人印象深刻,但是在大部分实际动态系统的辨识中还没有得到广泛的应用。
本文的重点在于论述有限空间非线性差分(或积分)方程条件下动态系统的在线辨识与控制。
这样的线性模型在系统文献中是众所周知的,在以下章节中也将讨论到这种模型。
B系统的描述和问题的提出在系统理论中,相当一部分系统可以用矢量微分方程或矢量差分方程来描述,例如可以用微分方程表示为:其中为状态矢量,为控制输入矢量,为输出矢量,和为静态非线性映射:,矢量x(t)在时间t上表示系统状态,并在t0<t状态下定义,而输入U定义于闭区间。
输出y(t)完全由t时间的系统状态决定。
在本文中,对于离散时间系统,可以用和方程(2)不同的以下形式的差分方程描述:其中u(.),x(.),y(.)是离散时间序列。
大部分结果也可以扩展成连续时间系统来表示。
如果假定方程(3)所描述的系统为线性、非时变系统,可以用下式进行描述:其中A,B,C分别为阶矩阵。
系统由三元组参数化。
在过去三十年里,已知C,A和B的线性非时变系统理论已经得到很大的发展,线性非时变系统的可控性、稳定性以及可观性的研究也比较成熟。
不同问题的简易性最终使得线性方程由n个未知数解出n个解。
与之相反的是,对于包括非线性方程(3)的问题,和已知时,没有类似的手段对非线性代数方程的结果进行逼近。
因此,正如以下所述那样,为了使问题更容易分析,必须作一些假设。
C 辨识与控制1.辨识:方程(3)中的函数和或者(4)中的矩阵A、B、C是未知时,就出现了未知系统(也就是以下章节中所指的对象)的辨识问题。
具体表述如下[1]:非时变、时间离散动态系统的输入和输出分别为和。
其中是时间有界函数。
假设系统在参数化已知而参数值未知时是稳定的,目的是建立一个稳定的辨识模型(图 1(a))。
其中当输入同时为u(k)时,得到如时,得到如(1)所述的近似值输出。
图.1(a)系统辨识图.2(b)参数自适应控制模型2.控制:在控制理论的动态系统分析与综合问题中,或多或少的变量都必须保持在一定的限制内。
如果方程(3)中的和已知,控制的问题就是设计一个控制器使之在常值k的所有信息基础上产生理想的控制输入u(k)。
而对于如(4)所述的线性系统,A,B,C已知的控制器综合问题,已经存在大量的频率和时域技术,而对于已经规定和的非线性系统,并没有类似的方法。
在过去三十年里,人们就对存在不定性的动态系统(1)的控制系统产生了很大的兴趣。
为了更具数学简易性,人们将更多的努力花在对线性、非时变和具有不确定参数的对象进行自适应控制上。
本文的重点主要是不确定参数非线性动态系统的辨识与控制。
直接使用控模型的自适应系统得到很广泛的研究。
这种系统通常被称为参考模型自适应控制(MRAC)体统. MRAC问题的格式化隐性假设是设计者对所讨论的对象足够熟悉,他可以根据参考模型的输出确定对象的理想行为。
MRAC问题实质上可以如下(图.1(b))所示:(a)参考模型自适应控制:控制对象P,给定输入-输出对,稳定参考模型M的确定输入-输出对为,其中是有界函数,输出是系统的理想输出。
目的是对于确定控制输入使得在常数下有:和上面所述的一样,辨识模型的选择(如参数化)以及基于辨识误差的参数调整方法是辨识问题的两个主要部分。
决定控制器结构,调整参数使得系统输出与理想输出间的误差最小代表着控制问题的相应部分。
章讲述的是为线性系统建立辨识模型和控制器结构以及辨识与控制参数调整的一些著名方法。
紧跟着在章中简单阐述非线性动态系统辨识与控制中遇到的问题。
3.线性系统:对于线性、非时变不确定参数对象,辨识模型的产生目前已经众所周知。
对于一个单输入单输出可控可观系统,方程(4)中的矩阵A和向量B和C可以用以下方程方式表示:其中和是不确定参数。
多输入多输出可控可观系统也可以用相似的方法表示。
这意味着在时间k+1时的输出是输入和输出过去值的线性组合。
公式(5)激励以下辨识模型的选择:并行模型串行模型其中决定阶数的大小。
在以下的论述中,系统参数的常向量由 P表示,而辨识模型由表示。
对于可控可观线性、非时变系统可以通过线性稳定反馈显示其稳定性。
这一事实可以用于设计系统的自适应控制器。
例如,当已知系统阶数上限时,控制输出可以通过输入和输出各自的线性组合产生。
如果表示控制的参数矢量,那么存在一个常值矢量,当时,控制器以及系统于参考模型具有相同的输入-输出特性。
调整使其保持在稳定状态的自适应算法已是众所周知,其总的格式如(8)所示。
4.非线性系统:从的讨论中可以知道,可控性和可观性在线性系统辨识与控制问题的格式化上是很重要的。
线性系统的其他著名的结果也要求选择一个参考模型和合适的系统参数化以保证理想控制器的存在。
尽管近年来有很多学者提出诸如非线性系统的可控性、可观性、反馈稳定化以及观测器设计等问题。
,但是没有得出像线性系统那样有效的结论。