当前位置：文档之家› 9.7 机器人神经网络自适应控制

9.7 机器人神经网络自适应控制

声明：应部分读者的要求，本书第9章增加“机器人神经网络自适应控制”一节，图序、公式序顺延。

9.7 机器人神经网络自适应控制

机器人学科是一门迅速发展的综合性前沿学科，受到工业界和学术界的高度重视。机器人的核心是机器人控制系统，从控制工程的角度来看，机器人是一个非线性和不确定性系统，机器人智能控制是近年来机器人控制领域研究的前沿课题，已取得了相当丰富的成果。

机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩，使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样，当机器人的结构及其机械参数确定后，其动态特性将由动力学方程即数学模型来描述。因此，可以采用自动控制理论所提供的设计方法，采用基于数学模型的方法设计机器人控制器。但是在实际工程中，由于机器人是一个非线性和不确定性系统，很难得到机器人精确的数学模型。

采用神经网络，可实现对机器人动力学方程中未知部分的精确逼近，从而实现无需建模的控制。本节讨论如何利用神经网络控制和李雅普诺夫（Lyapunov ）方法设计机器人轨迹跟踪控制的问题，以及如何分析控制系统的稳定性和收敛性。 9.7.1 机器人动力学模型及其结构特性

n 关节机械手动态方程可表示为：

()()()(),d ++++=M q q

V q q q G q F q ττ （9.30）其中，n R ∈q 为关节转动角度向量，()M q 为n n ?维正定惯性矩阵，(),V q q

为n n ?维向心哥氏力矩，()G q 为1?n 维惯性矩阵，()F q 为1?n 维摩擦力，d τ为未知有界的外加干扰，n

R ∈τ为各个关节运动的转矩向量，即控制输入。

机器人动力学系统具有如下动力学特性：特性1：惯量矩阵M(q)是对称正定阵且有界；

特性2：矩阵(),V q q

有界；特性3：()()2,-M q C q q

是一个斜对称矩阵，即对任意向量ξ，有 ()()()2,0T

-=ξ

M q C q q

ξ (9.31)

特性4：未知外加干扰d τ满足d d b ≤τ，d b 为正常数。

9.7.2 传统控制器的设计及分析定义跟踪误差为：

()()()d t t t =-e q q （9.32）

定义误差函数为：

=+∧r e

e （9.33）其中0>∧=∧T

。

则

d =-++∧q

r q e ()()()()()d d d d d d d d

q =-+∧=+∧-=+∧++++-=+∧-++∧+++-=--++Mr

M q q e M q e M M q

e Vq G F ττM q

e Vr V q e G F ττVr τ

f τ （9.34）

其中，f 为包含机器人模型信息的非线性函数。f 表示为

()()()d d =+∧++∧++f x M q

e V q e G F （9.35）在实际工程中，()M

q ，(),V q q

，()G q 和()F q 往往很难得到精确的结果，导致模型不确定项()f x 为未知。

为了设计控制器，需要对不确定项()f x 进行逼近，假设?f

为f 的逼近值。设计控制律为 ?v

=+τf K r （9.36）将控制律式（9.36）代入式（9.34），得

()()0

?v d

v d v =---++=-+++=-++Mr Vr f K r f τK V r f τK V r ? （9.37）

其中f 为针对f 的逼近误差，?=-f f f ，0d

=+?f τ 。如果定义Lyapunov 函数

L =

r Mr （9.38）则

()011222

T T T T T v L =+=-+-+r Mr r Mr r K r r M V r r ?

0T T v

L =-r ?r K r 这说明在v K 固定条件下，控制系统的稳定依赖于0?，即?f 对f 的逼近精度及干扰d

τ的大小。

9.7.3 基于RBF 神经网络逼近的机器人控制

1．基于RBF 网络的逼近算法

已经证明，采用RBF 网络可以实现对任意连续函数的精确逼近。因此，可以采用RBF 网络实现对不确定项f 的逼近。

在RBF 网络结构中，取[]T n

x x x ,....,21=X 为网络的输入向量。设RBF 网络的径向基向

量[]

T m

h h ,,1 =H ，其中h j 为高斯基函数： 2

j 2

-h exp(-

),1,2,2j j

j m b

==X C . （9.39）

其中网络第j 个结点的中心矢量为[]

jn j j c c ,

,1 =C ，n i ,,2,1 =。

假设存在权值W ，逼近函数()f x 的理想RBF 网络输出为：

()()=+f Wh x εx （9.40）

其中W 网络的权向量，[]12,n h h h =

h ，()εx 为逼近误差，()()N

<εx εx 。

考虑式（9.35），针对()f x 中包含的信息，逼近函数()f x 的RBF 网络输入取：

T T T T d d

d ??=?

?X e e

q q q （9.41）

2．基于RBF 网络的控制器和自适应律设计

定义RBF 神经网络的实际输出为：

()()??T =f

x W h x （9.42）取

?=-W

W W （9.43）控制律和自适应律设计为：

()?T v

=+-τW h x K r v （9.44） ()?T =W

Fh x r （9.45）其中F 为对称正定阵，0T

=>F F 。

将式（9.40）、式(9.42)和式（9.44）代入式（9.34），得

()()()()1T v m d v m =-+++++=-++Mr K V r W φx ετv K V r ? （9.46）其中()()1T

d =+++?W

h x ετv ，v 为用于克服神经网络逼近误差ε和干扰d τ的鲁棒项。

将鲁棒项v 设计为：

()()N d b sgn ε=-+v r （9.47）

其中sgn 为符号函数。

()1

sgn 0

010

>??

==??-

r r r r （9.48）

3. 稳定性及收敛性分析

针对n 个关节的神经网络控制，定义Lyapunov 函数为：

()

11122

T T L tr -=+r Mr W F W （9.49）其中()tr ?为矩阵的迹，其定义为：设A 是n 阶方阵，则称A 的主对角元素的和为A 的迹，记作()tr A 。则

()

112

T T T L tr -=++r Mr r Mr W F W

将式（9.46）代入上式，得

()()

()1122

T T T T T v m

d L tr -=-+-+++++r K r r M V r W F W hr r ετv （9.50）将式（9.31）和式（9.45）代入上式，得

()T T v d

L =-+++r K r r ετv 下面分两种情况进行讨论。

（1）不考虑鲁棒项，取0=v ，则

()()2

min

T T v d v N d L K b ε=-++≤-++r K r r ετr r 如果要使0L

≤ ，则需要满足： ()min /N d v b K ε≥+r （9.51）

如果满足0L

≤ ，由于0L >，且M(q)有界，则由L 表达式可知，()t r 、W 和?W 都有界。由()t r 有界可知，跟踪误差()t e 及其导数()t e

都有界，从而q 和q 有界，且跟踪误

差()t e 及其导数()t e 的收敛值随神经网络逼近误差上界N ε和干扰上界d b 的增大而增大，并

可通过增大v K 的值达到任意小。

（2）考虑鲁棒项，v 取式（9.47），则

()()()()0T T T T d d d N d b ε++=++=+-+≤r ετv r ετr v r ετr

0T v

L ≤-≤r K r 由于0L >，且M(q)有界，则()t r 、W 和?W 为有界。由于2T v L =-r K r ，又由于式（9.46）的右边信号都有界，则r

有界，L 有界，则根据Barbalat 引理，L 趋近于零，即()t r 趋近于零，从而可得出()t e 和()t e

趋近于零。

9.7.4 仿真实例

选二关节机器人力臂系统，其动力学模型为：

()()()()d ++++=M q q

V q,q q G q F q ττ （9.52）其中

1232

23223222cos cos ()cos p p p q p p q p p q p +++??=?

?+??M q ，3223122312sin ()sin (,)sin 0p q

q p q

q q p q q --+??=????

V q q 41512512cos cos()()cos()p g q p g q q p g q q ++??=??+??

G q ，()()0.02sgn =F q q ，()()0.2sin 0.2sin T

d t t =????τ。取[][]2

12345,,,, 2.9,0.76,0.87,3.04,0.87p p p p p kgm ==p 。RBF 网络高斯基函数参数的

取值对神经网络控制的作用很重要，如果参数取值不合适，将使高斯基函数无法得到有效的

映射，从而导致RBF 网络无效。故c 按网络输入值的范围取值，取0.20b =，网络的初始

权值取零，网络输入取[]d d d =z e e

q q

q 。系统的初始状态为[]0.09

00.090-，两个关节的位置指令分别为

()

10.1sin d q t =，

()

20.1sin d q t =，控制参数取{}50,50v diag =K ，

{}25,25diag =F ，{}5,5diag ∧=，在鲁棒项中，取0.20N ε=，0.10d b =。

采用Simulink 和S 函数进行控制系统的设计，M=1时为不考虑鲁棒项，仿真结果如图

9-25、图9-26和图9-27所示。

图9-25 关节1和关节2的位置跟踪（M=1）

图9-26 关节1和关节2的控制输入（M=1）

图9-27 函数f及其逼近?f（M=1）

Simulink主程序：chap9_5sim.mdl

位置指令子程序：chap9_5input.m function [sys,x0,str,ts] = spacemodel(t,x,u,flag) switch flag,

case 0,

[sys,x0,str,ts]=mdlInitializeSizes;

case 1,

sys=mdlDerivatives(t,x,u);

case 3,

sys=mdlOutputs(t,x,u);

case {2,4,9}

sys=[];

otherwise

error(['Unhandled flag = ',num2str(flag)]); end

function [sys,x0,str,ts]=mdlInitializeSizes sizes = simsizes;

sizes.NumContStates = 0;

sizes.NumDiscStates = 0;

sizes.NumOutputs = 6;

sizes.NumInputs = 0;

sizes.DirFeedthrough = 0;

sizes.NumSampleTimes = 1;

sys = simsizes(sizes);

x0 = [];

str = [];

function sys=mdlOutputs(t,x,u)

qd1=0.1*sin(t);

d_qd1=0.1*cos(t);

dd_qd1=-0.1*sin(t);

qd2=0.1*sin(t);

d_qd2=0.1*cos(t);

dd_qd2=-0.1*sin(t);

sys(1)=qd1;

sys(2)=d_qd1;

sys(3)=dd_qd1;

sys(4)=qd2;

sys(5)=d_qd2;

sys(6)=dd_qd2;

控制器子程序：chap9_5ctrl.m

function [sys,x0,str,ts] = spacemodel(t,x,u,flag) switch flag,

case 0,

[sys,x0,str,ts]=mdlInitializeSizes;

case 1,

sys=mdlDerivatives(t,x,u);

case 3,

sys=mdlOutputs(t,x,u);

case {2,4,9}

sys=[];

otherwise

error(['Unhandled flag = ',num2str(flag)]); end

function [sys,x0,str,ts]=mdlInitializeSizes global node c b Fai

node=7;

c=0.1*[-1.5 -1 -0.5 0 0.5 1 1.5;

-1.5 -1 -0.5 0 0.5 1 1.5;

-1.5 -1 -0.5 0 0.5 1 1.5];

b=0.20;

Fai=5*eye(2);

sizes = simsizes;

sizes.NumContStates = 2*node;

sizes.NumDiscStates = 0;

sizes.NumOutputs = 3;

sizes.NumInputs = 11;

sizes.DirFeedthrough = 1;

sizes.NumSampleTimes = 0;

sys = simsizes(sizes);

x0 = zeros(1,2*node);

str = [];

ts = [];

function sys=mdlDerivatives(t,x,u) global node c b Fai

qd1=u(1);

d_qd1=u(2);

dd_qd1=u(3);

qd2=u(4);

d_qd2=u(5);

dd_qd2=u(6);

q1=u(7);

d_q1=u(8);

q2=u(9);

d_q2=u(10);

q=[q1;q2];

e1=qd1-q1;

e2=qd2-q2;

de1=d_qd1-d_q1;

de2=d_qd2-d_q2;

e=[e1;e2];

de=[de1;de2];

r=de+Fai*e;

qd=[qd1;qd2];

dqd=[d_qd1;d_qd2];

dqr=dqd+Fai*e;

ddqd=[dd_qd1;dd_qd2];

ddqr=ddqd+Fai*de;

z=[e;de;qd;dqd;ddqd];

for j=1:1:node

h1(j)=exp(-norm(z(1)-c(:,j))^2/(b*b));

h2(j)=exp(-norm(z(2)-c(:,j))^2/(b*b)); end

F=25*eye(2);

for i=1:1:node

sys(i)=F(1,1)*h1(i)*r(1);

sys(i+node)=F(2,2)*h2(i)*r(2);

end

function sys=mdlOutputs(t,x,u)

global node c b Fai

qd1=u(1);

d_qd1=u(2);

dd_qd1=u(3);

qd2=u(4);

d_qd2=u(5);

dd_qd2=u(6);

q1=u(7);

d_q1=u(8);

q2=u(9);

d_q2=u(10);

q=[q1;q2];

e1=qd1-q1;

e2=qd2-q2;

de1=d_qd1-d_q1;

de2=d_qd2-d_q2;

e=[e1;e2];

de=[de1;de2];

r=de+Fai*e;

W_f1=[x(1:node)]';

W_f2=[x(node+1:node*2)]';

qd=[qd1;qd2];

dqd=[d_qd1;d_qd2];

ddqd=[dd_qd1;dd_qd2];

z=[e;de;qd;dqd;ddqd];

for j=1:1:node

h1(j)=exp(-norm(z(1)-c(:,j))^2/(b*b));

h2(j)=exp(-norm(z(2)-c(:,j))^2/(b*b)); end

fn=[W_f1*h1';

W_f2*h2'];

Kv=50*eye(2);

M=2;

if M==1

tol=fn+Kv*r; %Adaptive RBF Control elseif M==2

epN=0.20;

bd=0.10;

v=-(epN+bd)*sign(r);

tol=fn+Kv*r-v; %Robust adaptive RBF Control elseif M==3

tol=Kv*r; %PD Control

end

fn_norm=norm(fn);

sys(1)=tol(1);

sys(2)=tol(2);

sys(3)=fn_norm;

被控对象子程序：chap9_5plant.m

function [sys,x0,str,ts]=s_function(t,x,u,flag)

switch flag,

case 0,

[sys,x0,str,ts]=mdlInitializeSizes;

case 1,

sys=mdlDerivatives(t,x,u);

case 3,

sys=mdlOutputs(t,x,u);

case {2, 4, 9 }

sys = [];

otherwise

error(['Unhandled flag = ',num2str(flag)]);

end

function [sys,x0,str,ts]=mdlInitializeSizes

global p g

sizes = simsizes;

sizes.NumContStates = 4;

sizes.NumDiscStates = 0;

sizes.NumOutputs = 5;

sizes.NumInputs =3;

sizes.DirFeedthrough = 0;

sizes.NumSampleTimes = 0;

sys=simsizes(sizes);

x0=[0.09 0 -0.09 0];

str=[];

ts=[];

p=[2.9 0.76 0.87 3.04 0.87];

g=9.8;

function sys=mdlDerivatives(t,x,u)

global p g

M=[p(1)+p(2)+2*p(3)*cos(x(3)) p(2)+p(3)*cos(x(3));

p(2)+p(3)*cos(x(3)) p(2)];

V=[-p(3)*x(4)*sin(x(3)) -p(3)*(x(2)+x(4))*sin(x(3));

p(3)*x(2)*sin(x(3)) 0];

G=[p(4)*g*cos(x(1))+p(5)*g*cos(x(1)+x(3));

p(5)*g*cos(x(1)+x(3))];

dq=[x(2);x(4)];

F=0.02*sign(dq);

told=[0.2*sin(t);0.2*sin(t)];

tol=u(1:2);

S=inv(M)*(tol-V*dq-G-F-told);

sys(1)=x(2);

sys(2)=S(1);

sys(3)=x(4);

sys(4)=S(2);

function sys=mdlOutputs(t,x,u)

global p g

M=[p(1)+p(2)+2*p(3)*cos(x(3)) p(2)+p(3)*cos(x(3));

p(2)+p(3)*cos(x(3)) p(2)];

V=[-p(3)*x(4)*sin(x(3)) -p(3)*(x(2)+x(4))*sin(x(3));

p(3)*x(2)*sin(x(3)) 0];

G=[p(4)*g*cos(x(1))+p(5)*g*cos(x(1)+x(3));

p(5)*g*cos(x(1)+x(3))];

dq=[x(2);x(4)];

F=0.02*sign(dq);

told=[0.2*sin(t);0.2*sin(t)];

qd1=sin(t);

d_qd1=cos(t);

dd_qd1=-sin(t);

qd2=sin(t);

d_qd2=cos(t);

dd_qd2=-sin(t);

qd1=0.1*sin(t);

d_qd1=0.1*cos(t);

dd_qd1=-0.1*sin(t);

qd2=0.1*sin(t);

d_qd2=0.1*cos(t);

dd_qd2=-0.1*sin(t);

q1=x(1);

d_q1=dq(1);

q2=x(3);

d_q2=dq(2);

q=[q1;q2];

e1=qd1-q1;

e2=qd2-q2;

de1=d_qd1-d_q1;

de2=d_qd2-d_q2;

e=[e1;e2];

de=[de1;de2];

Fai=5*eye(2);

dqd=[d_qd1;d_qd2];

dqr=dqd+Fai*e;

ddqd=[dd_qd1;dd_qd2];

ddqr=ddqd+Fai*de;

f=M*ddqr+V*dqr+G+F;

f_norm=norm(f);

sys(1)=x(1);

sys(2)=x(2);

sys(3)=x(3);

sys(4)=x(4);

sys(5)=f_norm;

绘图子程序：chap9_5plot.m

close all;

figure(1);

subplot(211);

plot(t,x1(:,1),'r',t,x1(:,2),'b');

xlabel('time(s)');ylabel('position tracking for link 1'); subplot(212);

plot(t,x2(:,1),'r',t,x2(:,2),'b');

xlabel('time(s)');ylabel('position tracking for link 2'); figure(2);

subplot(211);

plot(t,tol1(:,1),'r');

xlabel('time(s)');ylabel('control input of link 1'); subplot(212);

plot(t,tol2(:,1),'r');

xlabel('time(s)');ylabel('control input of link 2');

figure(3);

plot(t,f(:,1),'r',t,f(:,2),'b');

xlabel('time(s)');ylabel('f and fn');

9.7 机器人神经网络自适应控制

声明：应部分读者的要求，本书第9章增加“机器人神经网络自适应控制”一节，图序、公式序顺延。 9.7 机器人神经网络自适应控制机器人学科是一门迅速发展的综合性前沿学科，受到工业界和学术界的高度重视。机器人的核心是机器人控制系统，从控制工程的角度来看，机器人是一个非线性和不确定性系统，机器人智能控制是近年来机器人控制领域研究的前沿课题，已取得了相当丰富的成果。机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩，使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样，当机器人的结构及其机械参数确定后，其动态特性将由动力学方程即数学模型来描述。因此，可以采用自动控制理论所提供的设计方法，采用基于数学模型的方法设计机器人控制器。但是在实际工程中，由于机器人是一个非线性和不确定性系统，很难得到机器人精确的数学模型。采用神经网络，可实现对机器人动力学方程中未知部分的精确逼近，从而实现无需建模的控制。本节讨论如何利用神经网络控制和李雅普诺夫（Lyapunov ）方法设计机器人轨迹跟踪控制的问题，以及如何分析控制系统的稳定性和收敛性。 9.7.1 机器人动力学模型及其结构特性 n 关节机械手动态方程可表示为： ()()()(),d ++++=M q q V q q q G q F q ττ （9.30）其中，n R ∈q 为关节转动角度向量，()M q 为n n ?维正定惯性矩阵，(),V q q 为n n ?维向心哥氏力矩，()G q 为1?n 维惯性矩阵，()F q 为1?n 维摩擦力，d τ为未知有界的外加干扰，n R ∈τ为各个关节运动的转矩向量，即控制输入。机器人动力学系统具有如下动力学特性：特性1：惯量矩阵M(q)是对称正定阵且有界；特性2：矩阵(),V q q 有界；特性3：()()2,-M q C q q 是一个斜对称矩阵，即对任意向量ξ，有 ()()()2,0T -=ξ M q C q q ξ (9.31)

基于神经网络的机器人模型辨识-自动化专业

第二章神经网络 2.1神经网络基础人的大脑中有众多神经元，它们连接在一起组成复杂的神经网络，因此大脑拥有高级的认知能力。人工神经网络实际上是对人大脑处理信息方法的简单化。 2.1.1神经网络概述神经网络是推广众多简单处理单元构成的一种非线性动力学系统，能够大规模地进行信息分布式存储和并行处理。同时神经网络具有自学习的能力，当外界的环境发生了改变，神经网络经过训练能够在外界信息的基础上自动调整内部结构，对于给定的输入可以得到期望输出。由图可知，神经元是一种性质为多输入单输出的系统，是由n 个输入i x 和一个输出j y 组成。图2-1 神经元结构 j u ：第j 个神经元的状态； j ：第j 个神经元的阈值； i x ：第i 个神经元的输入信号； ji w ：第i 个神经元到第j 个神经元的连接权系数；其中：激发状态时ji w 取正数，抑制情况下ji w 取的是负值；

j s ：第j 个神经元的外部输入信号。输出可以表示为 1n j ji i j j i Net w x s θ==+-∑ (2.1） ()j j u f Net = (2.2） ()()j j j y g u h Net == （2.3）一般(.)g 是单位映射，也就是说()j j g u u = 。 j Net 表示第j 个神经元的输入； (.)f 表示第j 个神经元的激励函数； (.)g 表示第j 个神经元的输出函数。激活函数往往采用这三种函数：（1）二值函数（阈值型）： 1,0()0,0x f x x >?=?≤? （2.4） (2) S 型函数： 1 ()1x f x e α-= +，0()1f x << （2.5）（3）双曲正切函数: 1()1x x e f x e αα---=+，1()1f x -<< （2.6） 2.1.2神经网络的分类以连接方式对神经网络可分为两大类：一是没有反馈的前向网络，二是相互结合型网络（含有反馈网络）[10]。（1）前向神经网络

神经网络自适应控制

神经网络自适应控制学院：电气工程与自动化学院专业：控制科学与工程姓名：兰利亚学号： 1430041009 日期： 2015年6月25日

神经网络间接自适应控制摘要：自适应模糊控制系统对参数变化和环境变化不敏感,能用于非线性和多变量复杂对象,不仅收敛速度快,鲁棒性好,而且可以在运行中不断修正自己的控制规则来改善控制性能,因而受到广泛重视。间接自适应控制是通过在线辨识的到控制对象的模型。神经网络作为自适应控制器，具有逼近任意函数的能力。关键词：神经网络间接自适应控制系统辨识一、引言自适应控制系统必须完成测量性能函数、辨识对象的动态模型、决定控制器如何修改以及如何改变控制器的可调参数等功能。自适应控制有两种形式：一种是直接自适应控制，另一种是间接自适应控制。直接自适应控制是根据实际系统性能与理想性能之间的偏差，通过一定的方法来直接调整控制器的参数。二、间接自适应系统分析与建模 2.1系统的分析系统过程动态方程：y(k+1)= -0.8y(k)/(1+y2(k))+u(k),参考系统模型由三阶差分方程描述： ym(k+1)=0.8ym(k)+1.2ym(k-1)+0.2ym(k-2)+r(k) 式中，r(k)是一个有界的参考输入。如果输出误差ec(k)定义为 ec(k)=y(k)-ym(k),则控制的目的就是确定一个有界的控制输入u(k),当k趋于正无穷时，ec(k)=0.那么在k阶段，u(k)可以从y(k)和它的过去值中计算得到： u(k)=0.8y(k)/(1+y2(k))+0.8y(k)+1.2y(k-1)+0.2y(k-2)+r(k) （1）于是所造成的误差方程为： ec(k+1)=0.8ec(k)+1.2ec(k-1)+0.2ec(k-2) （2）因为参考模型是渐进稳定的，所以对任意的初始条件，它服从当k趋于无穷， ec(k)=0。在任何时刻k，用神经元网络N2计算过程的输入控制，即 u(k)=-N[y(k)]+0.8y(k)+1.2y(k-1)+0.2y(k-2)+r(k) （3）由此产生非线性差分方程：y(k+1)=-0.8y(k)/(1+y2(k))+N[y(k)] +0.8y(k)+ 1.2y(k-1)+0.2y(k-2)+r(k) （4）故设计的要点是设计一个神经网络来逼近0.8y(k)/(1+y2(k))。 2.2系统的建模设计过程第一步，用BP神经网络逼近，神经网络的结构包含三层：输入层、隐含层和输出层。BP网络的训练过程如下：正向传播是输入信号从输入层经隐层传向输出层，若输出层得到了期望的输出，则学习算法结束；否则，转至反向传播。第二步，输入测试样本，对神经网络的逼近程度进行测试，将测试后的期

神经网络α阶逆系统控制方法在机器人解耦控制中的应用

文章编号 2 2 2 神经网络Α阶逆系统控制方法在机器人解耦控制中的应用Ξ 戴先中孟正大沈建强阮建山东南大学自动控制系南京摘要本文利用神经网络Α阶逆系统线性化解耦能力将严重耦合的多自由度机械手解耦成多个二阶积分子系统进一步采用线性系统设计方法对已解耦系统设计闭环控制器成功地实现了位置快速跟踪该控制方法不需要知道机器人系统的精确数学模型并且结构简单易于工程实现关键词机器人神经网络逆系统多变量解耦中图分类号 ×° 文献标识码 ΡΟΒΟΤΔΕΧΟΥΠΛΙΝΓΧΟΝΤΡΟΛΒΑΣΕΔΟΝΑΝΝ ΑΤΗ?ΟΡΔΕΡΙΝ?ΕΡΣΕΣΨΣΤΕΜΜΕΤΗΟΔ ? ÷ 2 ∞ 2 ≥ ∞ 2 2 ΑυτοματιχΧοντρολΕνγ Δεπτ οφΣουτηεαστΥνι? Ναν?ινγ Αβστραχτ Α 2 √ √ ? ∏ ?? ∏ ≥ ≥ ∏ × √ ∏ ∏ ∏ 2 √ √ ∞? ∏ √ ∏ ? ∏ ∏ ∏ Κεψωορδσ ∏ √ ∏ √ ∏ 1引言 Ιντροδυχτιον 由于多自由度机械手模型的非线性和强耦合性机械手的轨迹快速跟踪控制一直是控制领域中富有挑战性的课题之一基于局部线性化理论的传统°?和° ?控制器仅能使得系统在一个很小的工作空间内获得较好的跟踪性能基于非线性全局线性化理论而提出的计算力矩法由于可以使闭环系统获得完全的解耦和线性化从而能在整个工作空间中获得良好的跟踪特性但是计算力矩法所需的模型参数完全准确以及不存在测量误差等条件在工程实际中较难得到满足为此一些学者又先后提出了自适应控制等方案本文利用神经网络Α阶逆系统线性化解耦能力≈ 将严重耦合的多自由度机械手解耦成多个二阶积分子系统进一步采用线性系统设计方法对已解耦系统设计闭环控制器成功地实现了位置快速跟踪 2多变量系统的神经网络Α阶逆系统解耦控制方法 ΔεχουπλινγχοντρολμετηοδοφΜΙΜΟσψστεμβασεδονΑΝΝΑτη?ορδεριν?ερσεσψστεμ 考察一个用输入输出微分方程表示的 ρ 个输入Υ ρ个输出Ψ 非线性系统Ε Φ Ψ Α Ψ2 Υ 其中第卷第期年月机器人ΡΟΒΟΤ? ∏ Ξ基金项目国家自然科学基金资助项目收稿日期

MATLAB和神经网络自适应控制

自动控制理的研究离不开人类社会的发展。电子计算机的迅速发展、计算和信息处理的水平提高不断地促使着自动控制理论向更复杂的方向发展。自适应控制的提出是针对系统的非线性、不确定性、复杂性。它的研究主要目标不再是被控对象而是控制系统本身。自上世纪年代初神经网络控制系统，提出了基于理论和应用方面都有了新的突破。 MATLAB简介 MATLAB是美国MathWorks公司开发的用于教育、工程与科学计算的软件产品，它向用户提供从概念设计、数据分析、算法开发、建模仿真到实时实现的理想集成环境，是国际控制界公认的标准计算软件。经过十多年的不断地完善和扩充，MATLAB已经拥有了数十个工具箱和功能模块，可以实现数值分析、优化、统计偏微分方程数值解、自动控制、信号处理、图像处理、声音处理、系统建模等诸多领域的计算和图形显示功能。 MATLAB提供了一种用于编程的高级语言——M语言。M语言是一种面向科学与工程计算的高级语言，其最大的特点是简单和直接。它允许用数学形式的语言编写程序，MATLAB的程序文件和脚本文件通常保存为后缀为“.m”的文件，可以称之为M文件。MATLAB是一种基于不限维数组数据类型的内部交互系统，它既能够进行矩阵和向量计算，也能够采用特定的方法在标量语言中编写程序。它采用一些常用的数学符号来表示问题及其解决方案，将计算、可视化和编程等功能集成于一个简单、易用的开发环境中，为用户工作平台的管理和数据的输入/输出提供了便利的方法，同时还提供了M文件的扩展和管理工具。神经网络自适应控制人工神经网络ANN( Ar tif icial Neur al Netw ork) 简称神经网络，是在现代神经学的基础上提出来的，是对人脑或自然神经网络基本特征的抽象和模拟。神经网络很早之前就被证明出来有逼近任意连续有界非线性函数的特殊能力。因此它有很多优点，比如强鲁棒性、容错性、强自适应能力强等。复杂的系统控制提供了一条全新的思路和选择。神经网络控制系统的结构形式有很多种，本文着重介绍神经网络自适应控制方法。一般包括补偿器和自适应处理单元。自适应控制系统的本质是一个非线性随机控制系统，很难为其找到合适的数学模型。为了充分发挥出自适应控制系统的优越性能，提高控制系统的鲁实时性、容错性、鲁棒性以及控制系统参数的自适应能力，能更有效地实现对一些非线性复杂过程系统的

机器人神经网络控制

第一部分机器人手臂的自适应神经网络控制机器人是一具有高度非线性和不确定性的复杂系统，近年来各研究单位对机器人智能控制的研究非常热门，并已取得相当丰富的成果。机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩，使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样，当机器人的结构及其机械参数确定后，其动态特性将由动力学方程即数学模型来描述。因此，可采用经典控制理论的设计方法——基于数学模型的方法设计机器人控制器。但是在实际工程中，由于机器人模型的不确定性，使得研究工作者很难得到机器人精确的数学模型。采用自适应神经网络，可实现对机器人动力学方程中未知部分的精确逼近，从而实现无需建模的控制。下面将讨论如何利用自适应神经网络和李雅普诺夫（Lyapunov ）方法设计机器人手臂跟踪控制的问题。 1、控制对象描述：选二关节机器人力臂系统（图1），其动力学模型为：图1 二关节机器人力臂系统物理模型 ()()()()d ++++=M q q V q,q q G q F q ττ （1）其中 1232 232232 22cos cos ()cos p p p q p p q p p q p +++??=? ?+??M q ，322 3122312 sin ()sin (,)sin 0p q q p q q q p q q --+?? =???? V q q

41512512cos cos()()cos()p g q p g q q p g q q ++??=??+?? G q ，()()0.02sgn =F q q ，()()0.2sin 0.2sin T d t t =????τ。其中，q 为关节转动角度向量，()M q 为2乘2维正定惯性矩阵，(),V q q 为2乘2维向心哥氏力矩，()G q 为2维惯性矩阵，()F q 为2维摩擦力矩阵，d τ为未知有界的外加干扰，τ为各个关节运动的转矩向量，即控制输入。已知机器人动力学系统具有如下动力学特性：特性1：惯量矩阵M(q)是对称正定阵且有界；特性2：矩阵 () ,V q q 有界；特性3：()()2,-M q C q q 是一个斜对称矩阵，即对任意向量ξ，有 ()()()2,0T -=ξ M q C q q ξ (2) 特性4：未知外加干扰d τ 满足 d d b ≤τ， d b 为正常数。我们取[][]2 12345,,,, 2.9,0.76,0.87,3.04,0.87p p p p p kgm ==p ，两个关节的位置指令分别为()10.1sin d q t =，()20.1cos d q t =，即设计控制器驱动两关节电机使对应的手臂段角度分别跟踪这两个位置指令。 2、传统控制器的设计及分析：定义跟踪误差为： ()()()d t t t =-e q q （3）定义误差函数为： =+∧r e e （4）其中0>∧=∧T 。则 d =-++∧q r q e

基于神经网络的多任务学习机器人

基于神经网络的多任务学习机器人目前绝大多数智能机器人具有较高的鲁棒性，但其基于具体行为的实现方法都需要程序员对相应的任务进行手工编程。然而，环境是复杂多样的，而要使得机器人能够在多种环境下进行任务，需要程序员将各种情况考虑在内，这样的系统对环境并不具有适应性，让机器人的应用受到了局限。基于此，提出的自主学习机器人以类人形机器人为基本模型，以神经网络为基础，通过人体对机器人进行示范，训练一个能识别人关节姿态的完备的神经网络。当机器人身处不同环境执行任务时，能够做出适应环境变化的动作。为此所设计的学习机器人系统的特色就在于使用神经网络具有学习能力，提高机器人对环境的适应能力，从而让任务执行更加灵活，使得机器人拥有更广阔的应用前景。标签：自主学习；神经网络；姿態识别；机器人 doi：10.19311/https://www.doczj.com/doc/0016084957.html,ki.16723198.2017.01.092 1引言 1.1机器人在现代社会中的重要性随着城乡居民消费结构的持续升级，以及智慧中国战略的不断推进，智能机器人在家庭、农业、工业等生活的方方面面都有着极其广泛的应用。随着社会的不断发展，社会分工越来越细，与此同时工作也变得越来越单调。另外，社会上有些工作风险较高，若让人去做，不仅效率不高，而且更会产生生命危险。在这样高风险的作业领域，对机器人的需求越来越高。在这一背景下，各种各样的机器人被研制了出来，用它们代替人来完成枯燥、单调、高风险的工作。这极大的提高了劳动生产率和生产质量，创造出了更多的社会财富。同时，社会服务也对机器人产生了大量的需求。从公共服务方面来说，目前我国老龄人口已超过总人口的10%，人口老龄化问题已成为中国需要面临的重大课题。此外，我国残疾人口占总人口的比重也位居世界较高国家之列。机器人的运用，可以为他们提供大量的护理服务，提高他们的生活质量。在医疗服务方面机器人也有很大的优势，手术机器人凭借其操作的精度及可长期工作等特性广泛应用于手术操作中。总而言之，机器人已成为我们的社会不可取代的一部分。 1.2当前机器人领域的现状及弊端目前机器人正处于快速发展的阶段，但目前市场上的机器人仍存在着许多弊端。传统机器人需要设计者针对具体的任务进行手工编程，为了使机器人在环境改变时也能完成任务，设计者就需要尽量将各种情况考虑在内。但是这样的机器人存在一些问题：一方面程序员无法穷尽所有的可能情况，另一方面环境的复杂性也无形中加大了机器人可能出故障的概率，这使得机器人缺乏良好的环境自适应能力，给机器人的广泛应用带来了很大的限制。

基于卷积神经网络算法的机器人系统控制

第２９卷一第４期长一春一大一学一学一报Ｖｏｌ.２９一Ｎｏ.４一２０１９年４月ＪＯＵＲＮＡＬＯＦＣＨＡＮＧＣＨＵＮＵＮＩＶＥＲＳＩＴＹＡｐｒ.２０１９一收稿日期:２０１８－０１－２０基金项目:安徽省科技厅项目(１７０３０９０１０３３) 作者简介:张松林(１９８１－)?男?安徽皖寿人?工程师?硕士?主要从事电子信息工程方面研究?基于卷积神经网络算法的机器人系统控制张松林 (安徽信息工程学院信息系?安徽芜湖２４１０００) 摘一要:随着计算机技术的不断成熟和数据分析技术的不断完善?近年来突出机器深度学习功能的智能算法取得重大突破?其中以卷积神经网络为代表的技术?可根据不同的控制要求进行相应数据训练?从而提高系统的控制效果?在机器人控制二目标识别等领域得到广泛应用?随着机器人应用环境的复杂化?设计基于卷积神经网络机器人控制算法在非结构化环境中实现精准化物体抓取?建立一个完整的机器人自动抓取规划系统? 关键词:机械臂?深度强化学习?策略搜索?卷积神经网络中图分类号:ＴＰ１８３一一文献标志码:Ａ一一文章编号:１００９－３９０７(２０１９)０４－００１４－０４一一自２０世纪中期开始?机器人系统逐步得到发展?从简单的机械结构到具有感知识别功能的智能机器人系统?已经在多个领域广泛应用?其中?物体抓取操作是机器人的重要功能?随着硬件技术的不断成熟?机器人系统通过传感器实现环境感知?并通过智能算法的设计来实现物体的任意抓取?由于机器人系统应用领域的复杂化?对机器人的控制算法提出了更高的要求?目前?工业机器人的抓取算法设计需要依赖预先建立好的物体抓取模型并整理为数据库?但对于在非结构化的环境中进行抓取的机器人来说?建立准确的数学模型难以实现?因此?要建立起能够对环境实时预测并快速整定的抓取规划算法?为优化这一问题?引入基于卷积神经网络的机器人规划算法?机器人通过传感器获取的环境信息?建立对应的抓取位姿映射关系?即通过环境模型库来存储机器人抓取经验?相比与传统的抓取控制算法而言?基于卷积神经网络的算法可以实现对未知物体的抓取经验迁移? １一机器人抓取模型设计机器人物体抓取可以视为机械臂对物体表面上一组接触点的施加力?以防止物体在外界扰动下发生运动?为提高机器人对物体抓取的控制性能?首先?需要建立机器人物体抓取的接触力数学模型[１]? 图１一物体与末端执行器接触模型的坐标系关系１.１一机器人与物体之间的接触力当需要通过机器人的机械臂进行物体抓取时?机械臂的末端抓手会通过若干个接触点与物体进行关联?一般情况下?在接触点上定义坐标系?并沿３个不同维度设立坐标轴ｎｌ二ｐｌ二ｑｌ?其中?接触点上切平面的单位法向量定义为ｎｌ?而ｐｌ二ｑｌ为符合右手定则的在切平面相互垂直的两个单位向量?在接触点建立坐标系如图１所示?机器人的物体抓取定义为爪手与物体之间的运动?而接触面的形状以及爪手与物体之间的摩擦系数共同决定了该运动的性质?在物体的接触点上会提供一个单方向的约束[２]?以此防止物体向接触向量的方向偏移?机械臂爪手对物体施加的力和力

机械臂神经网络自适应控制

机械臂神经网络自适应控制一.前言由于经典控制方法和现代控制方法在控制机器人这种复杂系统时所表现的种种不足，近年来，越来越多的学者开始将智能控制方法引入机器人控制，实现机器人控制的智能化。主要的控制方法有：模糊控制Fc，神经网络控制NNc，专家控制Ec等等。对于复杂的环境和复杂的任务，如何将人工智能技术中较少依赖模型的求解方法与常规的控制方法来结合，正是智能控制所要解决的问题。因此，智能控制系统必须具有模拟人类学习和自适应、自组织的能力。现代智能控制技术的进步，为机器人技术的发展尤其是智能机器人技术的研究与发展提供了可能。神经网络的研究已经有30多年的历史，它是介于符号推理与数值计算之间的一种数学工具，具有很好的学习能力和适应能力，适合于用作智能控制的工具，所以神经网络控制是智能控制的一个重要方面。由于神经网络在许多方面试图模拟人脑的功能。因此神经网络控制并不依赖精确的数学模型，并且神经网络对信息的并行处理能力和快速性，适于机器人的实时控制。神经网络的本质非线性特性为机器人的非线性控制带来了希望。神经网络可通过训练获得学习能力，能够解决那些用数学模型或规则描述难以处理或无法处理的控制过程。同时神经网络还具有很强的自适应能力和信息综合能力，因而能同时处理大量的不同类型的控制输人，解决输入信息之间的互补性和冗余性问题，实现信息融合处理。这就特别适用于像机器人这样具有复杂的不确定性系统、大系统和多变量高度非线性系统的控制。近年来，神经网络在机器人控制中得到了广泛的应用。二、机械臂系统设计机械臂是一个多输人多输出、强耦合的复杂机电系统，要对其实现精确的控制比较困难。为此，先不考虑机械臂的动态控制，只对其进行运动控制，使其能够准确的跟踪给定的轨迹曲线。其基本的控制结构，如图1所示。 (一)机械臂的模型设计本文针对两关节机械臂进行设计，两关节机械臂的控制图如下 n一连杆平面机械臂的动力学模型如下式：（2-1）其中分别代表各关节的角度位置、角速度以及角加速度；为惯性矩阵；为向心矩阵；为重力向量；代表控制输入向量。

基于机器人的递归神经网络运动规划

基于机器人的递归神经网络运动规划文章研究机器手臂的重复运动规划问题，在考虑关节角度极限和关节速度极限的情况下，将此模型转化为一个含不等式约束的二次规划问题，并利用简化对偶神经网络来求解该问题，从而实现机器手臂的关节重复运动。标签：冗余机械臂；重复运动规划；二次规划；对偶神经网络 4 数值仿真本节以平面六连杆冗余机械臂末端执行器作来回直线运动为例进行计算机仿真验证。直线长度为1m，观察其关节轨迹能否重合。末端执行器的运动周期为8s，关节变量的初始状态为：？兹（0）=（0，-？仔/4，0，？仔/2，0，-？仔/4）T弧度。仿真结果如图1所示，从图1也可以看出，在经过8s周期运动之后，平面六连杆机器手臂的各自关节状态都回到初始状态；仿真结果达到预期的目的，且其最大位置误差不大于1.79×10-6。可见，利用所提出的规划解析方案对带关节物理约束的机械臂进行重复运动规划是可行、有效的。 5 结束语针对平面冗余机械臂重复运动规划问题，文章首先将机械臂重复运动问题转化为一个二次型规划问题，该二次规划方案可避开传统的伪逆解析方案难以求逆的问题，然后利用一种简单对偶神经网络来求解该含不等式约束的二次规划问题，该实现算法具有并行性、快速实时处理能力和电路实现性。 6 致谢感谢中山大学张雨浓教授提供相关源程序。参考文献 [1]Malysz P，Sirouspour S.A kinematic control framework for single-slave asymmetric teleoperation systems. IEEE Transactions on Robotics，2011，27（5）：901-917. [2]张智军，张雨浓.重复运动速度层和加速度层方案的等效性[J].自动化学报，2013，39（1）：88-91. [3]Zhang Y N，Xie L，Zhang Z J，Li K N，Xiao L.Real-time joystick control and experiments of redundant manipulators using cosine-based velocity mapping. Proceedings of the 2011 IEEE International Conference on Automation and Logistics.

智能控制神经网络的自适应PID控制器综述

HUNAN UNIVERSITY 2016 年6 月 25 日课程智能控制理论题目基于神经网络的自适应PID 控制器的设计学生姓名学生学号专业班级学院名称

基于神经网络的自适应PID控制器的设计摘要神经网络由于其固有的自学习、自适应、自组织和大规模并行处理能力，已经在控制及其优化领域取得了广泛的应用。利用神经网络来可以处理控制系统的非线性、不确定性和逼近系统的辨识函数等问题并取得了大量研究成果。PID控制是最经典的控制算法，其简单、稳定、高效的性能使其在工业控制领域具有绝对的统治地位。但是面对现代控制系统规模大，复杂度高的情况，单纯使用传统的PID控制已经无法满足要求。本文结合神经网络与PID两者的优势，提出了一种基于神经网络的自适应PID控制器的设计的方法。实验证明该方法具有一定的实际应用价值。近年来，智能控制在工业领域的应用受到了广泛的关注，硬件性能的不断提高与硬件成本的不断降低起到了至关重要的作用。目前在工业中单纯使用传统的控制方法具有一定的局限性，在面对复杂系统与大规模控制的情况下不能保证在任何时刻都提供准确无误的控制信号，将传统的PID控制方法结合智能控制中的神经网络控制可以克服信息的不完备性和不确定性，更加准确地控制被控对象，从而做出正确的判断和决策。 1.神经网络控制神经网络用于控制系统设计主要是针对系统的非线性、不确定性和复杂性进行的。资料显示，国内外将神经网络用于控制系统设计的方式和结构还未有一种统一的分类方法。目前，对神经网络控制系统比较公认地研究方向可以分为监督控制、神经自适应控制、预测控制和逆控制，这时根据控制系统的结构划分的。本文利用到的就是神经自适应控制。本文结合神经网络自适应控制与PID控制，提出了一种有效的控制器设计方法，并在在MA TLAB中进行控制系统仿真。 2.控制器原理根据当前产生误差的输入和输出数据，以及误差的变化趋势作为神经网络的输入条件，神经网络将根据当前PID控制器的误差情况以及过去所有进行的PID控制历史数据，共同作为样本数据，重新进行神经网络的参数的训练，得到神经网络内部传递函数的新的表达式，之后PID参数调整将依据新的神经网络进行自动的控制和调整，从而以实现PID控制器具备自适应调节的能力。图2-1 单神经元自适应PID控制实现原理图为此设计了PID控制器实现原理图，如图2-1所示。从图2中可以看出PID控制器在完成正常PID功能之外设计了基于神经网络的PID参数调整模块。模块依照前期生成的神

神经网络自适应控制地原理

神经网络自适应控制的原理自适应控制是一种特殊的反馈控制，它不是一般的系统状态反馈或输出反馈，即使对于现行定常的控制对象，自适应控制亦是非线性时变反馈控制系统。这种系统中的过程状态可划分为两种类型，一类状态变化速度快，另一类状态变化速度慢。慢变化状态可视为参数，这里包含了两个时间尺度概念：适用于常规反馈控制的快时间尺度以及适用于更新调节参数的慢时间尺度，这意味着自适应控制系统存在某种类型的闭环系统性能反馈。原理图如下：图2-7自适应控制机构框图人工神经网络（简称ANN）是也简称为神经网络（NNS ）或称作连接模型，是对人脑或自然神经网络若干基本特性的抽象和模拟。人工神经网络以对大脑的生理研究成果为基础的，其目的在于模拟大脑的某些机理与机制，实现某个方面的功能。人工神经网络下的定义就是：“人工神经网络是由人工建立的以有向图为拓扑结构的动态系统，它通过对连续或断续的输入作状态相应而进行信息处理。”这一定义是恰当的。人工神经网络的研究，可以追溯到1957年Rosenblatt提出的感知器模型。目前在神经网络研究方法上已形流派，最富有成果的研究工作包括：多层网络BP算法，Hopfield网络模型，自适应共振理论，自组织特征映射理论等。它虽然反映了人脑功能的基本特征，但远不是自然神经网络的逼真描写，而只是它的某种简化抽象和模拟。神经网络的研究可以分为理论研究和应用研究两大方面。理论研究可分为以下两类：（1）利用神经生理与认知科学研究人类思维以及智能机理。（2）利用神经基础理论的研究成果，用数理方法探索功能更加完善、性能更加优越的神经

网络模型，深入研究网络算法和性能，女口：稳定性、收敛性、容错性、鲁棒性等；开发新的网络数理理论。应用研究可分为以下两类：（1）神经网络的软件模拟和硬件实现的研究。（2）神经网络在各个领域中应用的研究。神经网络具有以下?特点：（1）能够充分逼近任何复杂的非线性关系；（2）全部定性或定量的信息都均匀分布存在于网络内的各神经元，因此有很强的容错性和鲁棒性；（3）使用并行分布处理的方式，让大量运算成可以快速完成；神经网络自适应的一般结构神经网络自适应控制有两种基本结构形式，一种是神网络模型参考自适应控制（NNMRAC ），—种是神经网络自校正控制（NNSTC ）。神经网络模型参考自适应控制又分为直接型与间接型。结构如图（2 -8 ）所示。构造一个参考模型使其输出为期望输出，控制的目的是使y 跟踪。（a ）直接型 (b)间接型图2-8神经网络模型参考自适应控制结构 y

一种递归模糊神经网络自适应控制方法

一种递归模糊神经网络自适应控制方法毛六平,王耀南,孙　炜,戴瑜兴 (湖南大学电气与信息工程学院,湖南长沙410082) 摘　要:　构造了一种递归模糊神经网络(RFNN ),该RFNN 利用递归神经网络实现模糊推理,并通过在网络的第一层添加了反馈连接,使网络具有了动态信息处理能力.基于所设计的RFNN ,提出了一种自适应控制方案,在该控制方案中,采用了两个RFNN 分别用于对被控对象进行辨识和控制.将所提出的自适应控制方案应用于交流伺服系统,并给出了仿真实验结果,验证了所提方法的有效性. 关键词:　递归模糊神经网络;自适应控制;交流伺服中图分类号:　TP183 文献标识码:　A 文章编号:　037222112(2006)1222285203 An Adaptive Control Using Recurrent Fuzzy Neural Network M AO Liu 2ping ,W ANG Y ao 2nan ,S UN Wei ,DAI Y u 2xin (College o f Electrical and Information Engineering ,Hunan University ,Changsha ,Hunan 410082,China ) Abstract :　A kind of recurrent fuzzy neural network (RFNN )is constructed ,in which ,recurrent neural network is used to re 2alize fuzzy inference temporal relations are embedded in the network by adding feedback connections on the first layer of the network.On the basis of the proposed RFNN ,an adaptive control scheme is proposed ,in which ,two proposed RFNNs are used to i 2dentify and control plant respectively.Simulation experiments are made by applying proposed adaptive control scheme on AC servo control problem to confirm its effectiveness. K ey words :　recurrent fuzzy neural network ;adaptive control ;AC servo 1　引言近年来,人们开始越来越多地将神经网络用于辨识和控制动态系统[1～3].神经网络在信号的传播方向上,可以分为前馈神经网络和递归神经网络.前馈神经网络能够以任意精度逼近任意的连续函数,但是前馈神经网络是一个静态的映射,它不能反映动态的映射.尽管这个问题可以通过增加延时环节来解决,但是那样会使前馈神经网络增加大量的神经元来代表时域的动态响应.而且,由于前馈神经网络的权值修正与网络的内部信息无关,使得网络对函数的逼近效果过分依赖于训练数据的好坏.而另一方面,递归神经网络[4～7]能够很好地反映动态映射关系,并且能够存储网络的内部信息用于训练网络的权值.递归神经网络有一个内部的反馈环,它能够捕获系统的动态响应而不必在外部添加延时反馈环节.由于递归神经网络能够反映动态映射关系,它在处理参数漂移、强干扰、非线性、不确定性等问题时表现出了优异的性能.然而递归神经网络也有它的缺陷,和前馈神经网络一样,它的知识表达能力也很差,并且缺乏有效的构造方法来选择网络结构和确定神经元的参数. 递归模糊神经网络(RFNN )[8,9]是一种改进的递归神经网络,它利用递归网络来实现模糊推理,从而同时具有递归神经网络和模糊逻辑的优点.它不仅可以很好地反映动态映射关系,还具有定性知识表达的能力,可以用人类专家的语言控制规则来训练网络,并且使网络的内部知识具有明确的物理意义,从而可以很容易地确定网络的结构和神经元的参数. 本文构造了一种RFNN ,在所设计的网络中,通过在网络的第一层加入反馈连接来存储暂态信息.基于该RFNN ,本文还提出了一种自适应控制方法,在该控制方法中,两个RFNN 被分别用于对被控对象进行辨识和控制.为了验证所提方法的有效性,本文将所提控制方法用于交流伺服系统的控制,并给出了仿真实验结果. 2　RFNN 的结构所提RFNN 的结构如图1所示,网络包含n 个输入节点,对每个输入定义了m 个语言词集节点,另外有l 条控制规则节点和p 个输出节点.用u (k )i 、O (k ) i 分别代表第k 层的第i 个节点的输入和输出,则网络内部的信号传递过程和各层之间的输入输出关系可以描述如下: 第一层:这一层的节点将输入变量引入网络.与以往国内外的研究不同,本文将反馈连接加入这一层中.第一层的输入输出关系可以描述为:O (1)i (k )=u (1)i (k )=x (1)i (k )+w (1)i (k )?O (1)i (k -1), i =1,…,n (1) 之所以将反馈连接加入这一层,是因为在以往的模糊神经网络控制器中,控制器往往是根据系统的误差及其对时间的导数来决定控制的行为,在第一层中加入暂态反馈环,则只需要以系统的误差作为网络的输入就可以反映这种关系,这样做不仅可以简化网络的结构,而且具有明显的物理意义,使收稿日期:2005207201;修回日期:2006206218 基金项目:国家自然科学基金项目(N o.60075008);湖南省自然科学基金(N o.06JJ50121) 　第12期2006年12月电子学报 ACT A E LECTRONICA SINICA V ol.34　N o.12 Dec.　2006

机器人神经网络控制汇总

(1) 第一部分机器人手臂的自适应神经网络控制机器人智能控制的研究非常热门，并已取得相当丰富的成果。机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩, 机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样, 当机器人的结构及其机械参数确定后，其动态特性将由动力学方程即数学模型来描述。因此，可采用经典控制理论的设计方法一一基于数学模型的方法设计机器人控制器。但是在实际工程中，由于机器人模型的不确定性，使得研究工作者很难得到机器人精确的数学模型。采用自适应神经网络，可实现对机器人动力学方程中未知部分的精确逼近，从而实现无需建模的控制。下面将讨论如何利用自适应神经网络和李雅普诺夫(Lyapunov )方法设计机器人手臂跟踪控制的问题。 1、控制对象描述: 选二关节机器人力臂系统(图 1)，其动力学模型为: 图1 二关节机器人力臂系统物理模型 M (q )q+V (q,d )q+G (q ) + F(q)+ T 其中 M (q )屮 1"P ；"2P 3COSq 2 P2+ P 3COSq2］，V (q , q )斗一 P q q 2Sinq 2 L P2+P 3cosq 2 P 2 」 L 9361 Sinq 2 机器人是一具有高度非线性和不确定性的复杂系统, 近年来各研究单位对使得 -P 3仙1 +q 2)sin q 2 P 2

6计鶯：鶯?］，FZsgnq …W 0.2血。其中，q 为关节转动角度向量，M （q ）为2乘2维正定惯性矩阵，V （q q ）为 2乘2维向心哥氏力矩，G （q ）为2维惯性矩阵，F （q ）为2维摩擦力矩阵，T 为未知有界的外加干扰， T 为各个关节运动的转矩向量，即控制输入。已知机器人动力学系统具有如下动力学特性: E T (M(q)-2C(q ,q ))E = 0 我们取 P =〔Pi, P 2, P 3, P 4, P ＞〔2.9, 0.76, 0.87, 3.04, ，两个关节的位置指令分别为q id =0.1sin （t ）, q 2d=0.1coSt ），即设计控制器驱动两关节电机使对应的手臂段角度分别跟踪这两个位置指令。 2、传统控制器的设计及分析: 定义跟踪误差为: e (t ) = qd (t )— q(t ) 定义误差函数为: r =e +A e 其中八=A T > 0。贝U q=-r+q d + Ae 特性 1：惯量矩阵M （q ）是对称正定阵且有界; 特性 2：矩阵V （q q ）有界; 特性 3： M （q ）-2C （q,q ）是一个斜对称矩阵，即对任意向量，有特性 4:未知外加干扰 T 满足 T - b d ，b d 为正常数。 (4)

利用simulink对自适应控制系统模型进行仿真分析

第一章前言 1.1 课题的意义：本毕业设计旨在学习并比较各种自适应控制算法，掌握matlab语言，利用simulink对自适应控制系统模型进行仿真分析。自适应控制是人们要求越来越高的控制性能和针对被控系统的高度复杂化，高度不确定性的情况下产生的，是人工智能渗入到应用科技领域的必然结果。并在常规控制理论的基础上得到进一步的发展和提高。进入21世纪以来，智能控制技术和远程监测技术继续飞速发展，逐渐被应用到电力、交通和物流等领域。从卫星智能控制，到智能家居机器人；从公共场所的无线报警系统，到家用煤气、自来水等数据的采集。可以说，智能控制技术和远程监测技术己经渗透到了人们日常生活之中，节约了大量的人力和物力，给人们的日常生活带来了极大的便利。目前，自适应控制的研究以认知科学、心理学、社会学、系统学、语言学和哲学为基础，有效的把数字技术、远程通信、计算机网络、数据库、计算机图形学、语音与听觉、机器人学、过程控制等技术有机的结合，提供了解决复杂问题的有效手段。自适应控制是在人们在追求高控制性能、高度复杂化和高度不确定性的被控系统情况下产生的，是人工智能渗入到应用科技领域的必然结果，并在常规控制理论的基础上得到进一步的发展和提高。主要研究对象从单输入、单输出的常系数线性系统，发展为多输入、多输出的复杂控制系统。自适应控制理论的产生为解决复杂系统控制问题开辟了新的途径，成为当下控制领域的研究和发展热点。 1.2 国内外研究概况及发展趋势： 1943年，心理学家W·Mcculloch和数理逻辑学家W·Pitts在分析、总结神经元基本特性的基础上首先提出神经元的数学模型。此模型沿用至今，并且直接影响着这一领域研究的进展。因而，他们两人可称为人工神经网络研究的先驱。1945年冯·诺依曼领导的设计小组试制成功存储程序式电子计算机，标志着电子计算机时代的开始。1948年，他在研究工作中比较了人脑结构与存储程序式计算机的根本区别，提出了以简单神经元构成的再生自动机网络结构。但是，由于指令存储式计算机技术的发展非常迅速，迫使他放弃了神经网络研究的新途径，继续投身于指令存储式计算机技术的研究，并在此领域作出了巨大贡献。虽然，冯·诺依曼的名字是与普通计算机联系在一起的，但他也是人工神经网络研究的先驱之一。

基于神经网络的移动机器人避障控制和决策

２００６年第８期农业装备与车辆工程基于神经网络的移动机器人避障控制和决策伊连云，金秀慧，贺廉云，王慧（德州学院机电工程系，山东德州，２５３０１５）摘要：针对移动机器人避障的特点，提出了一种基于神经网络的动态避障控制方法。介绍了避障行为的决策、基于神经网络的机器人在避障过程中的运动控制等。该方法不用考虑障碍物的运动状态，简化了机器人避障的步骤，机器人能够根据各种情况灵活地判断是否避障以及灵活地选择适当的避障方式，提高了机器人避障的灵活性和鲁棒性。仿真试验证明这种方法是可行而有效的。关键词：移动机器人；神经网络；避障中图分类号：ＴＰ２４文献标识码：Ａ文章编号：１６７３－３１４２（２００６）０８－００２２－０３ＭｏｂｉｌｅＲｏｂｏｔＯｂｓｔａｃｌｅＡｖｏｉｄａｎｃｅＣｏｎｔｒｏｌａｎｄＤｅｃｉｓｉｏｎＢａｓｅｄｏｎＮｅｕｒａｌＮｅｔｗｏｒｋＹｉＬｉａｎｙｕｎ，ＪｉｎＸｉｕｈｕｉ，ＨｅＬｉａｎｙｕｎ，ＷａｎｇＨｕｉ（ＤｅｐａｒｔｍｅｎｔｏｆＥｌｅｃｔｒｏｍｅｃｈａｎｉｃＥｎｇｉｎｅｅｒｉｎｇ，ＤｅｚｈｏｕＵｎｉｖｅｒｓｉｔｙ，Ｄｅｚｈｏｕ２５３０１５，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ａｃｃｏｒｄｉｎｇｔｏｔｈｅｃｈａｒａｃｔｅｒｉｓｔｉｃｓｏｆｔｈｅｍｏｂｉｌｅｒｏｂｏｔｉｎｏｂｓｔａｃｌｅａｖｏｉｄａｎｃｅ，ａｍｅｔｈｏｄｏｆｄｙｎａｍｉｃｏｂｓｔａｃｌｅａｖｏｉｄａｎｃｅｂａｓｅｄｏｎｎｅｕｒａｌｎｅｔｗｏｒｋｉｓｐｒｅｓｅｎｔｅｄ．Ｔｈｉｓａｒｔｉｃｌｅｐｒｅｓｅｎｔｓｔｈｅｄｅｃｉｓｉｏｎｏｆｏｂｓｔａｃｌｅａｖｏｉｄａｎｃｅｂｅｈａｖｉｏｒ，ｒｏｂｏｔｍｏｖｉｎｇｃｏｎｔｒｏｌｂａｓｅｄｏｎｎｅｕｒａｌｎｅｔｗｏｒｋｄｕｒｉｎｇｏｂｓｔａｃｌｅａｖｏｉｄａｎｃｅｐｒｏｃｅｓｓ．Ｔｈｉｓｍｅｔｈｏｄｄｏｅｓｎｏｔｎｅｃｅｓｓａｒｉｌｙｔａｋｅｔｈｅｖｅｌｏｃｉｔｙａｎｄｔｈｅｄｉｒｅｃｔｉｏｎｏｆｔｈｅｏｂｓｔａｃｌｅｓｉｎｔｏａｃｃｏｕｎｔ，ｓｏｐｒｅｄｉｇｅｓｔｓｔｈｅｐｒｏｃｅｄｕｒｅｏｆｏｂｓｔａｃｌｅａｖｏｉｄａｎｃｅ．Ｔｈｅｒｏｂｏｔｃａｎｊｕｄｇｅｆｌｅｘｉｂｌｙｗｈｅｔｈｅｒｉｔｎｅｅｄｓｔｏａｖｏｉｄｔｈｅｏｂｓｔａｃｌｅａｎｄｃａｎｃｈｏｏｓｅｐｒｏｐｅｒｗａｙｓｏｆｏｂｓｔａｃｌｅａｖｏｉｄ－ａｎｃｅａｃｃｏｒｄｉｎｇｔｏｄｉｖｅｒｓｉｆｉｅｄｃｉｒｃｕｍｓｔａｎｃｅｓ．Ｉｔｉｍｐｒｏｖｅｓｆｌｅｘｉｂｌｙａｎｄａｄａｐｔｉｖｅｌｙｔｈｅｒｏｂｏｔｏｂｓｔａｃｌｅａｖｏｉｄａｎｃｅ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔｏｆｓｉｍｕｌａｔｉｏｎｉｎｄｉｃａｔｅｓｔｈａｔｔｈｅｍｅｔｈｏｄｉｓｆｅａｓｉｂｌｅａｎｄｖａｌｉｄ．ＫｅｙＷｏｒｄｓ：ｍｏｂｉｌｅｒｏｂｏｔ；ｎｅｕｒａｌｎｅｔｗｏｒｋ；ｏｂｓｔａｃｌｅａｖｏｉｄａｎｃｅ收稿日期：２００５－１２－１９作者简介：伊连云（１９７４－），女，山东德州人，硕士，讲师，主要研究领域为自动控制及人工智能。农业装备与车辆工程ＡＧＲＩＣＵＬＴＵＲＡＬＥＱＵＩＰＭＥＮＴ＆ＶＥＨＩＣＬＥＥＮＧＩＮＥＥＲＩＮＧ２００６年第８期（总第１８１期）Ｎｏ．８２００６（Ｔｏｔａｌｌｙ１８１）０引言随着移动机器人的应用领域不断扩大，人们希望机器人能够在未知环境中自动实现路径规划，以大大提高其对环境的适应能力。避障是移动机器人运动规划中的基本问题之一，一直以来都是机器人路径规划中的难点。根据机器人对环境信息知道的程度不同，可分为两种类型：环境信息完全知道的全局路径规划和环境信息完全未知或部分未知的局部路径规划。对于已知环境下的避碰问题，已经提出了许多有效的解决方法。其中，Ｋｈａｔｉｂ提出的人工势场法，结构简单，易于实现，得到了广泛应用。但人工势场法主要存在陷阱区域，栅格法空间分辨率、时间复杂度与内存容量、实时性要求之间的矛盾限制了它的使用。近年来，一些生物进化算法被用于机器人的避碰与路径规划研究，如人工神经网络、遗传算法、模拟退火算法、蚂蚁算法等。与在已知环境中相比，机器人在环境完全未知或部分未知情况下实现避障更加困难。针对环境信息不确定情况下的避障问题，本文提出一种机器人的动态避障方法，该方法是以机器人与障碍物之间的相对运动作为决策依据，不用考虑障碍物的运动状态，简化了机器人避障的步骤；另外，机器人能够根据各种情况灵活地判断是否避障以及灵活地选择适当的避障方式，使机器人在躲避碰撞的前提下能快速地跟踪规划路径。１避障行为的决策机器人在运动过程中需要对碰撞的危险性进行判断并以此作为机器人避障行为选择的依据。图１ａ给出了机器人的扇形视野区域。机器人把所有的障碍物都看作运动体，通过检测障碍物的历史位置与当前位置的相对关系，来判断机器人是否会与障碍物相撞，判断步骤如下：（１）连接历史点与当前点，并延长至与扇形区相交，当交点在扇形的弧线上，标志障碍物正远离物 ?２２? 资料整理自互联网，版权归原作者！欢迎访问 https://www.doczj.com/doc/0016084957.html, 新势力单片机、嵌入式