当前位置:文档之家› 连续系统的最优控制

连续系统的最优控制

连续系统的最优控制
连续系统的最优控制

第6章 连续系统的最优控制

6.1 最优化问题

6.2 最优控制的变分法求解

6.3 线性系统二次型性能指标的最优控制

1、线性系统有限时间最优状态调节系统 ◆二次型性能指标

设受控系统对平衡点的增量方程为

()()()()()x t A t x t B t u t ?=?+?,00()x t x ?=?

简记为

()()()()()x t A t x t B t u t =+,00()x t x =

最优状态调节是指:对上述系统,在时间区间0[,]f t t t ∈,

寻求最优状态反馈控制,使初始状态偏差00()x t x =迅速衰减,且同时使二次型性能泛函

11()()[()()()()]d 22f

t t t t

f f f x u t J x t Q x t x t Q x t u t Q u t t =++?

*

min f x u J J J J J =++→=

式中 ()0f n n Q ?≥——终端加权矩阵。

()0x n n Q ?≥——状态加权矩阵。 ()0u r r Q ?>——控制加权矩阵。

三个加权矩阵均为对称矩阵,为简单,一般取为对角矩

阵。

●1()()2

t

f f f f J x t Q x t =表示对终端状态偏差即稳态控制精度的限制。当1

diag[]f f fn Q q q =,2

1

1()2n f fi i f i J q x t ==∑

●0

1()()d 2f

t t

x x

t J x t Q x t t =?表示对控制过程中状态偏差衰减速度的要求。当1

diag[]x x xn Q q q =,0

2

11()d 2f

t n

x xi i i t J q x t t ==∑?

●0

1()()d 2f

t t

u u t J u t Q u t t =?表示对控制过程中所消耗的能量的限制,以避免状态偏差过快衰减导致控制量超过允许数值。当

1

diag[]u u ur Q q q =,0

2

11()d 2f

t r

u ui i i t J q u t t ==∑?,2()i u t 可理解为功率。

实际上,在性能指标中,x J 已经对控制的稳态精度有所要求。当对稳态精度有更高的要求时,才增加f J 项。

由上可知,上述二次型性能指标的物理意义是,在整个时间区间0[,]f t t t ∈,特别是终值时刻f t t =上状态变量尽量接近于0

而又不消耗过大的控制能量。

◆f t 有限时的最优状态控制

最优状态调节器问题是始端固定、终端自由的泛函极值问

题,即0t 给定,00)x t x =(,f t 给定, )f t x (自由的泛函极值问题。

黎卡提(Riccati )矩阵微分方程(一阶非线性矩阵微分方程):

1

()()()()()()()()()t

t

u

x P t P t A t A t P t P t B t Q B t P t Q -++-+=0

其终值条件为

()f f P t Q =

可以证明,当矩阵(),(),(),()u x A t B t Q t Q t 的各元素在0[,]f t t 上都是t 的连续函数时,黎卡提方程在0[,]f t t 上满足终值条件的解存在且唯一。当()P t 解出后,便有最优控制为

*

1()()()()()()t

u

u t K t x t Q B t P t x t -==-

式中,1()()()t

u

K t Q B t P t -=-为时变状态反馈矩阵。

最优性能指标为

*

0001()()()2

t

J x t P t x t =

闭环系统结构如图:

?

x

◆()P t 的特征

*()P t 的时变性:

即使,,,u x A B Q Q 都是定常矩阵,此时黎卡提方程为定常系数矩阵微分方程,()P t 也是时变的。

*()P t 的对称性

()P t 是对称矩阵,共含有(1)/2n n +个不同的元素。

*()P t 0[,]f t t t ∈的非负定性

由于,,f u x Q Q Q 均为非负定矩阵,所以对任意的()u t 和相应

的()x t ,总有0J ≥,*

1()()()02

t

J x t P t x t =≥,因()x t 是任意的,可

知()0P t ≥。

*当f t t <<=∞,()P t 为常数矩阵

在这种情况下,在动态过程的大多数时间内,()P t 为常数矩阵,从而最优控制的时变状态反馈简化为定常状态反馈。

说明后列。 例:系统状态方程为

x x u =-+,0(0)x x =

求最优控制,使

10

222

11()()d min 22f J x t x u t =++→?

解:1A =-,1B =,1f Q =,1x Q =,1u Q =,00t =,10f t = 矩阵黎卡提微分方程为

2

()()2()10P t P t P t -++=,()(10)1f f P t P Q ===

对1f Q =,10f t =,解得

)

)

(21)1)(2()(2(2t t e

P t e

----+-++-=

+--

最优控制为

*

1()()()()()()t

u

u t Q B t P t x t P t x t -=-=-

数值计算表明:

(0)(1)(6)0.4140P P P ==

==,(7)0.4141P =,(8)0.4157P =

(9)0.4430P =,(9.5)0.5372P =,(10)1f P Q ==

1f Q =和0f Q =时的()P t 曲线如图所示。

t

2、f t →∞时的线性定常系统最优状态调节器

f t 有限时的最优状态调节器,由于()P t 是时变的。若f t →∞,

()P t 将趋于常数矩阵,最优状态反馈矩阵也将随之转化为常数

矩阵。

◆无限时间(f t →∞)状态调节器问题 若线性定常系统

x Ax Bu =+,00()x t x =

能控,u 不受限制,二次型性能泛函为

1[]d 2t t

x u t J x Q x u Q u t ∞

=+?

式中 ()0x n n Q ?≥——状态加权对称常矩阵;

()0u r r Q ?>——控制加权对称常矩阵。

当0x Q >或0x Q ≥但{,}A H 能观(其中t

x H H Q =),则最优状态反馈控制存在且唯一:

*

1

()()()t

u

u t Kx t Q B Px t -==-

式中 1()t

n n u

K Q B P -?=-为最优定常状态反馈矩阵

()n n P ?是满足满足下列黎卡提矩阵代数方程的正定对称常

数矩阵:

1t

t

u

x PA A P PBQ B P Q -+-+=0

最优轨线*

()x t 是下列奇次状态方程的解:

()x A BK x =+ , 00()x t x =

性能泛函的最小值为

*

001()()2

t

J x t Px t =

说明:

*表面上u 不受限制,但由于性能泛函中含有

1()()d 2t

u t u t Q u t t ∞

?,通过u Q 的选择,可把i u 控制在允许范围内。

* f t →∞最优调节闭环系统是定常系统。结构图为

?

x

*由于f t →∞,要求线性定常系统能控,否则不可控模态将使()x ∞→∞。

*无限时间最优调节系统必是大范围渐近稳定的。 证明:由前知,0P >.故标量函数()0t

V x x Px =>。而

()[()]()t

t

t

t V x x Px x Px A BK x Px x P A BK x =+=+++

11()()t

t t t

t

u

u

x A BQ B P Px x P A BQ B P x --=-+-

11()t

u

t t

u

t

A P PBQ

B P x PB x A Q P P B --=-+- 1()t

t

u

x x PBQ B Q P x -=+-

由于0x Q >,0u Q >,故()0V x <。此外,当x →∞,()V x →∞。根据李亚普诺夫稳定性定理,无限时间最优调节系统是大范围渐近稳定的。

*无限时间最优调节系统是渐近稳定的,当f t →∞,

*

()0f e x t x ==。故在性能泛函中,终端泛函1()()2

t

f f f x t Q x t 失去

意义,予以取消,或认为f Q =0。

例:简化的同步发电机—无穷大系统机电模型如图。模型数据为:10s M =,0.5T =,377rad/s N ω=。二次型性能泛函权矩阵diag[0.251]x Q =,1u Q =。求最优状态控制。

解:系统状态方程x Ax Bu =+为

0/01/N u T M

M ωδδωω??????????

=+???

?????-????????

?? 对于所给数据

37700.0500.1u δδωω??????????=+??????

??-????????

?? 展开黎卡提方程

1t

t

u

x PA A P PBQ B P Q -+-+=0

1112111212

221222037700.050.0503770p p p p p p p p -????

????+????????-????????

1112111212221222000.2500000.010

100p p p p p p p p ??????????

-+=???????????????????? 由于111212221222[00.1]0.1[]t

p p B P p p p p ??==???

??,因此,只需求出12p 和22p 。将黎卡提方程展开,有

212

p +1012p -25=0,222

0.01p +75422p +1=0

解得

12 2.071,12.07p =-

;22p =满足0P >的解为

12 2.071p =

,22395.3p ==

最优状态反馈矩阵为

112

22[]0.1[][0.207139.53]t

u

K k k Q B P p p δ

ω-==-=-?=--

闭环系统结构

无控制时,特征方程和特征值分别为

37700.05

s sI A s

--=

=,1,2j4.342rad/s λ=±

系统临界稳定。施加最优控制后

377

()00.0707 3.953

s sI A bK s ---=

=+

1,2 1.9765j4.769rad/s λ=-±

系统渐近稳定,且阻尼良好。阻尼比为

Re /0.383ζλλ==

3、f t →∞时的线性定常系统最优输出调节器

若线性定常系统

x Ax Bu =+,00()x t x =

y C x =

能控且能观,u 不受限制,二次型性能泛函为

1[]d 2t t

y u t J y Q y u Q u t ∞

=+?

式中 ()0y m m Q ?≥——输出加权对称常矩阵;

()0u r r Q ?>——控制加权对称常数矩阵。

求最优控制*

()u t ,使min J J →。

参照最优状态调节器的结果,最优输出调节器的最优控制为

*

1()()()t

u

u t Kx t Q B Px t -==-

式中 1()t

n n u

K Q B P -?=-为最优定常状态反馈矩阵

()n n P ?是满足满足下列黎卡提矩阵代数方程的正定对称常

数矩阵:

1u

t

y t

t

PA A P PBQ B P C Q C -+-+=0

注意:因黎卡提矩阵代数方程不同,此处所得P 阵与最优状态调节器时的不同,从而最优控制也不同。

连续系统的最优控制

第6章 连续系统的最优控制 6.1 最优化问题 6.2 最优控制的变分法求解 6.3 线性系统二次型性能指标的最优控制 1、线性系统有限时间最优状态调节系统 ◆二次型性能指标 设受控系统对平衡点的增量方程为 ()()()()()x t A t x t B t u t ?=?+?,00()x t x ?=? 简记为 ()()()()()x t A t x t B t u t =+,00()x t x = 最优状态调节是指:对上述系统,在时间区间0[,]f t t t ∈,

寻求最优状态反馈控制,使初始状态偏差00()x t x =迅速衰减,且同时使二次型性能泛函 11()()[()()()()]d 22f t t t t f f f x u t J x t Q x t x t Q x t u t Q u t t =++? * min f x u J J J J J =++→= 式中 ()0f n n Q ?≥——终端加权矩阵。 ()0x n n Q ?≥——状态加权矩阵。 ()0u r r Q ?>——控制加权矩阵。 三个加权矩阵均为对称矩阵,为简单,一般取为对角矩 阵。 ●1()()2 t f f f f J x t Q x t =表示对终端状态偏差即稳态控制精度的限制。当1 diag[]f f fn Q q q =,2 1 1()2n f fi i f i J q x t ==∑

●0 1()()d 2f t t x x t J x t Q x t t =?表示对控制过程中状态偏差衰减速度的要求。当1 diag[]x x xn Q q q =,0 2 11()d 2f t n x xi i i t J q x t t ==∑? ●0 1()()d 2f t t u u t J u t Q u t t =?表示对控制过程中所消耗的能量的限制,以避免状态偏差过快衰减导致控制量超过允许数值。当 1 diag[]u u ur Q q q =,0 2 11()d 2f t r u ui i i t J q u t t ==∑?,2()i u t 可理解为功率。 实际上,在性能指标中,x J 已经对控制的稳态精度有所要求。当对稳态精度有更高的要求时,才增加f J 项。 由上可知,上述二次型性能指标的物理意义是,在整个时间区间0[,]f t t t ∈,特别是终值时刻f t t =上状态变量尽量接近于0

最优控制胡寿松版部分习题答案

2-5 求通过(0)1x =,(1)2x =,使下列性能泛函为极值的极值曲线*()x t : 2(1)f t t J x dt =+? 解:由题可知,始端和终端均固定 被积函数2 1L x =+, 0L x ?=?,2L x x ?=?, 2d L x dt x ??=? 代入欧拉方程 0L d L x dt x ??-?=??,可得20x =,即0x = 故1x c = 其通解为:12x c t c =+ 代入边界条件(0)1x =,(1)2x =,求出11c =,21c = 极值曲线为* ()1x t t =+ 2-6 已知状态的初值和终值为 (1)4x =,()4f x t = 式中f t 自由且f t >1,试求使下列性能泛函达到极小值的极值轨线* ()x t : 2 1 1[2()()]2 f t J x t x t dt =+ ? 解:由题可知,2 122 L x x =+ ,()4f t ψ=,()14x =,()4f x t = 欧拉方程: L 0d L x dt x ??-=?? 横截条件:()00t x =x ,()() f f x t t ψ=,()0f T t L L x x ψ??? + -= ? ??? 易得到 2dx dt = 故12x t c =+ 其通解为:()2 12x t t c t c =++ 根据横截条件可得:()()()122121114424 f f f f f x c c x t t c t c x t t c ?=++=?? =++=??=+=?? 解以上方程组得:12 569f t c c =?? =-??=? 将f t ,1c ,2c 代入J 可得5 * 20 1500502150233 J x x dt =+=-=? 极值轨线为()* 2 69x t t t =-+ 2-7 设性能泛函为

离散时间系统最优控制离散时间系统最优控制

第五章离散时间系统最优控制

?前面所讨论的都是关于连续时间系统的最优控制问题。?现实世界中,很多实际系统本质上是时间离散的。?即使是系统是时间连续的,因为计算机是基于时间和数值上都离散的数字技术的,实行计算机控制时必须将时间离散化后作为离散系统处理。 引言 ?因此,有必要讨论离散时间系统的最优控制问题。 ?离散时间系统仍然属于连续变量动态系统(CVDS)范畴。注意与离散事件动态系统(DEDS)的区别。 ? CVDS 与DEDS 是自动化领域的两大研究范畴,考虑不同的自动化问题。

5.1 离散时间系统最优控制问题的提法 (1) 离散系统最优控制举例——多级萃取过程最优控制 ?萃取是指可被溶解的物质在两种互不相溶的溶剂之间的转移,一般用于将要提取的物质从不易分离的溶剂中转移到容易分离的溶剂中。 ?多级萃取是化工生产中提取某种价值高、含量低的物质的常用生产工艺。 萃取器萃取器萃取器萃取器V u (0)u (1)u (k -1)u (N -1) V V V V V V 含物质A 的混合物以流量V 进入萃取器1,混合物中A 浓度x (0); 萃取剂以流量u (0)通过萃取器1,单位体积萃取剂带走A 的量为z (0); 一般萃取过程的萃取物含量均较低,可认为通过萃取器1后混合物流量仍为V ; 流出萃取器1的混合物中A 物质的浓度为x (1)。以此类推至萃取器N 。 1 2 k N x (0) z (0)z (1) z (k-1) z (N -1) x (1) x (2) x (k -1) x (k ) x (N ) x (N -1) 多级萃取过程

(2) 离散系统最优控制问题的提法 给定离散系统状态方程(5-1-6)和初始状态 (5-1-7) 其中分别为状态向量和控制向量,f 为连续可微的n 维 函数向量。考虑性能指标 1 ,,1,0],),(),([)1( N k k k u k x f k x 0 )0(x x m n R k u R k x )(,)( 1 N 其中Φ、L 连续可微。 ?离散系统的最优控制问题就是确定最优控制序列u *(0),u *(1),…,u *(N -1),使性能指标J 达到极小(或极大)值。 ? 将最优控制序列u *(0),u *(1),…,u *(N -1)依次代入状态方程,并利用初始条件,可以解出最优状态序列x *(1),x *(2),…,x *(N ),也称为最优轨线。 (5-1-8) ] ),(),([]),([k k k u k x L N N x J

最优控制

最优控制综述 摘要:最优化方法是一种求极值的方法,即在一组约束为等式或不等式的条件下,使系统的目标函数达到极值,即最大值或最小值。从经济意义上说,是在一定的人力、物力和财力资源条件下,使经济效果达到最大(如产值、利润),或者在完成规定的生产或经济任务下,使投入的人力、物力和财力等资源为最少。而最优控制通常针对控制系统而言,目的在于使一个机组、一台设备或一个生产过程实现局部最优。本文重点阐述了最优系统常用的变分法、极小值原理和动态规划三种方法的基本理论及其在典型系统设计中的应用。 关键词:变分法、极小值原理、动态规划 1 引言 最优控制是分析控制系统常用的方法,是现代控制理论的核心之一。它尤其与航空航天的制导、导航和控制技术密不可分。最优控制理论所研究的问题可以概括为:对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制方案,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标最优。 这类问题广泛存在于技术领域或社会问题中。例如,确定一个最优控制方式使空间飞行器由一个轨道转换到另一轨道过程中燃料消耗最少,选择一个温度的调节规律和相应的原料配比使化工反应过程的产量最多,制定一项最合理的人口政策使人口发展过程中的老化指数、抚养指数和劳动力指数为最优等,都是一些经典的最优控制问题。 最优控制问题是要在满足约束条件下寻求最优控制函数,使目标泛函取极值。求解动态最优化问题的方法主要有古典变分法,极小值原理及动态规划法等。 2 研究最优控制的前提条件 2.1状态方程 对连续时间系统: x t=f x t,u t,t 对离散时间系统:x(k+1)=f x k,u k,k k=0,1,……,(N-1)

线性二次型最优控制

一、主动控制简介 概念:结构主动控制需要实时测量结构反应或环境干扰,采用现代控制理论的主动控制算法在精确的结构模型基础上运算和决策最优控制力,最后作动器在很大的外部能量输入下实现最优控制力。 特点:主动控制需要实时测量结构反应或环境干扰,是一种需要额外能量的控制技术,它与被动控制的根本区别是有无额外能量的消耗。 优缺点:主动控制具有提高建筑物的抵抗不确定性地面运动,减少输入的干扰力,以及在地震时候自动地调整结构动力特征等能力,特别是在处理结构的风振反应具有良好的控制效果,与被动控制相比,主动控制具有更好的控制效果。但是,主动控制实际应用价格昂贵,在实际应用过程中也会存与其它控制理论相同的问题,控制技术复杂、造价昂贵、维护要求高。 组成:传感器、控制器、作动器 工作方式:开环、闭环、开闭环。 二、简单回顾主动控制的应用与MATLAB应用 1.主动变刚度A VS控制装置 工作原理:首先将结构的反应反馈至控制器,控制器按照事先设定好的控制算法并结合结构的响应,判断装置的刚度状态,然后将控制信号发送至电液伺服阀以操纵其开关状态,实现不同的变刚度状态。 锁定状态(ON):电液伺服阀阀门关闭,双出杆活塞与液压缸之间没有相对位移,斜撑的相对变形与结构层变形相同,此时结构附加一个刚度; 打开状态(OFF):电液伺服阀阀门打开,双出杆活塞与液压缸之间有相对位移,液压缸的压力差使得液体发生流动,此过程中产生粘滞阻尼,此时结构附加一个阻尼。 示意图如下: 2. 主动变阻尼A VD控制装置 工作原理:变孔径阻尼器以传统的液压流体阻尼器为基础,利用控制阀的开孔率调整粘性油对活塞的运动阻力,并将这种阻力通过活塞传递给结构,从而实现为结构提供阻尼的目的。 关闭状态(ON):开孔率一定,液体的流动速度受限,流动速度越小,产生的粘滞阻尼力越大,开孔率最小时,提供最大阻尼力,此时成为ON状态; 打开状态(OFF):控制阀完全打开,由于液体的粘滞性可提供最小阻尼力。 示意图如下:

最优控制应用概述

最优控制的应用概述 1.引言 最优控制是现代控制理论的重要组成部分,它研究的主要问题是:在满足一定约束条件下,寻求最优控制策略,使得性能指标取极大值或极小值。最优控制是使控制系统的性能指标实现最优化的基本条件和综合方法。可概括为:对一个受控的动力学系统或运动过程,从一类允许的控制方案中找出一个最优的控制方案,使系统的运动在由某个初始状态转移到指定的目标状态的同时,其性能指标值为最优。最优控制是最优化方法的一个应用。从数学意义上说,最优化方法是一种求极值的方法,即在一组约束为等式或不等式的条件下,使系统的目标函数达到极值,即最大值或最小值。从经济意义上说,是在一定的人力、物力和财力资源条件下,是经济效果达到最大(如产值、利润),或者在完成规定的生产或经济任务下,使投入的人力、物力和财力等资源为最少。 最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门学科,基本内容和常用方法包括动态规划、最大值原理和变分法。这方面的开创性工作主要是由贝尔曼(R.E.Bellman)提出的“动态规划”和庞特里亚金等人提出的“极大值原理”,到了60年代,卡尔曼(Kalman)等人又提出了可控制性及可观测性概念,建立了最优估计理论。这方面的先期工作应该追溯到维纳(N.Wiener)等人奠基的控制论(Cybernetics)。最优控制理论的实现离不开最优化技术。控制系统最优化问题,包括性能指标的合理选择以及最优化控制系统的设计,而性能指标在很大程度上决定了最优控制性能和最优控制形式。最优化技术就是研究和解决最优化问题,主要包括两个需要研究和解决的方面:一个是如何将最优化问题表示为数学模型;另一个是如何根据数学模型尽快求出其最优解。 2.最优控制问题 所谓最优控制问题,就是指 在给定条件下,对给定系统确定 一种控制规律,使该系统能在规 定的性能指标下具有最优值。也 就是说最优控制就是要寻找容 许的控制作用(规律)使动态系 统(受控系统)从初始状态转移 到某种要求的终端状态,且保证 所规定的性能指标(目标函数)图1 最优控制问题示意图 达到最大(小)值。 最优控制问题的示意图如图1所示。其本质乃是一变分学问题。经典变分理论只能解决一类简单的最优控制问题。为满足工程实践的需要,20世纪50年代中期,出现了现代变分理论。最常用的方法就是极大值原理和动态规划。最优控制在被控对象参数已知的情况下,已成为设计复杂系统的有效方法之一。

系统工程作业题

第1章系统工程的概念 练习题 1、什么是系统(系统的定义)? 系统的定义:“系统”是结构上相互联系、状态变化上相互依赖的若干成员,构成的具有特定功能的整体。 系统的主要属性:整体性、关联性、环境适应性。 2、构成系统的基本要素有哪些? 系统的特性(区别于其它事物) (1) 整体性(2) 目的性(3) 有序性。(4) 相关性 (5) 复杂性(6) 适应性(7) 动态性(8) 开放性 3、什么是系统工程(系统工程的定义)?系统工程的定义:系统工程是针对系统整体对象全寿命周期的问题,运用系统的思想和

方法进行建模、仿真、设计、优化、评价、决策的多学科交叉的理论方法和技术。它从系统整体出发,分析各单元的内在联系(约束关系),作统筹安排,发挥各单元的功能, 基于定量和定性结合的系统思想及计算机技术等,处理大规模复杂系统的问题,从而达到系统整体最优的目的。 系统工程的内涵:(1) 是一类多学科交叉的系统对象普遍适用的通用共性方法;(2) 是一门多学科交叉的工程学科;(3) 是将这些 方法运用于“从概念到产品”的实践、运用于复杂系统问题以提供技术可行、经济最优的解决方案的实践(如最优控制) 。 4、系统工程的基本要素有哪些? 系统工程的主要特点在于强调以下观点: (1) 整体性和系统性的观点(前提); (2) 总体最优或总体平衡协调的观点(目

的); (3) 多种方法综合运用的观点(手段); (4) 问题导向及反馈控制的观点(保障)。 5、系统工程与传统工程学有何异同?差异对照: 对象基本方法专门方法 工程学= 特定物理对象+ 基本逻辑与常识+ 专业知识 系统工程= 一般对象+ 基本逻辑与系统观点+ 系统知识 实例: 电气工程学= 强电和弱电电路+ 基本逻辑与电学常识+ 电(力)网理论 系统工程学= 社会/经济/能源等+ 基本逻辑与系统观点+ 分析/预测/ 建模/评价/决策 共同点: 都把科学和技术应用到工程实际,以达到改造客观

线性二次型最优控制应用举例与仿真

线性二次型最优控制 一、最优控制概述 最优控制,又称无穷维最优化或动态最优化,是现代控制理论的最基本,最核心的部分。它所研究的中心问题是:如何根据受控系统的动态特性,去选择控制规律,才能使得系统按照一定的技术要求进行运转,并使得描述系统性能或品质的某个“指标”在一定的意义下达到最优值。最优控制问题有四个关键点:受控对象为动态系统;初始与终端条件(时间和状态);性能指标以及容许控制。 一个典型的最优控制问题描述如下:被控系统的状态方程和初始条件给定,同时给定目标函数。然后寻找一个可行的控制方法使系统从输出状态过渡到目标状态,并达到最优的性能指标。系统最优性能指标和品质在特定条件下的最优值是以泛函极值的形式来表示。因此求解最优控制问题归结为求具有约束条件的泛函极值问题,属于变分学范畴。变分法、最大值原理(最小值原理)和动态规划是最优控制理论的基本内容和常用方法。庞特里亚金极大值原理、贝尔曼动态规划以及卡尔曼线性二次型最优控制是在约束条件下获得最优解的三个强有力的工具,应用于大部分最优控制问题。尤其是线性二次型最优控制,因为其在数学上和工程上实现简单,故其有很大的工程实用价值。 二、线性二次型最优控制 2.1 线性二次型问题概述 线性二次型最优控制问题,也叫LQ 问题。它是指线性系统具有二次型性能指标的最优控制问题。线性二次型问题所得到的最优控制规律是状态变量的反馈形式,便于计算和工程实现。它能兼顾系统性能指标的多方面因素。例如快速性、能量消耗、终端准确性、灵敏度和稳定性等。线性二次型最优控制目标是使性能指标J 取得极小值, 其实质是用不大的控制来保持比较小的误差,从而达到所用能量和误差综合最优的目的。 2.2 线性二次型问题的提法 给定线性时变系统的状态方程和输出方程如下: ()()()()()()()() X t A t X t B t U t Y t C t X t ?=+? =? (2.1)

最优控制第五章习题答案

1. · 2. 已知二阶系统的状态方程122()(),()()x t x t x t u t ==性能泛函 3 222221212120111[(3)2(3)][2()4()2()()()]222 J x x x t x t x t x t u t dt =+++++?求最优控制。 解:把状态方程和性能指标与标准状态方程和标准性能指标比较,可得 0,101,02,11,,,,0,010,21,42A B P Q R ????????=====???????????????? 考虑到()K t 是对称阵,设11121222,(),k k K t k k ?? =? ??? 代入黎卡提方程1()()()()()()()()()()() T T K t K t A t A t K t K t B t R t B t K t Q t -=--+-即 1112111211121112111212221222122212221222,,,,,0,10,002,12[0,1],0,01,0,,1,1,4,k k k k k k k k k k k k k k k k k k k k ?????????????????? =--+-????????????????????????????????????? ? 令上式等号左右端的对应元相等,得2 111212111222222122222 21224 k k k k k k k k k =-=-+-=-+- 这是一组非线性微分方程。由边界条件(3)K P =即11121222(3),(3)1,0(3),(3)0,2k k k k ???? =? ? ???? ?? 最优控制为 11112112122212222()()() ,()2*[0,1]2()2() ,()T u t R B K t X t k k x t k x t k x t k k x t -=-???? =-=--???????? 3. ) 4. 能控的系统状态方程为122()(),()()x t x t x t u t ==这是一种双积分系统,其输出为1()x t ,其输入为()u t ,其传递函数为 12()1 ()()x s G s u s s ==其性能泛函为22 211220 1[()2()()()()]2J x t bx t x t ax t u t dt ∞ =+++?其中220a b ->求最优控制。 解:稳态时连续系统的状态调节器问题:由状态方程和性能指标求得 0,101,,,10,01A B Q R ??????====???????????? b ,b,a 显然Q 为半正定阵。 可控性阵为[]0,1,1,0B AB ?? =? ??? 是非奇异的,系统可控。

经济控制论

《经济控制论》课程教学大纲 课程编号: 总学时数:48 总学分数:3 课程性质:专业选修课 适用专业:信息与计算科学 一、课程的任务和基本要求: 本课程是为数理学院信息与计算科学专业运筹与控制方向开设的专业限选课程。本课程将系统地讲授现代控制理论的基本概念、原理和方法,包括系统的能控性、能观性和稳定性分析,变分法与最大值原理、动态规划以及有关的数值计算问题;同时结合案例讲解控制理论在动态经济系统中的应用,例如人口预测、市场调节与价格波动、经济最优增长、投入产出结构优化、双头垄断竞争对策、生态平衡、可再生与不可再生资源最优利用、最优货币政策与财政税收政策设计、经济波动周期分析等。课程结合经济控制论的最新发展趋势讲解有关的控制论原理和相关应用。 基本要求: 通过本课程的学习,使学生掌握现代控制理论的基本概念、原理和方法,了解系统分析与控制的基本思想,学习如何将控制理论知识应用于管理学科,掌握动态经济系统的分析与控制技术。 二、基本内容和要求: 第一章系统的状态空间描述方法 第二章离散时间动态经济系统的运动分析和稳定性分析 了解离散时间函数及z变换;会进行离散时间系统运动分析;理解离散时间系统的稳定性分析。 第三章连续时间动态经济系统的运动分析和稳定性分析 了解连续时间函数及拉普拉斯变换;会进行连续时间系统运动分析和连续时间系统稳定性分析;了解连续时间系统与离散时间系统相互关系。 第四章动态经济系统的调节与控制 了解经济系统受控变量的目标跟踪;理解线性系统能控性及逼近目标的可能性;掌握线性动态系统的极点配置与系统逼近目标的速度和起伏等。 第五章线性系统鲁棒调节器和鲁棒经济策略 第六章连续时间动态经济系统优化与决策 了解变分法与泛函优化;理解动态系统最优控制;掌握极大值原理;能解决最小能量控制问题等。 第七章离散时间动态经济系统优化与决策 掌握离散时间动态系统极大值原理;理解宏观经济系统协调发展时的最优增长的“快车道”定理等。 第八章应用实例与发展趋势 三、实践环节和要求:无

连续线性二次型最优控制的MATLAB实现

连续线性二次型最优控制的MATLAB 实现 1.绪 论 最优控制问题就是在一切可能的控制方案中寻找一个控制系统的最优控制方案或最优控制规律,使系统能最优地达到预期的目标。随着航海、航天、导航和控制技术不断深入研究,系统的最优化问题已成为一个重要的问题。 本文介绍了最优控制的基本原理,并给定了一个具体的连续线性二次型控制系统,利用MATLAB 软件对其最优控制矩阵进行了求解,通过仿真实验,设计得到最优控制效果比较好,达到了设计的目的。 2.最优控制理论介绍 2.1最优控制问题 设系统状态方程为: ]00)(,),(),()(x t x t t u t x f t x ==? (2—1) 式中,x(t)是n 维状态向量;u(t)是r 维控制向量;n 维向量函数[]t t u t x f ),(),(是x(t)、u(t)和t 的连续函数,且对x(t)与t 连续可微;u(t)在[]f t t ,0上分段连续。所谓最优控制问题,就是要寻求最优控制函数,使得系统状态x(t)从已知初态0 x 转移到要求的终态)(f t x ,在满足如下约束条件下: (1)控制与状态的不等式约束 []0),(),(≥t t u t x g (2—2) (2)终端状态的等式约束 []0),(=f f t t x M (2—3) 使性能指标 [][]?+Θ=f f t t t t t u t x F t t x J f 0 d ),(),(),( (2—4) 达到极值。式中[]t t u t x g ),(),(是m 维连续可微的向量函数,r m ≤;[]f f t t x M ),(是s 维连续可微的向量函数,n s ≤;[]f t t x f ),(Θ和[]t t u t x F ),(),(都是x(t)与t 的连续可

最优控制实验报告

实验报告 课程名称:现代控制工程与理论实验课题:最优控制 学号:12014001070 姓名:陈龙 授课老师:施心陵

最优控制 一、最优控制理论中心问题: 给定一个控制系统(已建立的被控对象的数学模型),选择一个容许的控制律,使被控对象按预定要求运行,并使给定的某一性能指标达到极小值(或极大值) 二、最优控制动态规划法 对离散型控制系统更为有效,而且得出的是综合控制函数。这种方法来源于多决策过程,并由贝尔曼首先提出,故称贝尔曼动态规划。 最优性原理:在一个多级决策问题中的最优决策具有这样的性质,不管初始级、初始状态和初始决策是什么,当把其中任何一级和状态做为初始级和初始状态时,余下的决策对此仍是最优决策 三、线性二次型性能指标的最优控制 用最大值原理求最优控制,求出的最优控制通常是时间的函数,这样的控制为开环控制当用开环控制时,在控制过程中不允许有任何干扰,这样才能使系统以最优状态运行。在实际问题中,干扰不可能没有,因此工程上总希望应用闭环控制,即控制函数表示成时间和状态的函数。 求解这样的问题一般来说是很困难的。但对一类线性的且指标是

二次型的动态系统,却得了完全的解决。不但理论比较完善,数学处理简单,而且在工际中又容易实现,因而在工程中有着广泛的应用。 一.实验目的 1.熟悉Matlab的仿真及运行环境; 2.掌握系统最优控制的设计方法; 3.验证最优控制的效果。 二.实验原理 对于一个给定的系统,实现系统的稳定有很多途径,所以我们需要一个评价的指标,使系统在该指标下达到最优。如果给定指标为线性二次型,那么我们就可以利用MATLAB快速的计算卡尔曼增益。 三.实验器材 PC机一台,Matlab仿真平台。 四.实验步骤 例题1 (P269)考虑液压激振系统简化后的传递函数方框图如下,其中K a为系统前馈增益,K f为系统反馈增益,w h为阻尼固有频率。(如图5-5所示) 将系统传递函数变为状态方程的形式如下: ,

二阶系统串联校正的根轨迹

毕 业 设 计 (论 文) 设计(论文)题目:_______ _______________________ _______________________________ 单 位(系别):______________________ 学 生 姓 名:______________________ 专 业:______________________ 班 级:______________________ 学 号:______________________ 指 导 教 师:______________________ 答辩组负责人:______________________ 填表时间: 20 年 月 重庆邮电大学移通学院教务处 编 号:____________ 审定成绩:____________

摘 要 对于一个系统,首要的要求就是系统的绝对稳定性。在系统稳定的情况下,要求系统的动态性能和稳态性能要好,这些可以通过设计校正来达到期望的性能标准。 本文用劳斯判据判断系统的稳定性,用根轨迹法改造系统的根轨迹,使系统达到要求的性能指标。从根轨迹图可以看出,只调整增益往往不能获得所希望的性能。通过增加新的(或者消去原有的)开环零点或者开环极点来改变原根轨迹的走向,得到新的闭环极点,从而使系统可以实现给定的性能指标来达到系统的设计要求。 本文对原系统采用串联校正的方法改善系统的性能指标,其步骤如下: 1.作原系统的根轨迹图,并根据动态期望指标推出满足条件的ζ、n ω。 2.检验动态性能。计算出主导极点,分析开环增益。 3.检验稳态性能。计算开环增益,判断校正方式。 4.计算校正装置,设置校正装置并检验。 5.作校正后的根轨迹图,判断校正后的系统性能。 最终使系统在输入为()5r t t =+时的静态指标ss e ≤0.2,同时使动态期望指标p σ≤ 5%;s t ≤ 5 sec 。并且用MATLAB 对原系统和校正后的系统分别进行仿真,对比其根轨迹以及在指定输入下的输出,分析其是否达到要求。 【关键词】根轨迹法 串联校正 MALTAB 仿真 动态性能 稳态性能

§7.4动态规划与离散系统最优控制

§ 7.4 动态规划与离散系统最优控制 1. 动态规划基本原理 最优性原则应有如此性质: 即无论(整个过程的)初始状态和初始决策如何,其余(后段)各决策对于由第一个决策(后)所形成的状态作为(后段)初始状态来说,必须也是一个最优策略。 A B C D E 最优性原则 图7.5

用式表示 1() ()min{(,())(())},1,2,,n n n n n u x J x R x u x J u x n N -=+= 阶段变量n (分析次序) 状态变量x 决策变量()n u x 决策组11{,, ,}n n u u u - 损失(效益)函数:(,)n R x u 对x 用决策n u 所付代价(效益) 后部最优策略函数()n J x 由x 至终最小损失(最大效益)

A 到D 的最短路线 解 3阶段的决策过程, 在CD 段(首), (分析)阶段变量1n =; 7.6 图A 2C 1 B D 2 B 3 B 1 C 3 C 4 5 55 6 3 3) b (A 2 C 1B D 2 B 3 B 1 C 3 C 4 4 5 55 55 66677 7 3 3 (a) 3 =n 1 =n 2 =n

111111*********()(,)3,();()(,)5,();()(,)3,(). J C R C D u C D J C R C D u C D J C R C D u C D ========= 在BC 段(首), (分析)阶段变量2n =; 21111,2,3 ()min{(,)()} min{73,65,53}8i i i J B R B C J C ==+=+++=,213()u B C =; 22211,2,3 ()min{(,)()} min{63,55,73}9i i i J B R B C J C ==+=+++=,221()u B C =; 23311,2,3 ()min{(,)()} min{53,65,73}8 i i i J B R B C J C ==+=+++=,231()u B C =;

Lorenz 系统的最优控制

- 37 - Lorenz 系统的最优控制 周俊冬 马 明 (南通广播电视大学,江苏 南通 226006) 【摘 要】文章讨论了Lorenz 系统的最优控制问题,将该混沌系统控制到任意所期望的状态。基于哈密顿-雅可比-贝尔曼方程将构建最优控制器问题归结为解偏微分方程问题,通过巧妙构造Lyapunov 函数从而得到最优控制器。数值仿真表明,所设计的控制器实用有效并且易于实现。 【关键词】Lorenz 系统;最优控制;哈密顿-雅可比-贝尔曼方程 【中图分类号】TP273 【文献标识码】A 【文章编号】1008-1151(2010)05-0037-02 (一)引言 1963年Lorenz 发现了第一个混沌吸引子——Lorenz 系统,从此揭开了混沌研究的序幕。Lorenz 系统在信息加密和保密通信等领域有着广阔的应用前景,自从Pecora 和Carroll 提出混沌系统控制的观点和理论以后,线性和非线性反馈控制、自适应控制、延迟控制、变结构控制等多种不同方法都被成功地应用于Lorenz 混沌系统的控制中。 近十多年来,混沌控制的研究得到了蓬勃的发展,这一方向迅速成为混沌和控制学科交叉研究的热点,其间,人们提出了各种混沌控制方法,其中优化控制是一种在系统控制中应用最为广泛的手段,通常给定性能指标,或称目标函数泛函,寻找一容许控制,使目标泛函沿系统所有可能的状态轨迹取最小值。 目前,国内外学者已提出许多不同的混沌最优控制方法,并且问题最后都归结为求解动态规划中所涉及的偏微分方程。实际上,在许多情况下,动态规划中的偏微分方程的解是不存在或不惟一的。因此,求解动态规划中的偏微分方程是获得非线性系统最优控制的主要障碍。 本文针对Lorenz系统提出了一种最优控制方法,将该混沌系统控制到任意所期望的状态。基于哈密顿-雅可比-贝尔曼方程将构建最优控制器问题归结为解偏微分方程问题,通过巧妙构造Lyapunov函数从而得到最优控制器,同时找出了哈密顿-雅可比-贝尔曼方程的解。仿真结果表明该方法的有效性。 (二)哈密顿-雅可比-贝尔曼方程 设一个连续的非线性动力系统方程为: *()()(),()0x t f x g x u f x =+=& (1) 式中n x R ∈是状态变量,m u R ∈是控制器,():n n f x R R →和 ():n n m g x R R ×→是连续函数,驱使系统从任意初始值到任意 确定点* x 的最优控制方案是,使目标函数 [][()]T J u q x u Ru dt ∞ =+∫ (2) 取得最小值,式中()q x 是连续、可微且正定的函数,根据动态规划,最优控制归结为Hamilton-Jacobi-Bellman 偏微分方程: min 0u U u u dS dS dt dt ωω∈=????+=+=???????? (3) 式中()T q x u Ru ω=+,(())min [()]T t u U S x t q x u Ru dt ∞ ∈=+∫ ,U 为所有 控制器的集合。0u 为最优控制 (三)Lorenz系统的最优控制 Lorenz 系统的数学模型为: 121212133123 ()x a x x x bx x x x x x x cx =??? =????=??&&& (4) 当参数10a =、28b =、83c =时,系统是混沌的,图1显 示了系统的混沌吸引子。下面把该混沌系统从任意初始点稳 定到任意给定的目标点****123(,,)T x x x x =。 x (3) 图1 Lorenz 系统的混沌吸引子 控制器分为前馈控制****123(,,) T u u u u =和反馈控制123(,,)T u u u u =两部分,那么系统(4)变为: * 12111 * 2121322* 312333 ()x a x x u u x bx x x x u u x x x cx u u ?=?++?=??++??=?++?&&& (5) 取前馈控制为: ***1122 ******* 212133113******31212213 2u ax ax ax u bx x x x x x x x u x x x x x x cx ?=?+?=?+++???=??+? (6) 则受控系统(5)变为: 【收稿日期】2010-01-29 【作者简介】周俊冬,南通广播电视大学机械工程系教师;马明,南通广播电视大学机械工程系教师。

经济数学的模型分类作业

经济数学模型分类作业 一、按数学模型的性质分为: 1、确定性模型: 确定性模型是一个由完全肯定的函数关系(因果关系)所决定的、不包含任何随机成份的模型。这种模型包括由微分方程所描述的数学模型,可用解析解法、数值解法和电模拟方法求解。对于确定性模型,只要设定了输入和各个输入之间的关系,其输出也是确定的,而与实验次数无关。确定性模型事实上是一种简化了的随机性模型。 举例: 模型名称:大坝位移确定性模型 模型:把坝体某考察点的位移i ?视为几种外界条件贡献的总和 )()()()(321i t f t f t f t i i i ++=? 式中: i ——某考察点, △——位移, t ——时间, )(1t f i ——水位变化引起的弹性位移分量, )(2t f i ——变温引起的弹性位移分量, )(3t f i ——由于混凝土和岩石的非弹性性质引起的不可恢复的位移分量。 2、随机性模型: 随机性模型是指含有随机成份的模型。 与确定性模型的不同可以很好地用以下例子解释:在赌场里赌大小,如果有人认为三次连开大第四次必然开小,那么此人所用的既是确定性模型。但是常识告诉我们第四次的结果并不一定与之前的结果相关联。概率模型、统计回归模型、马氏链模型都属于随机性模型 举例: 模型名称:报童的诀窍 模型:报童每天清晨从报社购进报纸零售,晚上将没有卖掉的报纸退回。购进太少,不购卖,

会少赚钱;购进太多,卖不完,将要赔钱。他应该如何确定每天购进量,以获得最大收入。 每天需求量是随机的,所以每天收入是随机的。 模型假设: 1、假设报纸没分购进价为b ,零售价为a ,退回价为c ,a>b>c 。 2、每天购进量为n 份,需求量为r 份的概率为f(r),r=0,1,2…。 3、每天购进量为n 份的日平均收入为G (n )。 模型构成: ∑∑=∞ +=-+ ----=n r n r r nf b a r f r n c b r b a n G 01)()()()])(()[()( 求n 使G (n )最大 二、按数学模型的变量和函数结构的变动情况分为: 1、连续性模型: 模型中的任何量或关系的微小变动是相对稳定的。模型中的时间变量是在一定区间内变化的模型称为连续性模型。一般用微分方程描述。如:人口增长模型。 举例: 模型名称:连续增长模型 模型:标准的连续增长模型方程式dN/dt=(b-d)N=rN 积分式Nt=0N e^rt 在很短的时间dt 内,b,d 为瞬时出生率、死亡率,N 为种群大小。r 为每员增长率,与密度无关。 2、非连续性模型: 模型中某些量或关系的变化是间断的,有跳跃的模型。 举例: 模型名称:马尔可夫模型 模型:马尔可夫链是随机变量X1,X2,X3…的一个数列。这些变量的范围,即他们所有可能取值的集合,被称为“状态空间”,而Xn 的值则是在时间n 的状态。如果Xn + 1对于过去状态的条件概率分布仅是Xn 的一个函数,则 P(Xn+1=x ∣X0,X1,X2,…,Xn)=P(Xn+1=x ∣Xn) 这里x 为过程中的某个状态。 3、离散性模型: 模型中的变量是由可数点列构成的。变量(主要是时间变量)取离散的模型称为离散性

基于MATLAB的线性二次型最优控制设计

基于M A T L A B的线性二次型最优控制设计 The Standardization Office was revised on the afternoon of December 13, 2020

基于MATLAB 的线性二次型最优控制设计 1. 引 言 最优控制问题就是寻找一个控制系统的最优控制方案或最优控制规律,使系统能最优地达到预期的目标。以状态空间理论为基础的最优控制算法是当前振动控制中采用最为普遍的控制器设计方法。本文所讨论的系统是完全可观测的,所以可以用线性二次型最优控制。 本实验介绍了线性二次型最优控制的基本原理,并给定了一个具体的控制系统,利用MATLAB 软件对其最优控制矩阵进行了求解,通过仿真实验,设计所得到的线性二次型最优控制效果比较好,达到了设计的目的。 2. 最优控制理论介绍 假设线性时不变系统的状态方程模型为 x ‘(t)=Ax(t)+Bu(t) y(t)=Cx(t)+Du(t) 引入一个最优控制的性能指标,即设计一个输入量u,使得 J = 为最小。其中Q 和R 分别为对状态变量和输入变量的加权矩阵; t f 为控制作用的终止时间。矩阵S 对控制系统的终值也给出某种约束,这样的控制问题称为线性二次型(Linear Quadratic ,简称LQ )最优控制问题。 为了求解LQ 问题,我们取Hamilton 函数 其中一种较为简便的解法为: 令λ(t)=P(t)x(t) 而将对λ(t)的求解转化到对函数矩阵P(t)的求解`,特别的,将λ(t)=P(t)x(t)代入上述式子中可得函数矩阵P(t)因满足的微分方程是 1'()()()()()()()()()()(); ().T T P t P t A t A t P t P t B t R t B t P t Q t P tf S -=--+-= (1) 对它的求解可应用成熟的Euler 方法。假定方程(1)的唯一对称半正定解P(t),则LQ 问题的解u(t)由下式给出: '(,(),(),())0.5(()()()()()())()(()()()());LQ ()(()()()());0(()()()()));()()()()(); T T T H t x t u t t x t Q t x t u t R t u t t A t x t B t u t H t Q t x t A t t H Q t x t A t t u x t A t x t B t u t λλδλλδλδλδ=+++=-=-+=+=+并应用变分原理推导出问题解满足的必要条件: ^1()()()()(). LQ u t)=-Kx(t). K T u t R t B t P t x t -=-上述问题的一个特例是动态方程为定常的情形,即 相应的控制向量取为(其中,为才是矩阵,而二次性能指标为

系统工程作业题

第1章系统工程的概念 练习题 1、什么是系统(系统的定义) 系统的定义:“系统”是结构上 状态变化上相 互依赖的若干成员,构成 的具有 特定功能的整体。 系统的主要属性:整体性、关联性、环 境适应性。 2、构成系统的基本要素有哪些 系统的特性(区别于其它事物) 整体性(2)目的性⑶ 有序性。⑷ 相关性 复杂性(6)适应性⑺动态性(8)开放性 什么是系统工程(系统工程的定义) 系统 工程的定义:系统工程是针对系统整体 对象全 寿命周期的问题, 运用系统的思想和 方法进行建 模、仿真、设计、优化、评价、 决策的多学科交叉的理论方法和技术。 它从 系统整体出发,分析各单元的内在联系 (约 束关系),作统筹安排,发挥各单元的功能, 基于相二 ⑴ (53、

定量和定性结合的系统思想及计算机技术等,处理大规模复杂系统的问题,从而达到系统整体最优的目的。 系统工程的内涵:(1)是一类多学科交叉的系统对象普遍适用的通用共性方法:⑵ 是 一门多学科交叉的工程学科;(3)是将这些方法运用于“从概念到产品”的实践、运用于复杂系统问题以提供技术可行、经济最优的解决方案的实践(如最优控制)。 4、系统工程的基本要素有哪些 系统工程的主要特点在于强调以下观点: (1)整体性和系统性的观点(前提);⑵总体最优或总体平衡协调的观点(目⑶ 多种方法综合运用的观点(手段);⑷问题导向及反馈控制的观点(保障)。 5、系统工程与传统工程学有何异同 差异对照:对象基本方法专门方法

匚程学=特定物理对象+基本逻辑与常识+专业 知识 系统工程= 统知识 实例: 电气工程学=强电和弱电电路+基本逻辑与电学 常识+电(力)网理论 系统工程学=社会/经济/能源等+基本逻辑与系 统观点+分析/预测/ 建模/评价/决策 共同点: 都把科学和技术应用到工程实际,以达到改造客观 世界的目的。 6、系统工程有哪些应用领域举一个实例 并分析它的基本要素。 “工程控制”系统工程 社会系统工程 经济系统工程 能源系统工程 环境生态系统工程 水资源系统工程 (7) 农业系统工程 (8) 企业系统工程 (9) 科技管理系统工程 (10) 人口系统工程 (11) 教育系统工程 般对象+基本逻辑与系统观点 +系 ⑴ ⑵ ⑶ ⑷ (5)

非线性系统最优控制理论综述

非线性系统最优控制理论综述 时间:2015-06-17 作者:马玲珑 摘要:非线性系统,其最优控制求解相当困难,寻求近似的最优控求解方法是当下解决这一问题的主要途径。目前,比较成熟的最优控制求解方法主要有七类,本文对这七种方法进行了详细的阐述,并对其优缺点进行了客观的对比。 论文关键词:非线性,最优控制 近年来,最优控制理论[1,2]的研究,无论在深度和广度上,都有了很大的发展,已成为系统与控制领域最热门的研究课题之一,取得了许多研究成果。同时,也在与其他控制理论相互渗透,出现了许多新的最优控制方式,形成了更为实用的学科分支。例如鲁棒最优控制[3]、随机最优控制[4]、分布参数系统的最优控制[5]、大系统的次优控制[6]、离散系统的最优控制及最优滑模变结构控制[7,8]等。而对于非线性系统,其最优控制求解相当困难,需要求解非线性HJB方程或非线性两点边值问题,除简单情况外[9],这两个问题都无法得到解析解。因此,许多学者都致力于寻求近似的求解方法[10~13],通过近似解得到近似的最优控,即次优控制。 1、非线性最优控制理论研究成果分类 目前,较为流行的近似最优控制求解方法主要有以下几类[6][13]。 1)幂级数展开法:幂级数展开方法通过一个幂级数来构造控制律,得到序列形式的近似最优解,或者将系统中的非线性项以幂级数形式分解,或者通过引进一个临时变量并围绕它展开。 将上式代入HJB方程求得级数近似解,也可利用Adomian分解将非线性项进行分解,由此寻求非线性HJB方程级数的近似解。 2)Galerkin逐次逼近方法:由动态规划得到的一般性偏微分HJB方程,引入一个迭代过程来求解一般非线性HJB方程的一个近似解序列。 3)广义正交多项式级数展开法:其主要思想是将最优控制问题中的状态变量,控制输入,性能指标和各个参数分别用广义正交多项式展开,利用广义正交多项式的积分、乘积运算阵 将描述系统的微分方程转化为一系列的代数方程。然后,得到 ,T非奇异时由得到的控制律是一个多项式级数解。该方法将最优控制问题转化为代数极值问题,从而避免了求解时变非线性Riccati方程。 4)有限差分和有限元方法:经典的有限差分和有限元方法可以用来近似求解非线性

相关主题
文本预览
相关文档 最新文档