最优控制理论_第一章
- 格式:pdf
- 大小:1.15 MB
- 文档页数:19
第一章 最优控制问题最优控制理论是现代控制理论中最早发展起来的分支之一. 所谓控制就是人们用某种方法和手段去影响事件及其运动的进程和轨道,使之朝着有利于控制主体的方向发展. 对于一个给定的受控系统,常常要求找到这样的控制函数,使得在它的作用下,系统从一个状态转移到为设计者希望的另一个状态,且使得系统的某种性能尽可能好. 通常称这种控制问题为最优控制问题. 最优控制理论主要讨论求解最优控制问题的方法和理论,包括最优控制的存在性和唯一性和最优控制应满足的必要条件等. 最优控制理论始于20世纪50年代末,其主要标志是前苏联数学家庞特里亚金(L.C.Pontryagin )等人提出的“最大值原理”. 最优控制理论在工矿企业、交通运输、电力工业、国防工业和国民经济管理等部门有着广泛的应用.本章我们通过几个具体实例介绍最优控制的基本问题和基本概念及其最优控制问题的数学描述.第一节 最优控制实例下面列举几个简单但具有实际应用的例子,他们虽然来自完全不同的领域,但却反映了一个共同的问题-最优控制问题例1 快速到达问题考虑一个机构(如车皮)W ,其质量为m ,沿着水平的轨道运动,不考虑空气的 阻力和地面对车皮的摩擦力,把车皮看成一个沿着直线运动的质点,x(t)表示车 皮在t 时刻的位置,u(t)是施加在车皮上的外部控制力,假定车皮的初始位置和速度分别为00)0(,)0(y xx x == ,我u(t)使车皮在最短时间内到达并静止在坐标原点,即到达坐标原点时速度为零.根据牛顿第二定律0),(>=t t u xm , (1.1) 令211,x xx x == ,则(1.1)化为 ),(,221t u xm x x== (1.2)其中)(),(21t x t x 分别表示车皮在t 时刻的位置和速度,写成向量形式,),()0(),(00Ty x X t bu AX X=+= (1.3)其中⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛=)()()(,/10,001021t x t x t X m b A . 由于技术上的原因,外部推力不可能要多大有多大,它在数量上是有界的,即M t u ≤)(, (1.4)其中M 是正常数.⎰=11))((t t dt t u J (1.5)问题是寻找一个满足条件(1.4)的控制函数)(t u ,把W 由初态T y x ),(00 转移到终态T )0,0(,且使性能指标(1.5)达到最小.任何能达到上述要求的控制函数,都称为最优控制.电梯的快速升降、轧钢机的快速控制和机械振动的快速消振问题都可以用上述问题阐述.例2 国民收入的增长问题国民经济收入主要用于两个方面:扩大再生产的积累资金和满足人民生活需要的消费基金. 我们的问题是如何安排积累和消费资金的比例使国民收入得到最快的增长.我们用x(t)表示t 时刻的国民收入,y(t)表示用于积累基金的部分,)()()(t x t y t u =称为积累率. 我们的目的是寻求最优积累率u(t),使国民收入x(t)增长最快. 国民收入的增长率x取决于当时的收入总值x(t)和积累率u(t),即有 ),,()(u x t f t x= . (1.6) 根据u(t)的实际含义,)(t u 应满足 1)(0≤≤t u .考虑一段时间T (5年或10年),使x(t)从初值0x 达到尽可能大的x(T), 即0)0(x x =, (1.7))(max T x . (1.8)问题归结为在(1.6)、(1.7)下求u(t)满足(1.8)。
最优控制理论读书报告第一章 最优控制问题与极大值原理最优控制问题具有广泛性、多样性及重要性,它可以应用到不同的领域中,例如升降机的最快升降问题、防天拦截问题、雷达跟踪问题及生产库存控制问题等等。
通过对这些问题的研究,我们可以看出它们都具有如下共同的特点:(1) 都有一个被控对象。
它通常是由常微分方程组描述的动态模型来表征的,即000(,,),[,]()f xf x u t t t t x t x =∈⎧⎨=⎩ (1.1)其中n x R ∈是状态量,r r u U R ∈⊆是控制量,0[,]f t t t ∈是时间变量,*0:[,],,,n n r f f R U t t R r n Z r n ⨯⨯→∈≤是描述被控对象动态特征的矢值函数,0,f t t 分别是初始和终端时刻,通常0t 为定值,而f t 可为定值,也可待求。
通常假设:对有限时间区间0[,]f t t 给定的任一分段连续矢值函数()r u t U ∈,(1.1)都存在唯一解。
(2) 都要求把被控系统的初态0x 通过控制作用,在某个终端时刻0f t t >引导到某个终端状态()f x t 。
通常要求终端状态()f x t 属于n R 中某个点集S ,S 称为目标集,且:{((),)0,,}p f f S x g x t t g R p n ==∈≤ (1.2) (3) 都有一个容许控制集合。
容许控制集合0[,]f t t U 为0[,]12:{()()((),(),,()),()f T t t r i U u t u t u t u t u t u t == 是定义在0[,]f t t 上的分段连续函数,1,2,,;i r =(),r u t U ∈且把(1.1)的初态0x 在终端时刻f t 引导到目标集S 上} (1.3)(4) 都有一个表征系统品质优劣的性能指标。
由于它是一个依赖控制函数()u t 的“函数”,又称为性能指标泛函或代价泛函。
中液体温度经1小时后上升到40℃,并要求
例2 月球上的软着陆问题(运动控制)飞船靠其发动机产生一与月球重力方向相反的推力u(t),以使飞船在月球表面实现软着陆,要寻求发动机推力的最优控制规律,以便使燃料的消耗为最少。
设飞船质量为m(t),高度为h(t),垂直速度为v(t),发动机推力为u(t),月球表面的重力加速度为常数g 。
设不带燃料的飞船质量为M ,初始燃料的总质量为F .初始高度为h 0,初始的垂直速度为v 0,那么飞船的运动方程式可以表示为:
⎪⎪⎩⎪⎪⎨⎧−=+−==)()()()()()()(t ku t m
t m t u g t v t v t h &&&初始条件
⎪⎩
⎪⎨⎧+===F M m v v h h )0()0()0(00终端条件
)(0
)(==f f t v t h 约束条件
α
≤≤)(0t u
性能指标:
使燃料消耗为最小,即
)(f t m J =达到最大值
我们的任务是寻求发动机推力的最
优控制规律u(t),它应满足约束条件,使飞船由初始状态转移到终端状态,并且使性能指标为极值(极大值)。
或使时间最短。
或试验而得到的。
值。