最优控制第六章习题答案
- 格式:docx
- 大小:209.43 KB
- 文档页数:5
2-5 求通过(0)1x =,(1)2x =,使下列性能泛函为极值的极值曲线*()x t :2(1)ft t J x dt =+⎰解:由题可知,始端和终端均固定被积函数21L x =+,0L x ∂=∂,2L x x ∂=∂, 2d L x dt x∂⋅=∂ 代入欧拉方程0L d L x dt x∂∂-⋅=∂∂,可得20x =,即0x = 故1x c = 其通解为:12x c t c =+代入边界条件(0)1x =,(1)2x =,求出11c =,21c = 极值曲线为*()1x t t =+2-6 已知状态的初值和终值为(1)4x =,()4f x t =式中f t 自由且f t >1,试求使下列性能泛函达到极小值的极值轨线*()x t :211[2()()]2ft J x t x t dt =+⎰ 解:由题可知,2122L x x =+,()4f t ψ=,()14x =,()4f x t = 欧拉方程:L 0d L x dt x∂∂-=∂∂ 横截条件:()00t x =x ,()()f f x t t ψ=,()0fTt L L x x ψ∂⎛⎫+-= ⎪∂⎝⎭易得到2dxdt= 故12x t c =+ 其通解为:()212x t t c t c =++根据横截条件可得:()()()122121114424f f f f f x c c x t t c t c x t t c ⎧=++=⎪⎪=++=⎨⎪=+=⎪⎩解以上方程组得:12569f t c c =⎧⎪=-⎨⎪=⎩将f t ,1c ,2c 代入J 可得5*201500502150233J x x dt =+=-=⎰ 极值轨线为()*269x t t t =-+2-7 设性能泛函为120(1)J x dt =+⎰求在边界条件(0)0x =,(1)x 自由情况下,使性能泛函取极值的极值轨线*()x t 。
解:由题可知,21L x =+,()00x =,()1x 自由欧拉方程:L 0d L x dt x∂∂-=∂∂ 横截条件:()00t x =x ,L 0ft x∂=∂,0fTt L L x x ∂⎛⎫+= ⎪∂⎝⎭易得到()x t a =其通解为:()x t at b =+代入边界条件()f x t a =,()00x =,1f t =,求出0a =,0b = 将f t ,a ,b 代入J 可得()1*211J x dt =+=⎰极值轨线为()*0x t = 2-9 求使泛函22211220(2)J x x x x dt π=++⎰为极值并满足边界条件1(0)0x =,2(0)0x =1()12x π=,2()12x π=- 的极值轨线*1()x t 和*2()x t 。
1. 有十个城市①为起点,⑩为终点。
站与站之间称为段,每段路程所用的时间(小时)写在段上,则应如何行使,让从①到⑩所花的时间最短.解:⑴ 4N =11(8)3,(9)4J J ==将距离数字标注于图中,数字旁括号内的文字表示相应的决策变量。
由于从8到10及从9到10都只有一种可能,所以本级无决策问题.⑵3N =本级决策有三种选择。
每种选择中又有两条可能的路线.例如,从5出发,可达8,也可达9,所以131(5,8)(8)13(2)min min 4(5,9)(9)44d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明5到10的最短距离为4,路线为5—8-10决策变量为2(5)8S = 同理,从6出发时,有121(6,8)(8)63(6)min min 7(6,9)(9)34d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明6到10的最短距离为7,路线为6-9—10决策变量为2(6)9S = 从7出发时,有121(7,8)(8)33(7)min min 6(7,9)(9)34d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明7到10的最短距离为6,路线为7-8—10决策变量为2(7)8S = ⑶2N =本级有三种选择,计算过程如下:2322(2,5)(5)74(2)min (2,6)(6)min 471166(2,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(2)5(6)S =2322(3,5)(5)34(3)min (3,6)(6)min 27746(3,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(3)5S =2322(4,5)(5)44(4)min (4,6)(6)min 17856(4,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(4)5(6)S =⑷1N =本级决策是唯一的,计算结果为2422(1,2)(2)211(1)min (1,3)(3)min 471138(1,4)(4)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量4(1)3(4)S =可确定最短路线为1-3-5-8—102.一维线性系统,设变量无约束,最优控制问题的数学模型为:22210(),k k k k k J qx ru T x ax bu +=+=+∑初始状态0x 为已知.式中,,,a b q r 为常数,0,=1r T >设。
最优控制课后习题答案最优控制课后习题答案最优控制是现代控制理论中的重要分支,它研究如何在给定约束条件下,使系统的性能指标达到最优。
在最优控制的学习过程中,课后习题是巩固理论知识、培养解决问题能力的重要环节。
本文将为大家提供一些最优控制课后习题的答案,希望能对大家的学习有所帮助。
1. 线性二次型最优控制问题考虑一个线性时不变系统,其状态方程和性能指标分别为:$$\begin{align*}\dot{x}(t) &= Ax(t) + Bu(t) \\J(u) &= \int_{0}^{T} (x^T(t)Qx(t) + u^T(t)Ru(t))dt\end{align*}$$其中,$x(t)$为系统的状态向量,$u(t)$为控制输入向量,$A$和$B$为系统矩阵,$Q$和$R$为正定矩阵,$T$为最优控制的时间段。
求解该问题的最优控制输入$u^*(t)$。
答案:根据最优控制的原理,最优控制输入$u^*(t)$满足以下的最优性条件:$$\begin{align*}\frac{\partial J}{\partial u}(u^*(t)) &= 2R u^*(t) + 2B^T P(t)x(t) = 0 \\\dot{P}(t) &= -PA - A^T P - Q + PBR^{-1}B^T P\end{align*}$$其中,$P(t)$为状态向量的共轭变量矩阵。
通过求解上述的代数方程和微分方程,可以得到最优控制输入$u^*(t)$和状态向量的共轭变量矩阵$P(t)$。
2. 非线性最优控制问题考虑一个非线性系统,其状态方程和性能指标分别为:$$\begin{align*}\dot{x}(t) &= f(x(t), u(t)) \\J(u) &= \int_{0}^{T} g(x(t), u(t)) dt\end{align*}$$其中,$f(x(t), u(t))$为非线性函数,$g(x(t), u(t))$为性能指标函数。
最优控制习题答案1.设系统方程及初始条件为⎩⎨⎧=+-=)()()(2)()(1211t x t x t u t x t x,⎩⎨⎧==0)0(1)(21x t x 。
约束5.1)(≤t u 。
若系统终态)(f t x 自由,利用连续系统极大值原理求)(*t u 性能指标,)3(2x J =取最小值。
解:2.设一阶离散时间系统为)()()1(k u k x k x +=+,初值2)0(=x ,性能指标为∑=+=2022)(21)2(k k u x J ,试用离散系统最小值原理求解最优控制序列:)2(),1(),0(u u u ,使J 取极小值。
解:3.软着落、空对空导弹的拦截问题、防空拦截问题。
解答:4.设离散系统状态方程为)(2.00)(101.01)1(k u k x k x ⎥⎦⎤⎢⎣⎡+⎥⎦⎤⎢⎣⎡=+,已知边界条件⎥⎦⎤⎢⎣⎡=01)0(x ,⎥⎦⎤⎢⎣⎡=00)1(x 。
试用离散系统最小值原理求最优控制序列,使性能指标∑==102)(03.0k k u J 取极小值,并求出最优的曲线序列。
解:属于控制无约束,N 不变,终端固定的离散最优控制问题,构造离散哈密尔顿函数)](2.0)()[1()](1.0)()[1()(03.0)(222112k u k x k k x k x k k u k H ++++++=λλ其中)1(),1(21++k k λλ为给定拉个朗日乘子序列,由伴随方程:)1()()(111+=∂∂=k k x H k λλ,)1()1(1.0)()(2122+++=∂∂=k k k x Hk λλλ得出 ⎩⎨⎧+==+==)2()2(1.0)1(),2()1()1()1(1.0)0(),1()0(2121121211λλλλλλλλλλ,由极值条件⎪⎪⎩⎪⎪⎨⎧>=∂∂=++=∂∂006.0)(0)1(2.0)(06.0)(222k u H k k u k u Hλ极小)1(310)(2+-=k k u λ可使min )(=k H ,令k=0和k=1的⎪⎩⎪⎨⎧-=-=)2(310)1(*)1(310)0(*22λλu u ,)(k u 带入状态方程并令k=0和1得到: 5.求泛函dtx x x x J ⎰++=102221211],[ 满足边界条件π===-=)3(,0)0(,0)3(,3)0(2211x x x x 和约束条件36221=+t x 的极值曲线。
最优控制习题及参考答案6212最优控制习题及参考答案习题 1求通过 x (0) = 1 , x (1) = 2 ,使下列性能指标为极值的曲线:t f J = ∫(x2 +1)dt t 0解: 由已知条件知: t 0=0 , t f= 1d由欧拉方程得:(2x ) = 0dtx = C 1x = C 1t + C 2将 x (0) = 1,x (1) = 2 代入,有:C 2 = 1,C 1 = 1得极值轨线: x *(t ) = t +1习题 2求性能指标:J = ∫ 1(x 2 +1)dt在边界条件 x (0) = 0 , x (1) 是自由情况下的极值曲线。
解: 由上题得:x * (t ) = C t + Cx * (t )63x f由 x (0) = 0 得: C 2= 0∂L由 ∂xt =tf= 2x (t f ) = 2C 1 t =t = 0t0 1于是: x *(t ) = 0【分析讨论】对于任意的 x (0) = x,x (1)自由。
6421∫ ⎩λ =有: C = x , C = 0 ,即: x *(t ) = x其几何意义: x (1) 自由意味着终点在虚线上任意点。
习题 3已知系统的状态方程为:x 1 (t ) = x 2 (t ), x 2 (t ) = u (t )边界条件为: x 1(0) = x 2(0) = 1 , x 1(3)= x 2(3) = 0 ,31 试求使性能指标 J =u 2(t )dt 2取极小值的最优控制 u *(t ) 以及最优轨线 x *(t ) 。
⎡ x ⎤解: 由已知条件知: f = ⎢ 2⎥⎢⎣ u ⎥⎦Hamiton 函数: H = L + λTfH = 1u 2+ λ x + λ u⎧λ = 0由协态方程: ⎨12121 2 2⎧λ = C① 得: ⎨1 1⎩λ2 = −C 1t + C2 ② ∂H由控制方程:∂u= u + λ2 = 0 得: u = −λ2= C 1t − C 2③由状态方程:x2 = u = C1t −C2得:x (t) = 1 C t2 −C t + C ④2 2由状态方程:x1 = x21 2 3得:x (t) = 1 C t3 −1 C t 2 + C t + C ⑤1 6 12 23 465661⎪⎩=− ∫⎡1⎤ ⎡0⎤将x (0) = ⎢ ⎢,x (3) = ⎢0⎢代入④,⑤, ⎣1⎦⎣ ⎦ 10联立解得: C 1 =由③、④、⑤式得:u * (t ) = 10t − 29,C 2 = 2 , C3=C 4 =1 9x * (t ) = 5 t 3 −t 2+ t +1 27 x *(t ) = 5 t 2 − 2t +1 29习题 4已知系统状态方程及初始条件为x =u , x (0) = 1试确定最优控制使下列性能指标取极小值。
第6章 习题及参考解答6-9 已知单位负反馈控制系统校正前对数幅频特性)(0ωL 如图6-63中点画线所示,串联校正装置对数幅频特)(c ωL 如图6-63中实线所示,要求1)作出校正后系统开环对数幅频渐进特性)(ωL 。
2)比较校正前、后的开环对数幅频特性)(0ωL 和)(ωL ,说明校正装置的作用。
习题 6-9 参考解答:1)校正后系统开环对数幅频渐进特性)(ωL 是)(0ωL 和)(c ωL 的线性叠加,如图右上图中红色实线所示。
2)校正装置的传递函数为2(1)()101c s G s s +=+,为滞后校正装置。
它的作用:①抬高了低频段幅值,可提高速度输入的稳态精度;②固有特性以-40dB/dec 穿越0dB 线,校正后的Bode 图以-20dB/dec 穿越0dB 线,中频段变缓,平稳性变好;校正后系统Bode 图的高频段幅值降低了,抗干扰能力提高;校正后系统的开环截止频率减小了,滞后校正是靠牺牲系统的快速性来换取平稳性的。
6-10 图6-64为三种校正装置的对数渐近幅频特性,它们都是由最小相位环节组成。
系统为单位负反馈 系统,其开环传递函数为02400()(0.011)G s s s =+试问: 1)这些校正网络特性中,哪一种使已校正系统的稳定性最好?2)为了将12Hz 的正弦噪声削弱10倍左右,你确定采用哪种校正网络特性?习题 6-10 参考解答: 校正装置传递函数分别是12310.110.510.51(),(),().1010.0111010.0251c c c s s s s G s G s G s s s s s ++++===++++。
1)a )使用滞后校正网络,校正后021400()(0.011)1().101c G G s s s s s s =+++10()()1c G j G j ωω==L (图6-63 题6-9图图6-64 题6-10图102400()()1110180arctan 6.32180arctan 0.01 6.32arctan16.3211.7063.2cc c co oo c G j G j ωωωωωγω⨯=⇒⨯⨯≈=-=+--⨯-⨯=b )使用超前校正网络,校正后022400()(0.011)0.11().0.011c G G s s s s s s =+++10()()1c G j G j ωω==1024000.1()()11180arctan 0.140180arctan 0.0140arctan 04032.4.0140c occ c o o G j G j ωγωωωω⨯=⇒⨯=+⨯---⨯==⨯≈c )使用滞后-超前校正网络,校正后0223400()(0.011)(0.51)().(101)(0.0251)c G G s s s s s s s =++++2230224000.5()()11011180(arctan 0.510)180arctan 1041010arctan 0.02510arctan 0.01108.2cc c c o o c oG j G j ωγωωωωω⨯=⇒⨯⨯⨯=+⨯--⨯-⨯-⨯=≈=由上述结果可知,在这些校正网络特性中,滞后-超前校正网络,其相角裕量γ=48o 最大,所以滞后-超前网络使已校正系统的稳定性最好。
12f最优控制习题及参考答案习题 1 求通过 x (0) = 1 , x (1) = 2 ,使下列性能指标为极值的曲线:t f J = ∫(x2 +1)dt t 0解: 由已知条件知: t 0 = 0 , t f = 1d由欧拉方程得: (2x ) = 0dtx = C 1x = C 1t + C 2将 x (0) = 1,x (1) = 2 代入,有:C 2 = 1,C 1 = 1得极值轨线: x * (t ) = t +1习题 2 求性能指标: J = ∫ 1(x 2 +1)dt在边界条件 x (0) = 0 , x (1) 是自由情况下的极值曲线。
解:由上题得: x *(t ) = C t + C由 x (0) = 0 得: C 2 = 0∂L由∂xt =t f= 2x (t f ) = 2C 1 t =t = 0 t于是: x * (t ) = 0【分析讨论】对于任意的 x (0) = x 0 ,x (1) 自由。
2 0 1 0∫ ⎩ λ= −λ 有: C = x , C = 0 ,即: x *(t ) = x其几何意义: x (1) 自由意味着终点在虚线上任意点。
习题 3 已知系统的状态方程为: x1 (t ) = x2 (t ) , x 2 (t ) = u (t )边界条件为: x 1 (0) = x 2 (0) = 1 , x 1 (3) = x 2 (3) = 0 ,31 试求使性能指标 J = 0 u 2(t )dt2取极小值的最优控制 u * (t ) 以及最优轨线 x * (t ) 。
⎡ x ⎤ 解:由已知条件知: f = ⎢ 2 ⎥⎢⎣ u ⎥⎦Hamiton 函数: H = L + λT fH = 1u 2 + λ x + λ u⎧λ = 0由协态方程: ⎨12 121 22⎧λ = C① 得: ⎨11⎩λ2 = −C 1t + C 2 ②∂H由控制方程: ∂u= u + λ2 = 0得: u = −λ2 = C 1t − C 2③由状态方程: x 2 = u = C 1t − C 2得: x (t ) = 1C t 2− C t + C④22由状态方程: x 1 = x 21 23得: x (t ) = 1C t 3 − 1C t 2 + C t + C⑤16122 341 ⎪ ⎩=− =− ∫ ⎡1⎤⎡0⎤将 x (0) = ⎢ ⎥ , x (3) = ⎢0⎥ 代入④,⑤, ⎣1⎦⎣ ⎦ 10联立解得: C 1 =由③、④、⑤式得:u * (t ) = 10t − 29 , C 2 = 2 , C 3 = C 4 = 1 9x * (t ) = 5 t 3 −t 2 + t +127 x *(t ) = 5 t 2 − 2t +1 2 9习题 4 已知系统状态方程及初始条件为x =u , x (0) = 1试确定最优控制使下列性能指标取极小值。
【思考与练习】一、单项选择题1.“亡羊补牢,犹未为晚”,可以理解成是一种(C)。
A.前馈控制 B.同步控制 C.反馈控制 D.直接控制2.控制工作得以展开的前提是(A)。
A.确定控制标准 B.分析偏差原因 C.采取矫正措施 D.明确问题性质3.“治病不如防病,防病不如讲卫生”说明(A)最重重。
A.前馈控制 B.同步控制 C.反馈控制 D.直接控制4.预算是一种(B)。
A.控制 B.计划 C.领导 D.组织5.控制工作的关键步骤是(C)。
A.拟定标准 B.衡量绩效 C.纠正偏差 D.管理突破6.确定控制对象和选择控制重点的工作是属于控制过程中(C)环节的工作。
A.衡量成效 B.纠正偏差 C.确立标准 D.找出偏差7.同步控制工作的重点是(B )。
A.把注意力集中在历史结果 B.正在进行的计划实施过程C.在计划执行过程的输入环节上 D.控制行动的结果8.按控制组织结构的不同,可把控制方法分为(A)。
A.集中控制、分散控制、分级控制B.战略控制、任务控制、结果控制C.前馈控制、同步控制、反馈控制D.内在控制、外在控制、结果控制9.预算是一种典型的(A)。
A.前馈控制 B.同步控制 C.反馈控制 D.预防性控制10.种庄稼需要水,但这一地区近年老不下雨,怎么办?一种办法是灌溉,以补天不下雨的不足,另一办法是改种耐旱作物,使所种作物与环境相适应。
这两种措施分别( C )。
A.纠正偏差和调整计划 B.调整计划和纠正偏差C.反馈控制和前馈控制 D.前馈控制和反馈控制二、多项选择题1.控制的特点包括(ABCD)。
A.目的性 B.整体性 C.动态性 D.人为性 E.实用性2.管理控制的必要性是由(ADE)因素决定的。
A.环境的变化 B.经济的发展 C.社会的需要D.管理权力的分散 E.工作能力的差异3.控制的基本过程包括(BCE)。
A.制订计划 B.确定标准 C.衡量成效D.诊断原因 E.纠正偏差4.一般来说,预算内容要涉及以下几个方面:(ABCDE)。
1. 有十个城市①为起点,⑩为终点。
站与站之间称为段,每段路程所用的时间(小时)写在段上,则应如何行使,让从①到⑩所花的时间最短。
解:⑴ 4N =11(8)3,(9)4J J ==将距离数字标注于图中,数字旁括号内的文字表示相应的决策变量。
由于从8到10及从9到10都只有一种可能,所以本级无决策问题。
⑵3N =本级决策有三种选择。
每种选择中又有两条可能的路线。
例如,从5出发,可达8,也可达9,所以131(5,8)(8)13(2)min min 4(5,9)(9)44d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明5到10的最短距离为4,路线为5-8-10决策变量为2(5)8S =同理,从6出发时,有121(6,8)(8)63(6)min min 7(6,9)(9)34d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明6到10的最短距离为7,路线为6-9-10决策变量为2(6)9S = 从7出发时,有121(7,8)(8)33(7)min min 6(7,9)(9)34d J J d J ++⎧⎫⎧⎫===⎨⎬⎨⎬++⎩⎭⎩⎭说明7到10的最短距离为6,路线为7-8-10决策变量为2(7)8S = ⑶2N =本级有三种选择,计算过程如下:2322(2,5)(5)74(2)min (2,6)(6)min 471166(2,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(2)5(6)S =2322(3,5)(5)34(3)min (3,6)(6)min 27746(3,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(3)5S =2322(4,5)(5)44(4)min (4,6)(6)min 17856(4,7)(7)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量3(4)5(6)S =⑷1N =本级决策是唯一的,计算结果为2422(1,2)(2)211(1)min (1,3)(3)min 471138(1,4)(4)d J J d J d J ++⎧⎫⎧⎫⎪⎪⎪⎪=+=+=⎨⎬⎨⎬⎪⎪⎪⎪++⎩⎭⎩⎭决策变量4(1)3(4)S =可确定最短路线为1-3-5-8-102.一维线性系统,设变量无约束,最优控制问题的数学模型为:22210(),k k k k k J qx ru T x ax bu +=+=+∑初始状态0x 为已知。
式中,,,a b q r 为常数,0,=1r T >设。
求最优控制序列。
解: 本题为三级决策问题. 因为=1T ,22210(),k k k k k J qxru T x ax bu +=+=+∑①令3,2N k ==*22122322,J qx ru x ax bu =+=+因为k u 无约束,故令*12220J ru u ∂==∂求得*20u =将上述结果代入*1J 方程,易得*212J qx = ② 2,1N k == 211x ax bu =+*22*2111222121222111122221111()[()](1)2()J qx ru J q x x ru q x ax bu ru q a x abqx u qb r u =++=++=+++=++++*2211122()0J abqx qb r u u ∂=++=∂解得*1121abq u x qb =-+将上述结果代入*2J 方程,易得 2222*222122(32)[(1)](1)a qb qb r J q a x qb ++=+++ ③ 1,0N k == 100x ax bu =+*22*3002222222220122222222220022(32)[(1)](1)(32)[(1)]()(1)J qx ru J a q b qb r qx ru q a x qb a q b qb r qx ru q a ax bu qb =++++=+++++++=++++++解得*0u 将上述结果代入*3J 方程,易得 3. 22210(),k k k k k J xru T x ax bu +=+=+∑,求最优控制序列。
解:本题为三级决策问题. 因为=1T ,22210(),k k k k k J xru T x ax bu +=+=+∑①令3,2N k ==*22122322,J x ru x ax bu =+=+因为k u 无约束,故令*12220J ru u ∂==∂求得*20u =将上述结果代入*1J 方程,易得*212J x = ② 2,1N k == 211x ax bu =+*22*2111222121222111122221111()[()](1)2()J x ru J x x ru x ax bu rua x abx ub r u =++=++=+++=++++*2211122()0J abx b r u u ∂=++=∂解得*1121ab u x b =-+将上述结果代入*2J 方程,易得 222*222122(32)[(1)](1)a b b r J a x b ++=+++③ 1,0N k == 100x ax bu =+*22*30022222222012222222220022(32)[(1)](1)(32)[(1)]()(1)J x ru J a b b r x ru a x b a b b r x ru a ax bu qb =++++=+++++++=++++++解得*0u 将上述结果代入*3J 方程,易得4.运用动态规划方法确定下列系统的最优控制3220(1)2()(),0,1,2,3[()()]t x t x t u t t J x t u t =+=+==+∑解:本题为四级决策问题。
① 3t =,(4)2(3)(3)x x u =+ *221(3)(3)J x u =+*12(3)0(3)J u u ∂==∂求得(3)0u =将上述结果代入*1J 方程,易得*21(3)J x = ②2t =,(3)2(2)(2)x x u =+,*22*2122222(2)(2)(2)(2)(3)5(2)2(2)4(2)(2)J x u J x u x x u x u =++=++=++*24(2)4(2)0(2)J u x u ∂=+=∂解得(2)(2)u x =-上述结果代入*2J 方程,易得*223(2)J x = ③1t =,(2)2(1)(1)x x u =+*22*3222222(1)(1)(1)(1)3(2)13(1)4(1)12(1)(1)J x u J x u x x u x u =++=++=++*38(1)12(1)0(1)J u x u ∂=+=∂解得3(1)(1)2u x =-上述结果代入*3J 方程,易得*233(1)J x = ④0t =,(1)2(0)(0)x x u =+*22*4322222(0)(0)(0)(0)4(1)17(0)5(0)16(0)(0)J x u J x u x x u x u =++=++=++*410(0)16(0)0(0)J u x u ∂=+=∂解得8(0)(0)5u x =-上述结果代入*4J 方程,易得*2421(0)5J x =5.系统方程为00()(),()dx ax t bu t x t x dt =-+=求最优控制使12210()tJ cx t u dt =+⎰取最小值,此处,,a b c 均为正常数。
解:令***2(,,)()()T T J J J H x u u ax bu x x x ∂∂∂=-+∂∂∂ ①对**(,)J u x x∂∂隐式解。
因为()u t 无约束,故令****120(,)=-2T T H J J J u b u x b u x x x∂∂∂∂=+=∂∂∂∂得 因为2220H u ∂=>∂故求得的**(,)J u x x∂∂可使哈密顿函数H 极小。
把***1(,)=-2T J J u x b x x ∂∂∂∂代入哈密顿—雅可比方程得:2***21()4T J J J b ax t x x⎛⎫∂∂∂=+ ⎪∂∂∂⎝⎭ 考虑该问题为定常问题,且f t 自由,因此最优函数仅为()x t 的函数,因此有2**21()04TJ J b ax x x ⎛⎫∂∂+= ⎪∂∂⎝⎭可得*=0x J ∂∂或*24a =-bJ x x ∂∂即可得:2**22a (bJ M x ==-恒值)或J **2=0=-a x b u u 最优控制或6.对于系统422,[]2x x u J u x dt ==++⎰最小化写出哈密顿-雅可比-贝尔曼方程式。
解:构造哈密顿函数**242J 1J L ()X 2xT H f x x u u ∂∂=+=+++∂∂ 根据哈密顿-雅可比方程有***242J J 1J min L min[()]2x T f x x u u x x ⎡⎤∂∂∂-=+=+++⎢⎥∂∂∂⎣⎦考虑控制不受限制可得:***H J 1J 20u 2u u x x ∂∂∂=+=→=-∂∂∂ 所以:**242J 11J ()24Xx x t ∂∂-=++∂∂。