离散时间系统最优控制离散时间系统最优控制
- 格式:pdf
- 大小:799.70 KB
- 文档页数:22
离散控制系统的最优控制理论离散控制系统的最优控制理论是控制工程领域中的一个重要研究方向。
离散控制系统是指在时间上只能在特定时间点进行操作的系统,相比连续控制系统,离散控制系统需要使用离散时间模型进行建模和控制设计。
最优控制理论是研究如何设计控制策略以使系统能够在某种指标下达到最优性能的一门学科。
离散控制系统的最优控制理论旨在寻找最优的控制策略,使得系统的性能指标如稳定性、响应速度、能耗等在给定约束条件下达到最优。
1. 离散控制系统的建模离散控制系统的建模是进行最优控制设计的基础。
在离散控制系统中,系统的状态在一系列离散时间点上进行更新。
离散控制系统的建模通常使用差分方程或状态空间模型。
差分方程描述了系统的状态在每个时间点的更新关系,而状态空间模型则将系统的状态和输入表示为向量,并使用矩阵形式描述系统的动态特性。
根据具体问题的需要,选择合适的建模方法可以更好地描述系统的动态行为。
2. 离散控制系统的性能指标离散控制系统的性能指标是评价系统控制性能的定量指标。
常见的性能指标包括稳定性、响应速度、能耗等。
稳定性是系统重要的性能指标之一,用于评估系统是否能够在有限时间内达到稳定状态。
响应速度是指系统对输入变化的快速响应能力。
能耗则是指系统在完成特定任务时所消耗的能源。
通过选取合适的性能指标,可以更好地评估和改进离散控制系统的性能。
3. 最优控制理论的基本原理最优控制理论的基本原理是寻找一组最优控制策略,使得系统的性能指标达到最优。
最优控制问题通常可以通过数学方法建立为一个优化问题。
其中,最常见的方法是最小化或最大化一个性能指标的数学表达式。
为了求解这些优化问题,可以使用动态规划、最优化理论等数学工具。
最优控制理论提供了一种系统优化设计的方法,可以帮助工程师设计更优秀的控制策略。
4. 最优控制策略的设计方法最优控制策略的设计方法取决于具体的离散控制系统和性能指标。
常见的设计方法包括经典控制方法和现代控制方法。
控制理论发展历史综述一:20世纪40年代末-50年代的经典控制理论时期,着重解决单输入单输出系统的控制问题,主要数学工具是微分方程、拉氏变换、传递函数;主要方法是时域法、频域法、根轨迹法;主要问题是系统的稳、准、快.二:20世纪60年代的现代控制理论时期,着重解决多输入多输出系统的控制问题,主要数学工具是以此为峰方程组、矩阵论、状态空间法主要方法是变分法、极大值原理、动态规划理论;重点是最优控制、随即控制、自适应控制;核心控制装置是电子计算机。
三:20世纪70年代之后的先进控制理时期,先进控制理论是现代控制理论的发展和延伸。
先进控制理论内容丰富、涵盖面最广,包括自适应控制、鲁棒控制、模糊控制、人工神经网络控制等。
经典控制理论经典控制理论适用于单输入、单输出的线性定常(参数不随时间而变)系统.发展过程1.原始阶段中国,两千年前我国发明的指南车:一种开环自动调节系统,它利用差速齿轮原理,利用齿轮传动系统,根据车轮的转动,由车上木人指示方向.不论车子转向何方,木人的手始终指向南方,“车虽回运而手常指南”.2.起步阶段人类社会发展,有一个点把人类社会的发展分成两大部分,那就是工业革命。
18世纪中叶之前,不管你什么怎么划分人类社会也好(农业牧业手工业),社会的发展始终离不开人力,就是必须得有人亲自去做.18世纪中叶之后,机器的出现,使得以机器取代了人力,所以称之为革命。
然后机器的出现变革了人类的整个历史,直至现代社会文明的如此进步.工业革命的开始的标志为哈格里夫斯发明的珍妮纺纱机,而工业革命的标志是瓦特改良蒸汽机,为什么扯这么多?如果机器不能控制,那和工具又有什么区别?所以工业革命的标志是瓦特改良蒸汽机.钱学森也在最新一版的工程控制论中提到技术革命。
1769年,控制思想首次应用于工业控制的是瓦特,发明用来控制蒸汽机转速的飞球离心控制器。
以后人们曾经试图改善调速器的准确性,却常常导致系统产生振荡。
1868年以前,这一百年来,自动控制装置的设计还出于“直觉"阶段,没有系统的理论指导,因此在控制系统的各项性能(稳、准、快)的协调方面经常出现问题.实践中出现的问题,促使科学家们从理论上进行探索研究。
离散控制系统中的最优控制方法离散控制系统是一种在时间和状态上都是离散的控制系统,相对于连续控制系统来说,其最优控制方法也有所不同。
本文将介绍离散控制系统中的最优控制方法,主要包括动态规划、最优化算法和强化学习。
一、动态规划动态规划是一种基于状态转移的最优化方法,在离散控制系统中有着广泛的应用。
其基本思想是将原问题分解为若干子问题,并通过求解子问题的最优解来得到原问题的最优解。
在离散控制系统中,我们可以将状态和控制变量转化为状态转移方程,然后利用动态规划递推求解,得到最优的控制策略。
二、最优化算法最优化算法是一种通过迭代优化来求解最优控制问题的方法,常见的有梯度下降法、牛顿法等。
在离散控制系统中,我们可以将控制问题转化为一个优化问题,并使用最优化算法来求解最优的控制策略。
例如,在离散时间马尔可夫决策过程中,我们可以利用值迭代或策略迭代等最优化算法来求解最优策略。
三、强化学习强化学习是一种通过试错学习来求解最优控制问题的方法,其核心思想是智能体通过与环境的交互来学习最优的行为策略。
在离散控制系统中,我们可以将控制问题抽象为一个马尔可夫决策过程,并使用强化学习算法如Q-learning、SARSA等来求解最优策略。
强化学习在离散控制系统中具有较好的应用效果,在复杂的离散控制系统中能够找到近似最优的控制策略。
综上所述,离散控制系统中的最优控制方法包括动态规划、最优化算法和强化学习。
这些方法在不同的离散控制系统中有着广泛的应用,能够求解出最优的控制策略。
在实际应用中,我们需要根据具体的控制问题选择合适的方法,并结合系统的特点和需求进行调整和优化。
离散控制系统中的最优控制方法在提高系统性能和效率方面具有重要意义,对于实际工程应用具有较大的价值。
控制工程基础第三版课后答案第一章1.1 分析控制系统的对象控制系统的对象通常指的是待控制的物理系统或过程。
在分析控制系统对象时,首先需要了解系统的动态特性。
为了分析控制系统的特性,我们可以通过选取一个合适的数学模型来描述物理系统的动态行为。
一种常用的方法是通过微分方程来描述系统的动态特性。
例如,对于一个简单的电路系统,可以使用基尔霍夫电流定律和基尔霍夫电压定律来建立描述电路中电流和电压之间关系的微分方程。
然后,通过求解这个微分方程,我们可以得到系统的传递函数。
另外,我们还可以使用频域分析的方法来分析控制系统的对象。
通过对信号的频谱进行分析,我们可以得到系统的频率响应。
1.2 常见的控制系统对象控制系统的对象存在各种各样的形式,下面列举了一些常见的控制系统对象:•机械系统:例如机器人、汽车悬挂系统等。
•电气系统:例如电路、电机等。
•热力系统:例如锅炉、冷却系统等。
•化工系统:例如反应器、蒸馏塔等。
针对不同的控制系统对象,我们需要选择合适的数学模型来描述其动态特性,并进一步分析系统的稳定性、性能等指标。
第二章2.1 控制系统的数学模型控制系统的数学模型描述了物理系统的动态特性和输入与输出之间的关系。
常见的控制系统数学模型包括:•模型中几何图形法:通过几何图形来描述系统的动态特性。
•传递函数法:采用以系统输入和输出的转移函数来描述系统的动态特性。
•状态方程法:将系统的状态变量与输入变量和输出变量之间的关系用一组偏微分方程或代数方程来描述。
在使用这些模型时,我们可以选择合适的数学工具进行分析和求解,例如微积分、线性代数等。
2.2 传递函数的定义和性质传递函数是描述控制系统输入输出关系的数学函数,通常用G(s)表示。
传递函数的定义和性质如下:•定义:传递函数G(s)是系统输出Y(s)和输入U(s)之间的比值,即G(s) = Y(s)/U(s)。
•零点和极点:传递函数可以有零点和极点,零点是使得传递函数为零的s值,极点是使得传递函数为无穷大的s值。
离散控制系统的最优控制设计在离散控制系统中,最优控制设计是一项重要的任务。
通过优化控制器的设计和参数,可以实现系统的最佳性能,提高生产效率和质量。
本文将介绍离散控制系统最优控制设计的基本概念、方法和应用。
一、离散控制系统概述离散控制系统是一种通过离散化的时间步长来采样和控制系统状态的控制系统。
它与连续控制系统相比,采样周期间隔固定,信号量为离散的数值。
离散控制系统广泛应用于工业自动化、电力系统、交通运输等领域。
二、最优控制的基本概念最优控制是在给定约束条件下,使得系统在一段时间内或长期运行中达到最佳性能的控制设计。
最优控制设计需要考虑系统的各种参数和限制条件,并利用数学和优化理论来求解最优解。
三、离散控制系统的最优控制设计方法:1. 动态规划方法动态规划方法是一种解决最优控制问题的常用方法。
它将控制问题分解为一系列离散时间步的最优控制子问题,通过递推和迭代求解最优解。
2. 状态空间方法状态空间方法将系统的状态和控制输入转化为状态向量和控制向量的形式,建立离散时间下的状态空间模型。
通过优化状态空间模型的参数,可以得到最优控制器的设计。
3. 优化理论方法优化理论方法是一种利用数学优化理论和方法求解最优控制问题的方法。
通过构建系统的优化目标函数和约束条件,可以利用数学优化方法求解最优解。
四、离散控制系统最优控制设计的应用1. 工业自动化控制离散控制系统最优控制设计在工业自动化控制中有着广泛的应用。
通过优化控制器参数和设计,可以实现工业生产过程的高效运行,提高生产效率和质量。
2. 电力系统控制离散控制系统最优控制设计在电力系统中也有着重要的应用价值。
通过优化电力系统的控制策略和参数,可以实现电力系统的稳定运行和能源的高效利用。
3. 交通运输控制离散控制系统最优控制设计在交通运输控制中也有着广泛的应用。
通过优化交通信号灯的控制策略和参数,可以实现道路交通的高效运行,缓解交通拥堵问题。
五、结论离散控制系统的最优控制设计是提高系统性能和效率的重要手段。
离散控制系统中的最优控制离散控制系统是指由一系列离散(非连续)的控制器构成的系统,它对系统进行离散化处理和采样,并根据采样值进行控制。
在离散控制系统中,最优控制是一种优化问题,旨在找到使给定性能指标最小化或最大化的控制策略。
本文将介绍离散控制系统中的最优控制方法和应用。
一、动态规划方法动态规划是离散控制系统最优控制的常用方法之一。
它通过将控制问题划分为一系列互相关联的子问题,逐步求解并获得最优解。
动态规划方法有以下几个步骤:1. 状态定义:将系统的状态用离散变量表示,例如状态矢量。
2. 动态规划递推方程:建立系统状态在不同时间步长之间的递推关系,用于计算最优解。
3. 边界条件:确定初始和终止条件,保证递推方程的有效求解。
4. 最优化准则:选择适当的性能指标,例如代价函数或效用函数,作为最优化准则。
5. 迭代求解:根据动态规划递推方程和最优化准则进行迭代求解,得到最优控制策略。
动态规划方法在离散控制系统中有广泛的应用。
例如,在机器人路径规划和自动化生产线调度等领域,动态规划方法可以帮助确定最优路径和最优调度策略,实现系统的高效控制。
二、最优控制理论最优控制理论是离散控制系统中另一种常用的最优控制方法。
它通过优化控制问题的最优化准则,找到使性能指标达到最小值或最大值的控制策略。
最优控制理论的核心是求解最优控制问题的最优化方程。
最优控制问题的最优化方程通常通过极值原理或哈密顿-雅可比-贝尔曼(HJB)方程来建立。
这些方程使用众多数学工具,如变分法和微分几何学,将控制问题转化为求解偏微分方程或变分问题。
通过求解最优化方程,可以得到最优控制器的具体形式和参数。
最优控制理论在离散控制系统中具有重要的应用价值。
例如,在飞行器姿态控制和无线传感网络中,最优控制理论可以帮助设计出具有最佳性能的控制器,提高系统的稳定性和响应速度。
三、模型预测控制(MPC)模型预测控制是离散控制系统中一种基于模型的最优控制方法。
它将系统建模为一个预测模型,并根据预测模型的结果来制定最优控制策略。
离散时间平均场二次最优控制问题冀鹏飞【摘要】讨论了带有约束终端的离散时间系统的平均场随机线性二次型最优控制问题.利用拉格朗日乘子定理,在线性二次最优控制问题成立的条件下,给出了状态反馈解的一个必要条件.从某种意义上说,本文可以看作是平均场离散时间随机线性二次最优控制问题的推广.【期刊名称】《德州学院学报》【年(卷),期】2018(034)002【总页数】7页(P8-14)【关键词】随机二次最优控制;离散时间系统;平均场理论;拉格朗日乘子定理【作者】冀鹏飞【作者单位】山东科技大学数学与系统科学学院,山东青岛 266000【正文语种】中文【中图分类】O2321 引言1958年,贝尔曼开始研究二次型最优控制.1960年卡曼建立了基于状态反馈的线性二次型最优控制理论,并在最优控制理论中引入了黎卡提微分方程.这样就可以用统一的解析式来表示线性二次型最优控制的解,且得到一个简单的线性状态反馈控制律,从而构成闭环最优控制.同时线性二次型最优控制问题还可以兼顾系统的性能指标等多方面的因素,如它可以把得到的最优反馈控制与非线性系统开环最优控制结合起来,可以减少开环系统的误差,得到更精确的结果.从20世纪50年代末开始,控制理论进入了一个新的发展时期,它所研究的对象扩展为多输入多输出的,非线性的,时变的离散时间系统,它涉及到了线性控制,自适应控制,最优控制,鲁棒控制,非线性控制,控制系统CAD等理论和方法.今天,随着被控模型的复杂性,不确定性和规模的增大,传统的基于精确的数学模型的控制理论的局限性日益明显. 众所周知,系统很容易受到各种限制因素的影响,例如温度、压力等.因此受约束的随机线性二次最优控制问题的研究是一个非常重要的课题.文献[1]针对模型自由的随机线性离散时间系统,通过Q学习算法,求解无限时间随机线性二次最优控制问题.文献[2]研究了离散时间随机二次最优控制问题.文献[3]考虑了具有确定性系数的平均场随机微分方程的线性二次最优控制问题.在文献[4]中,研究了在无限时间范围内存在的平均场二次最优控制问题.文献[5]提出了有限时域随机最优控制模型的数值方法,推导出了随机最小值原理,并在此基础上提出了一种基于最小值原理直接求解的数值方法.文献[6]研究一类基于社交影响力和平均场理论的信息传播动力学模型,在针对影响力度量中主要研究静态拓扑结构,利用平均场理论来忽略个体行为特征,提出了一种基于动态节点行为和用户影响力的信息传播动力学模型.本文利用凸分析的拉格朗日乘子定理研究带终端的随机线性二次最优控制问题,并且将平均场理论应用到最优控制问题中,可以最大限度的减小噪声对系统的影响,并能方便的处理噪声方面的问题.同时验证了平均区域随机二次最优控制问题存在线性反馈最优解的必要条件,其结果可以看作是平均场离散时间随机二次最优控制问题的推广.为了方便,给出以下定义:M'是矩阵M的转置;Tr(M)是矩阵M的迹;当M>0(M≥0)时,M为正定矩阵;Ex代表随机变量x的数学期望,Rm×n为n×m矩阵;N={0,1,2,…,T};并且令2 问题陈述考虑以下形式的平均区域离散时间系统(1)bi1x1T+bi2x2T+…+binxnT=ξi, i=1, 2,…, r(2)其中是给定的矩阵值函数;xt和ut分别是状态过程和控制过程;E[ωt]=0和E[ωtωt]=δst是一个二阶过程,δst是Kronecker函数;ωt, t∈N是定义在概率空间(Ω, F, P)上的一维的标准Brown运动,Ft=σ(ωs:s∈N+)为Brown运动生成的信息流.u(.)属于允许控制集(3)ξi为给定的FT可测的平方可积随机变量,即E|ξi|<+,bij为已知实数,i=1,2,…,r;j=1,2,…,n. 令Nr×n=(bij)r×n,ξ=(ξ1,ξ2,…,ξr)′,则约束(2)可写为NT=ξ,在这里假设N为行满秩.表述本文主要定理之前,首先给出本文要用到的拉格朗日乘子定理和一些重要的引理.定义1[7] 设X为向量空间,Y为赋范线性空间,T为X到Y的变换,对x,h∈X,如果极限(4)存在,称此极限为T在x处方向h的方向导数或Gateaux导数.若对任意的h∈X,上述极限都存在,则称T在x处为 Gateaux 可导.定义2[7] 设X,Y为赋范线性空间,T为定义于X到Y的变换.对于给定的x∈D,h∈X,T在x处为Gateaux 可导,Gateaux导数δTx; h∈Y关于h为有界线性变换,且满足则称T在x处为 Frechet 可导,δTx, h为T在x处h的 Frechet 导数.定义3[7] 设Tx为定义于Banach空间X到Banach空间Y的变换,且有连续的Frechet导数.若对x0∈D,δTx; h为从X到Y的满射,则称x0为变换T的正则点. 引理1 [7] 设fx是定义于 Banach 空间X上具有连续的Frechet导数的实值函数,Hx为X到Banach空间Z的映射,x0为变换Hx的正则点.若fx在约束Hx=0下在x0处达到极值,则存在Z上有界线性泛函使Lagrang泛函在x0处有驻点,即†Hx0; h=0,对所有h∈X都成立.在本节的最后再给出一个关于广义逆矩阵的引理.引理2[8] 给定M∈Rm×n,则存在唯一的M†∈Rn×m,满足矩阵M†称为M的 Moor-Penrose 广义逆.3 主要结论对于离散时间控制系统(1),给出关于可容许控制集Uad的目标函数(5)其中是对称矩阵.定义4 如果存在u0∈Uad 满足Jx0, u0=infJx0, u,>-, u∈Uad(6)则称u0为最优控制,系统(1)为适定的.为最优轨迹,Jx0,u0为最优目标函数.如果线性反馈控制对问题(1)和(6)是最优的,那么它在下列形式的反馈中也是最优的(7)其中Lt, t∈NT-1是矩阵值函数,为最优状态反馈控制.把(7)代入(1),则二次最优控制问题变为以下形式(8)称Lt, t∈N为新的控制集.令通过(8)式可以得到(9)X0=Ex0x0′(10)把(9)和(10)代入(5),经过简单的变形得到目标泛函如下其中约束终端(2)变为(11)最优控制问题归结为以下形式目标泛函Jx0, u可视为定义在空间Cm×n[0,T]×Cm×n[0,T]上,其中Cm×n[0,T]为所有元素是[0,T]上连续函数的n阶方阵构成的空间;(9)式和(10)式定义了从Cm×n×Cm×n到Cn×n的变换(12)而(11)式定义了从Cn×n[0,T] 到Rr×r的变换G(XT)=NXTN′从而约束(9)式,(10)式,(11)式可表示成为(13)下面来证明和有连续的Frechet 导数.定理都有连续的 Frechet 导数,且导数为δHX( ΔXt+1)=-ΔXt+1(14)(15)的 Fretchet 导数为其中是矩阵值连续函数.证明在这里只证明(14)式,其他证明过程跟(14)式相似. 令Xαt=Xt+αΔXt,通过定义1,能够得出(16)其中(17)令α→0,可以得出(14).定理2 如果存在(18)是最优控制,那么存在对称矩阵和λ∈Rr×r满足(19)(20)证明设是(5)式的最优解,通过定理2,可以得到对称矩阵和满足以下等式δJXΔXt+δHXΔXt+1+δHXΔXt+δGΔXT=0(21)δJLΔLt+δHLΔHt=0(22)由于那么(21)式和(22)式变为NΔXTN'-TrPTΔXT=0由于ΔXt和ΔXT相互独立,则(19)式证出.通过类似的方法,(20)式也可以被证出.结论1 如果(8)式,(11)式,(18)-(20)式存在解是最优控制,则最优目标函数满足其中把(16)式代入(5)式,经简单变形,就可得到上述结论.推论1 对于平均场二次最优控制问题,如果满足则满足≥0,t∈T.此证明过程与参考文献[9]的证明过程相似,不再加以赘述.4 数值例子考虑一个周期为3的数值例子满足其系数值为借助于Riccati方程(12)和(18),可以得到Riccati解为应用结论1,可以得到最优控制其中5 总结主要研究了平均场线性二次最优控制问题.借助于拉格朗日乘子定理,给出了该问题存在最优解的必要条件,并计算出了状态反馈最优解.将平均场理论应用到最优控制问题中,可以最大限度的减小噪声对系统的影响并能方便的处理噪声问题.最后通过一个数值例子验证了结论的正确性.参考文献:[1] 么彩莲,王涛.模型自由的离散时间系统的随机线性二次最优控制问题[J].辽宁石油化工大学学报,2016,36(6):64-68.[2] X.K.Liu.Y.Li,W.H.Zhang.stochastic linear quadratic optimal control with constraint for discrete-time systems[J].Applied Mathematics and Computation,2014,228(9): 264-270.[3] J.M.Yong.A linear-quadratic optimal control problem for mean-field stochastic differential equations[J].SIAM J.Control andOptim,2013,51(4):2809-2838.[4] Y.N.Ni,R.Elliott,X.Li.Discrete-time mean-field stochastic linear-quadratic optimal control problems,: Infinite horizoncase[J].Automatica,2013,57(11):65-77.[5] P.Parpas,M.Webester.A stochastic minimum principle and an adaptive pathwise algorithm for stochastic optimalcontrol[J].Automatica,2013,49(6):1663-1671.[6] 肖云鹏,李松阳,刘宴兵.一种基于社交影响力和平均场理论的信息传播动力学模型[J].物理学报,2017,66(3):1-13.[7] D.G.Luenberger,Optimization by vectors Space Methods[M].Wiley,New York,1968.[8] M.A.Rami.J.B.Moore.X.Y.Zhou.Indefinite stochastic linear quadratic control and generalized differential Riccati equation[J].SIAM J.Control &Optimization,2001,40:1296-1311.[9] R.J.Elliott,X.Li,Y.H.Ni.Discrete-time mean-field stochastic linear-quadratic optimal control problems[J].Automatica,2013,49:3222-3223.。
第五章离散时间系统最优控制
•前面所讨论的都是关于连续时间系统的最优控制问题。
•现实世界中,很多实际系统本质上是时间离散的。
•即使是系统是时间连续的,因为计算机是基于时间和数值上都离散的数字技术的,实行计算机控制时必须将时间离散化后作为离散系统处理。
引言
•因此,有必要讨论离散时间系统的最优控制问题。
•离散时间系统仍然属于连续变量动态系统(CVDS)范畴。
注意与离散事件动态系统(DEDS)的区别。
•
CVDS 与DEDS 是自动化领域的两大研究范畴,考虑不同的自动化问题。
5.1 离散时间系统最优控制问题的提法
(1) 离散系统最优控制举例——多级萃取过程最优控制
•萃取是指可被溶解的物质在两种互不相溶的溶剂之间的转移,一般用于将要提取的物质从不易分离的溶剂中转移到容易分离的溶剂中。
•多级萃取是化工生产中提取某种价值高、含量低的物质的常用生产工艺。
萃取器萃取器萃取器萃取器V u (0)u (1)u (k -1)u (N -1)
V
V V V V V
含物质A 的混合物以流量V 进入萃取器1,混合物中A 浓度x (0);
萃取剂以流量u (0)通过萃取器1,单位体积萃取剂带走A 的量为z (0);
一般萃取过程的萃取物含量均较低,可认为通过萃取器1后混合物流量仍为V ;
流出萃取器1的混合物中A 物质的浓度为x (1)。
以此类推至萃取器N 。
1
2
k
N
x (0)
z (0)z (1)
z (k-1)
z (N -1)
x (1)
x (2)
x (k -1)
x (k )
x (N )
x (N -1)
多级萃取过程
(2) 离散系统最优控制问题的提法
给定离散系统状态方程(5-1-6)和初始状态
(5-1-7)
其中分别为状态向量和控制向量,f 为连续可微的n 维
函数向量。
考虑性能指标
1
,,1,0],),(),([)1( N k k k u k x f k x 0
)0(x x m
n R k u R k x )(,)( 1
N 其中Φ、L 连续可微。
•离散系统的最优控制问题就是确定最优控制序列u *(0),u *(1),…,u *(N -1),使性能指标J 达到极小(或极大)值。
•
将最优控制序列u *(0),u *(1),…,u *(N -1)依次代入状态方程,并利用初始条件,可以解出最优状态序列x *(1),x *(2),…,x *(N ),也称为最优轨线。
(5-1-8)
]
),(),([]),([k k k u k x L N N x J
5.3离散极大值原理
•
与连续系统相似,离散变分法解最优控制问题多有不便,需考虑离散极大值原理。
考虑离散系统状态方程
(5-3-1)初始状态
(5-3-2)1
· · ·,1,0],),(),([)1( N k k k u k x f k x ,0)0(x x 终态应满足的约束条件
(5-3-3)其中:x (k )∈R n ,u (k )∈R m 。
u (k )不受约束,f 为n 维连续可微向量
函数,Ψ是x (N )的连续可微r 维向量函数,Φ是x (N )的连续可微标量函数,L 为x (k )、u (k )的连续可微标量函数,要求最优控制序列u *(k ), k =0,…, N -1,使J 最小。
]),([ N N x 和性能指标(5-3-4)
1
]),(),([]),([N k k k u k x L N N x J
上述问题中,当控制序列受到约束时,即
时,其中是m 维实函数空间的闭子集,
即,则与连续系统相同,有相应的极大值原理形式,即上述定理中(3)不同,为
(3’)离散H 函数对最优控制序列达到最小值,即:
(5-3-16)
离散最优控制的极大值原理)1,,1)(( N k k u 1,,0,)( N k k u m
R ]),(),(),([min ]),(),(),([*
*
)(*
*
*
k k u k k x H k k u k k x H k u 11
•充分条件为:
(i) 离散最优控制问题的状态集为凸集,(ii) 性能指标泛函为凸函数
•如果上述条件不能满足,则不能确定极大值原理是否是离散最优控制的充分AND/OR 必要条件。
5.4连续与离散极大值原理的比较
•本章讨论的离散系统极大值原理和在第三章讨论的连续系统极大值原理,基本原理是相同的,因此我们希望在解决同一个最优控制问题时应该得到同样的结果。
•然而,从连续系统极大值原理出发,以不同的变换途径所得的离散系统极大值原理在形式上有所不同,解决同一问题所得到的解
也会有所不同。
•通过比较两种不同的离散系统极大值原理获取途径,分析同一问题所得到的离散最优控制解不同的原因,可以帮助尽量避免这种现象产生。