神经网络模型预测控制器
- 格式:doc
- 大小:826.50 KB
- 文档页数:15
控制系统中的神经网络控制方法控制系统是指通过对被控对象进行监测和调节,以达到预定要求的系统。
而神经网络控制方法是指利用神经网络模型和算法对控制系统进行优化和改进的方法。
本文将介绍神经网络控制方法在控制系统中的应用以及其原理和优势。
一、神经网络控制方法的原理神经网络控制方法主要基于人工神经网络模型,它模拟了生物神经系统的结构和功能。
该模型由多个神经元组成,这些神经元相互连接并通过权重参数传递和处理信息。
其原理主要包括以下几个方面:1. 网络拓扑结构:神经网络控制方法中使用的神经网络有多种拓扑结构,如前馈神经网络、循环神经网络和自适应神经网络等。
这些网络结构可以灵活地应用于不同的控制问题。
2. 学习算法:神经网络通过学习算法来调整网络中神经元之间的连接权重,以逐步优化网络的性能。
常见的学习算法包括反向传播算法、遗传算法和模糊神经网络算法等。
3. 控制策略:神经网络控制方法可以基于不同的控制策略,如比例积分微分(PID)控制、模糊控制和自适应控制等。
通过在神经网络中引入相应的控制策略,可以实现对被控对象的精确控制和调节。
二、神经网络控制方法在控制系统中的应用1. 机器人控制:神经网络控制方法在机器人控制中有广泛应用。
通过将神经网络嵌入到机器人的控制系统中,可以实现对机器人运动、感知和决策等方面的智能控制。
这种方法能够提高机器人的自主性和适应性,使其能够更好地适应不同环境和任务的需求。
2. 工业过程控制:神经网络控制方法在工业过程控制中也得到了广泛应用。
通过利用神经网络对工业过程进行建模和优化,可以提高生产效率、降低能耗和减少故障率。
此外,神经网络控制方法还可以应用于故障诊断和预测维护等方面,提高工业系统的可靠性和稳定性。
3. 航天飞行器控制:神经网络控制方法在航天飞行器控制方面也有重要应用。
通过神经网络对航天飞行器的姿态、轨迹和轨道控制进行优化,可以提高飞行器的稳定性和导航精度,降低燃料消耗和飞行风险。
基于神经网络的闭环控制学习算法一、神经网络在闭环控制中的应用概述神经网络作为一种强大的机器学习模型,其在闭环控制系统中的应用日益广泛。
闭环控制系统,又称为反馈控制系统,是指系统输出与期望输出之间存在反馈回路的控制系统。
在这种系统中,控制算法根据系统输出与期望输出之间的误差来调整控制输入,以达到控制目标。
神经网络因其出色的非线性映射能力和自适应学习能力,在处理复杂系统和不确定性环境中显示出了巨大的潜力。
1.1 神经网络的基本原理神经网络是由大量简单的计算单元(称为神经元)组成的网络,这些神经元通过加权连接相互连接。
每个神经元接收输入信号,进行加权求和,并通过激活函数处理后输出。
通过调整神经元之间的连接权重,神经网络可以学习到输入与输出之间的复杂映射关系。
1.2 神经网络在闭环控制中的作用在闭环控制系统中,神经网络可以用于建模、预测、控制和优化等多个方面。
它可以学习系统的动态行为,预测系统的未来状态,或者直接作为控制器来调整控制输入。
此外,神经网络还可以用于处理系统的不确定性和非线性,提高系统的鲁棒性和适应性。
二、基于神经网络的闭环控制学习算法基于神经网络的闭环控制学习算法是一类利用神经网络来实现闭环控制的算法。
这些算法通过训练神经网络来学习控制策略,以实现对系统的精确控制。
以下是几种典型的基于神经网络的闭环控制学习算法:2.1 反向传播算法(Backpropagation)反向传播算法是神经网络中最常用的学习算法之一。
它通过计算网络输出与期望输出之间的误差,并将误差反向传播至网络的输入层,以此调整网络权重。
在闭环控制系统中,反向传播算法可以用来训练神经网络控制器,使其能够根据系统误差来调整控制输入。
2.2 强化学习算法(Reinforcement Learning)强化学习是一种无模型的学习算法,它通过与环境的交互来学习最优策略。
在闭环控制系统中,强化学习算法可以使神经网络控制器通过试错来学习如何控制系统,以达到最优性能。
机器人控制器的高级算法主要包括以下几个方面:1. 模型预测控制(Model Predictive Control, MPC):MPC是一种基于模型的控制算法,它通过预测未来一段时间内系统的状态和输出,优化未来的控制输入以达到最佳的控制性能。
在机器人控制中,MPC 可以处理多变量、非线性和约束条件等问题,适用于复杂的运动规划和轨迹跟踪任务。
2. 自适应控制(Adaptive Control):自适应控制算法能够根据系统参数的变化或者未知环境的影响自动调整控制参数,以保持良好的控制性能。
在机器人控制中,自适应控制可用于处理模型不确定性、外界干扰和机械磨损等问题。
3. 滑模控制(Sliding Mode Control, SMC):SMC是一种鲁棒控制算法,它通过设计特殊的控制律使得系统状态快速进入并保持在一个所谓的“滑动面”上,从而消除系统中的不确定性影响和外部扰动。
在机器人控制中,SMC常用于保证系统的稳定性和精确跟踪。
4. 神经网络控制(Neural Network Control):神经网络控制利用人工神经网络的非线性映射能力和学习能力来实现对复杂系统的控制。
在机器人控制中,神经网络可以用于建模未知的动态系统、处理高维和非线性问题,以及实现智能决策和自主学习。
5. 模糊控制(Fuzzy Control):模糊控制是一种基于模糊逻辑的控制方法,它可以处理不精确、不确定和非线性的控制问题。
在机器人控制中,模糊控制常用于处理语言描述的控制规则和复杂的环境交互。
6. 遗传算法和粒子群优化(Genetic Algorithm and Particle Swarm Optimization, GA & PSO):这些是两种常用的优化算法,可以用于寻找最优的控制参数或控制策略。
在机器人控制中,GA和PSO可以用于优化路径规划、姿态控制和动作学习等问题。
7. 深度强化学习(Deep Reinforcement Learning, DRL):DRL结合了深度学习和强化学习的优点,能够在复杂的环境中学习最优的控制策略。
神经网络在工业控制中的应用随着人工智能技术的不断发展,神经网络已经成为工业控制领域中重要的技术之一。
神经网络模型具有很强的适应性、自学习能力和非线性映射能力,可以应用于控制、诊断和优化等各个方面。
本文将介绍神经网络在工业控制中的应用,并探讨其发展前景。
一、神经网络在控制领域的应用1.1. 过程控制神经网络在过程控制方面的应用是最为广泛的。
例如,在石化、冶金、电力、水泥等行业中,可以利用神经网络对生产过程进行优化。
神经网络模型可以根据工业控制过程中的输入和输出信息,训练出一个适应性比较好的控制器,从而实现对生产过程的控制。
1.2. 机器人控制神经网络模型可以用于机器人控制领域。
例如,可以将神经网络与机器人掌握物体的动作相结合,通过训练网络来识别并掌握不同的物体,实现机器人对物体的掌握与放置。
1.3. 智能制造在智能制造领域中,神经网络可用于质量检测、故障诊断、生产预测等方面。
通过复杂的训练和数据分析,可以建立一个准确、高效的神经网络模型来优化制造流程和提高产品质量。
二、神经网络在工业控制中的优势2.1. 神经网络具有良好的非线性适应能力传统的控制方法主要基于线性模型来描述生产过程和控制系统。
然而,在现实生产过程中,经常会遇到非线性的控制问题。
由于神经网络模型具有很强的非线性特性,可以更有效地适应这些复杂的控制问题。
2.2. 神经网络具有高效的自适应学习能力传统的控制方法需要人工编程来调整系统参数,这需要大量的时间和经验。
而神经网络模型具有自适应学习能力,可以通过学习来适应新的控制环境,避免了传统控制方法的不足之处。
2.3. 神经网络具有高诊断能力神经网络模型可以对生产过程进行监测,同时可以定位和判断工业控制过程中的故障和异常。
相比传统的诊断方法,神经网络具有更高的准确率和故障检测能力。
三、神经网络在工业控制中的发展趋势3.1. 神经网络与云计算、大数据的结合随着云计算和大数据技术的不断发展,神经网络将更加普及和广泛应用。
径向基函数神经网络模型及其在预测系统中的应用概述:径向基函数神经网络(Radial Basis Function Neural Network, RBFNN)是一种基于神经网络的非线性模型,具有广泛的应用领域。
在预测系统中,RBFNN能够准确预测未知输入与输出之间的关系,从而为预测问题的解决提供了有效的方法。
一、径向基函数神经网络模型的基本原理1.1 RBFNN的结构径向基函数神经网络由输入层、隐含层和输出层构成。
输入层接受原始数据,隐含层通过径向基函数对输入数据进行转换,输出层将转换后的数据映射到期望的输出。
1.2 径向基函数的选择径向基函数的选择对RBFNN的性能有重要影响。
常用的径向基函数有高斯函数、多项式函数和细分函数等。
根据问题的需求和特点选择合适的径向基函数,以提高模型的预测能力。
1.3 模型的训练与优化通过使用已知输入与输出的训练数据,结合误差反向传播算法,可以对RBFNN的参数进行学习和优化。
训练的目标是使得模型的输出与实际输出之间的误差最小化,从而提高预测的准确性。
二、径向基函数神经网络模型在预测系统中的应用2.1 股票市场预测股票市场价格的预测一直是金融领域的研究热点。
RBFNN通过学习历史价格与因素的关系,能够预测未来的股票价格走势。
通过准确的预测,投资者可以做出更明智的决策,提高投资回报率。
2.2 污染物浓度预测环境污染是当今社会面临的严重问题之一。
RBFNN可以利用区域内的环境数据,如气象数据、监测数据等,预测出某个时刻某地区的污染物浓度。
这有助于预警系统的建立,提前采取措施避免污染的扩散。
2.3 交通流量预测交通流量的预测在城市交通管理中具有重要意义。
通过收集历史交通流量和相关影响因素的数据,RBFNN能够准确预测未来某个时间段某条道路的交通流量。
这有助于交通规划和拥堵疏导的决策。
2.4 预测市场需求在制造业和零售业等领域,准确预测市场的需求对企业决策具有重要影响。
RBFNN可以通过学习历史销售数据和市场因素的关系,预测未来某段时间内产品的需求量。
模型预测控制技术路线模型预测控制(Model Predictive Control,MPC)是一种先进的控制策略,它结合了动态模型、优化方法和实时测量反馈,用于实现对动态系统的高性能控制。
MPC技术路线涉及以下几个方面:1. 动态系统建模,首先需要对待控制的动态系统进行准确的建模。
这可能涉及从物理原理出发建立微分方程模型,或者通过数据驱动的方法构建黑盒模型,如神经网络或系统辨识技术。
2. 优化问题建立,MPC使用优化方法来求解控制问题,因此需要将控制目标、系统约束和性能指标转化为数学优化问题。
这通常涉及到定义系统的状态变量、控制输入、约束条件和性能指标,并将其转化为适合优化求解的形式。
3. 预测模型设计,MPC需要使用系统模型进行预测,以便在优化问题中考虑未来时刻的系统响应。
这可能涉及将系统模型离散化,选择合适的预测时域和优化时域,并考虑系统不确定性的影响。
4. 优化求解,MPC通常使用迭代优化方法来求解控制问题,因此需要选择合适的优化算法和求解器。
常用的算法包括线性二次规划(LQP)和非线性优化方法,如序列二次规划(SQP)或者内点法等。
5. 实时实现,MPC需要在实时系统中实现,这涉及到将优化问题在线实时求解,并将优化结果转化为实际的控制指令。
这通常需要考虑计算效率、数值稳定性和实时性等方面的问题。
总的来说,MPC技术路线涉及动态系统建模、优化问题建立、预测模型设计、优化求解和实时实现等多个方面,需要综合考虑控制理论、数学优化、计算机实现等多个领域的知识和技术。
在实际应用中,还需要根据具体的控制目标和系统特性进行具体的技术路线设计和实现。
MPC替代方案随着技术的不断发展,传统的MPC(模型预测控制)方案在某些情况下可能存在一些弊端。
因此,为了解决这些问题,研究人员提出了一些MPC的替代方案,以满足不同场景下的需求。
本文将介绍几种常见的MPC替代方案,并讨论它们的优点和适用范围。
一、神经网络控制神经网络控制是一种基于人工神经网络的控制方法,可以用于替代传统的MPC方案。
它通过学习和优化神经网络的权重和偏差,以实现对系统的控制。
相比于MPC,神经网络控制具有以下优点:1. 神经网络控制不需要精确的系统模型,能够通过学习和训练适应系统的非线性特性。
2. 神经网络控制具有较强的鲁棒性,能够有效应对系统参数变化和外部干扰。
3. 神经网络控制具有较快的响应速度和较高的控制性能。
然而,神经网络控制也存在一些局限性。
首先,神经网络的建模和训练过程可能需要大量的数据和计算资源。
其次,由于神经网络的黑盒性质,我们很难对其内部的运行机制进行解释和验证。
二、模糊控制模糊控制是另一种常见的MPC替代方案,它通过建立模糊规则库和模糊推理机制来实现对系统的控制。
相比于传统的MPC,模糊控制具有以下优势:1. 模糊控制能够处理系统模型的不确定性和模糊性,适用于包含模糊规则的复杂系统。
2. 模糊控制具有较好的鲁棒性,能够在噪声和干扰的情况下保持良好的性能。
3. 模糊控制能够将人类专家的经验知识融入到控制系统中,提高控制效果。
然而,模糊控制也存在一些缺点。
首先,模糊规则的设计和优化可能需要较多的工作,对系统方面的专业知识要求较高。
其次,模糊控制的性能可能受到模糊规则库的规模和模糊推理机制的设计参数的影响。
三、基于强化学习的控制基于强化学习的控制是近年来备受关注的一种MPC替代方案。
它基于智能体与环境的交互,在连续决策问题中寻找最优策略。
相比于传统的MPC,基于强化学习的控制具有以下特点:1. 基于强化学习的控制能够在缺乏系统模型的情况下进行学习和决策,适用于实际环境中的复杂问题。
先进控制技术及应用先进控制技术指的是一些高级别、智能化的控制系统技术,旨在提高系统控制性能、优化效率,并节省能源消耗。
这种技术应用在不同的工业制造领域,如机械制造、自动化、化工和环保等领域。
本文将讨论一些先进控制技术及其应用。
先进控制技术包括各种算法和软件工具,如模型预测控制(MPC)、自适应控制、最优控制、模糊控制、神经网络控制及专家系统。
这些技术可用于优化各种工业过程的控制,例如温度、压力、流量、水平、质量和pH 值等过程变量的控制。
MPC 是先进控制技术中最常使用的一种。
MPC 是一种模型驱动的优化控制器,它通过建立数学模型来预测系统的未来行为,并制定优化策略以实现最优控制。
概念上,MPC 通过将预测误差最小化来实现。
在M PC 中,控制器使用当前的测量值和过去少数个测量值作为输入,并预测未来的系统行为。
此外,MPC 还可以为系统设计预演算法和灵活的计算机算法,以克服某些文内外的障碍。
自适应控制是一种可以自动调整参数以提高系统控制性能的控制技术。
自适应控制器能够根据系统的性能变化来调节自身的参数。
这种技术可用于快速变化的工艺过程,例如化学过程或加热和冷却过程。
最优控制是一种将系统性能与优化目标相结合的控制技术。
此技术使用数学模型来确定最佳控制策略,以实现系统的最佳性能。
最优控制技术可用于带有多个变量的复杂过程,例如多输入多输出的系统或非线性系统,也能在有效解决系统的限制条件时实现动态控制。
模糊控制技术可以帮助控制系统应对不确定性和复杂性。
该技术能够自动化地调整目标系统的控制输入变量,以实现理想的稳态控制。
目前,模糊控制技术广泛应用于不确定因素非常大的环境中,例如飞行器、船舶、机器人、湿地和温度控制等方面。
神经网络控制是一种使用神经网络模型来实现系统控制的技术。
这种技术不需要完整的数学模型来进行计算,而是通过神经网络模型来推断出某种运动和行为,然后控制其执行。
由于神经网络模型可以学习系统行为和参考数据的变化,因此这种技术适用于控制器需要其自我适应的情况。
基于BP神经网络的PID控制系统设计摘要本文主要研究一个基于神经网络的自适应PID控制系统的设计方法,利用BP神经网络对被控对象进行在线辨识和控制。
基于BP神经网络学习算法设计出两个神经网络模型:一个利用神经网络(NNM)对非线性映射的逼近能力,对被控对象进行辨识,另一个构成具有PID结构的控制器(NNC)。
通过神经网络NNM的在线学习和修正,产生对被控对象输出的预测作用,然后由网络NNC实施控制作用,从而实现对辨识对象的PID控制。
在利用神经网络对系统进行辨识时,选用白噪声信号作为系统的输入信号,以提高系统的辨识精度;另外,为了得到神经网络控制器的初始化权值,本文在自整定过程中采用常规PID控制器整定方法之一的稳定边界法。
在设计过程中运用MATLAB语言工具箱进行编程,并通过SIMULINK动态仿真工具对一阶非线性对象进行了仿真。
仿真结果表明了利用神经网络对系统进行辨识的有效性,并用经辨识所得到的输出值取代系统的实际输出值,利用神经网络NNC对系统进行控制,获得了满意的控制效果。
关键词:神经网络,BP学习算法,自适应,参数优化,辨识1 综述PID调节器从问世至今已历经了半个多世纪,在这几十年中,人们为它的发展和推广做出了巨大的努力,使之成为工业过程控制中主要的和可靠的技术工具。
近几十年来,现代控制理论迅速发展,出现了许多先进的控制算法,但到目前为止,即使在微处理技术迅速发展的今天,过程控制中大部分控制规律都未能离开PID,这充分说明PID控制仍具有很强的生命力。
过程工业控制中实际应用最多的仍是常规的PID控制算法,这是因为PID控制具有结构简单、容易实现、控制效果好和鲁棒性强等特点,且PID算法原理简明,参数物理意义明确,理论分析体系完整,为广大控制工程师所熟悉。
但在生产现场往往由于参数整定不好而使PID控制器控制效果欠佳,整定的好坏不但会影响到控制质量,而且还会影响到控制器的性能。
PID控制中一个至关重要的问题,就是控制器三参数(比例系数、积分时间、微分时间)的整定。
基于神经网络的飞行器控制算法在现代航空航天领域,飞行器的控制算法一直是研究的重点和难点。
随着科技的不断进步,基于神经网络的飞行器控制算法逐渐崭露头角,为飞行器的精确控制和高效运行提供了全新的思路和方法。
神经网络,简单来说,就像是一个具有学习能力的智能系统,它能够通过对大量数据的学习和分析,自动提取特征和规律,并根据这些规律做出预测和决策。
将神经网络应用于飞行器控制,就是希望借助其强大的学习和适应能力,来应对飞行器在飞行过程中面临的各种复杂和多变的情况。
传统的飞行器控制算法通常基于数学模型和经典控制理论。
这些方法在一定程度上能够实现对飞行器的控制,但它们往往存在一些局限性。
例如,数学模型可能无法完全准确地描述飞行器的动态特性,尤其是在一些极端条件下;而且,传统算法对于系统中的不确定性和外部干扰的适应能力相对较弱。
相比之下,基于神经网络的飞行器控制算法具有显著的优势。
首先,神经网络能够直接从飞行数据中学习飞行器的动态特性,无需依赖精确的数学模型。
这意味着它可以更好地处理那些难以用数学模型准确描述的复杂情况。
其次,神经网络具有强大的自适应能力,能够实时调整控制策略,以应对飞行器在飞行过程中出现的各种变化,比如大气条件的改变、飞行器结构的损伤等。
此外,神经网络还可以实现多变量的协同控制,从而提高飞行器的整体性能。
在基于神经网络的飞行器控制算法中,数据的获取和预处理是至关重要的一步。
我们需要收集大量的飞行器飞行数据,包括各种飞行状态下的传感器数据、控制输入数据等。
这些数据需要进行清洗、筛选和预处理,以去除噪声和异常值,并将数据转换为适合神经网络学习的格式。
接下来是神经网络的设计和训练。
神经网络的结构选择会直接影响算法的性能。
常见的神经网络结构包括多层感知机、卷积神经网络、循环神经网络等。
在飞行器控制中,循环神经网络常常被用于处理具有时间序列特征的数据。
训练神经网络则需要选择合适的优化算法和损失函数,以确保网络能够学习到有效的控制策略。
神经网络模型预测控制器 摘要:本文将神经网络控制器应用于受限非线性系统的优化模型预测控制中,控制规则用一个神经网络函数逼近器来表示,该网络是通过最小化一个与控制相关的代价函数来训练的。本文提出的方法可以用于构造任意结构的控制器,如减速优化控制器和分散控制器。 关键字:模型预测控制、神经网络、非线性控制
1.介绍 由于非线性控制问题的复杂性,通常用逼近方法来获得近似解。在本文中,提出了一种广泛应用的方法即模型预测控制(MPC),这可用于解决在线优化问题,另一种方法是函数逼近器,如人工神经网络,这可用于离线的优化控制规则。 在模型预测控制中,控制信号取决于在每个采样时刻时的想要在线最小化的代价函数,它已经广泛地应用于受限的多变量系统和非线性过程等工业控制中[3,11,22]。MPC方法一个潜在的弱点是优化问题必须能严格地按要求推算,尤其是在非线性系统中。模型预测控制已经广泛地应用于线性MPC问题中[5],但为了减小在线计算时的计算量,该部分的计算为离线。 一个非常强大的函数逼近器为神经网络,它能很好地用于表示非线性模型或控制器,如文献[4,13,14]。基于模型跟踪控制的方法已经普遍地应用在神经网络控制,这种方法的一个局限性是它不适合于不稳定地逆系统,基此本文研究了基于优化控制技术的方法。 许多基于神经网络的方法已经提出了应用在优化控制问题方面,该优化控制的目标是最小化一个与控制相关的代价函数。一个方法是用一个神经网络来逼近与优化控制问题相关联的动态程式方程的解[6]。一个更直接地方法是模仿MPC方法,用通过最小化预测代价函数来训练神经网络控制器。为了达到精确的MPC技术,用神经网络来逼近模型预测控制策略,且通过离线计算[1,7.9,19]。用一个交替且更直接的方法即直接最小化代价函数训练网络控制器代替通过训练一个神经网络来逼近一个优化模型预测控制策略。这种方法目前已有许多版本,Parisini[20]和Zoppoli[24]等人研究了随机优化控制问题,其中控制器作为神经网络逼近器的输入输出的一个函数。Seong和Widrow[23]研究了一个初始状态为随机分配的优化控制问题,控制器为反馈状态,用一个神经网络来表示。在以上的研究中,应用了一个随机逼近器算法来训练网络。Al-dajani[2]和Nayeri等人[15]提出了一种相似的方法,即用最速下降法来训练神经网络控制器。 在许多应用中,设计一个控制器都涉及到一个特殊的结构。对于复杂的系统如减速控制器或分散控制系统,都需要许多输入与输出。在模型预测控制中,模型是用于预测系统未来的运动轨迹,优化控制信号是系统模型的系统的函数。因此,模型预测控制不能用于定结构控制问题。不同的是,基于神经网络函数逼近器的控制器可以应用于优化定结构控制问题。 在本文中,主要研究的是应用于非线性优化控制问题的结构受限的MPC类型[20,2,24,23,15]。控制规则用神经网络逼近器表示,最小化一个与控制相关的代价函数来离线训练神经网络。通过将神经网络控制的输入适当特殊化来完成优化低阶控制器的设计,分散和其它定结构神经网络控制器是通过对网络结构加入合适的限制构成的。通过一个数据例子来评价神经网络控制器的性能并与优化模型预测控制器进行比较。
2.问题表述 考虑一个离散非线性控制系统:
其中为控制器的输出,为输入,为状态矢量。控制目标是保持输出接近参考轨迹,一般地控制目标是通过最小化代价函数来实现的: 同时约束条件为: 其中为k时刻预测状态和输出的函数,这里,由将来的输入组成:
为输入增量: 在方程(2)中,Q和R输入与输出权值矩阵,为非负终止条件。 根据动态编程的优化原则[6],必须最小化代价函数(2),当终止条件为在K+N时刻时的无穷小,得出当时的无穷优化控制问题的解,同样就能得到有穷优化问题。对于非线性系统,优化控制问题一般无闭式解,因此,本文研究强力和不最理想的方法。
在模型预测控制(MPC)中,控制信号的确定是通过在每个采样时刻输入序列为时,最小化代价函数(2)。只有优化输入序列的第一个元素u(k)作为系统的输入,在下一个采样时刻k+1,新的优化问题是对于给定的优化控制问题而言的。在这种方法中,终止条件
可以看作是一个当时刻K+N趋于无穷时最小化代价函数的逼近器,但实际上更多的是用于保证闭环的稳定性。模型预测控制方法有一个非线性的缺点,且需要通过在每个采样时刻得到受约束的优化问题,同时需要通过在线计算来实现。 为了减小模型预测控制的计算量,本文提出了一种精确MPC方法,在这种方法中,计算的部分是离线进行的。对于非线性系统,优化的MPC方法应该由离线计算进行映射,且用一个函数逼近器表示。更准确地,控制策略是通过最小化代价函数(2)定义控制信号,或等
于它的增量: 其中作为计算代价函数(2)中的。对于任意,最小化代价函数(2)来评估方程(6)。从而通过离线训练来获得函数逼近器作为优化策略,尽管这种方法非常有用,但仍然存在一些限
制。因为MPC策略是基于信息来计算预测输出,这种不能很好的表示阶次递减或定结构的控制器。另外,计算还要求产生训练的数据非常广泛,这些每个训练数据点都需要一个MPC优化问题的解。
3.神经网络优化控制器 在本节中,研究了构成第2节所述的控制问题的一个神经网络模型预测控制器的问题。这里我们采样一个训练数据集作为直接训练代价函数(2)的控制器,而没有计算优化MPC控制信号的离线优化问题。 控制器表示如下:
其中为神经网络函数逼近器,I(k)为k时刻控制器的有效信号,W为逼近器参数(即神经网络权值)。
假设状态信息,如I(k)=时,控制器(7)可以看作是优化MPC策略(6)的函数近似。在本文中尽管研究的是这个方法,但控制器并没有完全受到状态信息的限制,而是把I(k)当成由许多输入u(k-i)与输出y(k-i)的过去值组成。,并将其作为参考信号
的设定值。这种方法可以构成高阶系统的较为复杂的控制器。I(k)值的不同选取方法将在第四节通过例子讲述。 Remark 1
为了降低控制器的复杂性,控制器的结构可以利用映射函数来确定,例如,假设
信息I(k)为:,一个分布式控制器为: ,控制器的结构为:
为了用控制规则(7),即最小化代价函数(2)来确定控制器的参数W,需要知道训练数据: 利用控制策略(7),系统的更新如下所示: 用训练数据定义联想代价函数:
逼近器(7)的训练,最小化优化问题的平方为: 约束条件为:
训练问题可以通过梯度算法来最小化优化问题的平方,如LM算法,从方程(11)可以得到代价函数的梯度为
其中: 其中为神经网络输出关于网络参数的偏导数,它取决于网络的结构,可以根据下式得到 : Remark 2 代价函数(11)用于训练神经网络控制器,与模型预测控制中代价函数类似,本文提出的控制器可以作为精确的模型预测控制器。注意到,对于一个给定的控制器的复杂性,计算量取决于优化控制器的参数W,而不是控制器的长度N。因此可以比模型预测控制能更灵活地用控制器的长度,从而被优化的参数也能成比例地增加。
4.仿真例子 在本节中,用例子仿真来说明第3节中所讲的神经网络模型预测控制器,在所有例子中,控制规则(7)用一个前馈神经网络来表示,该网络含有一层隐含层,用双曲正切函数作为激
活函数。这种网络可以以任意精度逼近所有连续非线性函数[12]。I(k)作为输入,为输出,训练算法为LM算法[21],用来解决非线性最小二乘问题(12),利用matlab的优化工具箱中的常规函数lsqnonlin来计算。 在所有的例子中,优化范围N为足够大,这样对于闭环系统就能达到平衡,因此,用一个零终止条件作为代价函数(11)。 例1 在本例中,我们仿真一个pH中和过程[10,18,17,1],在文献[1]中,应用了一个神经网络来逼近优化MPC策略的过程。这个过程可以用非线性微分方程来表示,该过程的表达式如下式所示[17,1]:
式中,输出y(k)由pH值控制,u(k)为输入流量,用于控制,系统还有确定性扰动d(k)、相互独立的随机白躁声扰动v(k)和n(k)(分别用Rv和Rn表示)。采样时间为0.2分钟,时延为L=5,系统矩阵表示为输出的函数,如下所示。 状态参数表达式为: 其中这些系统参数的函数表达式在文献[1]中已有研究。 根据方程(17),预测输出根据下式确定:
其中状态参数根据Kalman滤波原理得到:
,其中K(k)为Kalman滤波增益: 优化控制策略为预测状态的函数,参考轨迹为,i=1,….N 假设参考轨迹由参考模型给出:
式中为设定值,为阶跃响应。控制策略为在k+L时刻时预测系统状态,参考模型的状态,设定值等的函数,控制器(7)的信息I(k)为:
参数的选取根据文献[1],代价函数(11)中的权值为:Q=1,R=1。 白躁声变量:,用于Kalman滤波方程(19)中,参考模型(20)为一个二阶系统,增益为1,一对极点,均为0.9 由于非线性系统的动态特性,为了在整个操作过程中获得优化控制器的精确特性,需要大量的数据集。与非线性系统辨识相比较,仍需要长的训练集[16]。训练数据(9)用于训练控
制器,包括轨迹跟踪和扰动抑制(将输出pH的范围控制在)。因此训练数据有两种类型。对于轨迹跟踪,训练数据由以下构成:初始状态作为稳定状态响应
,设定值的改变,八个相等的初始pH值,14个设定值,给定的14个参考轨迹。代价函数(11)的控制范围设定为N=150,这个足够使新的设定到达参考模型(20)所定义的参考轨迹。对于扰动抑制,训练数据由以下构成:常量设定值,参
考信号,初始状态对稳定状态的响应。同样有14个不同的常量设定值,用于轨迹跟踪,且有28个初始状态。在这种情况下,控制范围为N=25步,这就使系统能达到设定值的一个初始偏值。初始状态和参考轨迹的总数为M=42。训练集中的每个元素包括了N个数据点,总的数据点数为2800。 根据一个独立的测试数据集来选取优化网络的大小,测试数据有36组2400个数据点,均是
均相同的方法产生训练数据, 6个范围在的初始pH值以及6个范围在的设定值。为了找出一个最小测试数据集,网络的大小不同,训练的结果如