第7章 非线性模型参数估值
- 格式:doc
- 大小:349.50 KB
- 文档页数:10
第7章 非线性模型参数估值7.1 引言数学模型是观测对象各影响因素相互关系的定量描述。
在获得实验数据并做了整理之后,就要建立数学模型。
这一工作在科学研究中有着十分重要的意义。
人们选用的模型函数可以是经验的,可以是半经验的,也可以是理论的。
模型函数选定之后,需要对其中的参数进行估值并确定该估值的可靠程度。
对于线性模型,待求参数可用线性最小二乘法求得,即用前一章中介绍的确定线性回归方程的方法。
对于非线性模型,通常是通过线性化处理而化为线性模型,用线性最小二乘法求出新的参数,从而再还原为原参数。
这种方法在处理经验模型时,简便易行,具有一定的实用价值。
但要注意到,这样做是使变换后的新变量y '的残差平方和(即剩余平方和)最小,这并不能保证做到使原变量y 的残差平方和也达最小值。
因此,得到的参数估计值就不一定是最佳的估计值。
可见在求理论模型的参数时,这种线性化的方法尚有其不足之处。
此外,还有些数学模型无法线性化,所以用线性化的方法是行不通的。
为此,需要一种对非线性模型通用的(不管是经验模型还是理论模型,不管这个模型能否线性化),能够得到参数最佳估计值的参数估计方法。
在工程中,特别是在化学工程中的数学模型大多是非线性、多变量的。
设y ˆ为变量x 1,x 2,…,x p ,的函数,含有m 个参数b 1,b 2,…,b m ,则非线性模型的一般形式可表示为:=y ˆf (x 1,x 2,…,x p ;b 1,b 2,…,b m ) (7.1) 或写为 ),(ˆb x f y= (7.2) 式中x 为p 维自变量向量,b 为m 维参数向量。
设给出n 组观测数据x 1 ,x 2 ,… ,x n y 1 ,y 2 ,… ,y n我们的目的是由此给出模型式(7.2)中的参数b 的最佳估计值。
可以证明,这个最佳估计值就是最小二乘估计值。
按最小二乘法原理,b 应使Q 值为最小,即∑==-=ni i i yy Q 12min )ˆ( 或写成 ∑==-=ni i i f y Q 12min )],([b x (7.3)现在的问题是根据已知的数学模型和实验数据,求出使残差平方和最小,即目标函数式(7.3)取极小值时的模型参数向量b 。
EViews非线性模型参数估计方法步骤1.新建EViews工作区,并将时间序列X、P1和P0导入到工作区;2.设定参数的初始值全部为1,其方法是在工作区中其输入下列命令并按回车键param c(1) 1 c(2) 1 c(3) 1 c(4) 13.估计非线性模型参数,其方法是在工作区中其输入下列命令并按回车键nls q=exp(c(1))*x^c(2)*p1^c(3)*p0^c(4)4.得到结果见table01(91页表3.5.4结果)(案例一结束)Dependent Variable: QMethod: Least SquaresDate: 03/29/15 Time: 21:44Sample: 1985 2006Included observations: 22Convergence achieved after 9 iterationsQ=EXP(C(1))*X^C(2)*P1^C(3)*P0^C(4)Coefficient Std. Error t-Statistic Prob.C(1) 5.567708 0.083537 66.64931 0.0000C(2) 0.555715 0.029067 19.11874 0.0000C(3) -0.190154 0.143823 -1.322146 0.2027C(4) -0.394861 0.159291 -2.478866 0.0233R-squared 0.983631 Mean dependent var 1830.000Adjusted R-squared 0.980903 S.D. dependent var 365.1392S.E. of regression 50.45954 Akaike info criterion 10.84319Sum squared resid 45830.98 Schwarz criterion 11.04156Log likelihood -115.2751 Hannan-Quinn criter. 10.88992Durbin-Watson stat 0.672163(92页表3.5.5结果)(案例二过程)5.新建EViews工作区,并将时间序列X、P1和P0导入到工作区;6.设定参数的初始值全部为1,其方法是在工作区中其输入下列命令并按回车键param c(1) 1 c(2) 1 c(3) 17.估计非线性模型参数,其方法是在工作区中其输入下列命令并按回车键nls q=exp(c(1))*(x/p0)^c(2)*(p1/p0)^c(3)8.得到结果见table02(92页表3.5.5结果)(案例二结束)Dependent Variable: QMethod: Least SquaresDate: 03/29/15 Time: 22:14Sample: 1985 2006Included observations: 22Convergence achieved after 4 iterationsQ=EXP(C(1))*(X/P0)^C(2)*(P1/P0)^C(3)Coefficient Std. Error t-Statistic Prob.C(1) 5.525965 0.072685 76.02666 0.0000C(2) 0.533824 0.019785 26.98163 0.0000C(3) -0.242862 0.134014 -1.812219 0.0858R-squared 0.982669 Mean dependent var 1830.000Adjusted R-squared 0.980845 S.D. dependent var 365.1392S.E. of regression 50.53638 Akaike info criterion 10.80939Sum squared resid 48524.59 Schwarz criterion 10.95817Log likelihood -115.9033 Hannan-Quinn criter. 10.84444Durbin-Watson stat 0.656740。
非线性回归模型的拟合与评估非线性回归是统计学中常用的一种回归分析方法,用于描述自变量与因变量之间的非线性关系。
本文将介绍非线性回归模型的拟合与评估方法。
一、非线性回归模型的拟合方法1. 数据收集与准备拟合非线性回归模型首先需要收集与问题相关的数据。
数据的准备包括数据清洗、变量选择和数据变换等步骤,以确保数据的质量和适应非线性回归模型的要求。
2. 模型选择在准备好数据后,需要选择适合问题的非线性回归模型。
常见的非线性回归模型包括多项式回归模型、指数回归模型、对数回归模型等。
选择合适的模型需要根据问题的特点和理论的支持进行判断。
3. 模型拟合模型拟合是指通过最小化残差平方和或最大似然估计等方法,估计模型的参数。
对于非线性回归模型,常用的拟合方法有最小二乘法、非线性最小二乘法、广义最小二乘法等。
4. 拟合效果评估拟合效果评估是判断非线性回归模型拟合程度好坏的指标。
常用的评估方法有残差分析、决定系数、AIC和BIC等。
残差分析可以检验模型的拟合效果和残差的独立性、常数方差和正态性假设。
二、非线性回归模型的评估方法1. 决定系数(R-squared)决定系数是衡量模型拟合程度的指标,其取值范围为0到1之间。
决定系数越接近1,表示模型对观测数据的解释能力越强。
但需要注意,决定系数无法判断模型是否过拟合。
2. 调整决定系数(Adjusted R-squared)调整决定系数是对决定系数进行修正,考虑了自变量数目的影响。
调整决定系数比决定系数更能有效地评估模型的拟合效果。
3. Akaike信息准则(AIC)和贝叶斯信息准则(BIC)AIC和BIC是用于比较不同模型的拟合效果的统计准则。
AIC和BIC数值越小,表示模型越好。
这两个指标在非线性回归模型的选择和评估中广泛应用。
4. 拟合图形分析通过绘制拟合曲线与实际观测数据的对比图,可以直观地评估非线性回归模型的拟合效果。
拟合图形分析可以帮助发现模型的不足之处,从而进行进一步的改进。
非线性模型非线性模型指的是在数据建模过程中,不满足线性关系的模型。
线性模型是指因变量与自变量之间存在线性关系,即因变量的变化与自变量以线性的形式变化,而非线性模型则是指因变量与自变量之间的关系不是线性的。
非线性模型在许多实际问题中具有重要的应用,因为许多自然、社会和工程现象的关系往往不是简单的线性关系。
非线性模型能够更好地捕捉到因变量与自变量之间的复杂关系,从而提高模型的准确性和预测能力。
非线性模型的数学形式可以多样化,常见的非线性模型包括多项式模型、指数模型、对数模型、幂函数模型、高斯模型等。
这些模型在描述实际问题时,可以更好地符合数据的分布特征,并能够更准确地预测未知的因变量值。
非线性模型的建立过程通常包括以下几个步骤:首先,确定因变量和自变量之间的关系形式。
根据实际问题的特点和数据的分布情况,选择合适的非线性模型形式。
其次,确定模型的参数估计方法。
对于非线性模型,通常采用最小二乘法、最大似然估计等方法来估计模型的参数。
然后,利用已知的数据对模型进行参数估计,并通过模型拟合方法来评估模型的拟合效果。
最后,通过模型的应用和验证,对模型进行调整和改进,以提高模型的预测能力和稳定性。
非线性模型的优点在于能够更好地适应实际问题,并更准确地描述和预测实际数据。
但非线性模型也存在一些挑战和限制。
首先,非线性模型的建立和参数估计相对复杂,需要较高的数学和统计知识。
其次,非线性模型的解释能力通常较弱,模型中的参数难以直接解释。
此外,非线性模型对数据的要求较高,需要充分、准确地收集和处理数据。
综上所述,非线性模型在数据建模中具有重要的应用价值。
通过选择合适的非线性模型,进行参数估计和模型拟合,可以更准确地描述和预测实际问题。
非线性模型的发展和应用无疑对社会和经济发展产生了积极的影响,成为现代数据分析和统计学中的重要工具。
非线性回归模型及其应用一、引言非线性回归模型在数据分析和预测中具有广泛的应用。
与线性回归模型不同,非线性回归模型能够更好地描述数据之间的复杂关系,适用于解决一些实际问题中的非线性回归分析。
本文将介绍非线性回归模型的基本原理及其应用领域。
二、非线性回归模型的基本原理1. 模型表达式非线性回归模型的表达式一般形式为:Y = f(X, β) + ε其中,Y为因变量,X为自变量,β为参数向量,f(·)为非线性函数,ε为误差项。
通常,我们将模型的函数形式根据问题的实际情况进行选择。
2. 参数估计方法非线性回归模型的参数估计可以使用最小二乘法和最大似然法等方法。
最小二乘法通过最小化误差平方和来估计参数值,最大似然法则是通过最大化似然函数来估计参数值。
选择合适的参数估计方法需要根据具体情况进行判断。
三、非线性回归模型的应用1. 生物医学领域在诊断和治疗方面,非线性回归模型可以用来建立生物医学数据的模型,进而进行疾病的预测和治疗方案的优化。
例如,可以通过建立非线性回归模型来预测病人术后恢复的时间。
2. 经济学领域非线性回归模型在经济学研究中也有广泛的应用。
例如,可以通过非线性回归模型来研究消费者对商品价格的反应,以及对商品需求的影响因素等。
3. 工程领域在工程领域,非线性回归模型可以用来研究工程结构的变形、断裂等情况。
例如,在建筑工程中,可以通过非线性回归模型来估计建筑物的强度和稳定性。
4. 金融领域非线性回归模型在金融领域中也有广泛的应用。
例如,可以通过建立非线性回归模型来分析股票价格的波动,预测市场的走势等。
四、非线性回归模型的评估指标1. 残差分析残差分析是评估非线性回归模型拟合优度的重要方法。
通过对模型的残差进行分析,可以判断模型是否符合假设,进而进行模型的改进和优化。
2. 决定系数决定系数(R-squared)是评估非线性回归模型拟合优度的指标之一。
决定系数越接近1,表示模型对观测数据的拟合程度越好。
非线性模型非线性模型是一种常用于描述非线性现象的数学模型。
与线性模型不同,非线性模型可以更好地适应复杂的数据结构和变化规律。
在各个领域中,非线性模型都有广泛的应用,包括物理学、生物学、经济学等。
非线性模型的建立是根据数据的特点和需求来确定的。
首先,在数据分析之前,需要对问题进行准确的描述和假设的建立。
然后,通过收集实际数据,可以利用统计方法和计算机技术来拟合非线性模型。
非线性模型可以分为参数模型和非参数模型两类。
参数模型是指模型的形式已知,并且其中的参数也可以通过拟合获得。
常见的参数模型包括多项式回归模型、指数模型、对数模型等。
非参数模型是指模型的形式不确定,需要通过数据来决定。
常见的非参数模型包括核函数回归模型、支持向量机模型等。
多项式回归模型是最常见的非线性模型之一。
它通过引入高次项来适应非线性关系。
例如,若要研究某种材料的强度与温度之间的关系,可以采用多项式回归模型来描述。
如果温度的增长对材料强度的影响是非线性的,那么高次项就会在模型中发挥作用。
指数模型和对数模型是描述变化趋势的常用非线性模型。
指数模型可以用于描述一些与时间或其他变量呈指数关系的数据。
对数模型则适用于呈现缓慢增长或减少的数据。
这两种模型在生物学、经济学等领域中具有重要的应用价值。
核函数回归模型是一种非参数模型,它通过引入核函数来实现非线性拟合。
核函数回归模型可以解决传统线性回归模型中无法描述的非线性问题。
它在图像处理、模式识别等领域中被广泛应用。
支持向量机模型是另一种常见的非参数模型。
它通过寻找最大化分类边缘的超平面来实现非线性分类。
支持向量机模型在模式识别、文本分类等领域中具有出色的性能。
总之,非线性模型在各个领域中都有广泛的应用。
通过适当的模型选择和合理的数据拟合,可以更好地描述和解释复杂的非线性现象。
非线性模型的建立和使用是数据分析和科学研究的重要工具。
非线性回归模型的参数估计方法比较研究论文素材一、引言非线性回归模型是在实际问题中广泛应用的一种统计模型。
不同的非线性回归模型需要使用不同的参数估计方法,选择合适的方法对模型进行参数的估计对于模型的准确性和可靠性至关重要。
本文旨在比较不同的非线性回归模型参数估计方法的优劣,为实际应用提供参考。
二、参数估计方法1. 最小二乘法最小二乘法是一种经典的参数估计方法,适用于线性回归和部分非线性回归模型。
该方法通过最小化观测值与模型预测值之间的误差平方和来估计参数值。
然而,对于高度非线性的模型,最小二乘法可能存在无法收敛或者达到局部最优解的问题。
2. 最大似然估计法最大似然估计法是一种常用的参数估计方法,尤其适用于非线性回归模型。
该方法基于观测数据的概率分布,寻找最大化观测数据出现概率的参数值作为估计值。
最大似然估计法在理论上具有良好的性质,但在实际应用中可能需要迭代算法来求解。
3. 二阶导数估计法二阶导数估计法是一种基于牛顿法的参数估计方法,通过使用二阶导数矩阵估计参数值。
这种方法的优点是收敛速度较快,但需要较高的计算复杂度。
在实际应用中,二阶导数估计法可能会遇到矩阵奇异或计算不稳定的问题。
4. 贝叶斯估计法贝叶斯估计法是一种基于贝叶斯统计思想的参数估计方法,通过引入先验分布和后验分布来估计参数值。
该方法能够灵活地处理不确定性,但需要选择合适的先验分布和进行复杂的数值计算。
三、方法比较根据不同的非线性回归模型特点和数据情况,选择合适的参数估计方法对于模型准确性和可靠性至关重要。
下面对不同的参数估计方法进行比较:1. 参数估计准确性最小二乘法对于线性回归模型具有较好的估计准确性,但对于非线性回归模型的准确性可能较低。
最大似然估计和二阶导数估计法对于非线性回归模型具有较好的估计准确性,但可能需要较高的计算复杂度。
贝叶斯估计法考虑了不确定性,但需要选择合适的先验分布。
2. 参数估计稳定性最小二乘法对于线性回归模型具有较好的稳定性,但非线性回归模型的稳定性可能较差。
非线性回归模型概述在统计学和机器学习领域,回归分析是一种重要的建模技术,用于研究自变量和因变量之间的关系。
在实际问题中,很多情况下自变量和因变量之间的关系并不是简单的线性关系,而是呈现出复杂的非线性关系。
为了更准确地描述和预测这种非线性关系,非线性回归模型应运而生。
一、非线性回归模型的基本概念非线性回归模型是指因变量和自变量之间的关系不是线性的数学模型。
在非线性回归模型中,因变量的取值不仅仅是自变量的线性组合,还可能包括自变量的非线性函数,如平方、指数、对数等。
因此,非线性回归模型的形式更加灵活,能够更好地拟合实际数据。
二、常见的非线性回归模型1. 多项式回归模型:多项式回归是一种最简单的非线性回归模型,通过增加自变量的高次项来拟合非线性关系。
例如,二次多项式回归模型可以表示为:Y = β0 + β1X + β2X^2 + ε,其中X^2为自变量X 的平方项。
2. 对数回归模型:对数回归模型适用于因变量和自变量之间呈现出对数关系的情况。
例如,对数线性模型可以表示为:Y = β0 + β1ln(X) + ε,其中ln(X)为自变量X的对数项。
3. 指数回归模型:指数回归模型适用于因变量和自变量之间呈现出指数关系的情况。
例如,指数回归模型可以表示为:Y = β0e^(β1X) + ε,其中e^(β1X)为自变量X的指数项。
4. 幂函数回归模型:幂函数回归模型适用于因变量和自变量之间呈现出幂函数关系的情况。
例如,幂函数回归模型可以表示为:Y =β0X^β1 + ε,其中X^β1为自变量X的幂函数项。
三、非线性回归模型的参数估计与线性回归模型类似,非线性回归模型的参数估计也可以通过最小二乘法来进行。
最小二乘法的核心思想是使模型预测值与实际观测值之间的残差平方和最小化,从而得到最优的参数估计值。
在非线性回归模型中,由于模型的非线性特性,参数估计通常需要通过迭代算法来求解。
四、非线性回归模型的评估在建立非线性回归模型后,需要对模型进行评估以验证其拟合效果和预测能力。
第7章非线性模型参数估值7.1 引言数学模型是观测对象各影响因素相互关系的定量描述。
在获得实验数据并做了整理之后,就要建立数学模型。
这一工作在科学研究中有着十分重要的意义。
人们选用的模型函数可以是经验的,可以是半经验的,也可以是理论的。
模型函数选定之后,需要对其中的参数进行估值并确定该估值的可靠程度。
对于线性模型,待求参数可用线性最小二乘法求得,即用前一章中介绍的确定线性回归方程的方法。
对于非线性模型,通常是通过线性化处理而化为线性模型,用线性最小二乘法求出新的参数,从而再还原为原参数。
这种方法在处理经验模型时,简便易行,具有一定的实用价值。
但要注意到,这样做是使变换后的新变量y'的残差平方和(即剩余平方和)最小,这并不能保证做到使原变量y的残差平方和也达最小值。
因此,得到的参数估计值就不一定是最佳的估计值。
可见在求理论模型的参数时,这种线性化的方法尚有其不足之处。
此外,还有些数学模型无法线性化,所以用线性化的方法是行不通的。
为此,需要一种对非线性模型通用的(不管是经验模型还是理论模型,不管这个模型能否线性化),能够得到参数最佳估计值的参数估计方法。
在工程中,特别是在化学工程中的数学模型大多是非线性、多变量的。
设yˆ为变量x1,x2,…,x p,的函数,含有m个参数b1,b2,…,b m,则非线性模型的一般形式可表示为:=yˆf(x1,x2,…,x p;b1,b2,…,b m) (7.1) 或写为),(ˆbxfy= (7.2)式中x为p维自变量向量,b为m维参数向量。
设给出n组观测数据x1 ,x2 ,…,x ny1 ,y2 ,…,y n我们的目的是由此给出模型式(7.2)中的参数b的最佳估计值。
可以证明,这个最佳估计值就是最小二乘估计值。
按最小二乘法原理,b应使Q值为最小,即∑== -=nii iy yQ12min)ˆ(或写成∑== -=nii ifyQ12min)],([bx (7.3)现在的问题是根据已知的数学模型和实验数据,求出使残差平方和最小,即目标函数式(7.3)取极小值时的模型参数向量b。
这显然是一个最优化的数学问题,可以采用逐次逼近法求解。
这种处理方法实质上是逐次线性化法或某种模式的搜索法。
在下面各节中将介绍几个适用方法。
7.2 高斯——牛顿法高斯——牛顿法是非线性最小二乘法的最基本方法。
其基本思想是把非线性模型函数在一局部范围内进行泰勒一阶展开,作为原函数的线性近似,代入目标函数则成为线性最小二乘法,因为它有解析解,所以可求出它的精确的极小值,以此点作为下一次线性近似的出发点。
这样反复采用同样方法逐次逼近真正的极小点,从而得到最佳的估计参数向量b 。
所以此法实质是逐次线性化法。
参数估计的目标函数为式(7.3)。
求解参数向量b 的思路是这样的,先给定初值b (0),然后一次次修正)()()1(k k k Δb b +=+ (7.4) 式中角标k 代表迭代回次,Δ(k )代表第k 次的修正量,每次修正须保证Q 值下降,这样一步步逼近目标函数的极小值min Q ,最后得到b 的解。
为确定Δ,对非线性函数,在初值点b (0)处进行泰勒一阶展开得:∑=∂∂+≈+mj j jii i b f f f 1)0()0()0(Δ),(),(bx Δbx (7.5)或简记为 ∑=∆∂∂+≈mj j j ii i b f f f 1)0()0( (7.6)代入式(7.3),得 ∑∑==∆∂∂--=ni mj j jiiib f f yQ 121)0()0(][ (7.7)当b (0)给定后,)0(i f 和]/[)0(j i b f ∂∂都是自变量x 的函数,根据实验点均可计算求得。
因此目标函数化为对未知的Δ的线性函数,并可用线性最小二乘法求得Q (Δ)的极小点。
由极值条件0)/(=∂∂ΔQ ,对式(7.7)求导数,并令其为零,得∑∑===∂∂∆∂∂---ni mj kij jiii b f b f f y 11)0()0()0(0][2 (k=1,2,…,m)由此得∑∑∑===∂∂-=∆∂∂∂∂ni mj ni kiiijkij ib f f yb f b f 111)0()0()0()0()( (k=1,2,…,m) (7.8)令⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡∂∂⋯∂∂∂∂⋯⋯⋯⋯∂∂⋯∂∂∂∂∂∂⋯∂∂∂∂=mnnn mm b f b f b f b f b f b f b f b f b f )0(2)0(1)0()0(22)0(21)0(2)0(12)0(11)0(10A (7.9))0(i i i f y r -= (7.10) ],,,[21n T r r r ⋯=r (7.11)代入式(7.8)则有r A ΔA A TT 000= (7.12) 令00A A A T = (7.13) r A D T 0= (7.14) 则有线性方程组D A Δ= (7.15)解之便得Δ,从而代入式(7.4),得到修正的b 。
经过反复迭代直至Δ的值很小,满足误差要求为止,这时的b 即为所求。
以上计算过程归纳如下: (1)人为地给定初值b (0);(2)求偏导值j i b f ∂∂/)0(,构成矩阵0A ; (3)计算并构成向量r ;(4)计算并构成矩阵A 和向量D ; (5)求解线性方程组得到Δ; (6)按式(7.4)修正b ;(7)若Δ满足误差要求则结束,否则返回步骤(2)。
在求解过程中之所以需要反复地迭代和修正,是因为泰勒级数展开式(7.6)只是近似的式子,故得到的b 也是近似的。
高斯——牛顿法对初值的要求是比较严格的,若初值选取不当,很可能得不到结果,即“发散”。
7.3 单纯形法及其Excel 程序高斯——牛顿法或麦夸特法都需要一阶导数矩阵0A ,当函数关系复杂时,就会给运算带来很大的困难。
这时可以采用不需要利用一阶导数矩阵的单纯形法。
我们的目的是寻求一组参数b 使目标函数Q 值为最小,寻求到的b 值称为最优估计值,简称最优值。
单纯形法的思路是先算出若干点处的目标函数值,然后进行比较,从它们之间的大小情况来判断函数的变化趋势,按照一定的模式确定搜索方向。
这个模式就是利用单纯形进行反射、扩张、压缩和收缩等方法进行搜索,不断形成新的单纯形,直到单纯形缩得很小时,便得到最优值。
那么,什么是单纯形呢?所谓单纯形就是一定的空间中的最简单的图形。
如二维空间(平面上),单纯形为三角形,三维空间为四面体,m 维空间为由m +1个顶点而构成的最简单的图形。
如果m +1个顶点的距离都相等,则称为正规的单纯形,简称正单纯形。
为了讨论的方便,把式(7.3)表示为)(b Q Q = (7.22) 下面给出单纯形法的计算步骤及公式。
1.初始单纯形的生成 给定初始点T m b b b ],,,[210⋯=b (7.23)其余几个点为⎪⎪⎭⎪⎪⎬⎫+⋯++=⋯⋯⋯+⋯++=+⋯++=Tm m Tm Tm p b q b q b q b p b q b q b q b p b ],,,[],,,[],,,[21212211b b b (7.24) 式中⎪⎪⎭⎪⎪⎬⎫-+=-++=hm m q h m m m p 211211 (7.25)式中h 为单纯形边长,一般取0.5≤h ≤15。
对于二维情况,有 h q h p m 2588.0,9659.0,2===这样形成的初始单纯形为正单纯形。
2.反射计算单纯形各顶点的目标函数值)(i i Q Q b = (i=0,2,…,m ) (7.26) 比较这m +1个点的目标函数值的大小,先找出Q 的最大、最小及次最大点的b 值,分别记为H b 、L b 、G b 即)(m ax )(i H H Q Q Q b b == (i =0,1,…,m ) (7.27) )(m in )(i L L Q Q Q b b == (i =0,1,…,m ) (7.28) )(m ax )(i G G Q Q Q b b == (i =0,1,…,m ;i ≠H ) (7.29) 计算除H b 外m 个点的重心,即反射中心C b ,即 ∑=-=mi H i C m)(1b b b (7.30)求出H b 的反射点R b ,即)(H C C R b b b b -+=α(7.31) 式中α为反射系数,一般为对称反射,取α=1。
3.扩张计算反射点的目标函数值)(R R Q Q b = (7.32)若R Q <G Q ,则进行扩张。
令)(H R H E b b b b -+=μ (7.33) 式中μ>1,称为扩张系数,一般取μ=1.2~2.0。
计算扩张点的目标函数值)(E E Q Q b = (7.34) 若E Q <R Q ,则扩张成功。
令E S E S Q Q ==,b b (7.35) 否则扩张失败。
令R S R S Q Q ==,b b (7.36)总之,总可得一新点S b ,用S b 代替H b 构成新的单纯形返回第二步,再次搜索。
4.压缩和收缩若R Q ≥G Q ,则反射失败,进行压缩。
令)(H R H S b b b b -+=λ (7.37) 式中0<λ<1和λ≠0.5,λ称为压缩系数,一般取λ=0.25或0.75,若λ=0.5,则S b =C b ,造成降维。
计算)(S S Q Q b = (7.38)若S Q <G Q ,则压缩成功。
用S b 代替H b 构成新的单纯形返回第二步,再次搜索。
若S Q ≥G Q ,则反射压缩都失败,则要进行收缩。
收缩的公式为2/)()()()1(k L k i k i b b b +=+ i =0,1,…,m (7.39)式中上角标k 表示计算i b 的次数。
以)1(+k i b 代替i b 构成新的单纯形返回第二步再次搜索。
5.收敛要求 继续上述过程,直至121)(ε<+-∑=m Q QmL ii (7.40)或22)(ε<-∑=mQ Qmii (7.41)为止。
式中1ε、2ε为充分小的正数。
单纯形法需要的总搜索步数较多,但每一步计算中除计算一次目标函数值外,只是一些简单的代数运算。
若使用计算机,运算时间就能大大缩短。
单纯形法对初值的要求不是很严,即使所选用的初值远离真值也可以收敛。
这一点是单纯形法的突出优点。
关于初始单纯形边长的选取,需根据具体问题由经验给出。
在使用单纯形法进行参数估值时应注意下面几个问题:第一,估计参数开始时,单纯形的边长应与估计的参数具有相近的数量级,保证参数估计有较大的空间。
第二,当一次估计找不到最佳参数值时,可把当前估计的参数值作为初值,接着再估计。
单纯形的边长将随着参数接近最佳值而缩小。
第三,如果有多个参数要同时估计,并且它们的数量级不同,最好对参数进行数量级转换,使估计的参数的数量级接近。