一类新的基于信赖域技术的非单调共轭梯度算法
- 格式:pdf
- 大小:215.27 KB
- 文档页数:13
Matlab中的最优化问题求解方法近年来,最优化问题在各个领域中都扮演着重要的角色。
无论是在工程、经济学还是科学研究中,我们都需要找到最优解来满足特定的需求。
而Matlab作为一种强大的数值计算软件,在解决最优化问题方面有着广泛的应用。
本文将介绍一些Matlab中常用的最优化问题求解方法,并探讨其优缺点以及适用范围。
一. 无约束问题求解方法1. 最速下降法最速下降法是最简单且直观的无约束问题求解方法之一。
其基本思想是沿着梯度的反方向迭代求解,直到达到所需的精度要求。
然而,最速下降法的收敛速度通常很慢,特别是在局部极小值点附近。
2. 共轭梯度法共轭梯度法是一种改进的最速下降法。
它利用了无约束问题的二次函数特性,通过选择一组相互共轭的搜索方向来提高收敛速度。
相比于最速下降法,共轭梯度法的收敛速度更快,尤其适用于大规模优化问题。
3. 牛顿法牛顿法是一种基于二阶导数信息的优化方法。
它通过构建并求解特定的二次逼近模型来求解无约束问题。
然而,牛顿法在高维问题中的计算复杂度较高,并且需要矩阵求逆运算,可能导致数值不稳定。
二. 线性规划问题求解方法1. 单纯形法单纯形法是一种经典的线性规划问题求解方法。
它通过在可行域内进行边界移动来寻找最优解。
然而,当问题规模较大时,单纯形法的计算复杂度会大幅增加,导致求解效率低下。
2. 内点法内点法是一种改进的线性规划问题求解方法。
与单纯形法不同,内点法通过将问题转化为一系列等价的非线性问题来求解。
内点法的优势在于其计算复杂度相对较低,尤其适用于大规模线性规划问题。
三. 非线性规划问题求解方法1. 信赖域算法信赖域算法是一种常用的非线性规划问题求解方法。
它通过构建局部模型,并通过逐步调整信赖域半径来寻找最优解。
信赖域算法既考虑了收敛速度,又保持了数值稳定性。
2. 遗传算法遗传算法是一种基于自然进化过程的优化算法。
它模拟遗传操作,并通过选择、交叉和变异等操作来搜索最优解。
遗传算法的优势在于其适用于复杂的非线性规划问题,但可能需要较长的计算时间。
常见的优化算法摘要:一、引言二、常见优化算法概述1.梯度下降2.随机梯度下降3.小批量梯度下降4.牛顿法5.拟牛顿法6.共轭梯度法7.信赖域反射算法8.岭回归与LASSO三、优化算法的应用场景四、总结正文:一、引言在机器学习和数据挖掘领域,优化算法是解决最优化问题的常用方法。
本文将对一些常见的优化算法进行概述和分析,以便读者了解和选择合适的优化算法。
二、常见优化算法概述1.梯度下降梯度下降是最基本的优化算法,通过计算目标函数的梯度,并乘以一个正数加到梯度相反号上,不断更新参数。
2.随机梯度下降随机梯度下降是梯度下降的一个变种,每次更新时随机选择一部分样本计算梯度,减少了计算复杂度。
3.小批量梯度下降小批量梯度下降是随机梯度下降的改进,每次更新时选择一小部分样本计算梯度,平衡了计算复杂度和收敛速度。
4.牛顿法牛顿法是一种二阶优化算法,通过计算目标函数的二阶导数(Hessian 矩阵)来更新参数,具有更快的收敛速度。
5.拟牛顿法拟牛顿法是牛顿法的近似方法,通过正则化Hessian 矩阵来避免牛顿法的计算复杂度问题。
6.共轭梯度法共轭梯度法是一种高效的优化算法,通过计算目标函数在参数空间中的共轭梯度来更新参数,具有较好的数值稳定性和收敛速度。
7.信赖域反射算法信赖域反射算法是一种基于信赖域的优化算法,通过不断缩小区间来更新参数,具有较好的收敛速度和鲁棒性。
8.岭回归与LASSO岭回归和LASSO 是一种正则化方法,通过加入正则项来优化目标函数,具有较好的过拟合抑制效果。
三、优化算法的应用场景不同的优化算法具有不同的特点和适用场景,如梯度下降适用于简单的问题,牛顿法和拟牛顿法适用于非凸问题,共轭梯度法适用于高维问题等。
在实际应用中,需要根据问题的特点选择合适的优化算法。
四、总结本文对常见的优化算法进行了概述和分析,包括梯度下降、随机梯度下降、小批量梯度下降、牛顿法、拟牛顿法、共轭梯度法、信赖域反射算法、岭回归和LASSO 等。
一类新的超记忆梯度法摘要:在本文中,我们提出了一类新的超记忆梯度法无约束优化问题.信赖域方法被用于新的算法,以保证全局收敛.在每一次迭代中,新的算法自动产生一个合适的信赖域半径,通过求解一个简单的子问题获得下一个迭代.这些算法由于使用更多的迭代信息使得算法稳定的收敛,当迭代点接近最优解时,此方法接近于拟牛顿法. 数值结果表明,这种新的超记忆梯度法在实际计算中是有效的.2006年爱思唯尔公司保留所有权利.关键词:无约束最优化; 超记忆梯度法; 全局收敛1. 引言考虑无约束最优化问题)(min x f ,nRx ∈, (1)这里n R 是n 维欧氏空间并且1:R R f n →是一个连续可微函数.对于求解无约束问题有许多的迭代方法, 如线性搜索方法和信赖域法.线性搜索方法的形式,2,1,0,1 =+=+k d x x k k k k α(2)其中0>k α是通过某种线性搜索得到的步长,()k k x f g ∇=,k d 是搜索方向,k β是一参数,不同的参数对应不同的共轭梯度法.在许多线性搜索方法的每一次迭代中只用当前迭代信息去生成一个新的迭代,而前一步的迭代信息就会被忽略.这是算法设计中的一种信息浪费. 共轭梯度法使用前一步的迭代信息,在每一次迭代中以产生一个新的迭代.形式(2)具有如下的迭代格式⎩⎨⎧≥+-=-=-,1,01k d g k g d k k k kk β (3)对于参数k β可定义为 212-=k k FR kg g β211)(---=k k k Tk P R P kg g g g β)()(111-----=k k T k k k Tk HS kg g dg g g β.其对应的算法分别称为FR, PRP, HS 共轭梯度法,参见[15,32,33].Fletcher [14] 提出了共轭下降法(简称CD 法)由k β定义为 112---=k T k k CD k g dg β.他的证明得出k d 的下降特性. Dai 和Yuan[10]证明了共轭梯度方法有关的强Wolfe 线性搜索的全局收敛.Dai. 和Yuan[7]由(3)还取了一个新的k β,如下:)(112---=k k T k kDYkg g dg β.他们证明了在强Wolfe 线性搜索下相应的共轭梯度法的全局收敛.Miele and Cantrell [23]还研究了记忆梯度法来解决无约束优化问题.设0x 是初始点,且00g -=δ,其算法如下,1k k k x x δ+=+1-+-=k k k g βδαδ,其中在函数()x f 中,标量α和β保证在每一次迭代中产生最速下降. Cantrell[4]证明了记忆梯度法和Fletcher –Reeves 算法[13]在二次函数的特定情况下是相同的.Cragg and Levy[5] 提出了一个超记忆梯度方法如下,1k k k x x δ+=+∑=-+-=ki i i k k g 11δβαδ,其中i i i x x -=+1δ,设0x 是初始点,且00g -=δ.Wolfe and Viazminsky[40]研究了超记忆下降方法,其主要的迭代形式如下,min1,,,1)(1⎪⎭⎫⎝⎛+-=⎪⎭⎫ ⎝⎛+-∑∑=-=-mi i k i k k mi ik k ik k k p x f p x f mδβαββαββα其中,1k k k x x δ+=+ ∑=-+-=mi i k k i k k k p 1)(δβαδ, 且0≠k T k g p .记忆梯度和超记忆梯度方法是共轭梯度法[8,9,16,20,30]的推广,它们不仅使用当前的迭代信息,而且还使用之前的迭代信息,在每一次迭代时,以产生新的迭代.此外,有限的拟牛顿记忆法也是一个解决大规模问题的有效方法 [2,3,11,12,18,25,26,31,39]. 它是在每一次迭代中用有限个记忆梯度来找到一个新的迭代.因此,有限的拟牛顿记忆法也就是超记忆梯度法[19,22,27-29] .事实上,当采用一些传统的非精确搜索时,有些减少极小化非二次目标函数的共轭梯度法不具有全局收敛.在某些情况下,许多超记忆梯度法也没有全局收敛.为了保证超记忆梯度法解的全局收敛和简化计算,一些新的非精确线搜索和曲线搜索规则在实际计算中被提出[ 1,34-36 ].但是,在分析采用非精确线性搜索的超记忆梯度法时,也要克服一些困难.例如,在一般情况下,全局收敛和收敛速率是有趣的和有意义的问题.如何使用信赖域法,以保证全局收敛是在算法设计中另一个挑战.事实上,我们希望构造这样一个超记忆梯度法,具有如下三个性质:稳定的收敛,便求解病态问题;简单的计算;自动调整参数的适应性.在本文中,我们提出了一类新求解无约束优化的问题的超记忆梯度法.在信赖域法中使用新的算法,以保证全局收敛.在每一次迭代中,新的算法自动产生一个合适的信赖域半径,通过求解一个简单的子问题获得下一个迭代.这些算法由于使用更多的迭代信息使得算法稳定的收敛,当迭代点接近最优解时,此方法接近于拟牛顿法. 数值结果表明,这种新的超记忆梯度法在实际计算中是有效的.本文其余部分安排如下,在第2节中我们描述的算法并分析了一些简单的性质.在第3和第4节中我们分别证明它的全局收敛性和收敛速度.数值结果在第5节中表述.在第6节中总结了一些得到的结论.2 .超记忆梯度法假设(H1)目标函数()x f 是连续可微,并在n R 上有下界.(H2)梯度函数)()(x f x g ∇=在包含水平集{},)()()(00x f x f R x x L n ≤∈=的开凸集B 上Lipschitz 连续,即存在常0>L 使y x L y g x g -≤-)()( .,B y x ∈∀ (4) 引理2.1 若(H1)和(H2)成立, 则对于B p x x ∈+,,.21)()()(2pL p x g x f p x f T+≤-+证明 由中值定理得,⎰⎰-++=+=-+1010)]()([)()()()(dtp x g tp x g p x g dt p tp x g x f p x f TTT.21)()()()()(210102p L p x g dtt p l P x g dt p x g tp x g p x g TTT+=+≤⋅-++≤⎰⎰得证.算法(A)Step0. 取()1,0∈ρ,()1,0∈μ,n R x ∈0,2≥m 和对称正定矩阵0B ,令1:=k ; Step1. 若()0=k x g ,则停止迭代;否则,转Step2; Step2. 定义k m 满足{}m k m k ,min 0≤≤.Step3. ),(1k k k k p x x α+=+其中k α是使在{},...,,,12ρρ中满足如下式子的最大α即,))(()0())((μαα≥-+-k k k k k k y q q p x f f (5)其中 )()(ααk k k y V p =和()αk y 是如下问题的解kkk Tkk Tk k k k Tk T k Tk k k dd B d d g y V t s yV B V y y V g f y q α-≤++=..21)(m i n (6))1(11),,,(,+⨯--+∈=∈k k k m n m k k k k m Rg g d V Ry 和n k R d ∈满足τ≥⋅-kk k Tk d g d g其中]1,0(∈τ.Step4. 令)(k k k p αδ=和;1k k k g g -=+γ若0>k T k γδ,定义k B 和1+k B 使用BFGS 或DFP 拟牛顿法修正k B 得到1+k B ,否则令.:1k k B B =+ Step5. 令1:+=k k ,转Step1.为方便起见,本文有时会记)(k k p α为k p .由算法,我们可以得到一些简单的性质.引理2.2 若)(αk y 是(6)式的解,则.)(2))(()0(2kk T kk T k k k k d B d d g y q q ⋅≥-αα证明 由算法(A),可以得到{}k B 是一个对称正定矩阵序列.因此.0>k k T k d B d若11_)0,,0,(+∈=km Tkk R y y 和)(k k T k k T k T k d B d d g y α-=,k y 是(6)式的可行解.注意到10≤≤α, 有k k Tk k T k k k T k k T k k k T k kk Tk kTk kk T k k T kk k k k k k d B d d g d B d d g d B d d B d d g d B d d g y q q y q q 2222)(21)(21)()()0())(()0(ααααα-≥⎪⎪⎭⎫ ⎝⎛-=-≥- kk Tk k T k d B d d g 2)(2⋅=α.得证.3.全局收敛为了分析全局收敛性,进一步假设 (H3)由算法(A)产生的矩阵序列{}k B 满足2120pp B p pk Tββ≤≤ . 0≥∀k n R p ∈∀.定理 3.1 假设(H1), (H2)和(H3),算法(A)产生一个无穷序列{}k x .则0lim =+∞→k k g .证明 用反证法, 存在一个无限子集{},...,2,1,0∈K 和0>ε有ε≥k g .K k ∈∀ (7) 由引理2.2 (H3)和(7)式,有22212)()(2)(2))](()0([))((kk k k T k kkk Tk k t k kk k k k k k k k g g d d g d B d d g y q q p x f f ⋅-≥⋅≥-≥+-βμααμαμα,22122212k kkg αβεμτβαμτ≥≥ .K k ∈从而,2))((122k k k k k p x f f αβεμτα≥+- .K k ∈ (8)由(H1)和上述不等式得0l i m ,=+∞→∈k k K k α. (9)由算法(A)和(9)式, 存在k '使得,))(()0())((μραρα<-+-k k k k k k k k y q q p x f f .K k ∈ .k k '≥ (10)由中值定理,(H2),(H3),Cauchy-Schwartz 不等式,引理2.1和2.2和 (9),令ρααk =,得))(()0()()()()0())(()0())((1))(()0())((2121221ααβααααααk k k k k k k k k k k k k k k k k k k y q q p p L q q y q q p x f f y q q p x f f -+≤-+-+-=--+-kk Tk kkk Tk k Tk k k T k kk T k kk Tk k T kk d B d d L d B d d g d B d d d g L d B d d g p L 21222222121222121)()()()()()()()(αβαβαβαα+≤+≤+≤001→+≤αββL ),(∞→∈k K k显然,设10)1(βμβα+-≤L则,1))(()0())((01μαββαα≥+-≥-+-L y q q p x f f k k k k k k .K k ∈此与(10)式矛盾.因此,不存在这样一个子集{},...,2,1,0∈K 和0>ε有(7)式成立. 得证.。