第8讲信赖域方法
- 格式:ppt
- 大小:765.50 KB
- 文档页数:24
一种求解信赖域子问题的精确解法王希云;李亮;于海波【摘要】在Hessian矩阵正定的前提下,首先利用线性插值构造了一条折线,并利用该折线提出了一种求解信赖域子问题的精确求解方法,称为分段折线法.并且证明了分段折线路径的合理性,最后分别通过与牛顿法、单折线法、双折线法和切线单折线法的数值实验作比较,数值结果表明新算法是有效且可行的.【期刊名称】《宁夏师范学院学报》【年(卷),期】2013(034)006【总页数】5页(P16-20)【关键词】信赖域子问题;最优曲线;精确解法;分段折线法【作者】王希云;李亮;于海波【作者单位】太原科技大学应用科学学院,山西太原030024;太原科技大学应用科学学院,山西太原030024;太原科技大学应用科学学院,山西太原030024【正文语种】中文【中图分类】O221信赖域方法的关键就是每步迭代时都需求解下面形式的信赖域子问题:其中g∈Rn为目标函数在当前迭代点的梯度,B∈Rn×n为目标函数在当前迭代点的Hessian矩阵或其近似,Δ∈R为信赖域半径,δ∈Rn为待求变量.当Δ变化时,上述信赖域子问题(1)的解δ*形成一条空间曲线,称为最优曲线[1].目前关于求解信赖域子问题(1)的方法有很多,比如常见的有精确求解方法、折线法与截断共轭梯度法[2].其中折线法较为普遍,如单折线法、双折线法、切线单折线法、不定折线法、混合折线法、双割线折线法等[3-7].而精确求解方法目前提出的主要是牛顿法,本文根据文献[2]中精确求解方法的思想,利用分段线性插值的方法,提出了一种新的求解信赖域子问题的精确求解方法,称为分段折线法.1 基础知识定理1[3]δ*是子问题(1)的解,当且仅当存在μ*≥0,使得而且(B+μ*Ⅰ)是半正定矩阵.由定理1可知,信赖域子问题的精确求解方法的思想是解如下方程组当μ=0时,信赖域子问题(1)的解δ*=-B-1g;当μ>0时,则是通过求解一元非线性方程‖ (B+ μⅠ)-1g‖2- Δ =0,得到解μ*,然后把μ*代入(2)的第一个方程,则可以求出信赖域子问题(1)的解δ*=-(B+ μ*Ⅰ)-1g.牛顿法的思想:在求解信赖域子问题(1)的解δ*,即(2)的解时,当μ =0时,则δ*=-B-1g;当μ >0时,定义函数φ(μ),而函数φ(μ)是严格单调增加的凹函数[3],然后利用牛顿法求方程φ(μ)=0的近似根μ*,从而求出子问题(1)的解δ*=-(B+μ*I)-1g.牛顿法的缺点:初始迭代点μ0不好选取.因为利用牛顿法求方程φ(μ)=0的近似根μ*时,只有当初始迭代点μ0充分接近方程φ(μ)=0的精确根时所求得的近似根μ*才较准确.但方程φ(μ)=0的精确根不知道,因此,如果选取的初始迭代点μ0离方程φ(μ)=0的精确根很远时,则可能会导致所求得的近似根μ*与方程φ(μ)=0的精确根误差很大,从而导致求得的解δ*=-(B+μ*I)-1g不是信赖域子问题(1)的最优解.本文提出的分段折线法则有效避免了初始迭代点μ0选取范围的限制,从而提高了计算效率.数值实验表明,对给定的信赖域半径Δ,当选取的初始迭代点μ0非常接近方程φ(μ)=0的精确根时,分段折线法求得的信赖域子问题的最优解的函数值与牛顿法求得的最优解的函数值误差很小,而且比单折线,双折线,切线单折线的效果要好.2 分段折线法的思想根据信赖域子问题精确求解方法的思想,可以得到最优曲线的参数方程如下定义函数则信赖域子问题(1)的解δ*就是:当自变量μ=0时,解δ*=-B-1g;当μ>0时,则通过求解一元非线性方程f(μ)-Δ=‖ -(B+μI)-1g‖2-Δ=0得到解μ*,此时解δ*=-(B+μ*I)-1g.由文献[3]可知函数f(μ) =‖ -(B+μI)-1g‖2是关于μ的连续单调减函数,而且当μ→+∞时,f(μ)→0.所以,当给定的信赖域半径Δ≥‖B-1g‖2时,令μ=μ0=0,则信赖域子问题(1)的最优解δ*=-B-1g;当给定的信赖域半径Δ<‖B-1g‖2时,对任意给定的步长h > 0,令μ = μk=kh,(k=1,2,3,…),则肯定存在最小的正整数M,使得f(μM)-Δ<0,从而得到了方程f(μ)- Δ =0的有根区间为[0,μM].记节点μk=kh 处的函数值f(μk)为 yk,称(μk,yk)为插值节点(k=0,1,…,M).对节点(μk,yk)(k=0,1,…,M)进行线性插值[8]构造M条直线,每条直线的方程记为Lk(μ)(k=1,…,M).然后把这M条直线连接起来就构成折线y0y1…ykyk+1…yM-1yM,这里记折线y0y1…ykyk+1…yM-1yM为Γ,称Γ为分段折线.最后采用分段折线Γ在插值点(μM-1,yM-1)和(μM,yM)之间利用线性插值所构造的直线函数LM(μ)代替函数f(μ)来求解原方程f(μ)-Δ =0的根μ*,从而求出信赖域子问题(1)的解δ*=-(B+μ*I)-1g.这种做法相当于把非线性程度高的方程f(μ)- Δ =0在每个小区间[μk,μk+1],(k=0,1,…,M-1)上转化为线性方程来求解δ*,进而大大降低了求解的难度,而且具有很好的数值结果.3 分段折线法的几何意义通过上述讨论,可以作出分段折线法的几何图形如下面的图1所示[9]图1 分段折线法的图示4 算法下面给出算法的具体步骤步1给定梯度g,正定矩阵B,信赖域半径Δ,任意步长h.步2 计算f(μ0),μ0=0,令y0=f(μ0).如果y0≤ Δ,取δ*=-B-1g,停止计算.否则令k:=1转步3.步3 计算f(μk),μk=kh,令yk=f(μk).在插值节点(μk-1,yk-1)和(μk,yk)之间用线性插值方法构造直线Lk(μ),形成分段折线Γ.步4 如果yk≤Δ,取δ*=-(B+ μ*I)-1g,停止计算.其中否则,令k:=k+1,转步 3.5 分段折线路径的性质分析定理2 记4中算法中所构造的分段折线Γ为则L(μ)满足(a)L(μ)关于μ为连续单调减函数.(b)对任意给定的信赖域半径Δ<‖-B-1g‖2,则一定存在μM,使得L(μM)-Δ <0. 证明由f(μ)的单调性及L(μ)的构造可知(a)显然成立.再由零点存在定理知(b)成立.证毕.定理2表明,对任意给定的信赖域半径Δ<‖ -B-1g‖2,方程L(μ)-Δ =0的根存在且唯一.6 数值结果对给定的测试函数1和测试函数2的信赖域子问题,对于不同的信赖域半径Δ,取h=0.01,将4中算法利用MATLAB进行了数值实验.并用该算法求得的相关数据分别与牛顿法、单折线法、双折线法和切线单折线法求得的相关数据进行比较,数值结果分别列在表1、表2、表3和表4中,其中Δ 表示信赖域半径,fPDL、fNEW、fSDL、fDDL和 fTDL分别表示分段折线法、牛顿法、单折线法、双折线法和切线单折线法求得的测试函数最优解的函数值.测试函数为从下表1的数值结果可以看出,当信赖域半径Δ≥‖B-1g‖2(见文献[4])时,分段折线法与牛顿法所求得的测试函数最优解的函数值相同;当信赖域半径Δ<‖B-1g‖2时,分段折线法与牛顿法求得的测试函数最优解的函数值的误差非常小.从下表2和表3的数值结果可以看出,当信赖域半径Δ≥‖B-1g‖2时,分段折线法与单折线法和双折线法的效果一样;当信赖域半径Δ<‖B-1g‖2时,分段折线法比单折线法和双折线法要好,而且当信赖域半径Δ接近‖δcp‖2(见文献[4])附近时,分段折线法比单折线法和双折线法要好得多.表1 数值结果1Δ fPDL fNEW fPDL-fNEW (10-4 Function 1 0.4 -10.923 868 028 -10.923 868 045 0.)000 170 000 1.8 -43.701 194 676 -43.701 198 920 0.042 440 000 3.0 -66.220 757 441 -66.220 766 109 0.086 680 000 5.6 -101.259 485 330 -101.259 562 689 0.773 590 000 7.0 -113.387 596 114 -113.387 692 318 0.962 040 000 10.0 -124.900 770 548 -124.900 806 441 0.358 930 000 Δ ≥ 10.31 -125.000 000 000 -125.000 000 000 0.000 000 000002 640 000 1.5 -7.977 595 666 -7.977 603 395 0.077 290 000 3.0 -12.154 479 276 -12.154 561 029 0.817 530 000 4.0 -13.543 248 294 -13.543 632 283 3.839 890 000 6.0 -15.136 592 354 -15.138 043 834 14.514 800 000 10.0 -16.445 491 393 -16.445 884 807 3.934 140 000 Δ ≥ 11.05 -16.500 000 000 -16.500 000 000 0.Function 2 0.5 -3.118 073 116 -3.118 073 380 0.000 000 000从表4的数值结果可以看出,当信赖域半径Δ =‖δzp‖2(见文献[4])时,分段折线法要明显优于切线单折线法;当信赖域半径Δ≥‖B-1g‖2时,分段折线法与切线单折线法求得的最优解的函数值相同;而对于其它给定的信赖域半径Δ分段折线法要稍微好于切线单折线法.表2 数值结果2Δ fPDL fNEW fPDL-fNEW (10-4)010 159 529 1.8 -43.701 194 676 -42.811 688 245 -0.889 506 431 2.83 -63.301 488 609 -60.022 237 630 -3.279 250 979 3.0 -66.220 757 441 -62.352 813 742 -3.867 943 699 5.65 -101.769 855 936 -79.999 882 548 -21.769 973 388 5.66 -101.871 284 560 -89.599 048 124 -12.272 236 436 5.68 -102.073 278 945 -89.911 928 099 -12.161 350 846 7.0 -113.387 596 114 -107.309 781 904 -6.077 814 210 10.0 -124.900 770 548 -124.849 370 263 -0.051 400 285 Δ ≥ 10.31 -125.000 000 000 -125.000 000 000 0.000 000 000 Function 1 0.4 -10.923 868 028 -10.913 708 499 -0.002 860 039 2.0 -9.749 596 265 -9.594 185 643 -0.155 410 622 3.0 -12.154 479 276 -11.524 611 797 -0.629 867 479 3.38 -12.764 916 981 -11.757 080 403 -1.007 836 578 3.49 -12.919 891 411 -11.772 869 502 -1.147 021 909 3.51 -12.947 180 026 -11.773 255 803 -1.173 924 223 3.53 -12.974 311 694 5.205 141 180 -18.179 452 874 4.0 -13.543 248 294 1.886 019 370 -15.429 267 664 6.0 -15.136 592 354 -7.732 689 943 -7.403902 411 9.0 -16.287 271 922 -15.116 755 421 -1.170 516 501 Δ ≥11.05 -16.500 000 000 -16.500 000 000 0.Function 2 0.5 -3.118 073 116 -3.115 213 077 -0.000 000 000表3 数值结果3Δ fPDL fNEW fPDL-fNEW (10-4)010 159 529 1.8 -43.701 194 676 -42.811 688 454 -0.889 506 222 2.83 -63.301 488 609 -60.022 237 630 -3.279 250 979 3.0 -66.220 757 441 -62.352 813 742 -3.867 943 699 5.65 -101.769 855 936 -79.999 882 582 -21.769 973 388 5.66 -101.871 284 560 -80.313 006 513 -21.558 278 047 5.67 -101.972 406 011 -81.262 021 961 -20.710 384 050 6.0 -105.180 136 680 -98.011 341 148 -7.168 795 531 7.34 -115.669 715 725 -114.632 000 000 -1.037 715 725 10.0 -124.900 770 548 -114.632 000 000 -10.268 770 548 Δ ≥ 10.31 -125.000 000 000 -125.000 000 000 -0.000 000 000 Function 1 0.4 -10.923 868 028 -10.913 708 499 -0.002 860 039 1.5 -7.977 595 666 -7.912 305 899 -0.065 289 767 3.0 -12.154 479 276 -11.524 611 797 -0.629 867 479 3.38 -12.764 916 981 -11.757 080 403 -1.007 836 578 3.49 -12.919 891 411 -11.772 869 502 -1.147 021 909 3.51 -12.947 180 026 -11.773 255 803 -1.173 924 223 3.53 -12.974 311 694 -12.023 539 017 -0.950 772 677 4.0 -13.543 248 294 -13.296 578 075 -0.246 670 219 6.0 -15.136 592 354 -14.977 358 622 -0.159 233 732 8.51 -16.174 377 749 -15.633 144 207 -0.541 233 542 9.0 -16.287 271 922 -15.633 396 922 -0.653 875 000 10.0 -16.445 491 393 -15.633 396 922 -0.812 094 471 Δ ≥11.05 -16.500 000 000 -16.500 000 000 -0.Function 2 0.5 -3.118 073 116 -3.115 213 077 -0.000 000 000表4 数值结果4Δ fPDL fNEW fPDL-fNEW (10-4)010 159 529 1.8 -43.701 194 676 -42.811 688 245 -0.889 506 431 2.83 -63.301 488 609 -60.034 008 146-3.267 480 463 4 -81.752 007 732 -80.915 320 937 -0.836 686 795 5 -94.675 250 520 -94.398 311 038 -0.276 939 482 5.66 -101.871 284 560 -101.741 707 624 -0.129 576 936 7.0 -113.387 596 114 -113.365 196 513 -0.022 399 601 10.0 -124.900 770 548 -124.900 805 570 0.000 350 220 Δ ≥ 10.31 -125.000 000 000 -125.000 000 000 0.000 000 000 Function 1 0.4 -10.923 868 028 -10.913 708 499 -0.002 860 039 1.5 -7.977 595 666 -7.912 305 899 -0.065 289 767 3.0 -12.154 479 276 -11.524 611 797 -0.629 867 479 3.38 -12.764 916 981 -11.757 080 403 -1.007 836 578 3.51 -12.947 180 026 -12.272 688 840 -0.674 491 186 4.0 -13.543 248 294 -13.216 785 622 -0.326 462 672 6.0 -15.136 592 354 -15.044 790 399 -0.091 801 955 9.0 -16.287 271 922 -16.276 841 769 -0.010 430 153 10.0 -16.445 491 393 -16.442 443 942 -0.003 047 451 Δ ≥ 11.05 -16.500 000 000 -16.500 000 000 0.Function 2 0.5 -3.118 073 116 -3.115 213 077 -0.000 000 000以上结果表明分段折线法是一种很好的求解信赖域子问题的精确求解方法.其中对于测试函数Function 1,‖B-1g‖2=10.31,‖δcp‖2=5.66,‖δzp‖2=2.83,测试函数Function 2,‖B-1g‖2=11.05,‖δcp‖2=3.51,‖δzp‖2=3.38.参考文献:【相关文献】[1]徐成贤,陈志平,李乃成.近代优化方法[M].北京:科学出版社,2002.[2]李董辉,童小娇,万中.数值最优化算法与理论[M].北京:科学出版社,2010.[3]袁亚湘,孙文瑜.最优化理论与方法[M].北京:科学出版社,2007.[4]赵英良,徐成贤.解信赖域子问题的切线单折线法[J].数值计算与计算机应用,2000,21(1):77-80.[5] CHEN Jun,SUN Wen-yu.Nonmonotone Adaptive Trust Region Algorithms with Inde-finite Dogleg Path for Unconstrained Minimization[J].Northeast Math,2008,24(1):19-30.[6]赵丹.解信赖域子问题的混合折线法[J].徐州师范大学学报:自然科学版,2009,27(3):38-41.[7]王希云,邵安.一种双割线折线法求解信赖域子问题[J].应用数学,2012,25(2):419-424. [8]颜庆津.数值分析[M].北京:北京航空航天大学出版社,2006.[9]任玉杰.数值分析及其MATLAB实现[M].北京:高等教育出版社,2007.。
带回溯线搜索步的双子问题信赖域算法唐明筠【摘要】无约束非线性优化问题广泛存在于工程、科学计算等实际应用领域.本文在信赖域算法的框架下提出无约束子问题,将它与信赖子问题相结合,构造了求解无约束优化问题的双子问题信赖域算法.同时利用信赖域子问题得到的试探步一定是目标函数充分下降方向的性质使得每次求解信赖域子问题之后均能得到使目标函数下降的步.在标准假设下证明了该算法具有全局收敛性和局部二次收敛速度.数值结果表明该算法比传统的信赖域算法速度更快更有效.【期刊名称】《工程数学学报》【年(卷),期】2010(027)004【总页数】10页(P627-636)【关键词】无约束优化;信赖域方法;双子问题;回溯;收敛性【作者】唐明筠【作者单位】中国农业大学理学院,北京100083【正文语种】中文【中图分类】O221.21 引言无约束优化是非线性最优化中的基本问题,它不但具有重要的理论意义,还在金融、工程、科学等许多领域都有着广泛的应用。
求解无约束优化问题的算法很多,信赖域方法就是其中一种非常有效的方法。
信赖域方法兴起于上个世纪七、八十年代,至今已建立了比较完善的框架和理论体系。
但有时候由于信赖域约束的影响,算法的迭代步过于保守。
比如当目标函数在一个比当前信赖域大很多的区域上凸时,可能需要很多步迭代才能使信赖域半径扩大到包含局部极小值点的区域。
为了尽量减少这种情况的产生我们设计了一个新的算法,力图在保持信赖域算法优越的收敛性的同时节省计算量和计算时间。
一方面,通过引入一个不要求信赖域约束的无约束子问题,我们可以求得一个步长为1的牛顿步。
根据模型函数的性质,我们选择求解信赖域子问题或者求解无约束问题。
另一方面,由于信赖域子问题得到的试探步一定是目标函数的充分下降方向,可以将信赖域与线搜索技巧相结合,在试探步失败时进行回溯的线搜索[1]。
2 无约束子问题和双子问题信赖域算法考虑无约束优化问题其中f是Rn上的实值二次连续可微函数,假设它是下方有界的。
一个新的带线性搜索的信赖域算法
蒋萍;王吉安
【期刊名称】《数学理论与应用》
【年(卷),期】2008(28)4
【摘要】本文对于无约束最优化问题提出了一个新的信赖域方法.在该算法中采用的是线性模型,并且当试探步不成功的时候,采用线性搜索,从而减少了计算量.文中证明了在适当的条件下算法的全局收敛性.
【总页数】4页(P76-79)
【作者】蒋萍;王吉安
【作者单位】中南大学数学科学与计算技术学院,长沙,410075;长沙理工大学数学与计算科学学院,长沙,410076
【正文语种】中文
【中图分类】O1
【相关文献】
1.等式约束下一个带线搜索的信赖域算法 [J], 李少娟;景书杰
2.基于简单锥模型的带线搜索的新信赖域算法 [J], 邢治业
3.一类新的带非单调线搜索的信赖域算法 [J], 曾宪廷
4.一个带线搜索的自适应信赖域算法 [J], 苗荣;景书杰
5.一个带不精确线性搜索的记忆梯度法 [J], 朱建伟
因版权原因,仅展示原文概要,查看原文内容请购买。