求解无约束优化的一个新的下降共轭梯度法

合集下载

求解无约束优化问题的共轭梯度法

求解无约束优化问题的共轭梯度法李芳梅，姚瑞哲指导教师：李良摘要：本文主要针对无约束优化问题，利用共轭梯度法（CG方法）求解此类问题，并得出其迭代次数及问题的解。

论文对此种方法给出了具体事例，并对例子进行了matlab软件实现。

1.引言共轭梯度法时介于最速下降法与牛顿法之间的一个方法。

它仅需利用一阶导数信息，但克服了最速下降法收敛慢的缺点，又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点。

共轭梯度法最早是由Hestenes和Stiefel（1952）提出来的，用于解正定系数矩阵的线性方程组。

由于共轭梯度法不需要矩阵存储，且有较快的收敛速度和二次终止性等优点，现已广泛应用与实际问题中。

2.共轭梯度法共轭梯度法是共轭方向法的一种。

所谓共轭方向法就是其所有的搜索方向都是相互共轭的方法。

定义设G是n×n对称正定矩阵，d1，d2是n维非零向量。

如果d1T G d2=0，则称向量d1和d2是G-共轭的，简称共轭的。

设d1，d2，…，d m是R n中任一组非零向量，如果d i T G d j=0 （i≠j），则称d1，d2，…，d m是G-共轭的，简称共轭的。

显然，如果d1，d2，…，d m是共轭的，则它们是线性无关的。

算法（共轭梯度法）步1.初始步：给出x0，ε>0,计算r0=G x0-b，令d0=-r0，k:=0. 步2.如果‖r k‖≤ε，停止.步3.计算αk=r k T r k/d k T Gd k,x k+1=x k+αk d k，r k+1=r k+αk Gd k，βk=r k+1T r k+1/r k T r k，d k+1=-r k+1+βk d k.步4.令k:=k+1，转步2.1.共轭梯度法的matlab实现（数值例子）首先建立如下的m.文件function[x,iter]=cgopt(G,b,x0,max_iter,tol)x=x0;fprintf('\n x0=');fprintf('%10.6f',x0);r=G*x-b;%残差d=-r;for k=1:max_iterif norm(r)<=toliter=k-1;fprintf('\n Algorithm finds a solution!');return endalpha=(r'*r)/(d'*G*d);%收敛速度 xx=x+alpha*d; rr=r+alpha*G*d; beta=(rr'*rr)/(r'*r); d=-rr+beta*d; x=xx; r=rr;fprintf('\n x%d=',k); fprintf('%10.6f',x); enditer=max_iter; return然后建立CG_main 的m.文件，带入数值例子function CG_main()12345123451234512345123451023412923277351432312174351512x x x x x x x x x x x x x x x x x x x x x x x x x ++++=⎧⎪+-+-=-⎪⎪-++-=⎨⎪+++-=-⎪---+=⎪⎩ G=[10 1 2 3 4;1 9 -1 2 -3;2 -1 7 3 -5;3 2 3 12 -1;4 -3 -5 -1 15]; b=[12 -27 14 -17 12]'; x0=[0 0 0 0 0]'; max_iter=1000; tol=1e-6;fprintf('\n');fprintf('Conjugate Gradiant Method:\n'); fprintf('=================\n');[x,iter]=cgopt(G,b,x0,max_iter,tol);fprintf('Iterative number:\n %d\n',iter); fprintf('Solution:\n'); fprintf('%10.6f',x);fprintf('\n================\n');4.结论实际上，共轭梯度法是最速下降法的一种改进。

无约束常用优化方法

步长，作前进（或后退）试探．如试探成功（目
标函数值有所减小），则按步长序列
，加
大步长（注意每次加大步长都是由初始点算起），直
至试探失败（目标函数值比前一次的有所增加）时，
则取其前一次的步长作为沿这个坐标轴方向搜索的最
优步长，并计算出该方向上的终止点，而后以这个终
止点为始点再进行下一坐标轴方向的搜索，并重复上
处
显然是二次函数，并且还是正定二次函数，所以是凸函数且存在唯一全局极小点．为求此极小点，令
即可解得
即
（5.9）
对照基本迭代公式,易知，式（5.9）中的搜索方向
步长因子
方向
是直指点处近似二次函数
的极小点的方向．此时称此方向为从点出发的
Newton方向．从初始点开始，每一轮从当前迭代点出发，
沿Newton方向并取步长的算法称为Newton法．
另外，共轭梯度法不要求精确的直线搜索．但是，不精确的直线搜索可能导致迭代出来的向量不再共轭，从而降低方法的效能．克服的办法是，重设初始点，即把经过 n次迭代得到的Xn作为初始点重新迭代．
五、坐标轮换法
在坐标轮换法中，沿各个坐标轴方向进行一维搜索
时，常选用最优步长法或加速步长法．加速步长法从
初始点出发，沿搜索（坐标轴）方向先取一个较小的
三、共轭方向法
1、概念
通常，我们把从任意点
出发，依次沿某组共轭
方向进行一维搜索的求解最优化问题的方法，叫做共
轭方向法．
2、特点
• 一般地，在n维空间中可以找出n个互相共轭的方向，对于n元正定二次函数，从任意初始点出发，顺次沿这n个共轭方向最多作n 次直线搜索就可以求得目标函数的极小点．这就是共轭方向法的算法形成的基本思想．

求解无约束优化问题的下降谱共轭梯度法

＝＝
—
ＩＩｇＩｌ
，，ｅ，ｋ，Ｉ
口一１Ｙｋ一１
ｌｌｇ一１ｌＩ
其中：ｙ＝ｇ一ｇ；ｌｌ・ｌｌ为欧氏范数。在迭代格式（２）下，ＤＹ方法具有独特的内在
性质：卢：，这一等价式在算法的收敛性
考虑无约束优化问题ｍｉｎ｛）ｌ ∈ Ｒ｝，其中ｆ：Ｒ一为一阶连续可微的非线性目标函数。共
轭梯度法是求解此类大规模非线性优化问题的一类有效方法。自２０世纪６０年代Ｆｌｅｔｃｈｅｒ和Ｒｅｅｖｅｓ提出解决非线性优化问题的共轭梯度法以
Ａｂｓｔｒａｃｔ：Ａｎｅｗｓｐｅｃｔｒａｌｃｏｎｊｕｇａｔｅｇｒａｄｉｅｎｔｍｅｔｈｏｄｉｓｐｒｏｐｏｓｅｄｉｎｔｈｉｓｐａｐｅｒ．Ｔｈｅｍｅｔｈｏｄｉｓｐｒｏｖｅｄ
第２７卷第５期
Ｖｏ１．２７
Ｎｏ．５
重庆理工大学学报（自然科学）
ＪｏｕｎａｒｌｏｆＣｈｏｎｇｑｉｎｇＵｎｉｖｅｒｓｉｔｙｏｆＴｅｃｈｎｏｌｏｇｙ（ＮａｔｕｒａｌＳｃｉｅｎｃｅ）
ｓｕｈｓｓｈｏｗｔｈａｔｔｈｅｎｅｗｍｅｔｈｏｄｗａｓｅｆｆｅｃｔｉｖｅ，ｓｕｉｔａｂｌｅｏｒｆｓｏｌｖｉｎｇｎｏｎｌｉｎｅａｒｕｎｃｏｎｓｔｒａｉｎｅｄｏｐｔｉｍｉｚａｔｉｏｎ

求解大规模无约束优化问题的共轭梯度法

求解大规模无约束优化问题的共轭梯度法共轭梯度法是求解大规模无约束优化问题的一种重要方法，具有快速收敛、少存储、高效率等优势。

本文起首介绍了共轭梯度法的基本原理及算法流程，接着对其收敛性进行了证明。

随后，分析了共轭梯度法在实际应用中存在的一些问题，并提出了相应的解决方案。

在此基础上，本文进一步探讨了共轭梯度法在无约束优化问题中的应用，并通过实例验证了其有效性。

最后，本文对共轭梯度法的进步趋势进行了展望，指出其在大规模数据处理和机器进修领域中可能会有广泛的应用前景。

关键词：共轭梯度法；大规模无约束优化问题；收敛性；实际应用；进步趋势一、引言在科学探究和工程实践中，浩繁问题都可以转化为优化问题，因此优化问题的求解一直是探究热点之一。

对于大规模无约束优化问题，由于其非线性、高维度、复杂性等特点，传统的优化算法往往难以胜任。

共轭梯度法作为一种有效的优化方法，可以在这种状况下发挥重要作用。

二、共轭梯度法的基本原理及算法流程共轭梯度法是求解无约束优化问题的一种迭代法，其基本思想是利用共轭梯度方一直加速迭代过程。

详尽而言，该方法通过一系列的迭代步骤，不息更新查找方向和步长，以期找到最优解。

其迭代流程如下：（1）给出初始点 $x^{(0)}$，初始查找方向 $d^{(0)}$，初始步长 $\alpha^{(0)}$；（2）计算 $x^{(k+1)}=x^{(k)}+\alpha^{(k)}d^{(k)}$；（3）计算 $g^{(k+1)}=\nabla f(x^{(k+1)})$，其中$f(x)$ 是目标函数的梯度；（4）计算 $\beta^{(k+1)}=\frac{\left \| g^{(k+1)}\right \|^2}{\left \| g^{(k)} \right \|^2}$；（5）计算 $d^{(k+1)}=-g^{(k+1)}+\beta^{(k+1)}d^{(k)}$；（6）计算 $\alpha^{(k+1)}=\arg \min_{\alpha \geq 0}f(x^{(k)}+\alpha d^{(k+1)})$；（7）重复步骤（2）至（6），直至达到预定精度或迭代次数上限。

一种无约束优化问题的谱共轭梯度法

ｉｄｓｕｓｄＴｅｇｏａｏｖｒｅｔｓｐｏｅｉｎｘｃｉｅｓａｃｆＷｏｓｉｓｅ．ｈｌｂｌｃｎｅｇｎｒｖｄｗｔｉｅａｔｎｅｒｈｏｃｉｈｌ
Ｋｙｗｒｓｃｎｕａａｉｔｔｏ，ｅａｔｉｅｓａｃｆ，ｌｂｌｏｖｒｅｃｅｏｄ：ｏｊｇｔｇｄｅｈｄｉｘｃｌｅｒｏｅｒｎｍｅｎｎｈＷ０ｇａｃｎｅｇｎｅｏ
度法的迭代公式为：
＋＝Ｉ＋ｌｄ
．－
２００１年，ｉｉＢｒｎ和Ｍｒｎｚ谱梯度法和共轭梯度ｇａｔｅ将ｉ法的思想结合起来，出了一类谱共轭梯度法ｊ提，之后Ｂｒｉｉｎ和Ｍｒｎｚ提出了谱Ｐｒｇａｔｅ又ｉｅｒ轭梯度ｙ共法］。谱共轭梯度法的数值试验和收敛性表明：谱共轭梯度法一般较相应的共轭梯度法有效。非线性无约束优化问题的一般形式为：ｍｎ／）Ｉ ∈Ｒ｝ｉ｛－（度记为ｇｘ．表示（）
［］Ｈ，ＴＲＹＣＧｏａｃｎｅｇｎｅｒｓｌｆｎｕａｒｄｅｔｅｏｓＪ．ＯＡ，９；１２：９－０．５ＵＹＦＳＯＥ．ｌｌｏｖｒｃｅｕｔｏｃｊｇｔｇａｉｎｍｔｄ［］ＪＴ１１７（）３９４５ｂｅｒｏｅｈ９［］万丽．６非精确线性搜索的ｗｏ搜索下的新的共轭梯度法［］广州大学学报：Ｊ．自然科学版，０４，（）２３２５２０３３：－．００［］袁亚湘．７非线性规划数值方法［．Ｍ］上海：上海科技出版社，９３１９．

第三章--无约束最优化的梯度方法

第三章无约束最优化的梯度方法1.最速下降法假定我们已经迭代了k 次，获得了第k 个迭代点k x 。

从k x 出发，显然应沿下降方向进行，由于负梯度方向是最速下降方向，因此沿负梯度方向应该是有利的。

因此，取搜索方向)(k k x f p -∇=。

)(1k k k k x f t x x ∇-=+此时有：0)()(1=∇∇+k T k x f x f如将该方法应用于二次函数c x b Qx x x f T T ++=21)(，则可求出k t 的显式表达式。

)()()())(()(1k k k k k k k k k k x f Q t x f x f Q t b Qx b x f t x Q b Qx x f ∇-∇=∇-+=+∇-=+=∇+0)()()()(=∇∇-∇∇k T k k k T k x f Q x f t x f x fkTk kTk k T k k T k k Qg g g g x f Q x f x f x f t =∇∇∇∇=)()()()( 2.Newton 法适用条件：如果目标函数)(x f 在n R 上具有连续的二阶偏导数，其Hesse 矩阵)(x G 正定。

基本想法：考虑从k x 到1+k x 的迭代过程。

在k x 点处用二次函数来逼近)(x f ，即：))(()(21)()()()()(k k T k k T k k x x x G x x x x x g x f x Q x f --+-+=≈0)())(()(=+-=∇k k k x g x x x G x Q)()(11k k k k x g x G x x x -+-==3.共轭方向法与共轭梯度法 1) 共轭方向法定义1:设Q 是n n ⨯对称正定矩阵。

若n 维空间中非零向量系110,...,,-m p p p 满足0=j T i Qp p ，)(1,...,2,1,j i m j i ≠-= ,则称110,...,,-m p p p 是Q 共轭的，或称110,...,,-m p p p 的方向是Q 共轭方向。

第9讲梯度法和共轭梯度法

{ x( ) }
k
A−a 收敛于 x , 则目标函数值的序列 f ( x( k ) ) 以不大于 A+ a
{
}
2
的收敛比线性的收敛于 f ( x ) . 若令 r = A / a ,则
A − a r −1 = < 1. A + a r +1
i =1 k
生成的子空间。 x 是由 d (1) , d ( 2 ) ,⋯ , d ( k ) 生成的子空间。特别地， k = n时， ( n +1)是当 f ( x )在 R n 上的唯一极小点。上的唯一极小点。
推论
在上述定理条件下，在上述定理条件下，必有
∇f ( x ( k +1) )T d ( i ) = 0 , i = 1 , 2 ,⋯ , k 。
( 2) 设已求得点 x ( k +1) ， ∇f ( x ( k +1) ) ≠ 0 ， g k +1 = ∇f ( x ( k +1) ) ，若令则下一个搜索方向 d ( k +1)按如下方式确定 : 令 d ( k + 1) = − g k + 1 + β k d ( k ) (1)
如何确定 β k？
证明
设存在实数 α 1 , α 2 ,⋯ , α k ，使得
i =1
∑ αid = 0,
i
k
上式两边同时左乘d jT A ，则有
i =1 k
∑ αid
k
jT
Ad i = 0 ,
共轭的向量，因为 d 1 , d 2 ,⋯ , d 是 k 个 A 共轭的向量，所以上式可化简为

求解无约束最优化问题的共轭梯度法

x4= 1.086550 -2.063574 2.792911 -2.101645 0.836386
x5= 1.000000 -2.000000 3.000000 -2.000000 1.000000
Algorithm finds a solution!Iterative number:
5
Solution:
要求：针对给定的实验题目，根据共轭梯度法的算法，能够熟练地使用某种语言上机编程，给出实验结果，注意上机编程的正确性。
二、实验原理
共轭梯度法是介于最速下降法与牛顿法之间的一个方法，它仅需利用一阶导数信息，但克服了最速下降法收敛慢的缺点，又避免了牛顿法需要存储和计算Hesse矩阵并求逆的特点。共轭梯度法具有二次终止性，即对于正定二次函数，在精确线搜索的条件下，方法有限步终止。关于正定二次函数和非二次函数的共轭梯度法详见教材中的算法4.3.4和算法4.3.8。需要写算法
% function
% x0: starting point
% max_iter: maximum number of iterations
% tol: tolerance of the gradient
x=x0;
fprintf('\n x0= ');
fprintf(' %10.6f',x0);
r=G*x-b;
fprintf('============= \n');
[x,iter]=cgopt(G,b,x0,max_iter,tol);
fprintf('Iterative number:\n %d\n',iter);
fprintf('Solution: \n');

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(Fletcher − Re eves [2],1964);
(1.5)
−
g
(g d
−
−
)
g (g − g − ) (Polak − Ribiere − Polyak [3,4],1969); (1.6) g− g− d g g − g (Conjugate D escent [6],1987);
−
y−d
邵阳学院学报（自然科学版） J ournal of S haoyang Univers ity （Natural S cience Edition）
Vol . 7 No . 4 Dec . 2010
求解无约束优化的一个新的下降共轭梯度法
陈玉，米黑龙
（湖南商学院信息学院，湖南长沙 410205 ）
10
邵阳学院学报（自然科学版）
(1.4)
第7卷
=
g (g − g
−
−
)
(g − g
) d
( Hestenses − Stiefel [1],1952);
证明：由于 d = − g , g d ，= − g 用 g 乘公式（1.3 ）
g d =− g
+
满足公式（2.2 ）
(g d
−
−
g g = g− g =
［3］E.Polak, G.Ribiere, Note Sur la convergence de directions conjugees ［J］ . Rev. Francaise Informat Recherche Operationelle 3e Annee., 1969,16:35- 43.
g d =− g
Armijo 线搜索条件下具有全局收敛性.
个新的共轭梯度法，对任意线搜索满足充分下降条件 g d ≤ − (1 −
1 ) g 4µ ,µ >
函数，在不限制 β 的下限值的条件下，标准 Wolf 线搜索具有全局收敛性.
2
β
DY 公式.
下降条件.
则对于任意的 k ≥ 1 ，
Á Á Â Ã Ä Â Â Á Å Æ Á Â Ç È É Á Á Â Â Á Â Â Ã Ä Á Á Â Å Æ Á Â Á Á Á Á Â Á Â Á Â Á Á Á Â Â Á Â Á Á Â Ã Á Â Ã Á Á Á Á Â Â Â Â Â Á ÁÁ Á Â Â
Á Â Á Â Â Ã Ã
陈玉，米黑龙：求解无约束优化的一个新的下降共轭梯度法
11
［4］B.T.Polyak,The conjugate gradient method in extreme problems ［J］ . put.Math.Phys,9(1969),94- 112. method ［J］ .Math.Program., 1977,12:241- 254. Optimization,second ［5］M.J.D.Powell,Restart procedures for the conjugate gradient ［6］R.Fletcher, Practical Method of Optimization ［M ］ .Vol.I:Unconstrained 1987. edit.,Wiley,NewYork,
g s− σ ≤ m ax{1, }. y −s − 1 −σ
1 [g ≤ y −s−
其中 Γ = max g . 因此
∈
D = max{ y − z : y , z ∈ L}.由引理 2.1 得
从 Wolf 条件和（2.11 ）中可得到考虑条件 *，
因此
inf g = 0 . 这与（2.10 ）式矛盾. 因此，lim →∞
参考文献：
［1］M.R.Hestenes, E.Stiefel, Method of conjugate gradient for 409- 436.
Á Á Â Â Â Á Â Á Á Â Ã Â Â Ä Å Æ Á Â
β
∑ =
.J.Res.Nat.Bur.Sand., 1952,49: solving linear equation ［J］［2］R.Fletcher, C.Reeves, Function minimization by conjugate gradients ［J］ put., 1964, （7 ） :149- 154.
问题的提出
考虑下列无约束优化问题
min{ f ( x) : x ∈ R },
为一种重要的方法.共轭梯度法的迭代公式如下： x + = x +t d ）（1.2
d 是搜索方向且 t 是线性搜索的步长，
− g d = − g + β − d if k = 1
−
（1.1 ）
f : R → R 是连续可微函数.
−
)
( Dai − Yuan [8],1999);
(1.9)
≤ =
1 1 [ (y d 2 2µ 1 g 4µ
) g
+ 2 µ( g d − ) g
−
]
(y − d
)
上述公式的全局收敛性已经被很多人研究，
+µ
g
(g d
−
−
)
(y − d
)
）式成立，证毕. 因此（2..2
基于新的 β − 和标准的 Wolf 线搜索，现在给
证明中假设具有下降方向. 为克服此缺陷，最近，有部分文献研究了具有下降方向的共轭梯度法 . Hager 和 Zhang([13])提出了一个新的共轭梯度法，
7 对于任意的线搜索都满足下降条件 g d ≤ − g ， 8
当线搜索满足 Wolf 条件和 β 的下限值被限制时，对一般的非线性函数具有全局收敛性.Zhang， Zhou 和 Li ([15]) 提出了无需线搜索满足下降条件
−
= − (1 − σ ) g − s − .
（2.5 ）
,
(2.2)
由定理 2.1 可得因此
g d ≤ −ω g
.
（2.6 ）
− g d ≥ ωγ
（2.7 ）
第4期
结合（2.5 ） (2.7)有 y − s − ≥ (1− σ )α ωγ . （2.8 ）注意到：g s − = y − s − + g − s − < y − s − .由 Wolf 条件有 g s − ≥ σ g − s − = −σ y − s − + σ g s − −σ y s 由于 σ < 1，故g s− ≥ 1− σ − − 因此
1 . 4 对一般的非线性
度 g 是李普希茨连续的，即：存在常数 L 满足
g ( x ) − g ( y ) ≤ L x − y , ∀x, y ∈ N .
）（2.3
引理 2.1
[13,14]
若条件 * （iii ）成立，线搜索满足
1 −δ g d . L d
Wolf 搜索条件，则
算法及其全局收敛性
1 y −d (g − µ g
α ≥
首先，给出一个新的非线性共轭梯度法公式
−
−
=
y −d
−
d − ) g ,µ >
1 4
(2.1)
定理 2.2
若 {x } 是上述算法产生的点列且满足条
件 *，则该算法在有限步终止或产生的点列满足
lim inf g = 0 （2.4 ） .
→∞
显然，若使用精确线性搜索，上述公式就是下面定理说明新公式对任意线搜索具有充分定理 2.1 在方法（1.2 ）和(1.3)中假设 β
（2.9 ）
−
+µ g
g s
［7］Y.Liu, C.Sorey,Efficient generalized conjugate gradient al. J.Optim.Theor.Appl., 1992,69: gorithms,Part I: theory ［J］ 129- 137.
1 4
出一个新的下降共轭梯度算法：
步 0 选 x ∈ R , µ > ,0 < δ ≤ σ < 1. 计算 f ( x ), g ( x ) .
令 d = −g , k = 1
则终止，否则转步 2. 步 1 假如 g = 0 ，步 2 计算满足 Wolf 条件的步长，令
（2.1 ）计算 β ，利用（1.3 ）式计算 d k +1 . 步 3 利用式步 4 令 k = k +1 ，转步 1.
g d ≤ −(1 − 1 ) g 4µ
−
证明假设 g ≠ 0, ∀k
γ = inf{ g : k ≥ 0}, s
y−s
−
由 Wolf 条件可得
−
> 0. 定义 1 = α − d − ,1 − = ω . 因此 γ > 0 4µ lim inf g
→∞
= β −，
= (g − g − ) s
−
≥ (σ −1) g − s
CHEN Yu, MI Hei- long
(School of Information, Hunan University of Commerce, Changsha, Hunan, 410205)
Abstr act: In this paper, based on the Dai- Yuan conjugate gradient method ,a new nonlinear conjugate gradient method is proposed for the unconstrained optimization. For any line search, our scheme satisfies the sufficient descent condition .