搜索下的记忆梯度法及其收敛性

合集下载

一类新的记忆梯度法及其收敛性

第４９卷
２１００年
第５期
９月
中山大学学报（自然科学版）
ＡＴＳＩＮＩＲＭＮＴＲＬＵＵＩＥＳＴＴＳＳＮＡＳＮＣＡＣＥＴＡＵＡＵＡＩＭＮＶＲＩＡＩＵＹＴＥＩ
Ｖｏ．Ｎｏ５１４９．Ｓｐ．２０ｅ０１
ＡｗｅｏｙＧｒｄｅｅｈｏｎｄＩｓＣｏｖｒｅｅＮｅＭｍｒａｉｎｔＭｔｄａｔｎｅｇｎｃ
ＴＮＧＪｎｙｎＤＯＡｉｇｏｇ一，ＮＧＬｉ
（．ｏｅｅｏｔｅａｉｎｆｒａｉｃｎｅＸｎａｇＮｒａＵｉｒｔ，ｉａｇ６００，ｈｎ；１ＣｌｇｆｈｍｔｓｄＩｏｍｔｎＳｉｃ，ｉｙｎｏｌｎｖｓｙＸｎｎ４０ＣｉａｌＭａｃａｎｏｅｍｅｉｙ４
ｓｏｔｔｔｅｎｗｅｈｄｉｆｃｅｔｉｒｃｉａｏｈｗｈａｈｅｍｔｏＳｅｆｉｎｎｐａｔｃｌｃｍｐｕａｉｎｉｔｔｏ．Ｋｅｙｗｏｒｄｓ：ｕｃｎｔａｎｄｏｔｍｉａｉｎ；ｍｅｒａｉｎｅｈｄ；ｇｏｌｃｎｅｇｎｃｎｏｓｒｉｅｐｉｚｔｏｍｏｙｇｄｅｔｍｔｏｒｌｂａｏｖｒｅｅ；ｌｎａｏｅ — ｉｅｒｃｎｖｒ
ｇｎｅｒｔｅｃａｅ
考虑无约束优化问题
ｍｉ－） ∈ Ｒｎ厂，（（）１
方法之一，它在每步迭代中不需计算和存储矩阵，算法简单，其搜索方向的基本结构为

Armijo搜索下的记忆梯度法及其收敛性

维普资讯
第１期
张祖华，：Ａｒｊ搜索下的记忆梯度法及其收敛性等ｍｉｏ
２５
信息，加了参数选择的自由度，增由此可以构造稳定的收敛均匀的算法潮，于求解大规模优化问题也对是一种有效的算法。但是，记忆步数越多，则计算公式越复杂。在实际问题中，忆二步到三步比较合适。记
Ｃｈｉｎ）
Ａｂｓｒｃ：ｎｔｓｐｐｒｗｅｐｒｓｎｔａｎｗｍｏｙｇａｉｎｔｍｅｈｏｏｒｓｌｎｇｕｏｔａｎｄｏｐｉｚｔｏｎｔａｔＩｈｉａｅｅｅｅｍｅｒｒｄｅｔｄｆｏｖｉｎｃｎｓｒｉｅｔｍｉａｉ
于求解大规模无约束优化问题．忆梯度法也具有类似的性质。舟。记］
记忆梯度算法和超记忆梯度算法实际上是共轭梯度法的一推广 பைடு நூலகம் 可更充分地利用前面迭代点的它
收稿日期：０６０ — ４２０－９０
作者简介：张祖华（９４）男，东济南人，究生；贞军（９３）男，东新泰人，授，要研究方向：筹学。１７一．山研时１６一，山教主运
Ａｒｊｅｒｈｒｌｎｄｈｒｅｏｏｏａａｔｒ．ＴｈｒｆｒｔｉｕｔｂｅｔｏｖａｇｃｌｍｉｓａｃｕｅａｄａｄｔｅｆｅｄｍｆｓｍｅｐｒｍｅｅｓｏｅｅｏｅｉｓｓｉａｌＯｓｌｅｌｒｅｓａｅ

Wolfe线性搜索下的超记忆梯度法及其收敛性

Ｗｏｆ性搜索下的超记忆梯度法及其收敛性ｌｅ线
汤京永，董。丽
（．信阳师范学院数学与信息科学学院，１河南信阳４４０；．上海交通大学数学系，６００２上海２０４）０２０
摘要：究无约束优化问题，给出了一种新的超记忆梯度法，在较弱条件下证明了算法具有研
Ｘ＋１＝Ｘｄ，＋（．）１２
这里ｄ为，Ｘ在Ｘ点的下降方向，Ｌ为＿Ｘ沿该方向的搜索步长．对和ｄ的不同选择构成了不（）０厂）（
同的迭代法Ｊ．对于ｄ，可采用ｄ＝一此种算法称为最速下降法．此类算法虽然结构简单，每次迭代的计ｇ，
收稿日期：０９０－６２０－６２．
作者简介：汤京永（９９）男，汉族，士，１７一，博讲师，从事非线性规划的研究，Ｅｍａ：ａｇｎ－ｏｇｏｃｒ． — ｉｔｎｊｇｙｎ＠ｔｏｌｉｍ．ｎ
基金项目：国家自然科学基金（准号：０７１９、山东省自然科学基金（批１５１０）批准号：２０Ａ１和信阳师范学院青年科研基金Ｙ０８０）
全局收敛性和线性收敛速率．数值试验表明新算法是有效的．关键词：无约束优化；记忆梯度法；全局收敛性；线性收敛速率超
中图分类号：０２．２１２文献标志码：Ａ文章编号：６１５８（００）３０９－５１７．４９２１０－３６０

梯度法

A1=A0+△A0 推广到一般的k+1次构造矩阵
Ak+1=Ak+△Ak
矩阵序列的基本迭代式
△Ak称为校正矩阵
拟牛顿条件
设F（x）为一般形式n阶的目标函数，并具有连续的一、二阶偏导。在点处的二次泰勒近似展开
该近似二次函数的梯度是
沿g(k)方向一维搜索，
求最优步长(k)。
x(k+1)= x(k)- (k) g(k)
出口
例 8-4 用最速下降法求解下列问题
min f (x) 2x12 x22 ，
给定初始点 x(1) (1, 1)T , 1 ．
10
解目标函数 f (x) 的梯度及 x(1) 处的最速下降方向为
f(xk+1)
>
阻尼牛顿法
对原始牛顿法的改进
为解决原始牛顿法的不足，加入搜索步长(k)
因此，迭代公式变为：
x (k+1) = x (k) - (k) Hk-1gk 这就是阻尼牛顿法的迭代公式，最优步长(k)也称
为阻尼因子，是沿牛顿方向一维搜索得到的最优步长。
牛顿法算法步骤
⑴任选初始点，给定精度ε，置k←0 ⑵计算点的梯度矢量及其模
(x)=
x (k)
gk+
Hkx=0
得 x (k+1) = x (k) - Hk-1gk
即牛顿法迭代公式，方向- Hk-1gk称为牛顿方向
三、原始牛顿法的特点
若用原始牛顿法求某二次目标函数的最优解，则构造的逼近函数与原目标函数是完全相同的二次式，其等值线完全重合，故从任一点出发，一定可以一次达到目标函数的极小点。
二、确k定的方确法定自学，不作要求。记住

三项记忆梯度法及其投影算法的收敛性分析

Ｓｂｅｔａｓｆａｉｎ（ＢＴ３４－２．ｕｊｃｓｉｃｔＣｌｉｏＧ／１７５９）１０７１４
三项记忆梯度法及其投影算法的收敛性分析
李梅霞ｔ刘茜｛孙清滢
摘要对于无约束优化问题，出了一类新的三项记忆梯度算法．这类算法是在参数提
ｐｏｅｎｅｏａｓｍｐｉｎｏｈｅｈｎｐｕｏｃｎｅｉｙａｄｃｎｉｕｕｉｅｅｔａｉｔｒｖｕｄｒｎｓｕｄｔｏｔｒｔａｓｄ－ｏｖｘｔｏｔｎｏｓｄｆｒｎｉｂｌｙｅｎｉ
维普资讯
２００７年３月
Ｍａｃ２０ｒｈ，０７
运筹学学报
ｏＲＴＲＡＡＴＩＮＳＮＳＣＯ
第ｌ１卷第１期
Ｖｂ．１Ｎｏ１Ｉ１．
ＣｏｎｅｇｎｃｏｒｙｈｅＴｈｒｅｔｒｅｏｙｖｒｅｅＰｒｐｅｔｏｆｔｅ－ｅｍＭｍｒ
￣ｐｒｍｅｔｏｐｉｄＭａｈｍａｉ，ＵｎｖｒｉｆＰｔｏｅｍ，ＤｏｇｉｇＳａｄｎ５０１ＤｅａｔｎｆＡｐｌｔｅｔｃｅｓｉｅｓｙｏｅｒｌｕｔｎｙｎｈｎｏｇ２７６，Ｃｈｎ；石ｉａ
ＧｒｄｅｔＭｅｈｄａｄＩｓＰｒｊｃｉｎＭｅｈｄａｉｎｔｏｎｔｏｅｔｏｔｏ
ＬｉｉｔＬｕＱｉ＊ＳｎＱｉｇｉｇ§ ｉｘａＭｅｉａｕｎｙｎｎ
ＡｂｓｒｃＩｈｓｐａｅ，ｗｅｐｒｐｓｅｋｎｆｔｒｅｔｒｅｒｒｄｅｔｔａｔｎｔｉｐｒｏｏｅａｎｗｉｄｏｈｅ－ｅｍｍｍｏｙｇａｉｎ

无约束优化的超记忆梯度法及其全局收敛性

第ｌ期
２００８年１月
基础理论研究・
无约束优化的超记忆梯度法及其全局收敛性
汤京永，金华，秦董
摘
丽
（阳师范学院数学与信息科学学院，信河南信阳４４０）６００
要：出一类新的求解无约束优化问题的超记忆梯度法，提并在较弱条件下证明了算法的全局收敛性
：
１假设与算法
假设
（：（在水平集＝｛ ∈Ｒｌ（Ｈ），），）≤，。｝（）上
有下界．
（－（在水平集上连续可微，（）Ｈ），）ｇｘ在上一致
连续的．
ｆ，＝；
Ｌ＋卢ｄ一， —ｇ１ｋ≥ ２，
其中，）Ｒ一Ｒ为连续可微函数，（为其梯度．求解（：ｇ）（ＰＵ）的算法主要是迭代法，其一般形式为
＋＝ｌ Байду номын сангаас Ｏ，ｔｄ
其中Ｏ是搜索步长，ｔｄ为搜索方向．若为当前迭代点，则记ｇ）ｇ（为）为＾ ’ ）为厂．）～（］ｇｘ）对Ｏ和ｄ的不同选择就构成了不同的迭代算法，ｔ如最速下降法（＝一ｇ）牛顿法（＝一［ｄ，ｄ等，中一个著名的方法叫共轭梯度法，其其搜索方向为
步１若ｌｌ：ｌｌ＝０则停止迭代；ｇ，否则，转步２；步２计算ｄ，：使其满足
维普资讯
信阳师范学院学报：自然科学版第２卷ｌ
・

Armijo线搜索下一个杂交共轭梯度法及其强收敛性

（１．１）
（１．２）
其中＝ｖｆ（ｘ），是沿搜索方向执行某种线搜索产生的步长，其中为方向调控参数，不同的卢对应不同的共轭梯度法，著名的计算公式。卜副有：
卢：
丝，ＪＪｇｋ一１ＪＪ
［摘要］讨论无约束优化问题，提出了一个新的杂交共轭梯度法公式．基于新公式，采用Ａｒｍ１ｊｏ型线搜索条件确定步长，建立了一个杂交共轭梯度算法，在常规假设条件下证明了新算法的下降性和强收敛．［关键词］无约束优化；共轭梯度法；Ａｒｍｉｊｏ￣＃＃Ｌ索；强收敛性
出了一个杂交共轭梯度法公式：
ａｘ
—
｛ｏ，
一
（ｇ一ｇ一）
，
｝
【收稿日期】２０１３ — ０３ — ０１［基金项目】国家自然科学基金（１１２７１０８６），广西自然科学基金（２０１１ＧＸＮＳＦＤＯ１８０２２），广西人才小高地建设运筹学与最优化控制创新团队联合资助。［作者简介】韩麟，广西大学数学与信息科学学院研究生。通讯作者：简金宝（１９６４￣），男，玉林师范学院教授，博士，博士生导师，主要研究方向：最优化理论与算法。Ｅ－ｍａｉ１：ｊｉａｎｊｂ＠ｇｘｕ．ｅｄｕ．ＣＦＩ。
其中为ｇ与ｇ ¨的夹角，Ｏ＇ｋ￣ｇ与以一的夹角．显然，当目标函数为严格凸且在精确线搜索条件下，公式

Wolfe线性搜索下的超记忆梯度法及其收敛性

Wolfe线性搜索下的超记忆梯度法及其收敛性汤京永;董丽【摘要】研究无约束优化问题, 给出了一种新的超记忆梯度法, 在较弱条件下证明了算法具有全局收敛性和线性收敛速率. 数值试验表明新算法是有效的.【期刊名称】《吉林大学学报（理学版）》【年(卷),期】2010(048)003【总页数】5页(P396-400)【关键词】无约束优化;超记忆梯度法;全局收敛性;线性收敛速率【作者】汤京永;董丽【作者单位】信阳师范学院,数学与信息科学学院,河南,信阳,464000;上海交通大学,数学系,上海,200240;信阳师范学院,数学与信息科学学院,河南,信阳,464000【正文语种】中文【中图分类】O221.21 引言考虑无约束优化问题min f(x), x∈Rn,(1.1)其中: Rn是n维欧氏空间; f(x): Rn→R为连续可微函数. 本文设f(x)的梯度函数为g(x), 若xk为当前迭代点, 则g(xk)简记为gk, f(xk)简记为fk, f(x*)简记为f *.求解问题(1.1)的算法主要是迭代法, 基本格式为xk+1=xk+αkdk,(1.2)这里dk为f(x)在xk点的下降方向, αk为f(x)沿该方向的搜索步长. 对αk和dk的不同选择构成了不同的迭代法[1].对于dk, 可采用dk=-gk, 此种算法称为最速下降法[1]. 此类算法虽然结构简单, 每次迭代的计算量小, 但收敛速度慢且容易产生拉锯现象. 若f(x)二次连续可微, 则可采用dk=-Hkgk, 其中Hk为▽2f(xk)-1或▽2f(xk)-1的某种近似, 此种算法称为拟牛顿法[1]. 拟牛顿法虽然在一定条件下有较快的收敛速度, 但每次迭代时都需要计算和存储矩阵, 不适于求解大型优化问题. 上述两种算法在每步迭代时仅利用当前点的信息产生下一个迭代点, 而忽略了前面迭代点的信息, 这在算法设计中是一种信息浪费.共轭梯度法在每次迭代时通过记忆前一步的迭代信息产生下一个迭代点, 搜索方向的基本结构为其中βk是一个参数, 当βk用不同的公式时即得到了不同的共轭梯度法[1-2]. 此类算法有效避免了计算和存储矩阵, 是求解大型优化问题的有效方法之一, 但很多共轭梯度法不具有全局收敛性[2-3].为了充分利用前面迭代点的信息, 以改进算法的性能, 保证算法具有全局收敛性, 文献[4]提出了记忆梯度法[4]. 记忆梯度法是共轭梯度法的推广, 在每步迭代时同样不需计算和存储矩阵, 算法简单, 因而适于求解大型优化问题, 且与共轭梯度法相比, 此类算法增加了参数选择的自由度, 更有利于构造稳定的快速收敛算法[5-7]. 但很多记忆梯度法仅利用前一步的迭代信息, 同样忽略了前面迭代点的信息. 文献[8]提出一种超记忆梯度法, 算法在每步都能充分利用前面多步迭代点的信息, 并且具有全局收敛性.本文提出一种新的求解无约束优化问题的超记忆梯度法, 算法在每步迭代时都充分利用前面多步迭代点的信息产生下降方向, 采用Wolfe线性搜索产生步长, 在较弱条件下证明了算法具有全局收敛性. 当目标函数为一致凸函数时, 证明了算法具有线性收敛速率. 数值试验表明算法是有效的.2 超记忆梯度法及其性质假设:(H1) 目标函数f(x)在水平集L0={x∈Rn|f(x) ≤f(x1)}上有下界;(H2) 梯度函数g(x)在包含L0的开凸集B上一致连续;(H3) f(x)是二次连续可微的一致凸函数.算法2.1 ρ∈(0,1), 0<σ1<σ2<1, m>0是一个整数, x1∈Rn. 令k ∶=1.步骤如下:(1) 若‖gk‖=0, 则停止迭代; 否则, 转(2);(2) 计算dk, 使其满足:(2.1)其中(2.2)(3) xk+1=xk+αkdk, 其中αk由Wolfe线性搜索确定, 即要求αk满足:(2.3)(2.4)(4) 令k ∶=k+1, 转(1).引理2.1 对任意的k≥1, 有注2.1 由引理2.1及式(2.3)可知{fk}单调不增, 即fk≤fk-1≤…≤f1, 从而知xk∈L0.引理2.2 对任意的k≥1, 有‖dk‖≤(1+ρ)‖gk‖.3 算法的全局收敛性定理3.1 假设(H1)和(H2)成立, {xk}是由新算法产生的迭代点列, 则证明: 首先证明{‖dk‖}有界. 由引理2.2知, 只需证明{‖gk‖}有界. 假设{‖gk‖}无界, 则存在无穷子列N⊂{1,2,…,}, 使得‖gk‖→+∞, k∈N, k→+∞.(3.1)由式(2.3)和引理2.2知(3.2)因为{fk}单调不增且有下界, 故知{fk}有极限, 从而由式(3.2)知(3.3)因此αk‖gk‖2→ 0 (k∈N, k→+∞), 于是由式(3.1)可知αk‖gk‖→ 0 (k∈N,k→+∞), 进而再由引理2.2可得αk‖dk‖→0, k∈N, k→+∞.(3.4)由式(2.4)、引理2.1及引理2.2可得(3.5)从而由(H2)和式(3.4)可得‖gk‖→ 0 (k∈N, k→+∞), 这与式(3.1)矛盾. 因此, {‖gk‖}有界.假设则存在无穷子列K⊂{1,2,…}及υ>0, 使得‖gk‖>, ∀k∈K.(3.6)由式(3.3)和(3.6)知,(3.7)从而知αk→ 0 (k∈K, k→+∞). 因为{‖dk‖}有界, 故知式(3.4)成立. 又由式(3.5)及假设(H2)和式(3.4)知‖gk‖→ 0 (k∈K, k→+∞), 这与式(3.6)矛盾. 因此,4 算法的线性收敛速率引理4.1[5] 若假设(H3)成立, 则假设(H1)和(H2)成立, f(x)在Rn上有唯一的极小点x*, 且存在M≥m>0, 使得:(4.1)m‖x-x*‖≤‖g(x)‖≤M‖x-x*‖.(4.2)引理4.2[5] 若假设(H3)成立, 则g(x)在水平集L0上Lipschitz连续, 即存在常数L>0, 使得‖g(x)-g(y)‖≤L‖x-y‖, ∀x,y∈L0.定理4.1 若假设(H3)成立, {xk}是由算法2.1产生的无穷点列, 则{xk}至少线性收敛于x*.证明: 由式(2.3)和引理2.1可知(4.3)又由式(3.5)知(4.4)从而由引理4.2可得于是由引理2.2知(4.5)又由式(4.3)和(4.5)可得(4.6)令则易知0<ω<1/2, 从而由式(4.6)知fk-fk+1≥ω‖gk‖2.余下的证明类似于文献[5]中的定理3, 故略.5 数值试验为进一步检验算法2.1的实用效果, 选取两个算例对本文算法进行数值试验, 并与Wolfe搜索下的共轭梯度法和最速下降法进行比较. 用IT表示达到相应精度时算法的迭代次数, fk表示迭代结束时的目标函数值, NA表示本文提出的新算法, 用FR,PRP,HS,CD和DY分别表示FR,PRP,HS,CD及DY共轭梯度法[1-2], SM表示最速下降法. 参数取值为ρ=0.299, σ1=0.38, σ2=0.85. 计算结果列于表1～表3. 例5.1 f(x)=(x1-x2)2+(x2+x3-2)2+(x4-1)2+(x5-1)2,x0=(-2,2,-2,2,2)T, x*=(1,1,1,1,1)T, f *=0.例5.2 扩展Beale函数:其中n=40.例5.3 例5.2中取n=80.表1 精度为|fk-f *|≤10-8,10-9,10-10时例5.1的计算结果Table 1 Results of example 5.1 with precision requirements |fk-f *|≤10-8,10-9,10-10方法ITfkNA8,9,91.531 2×10-9, 7.188 6×10-11, 7.188 6×10-11FR12,13,158.254 4×10-9, 9.037 9×10-10, 2.920 9×10-11PRP10,11,123.531 8×10-9, 1.4309×10-10, 8.863 7×10-11HS19,20,212.685 8×10-9, 2.552 0×10-10, 1.2343×10-11CD12,13,141.442 0×10-9, 1.403 5×10-10, 6.294 6×10-11DY12,14,149.175 2×10-9, 8.899 0×10-11, 8.899 0×10-11SM14,15,163.465 8×10-9, 5.180 8×10-10, 6.871 2×10-11表2 精度为|fk-f *|≤10-4,10-5,10-6时例5.2的计算结果Table 2 Results of example 5.2 with precision requirements |fk-f *|≤10-4,10-5,10-6方法ITfkNA13,15,165.902 6×10-5, 2.291 6×10-6, 2.108 7×10-7FR21,26,275.054 4×10-5, 2.864 4×10-6, 6.378 0×10-7PRP14,15,171.672 2×10-5, 5.0709×10-6, 8.909 3×10-7HS83,143,2036.925 6×10-5, 9.915 7×10-6, 9.9476×10-7CD16,18,22 6.059 7×10-5, 8.275 8×10-6, 7.110 6×10-7DY22,25,264.830 1×10-5, 1.036 3×10-6, 4.843 8×10-7SM98,128,1728.586 6×10-5, 9.226 2×10-6, 8.990 0×10-7表3 精度为|fk-f *|≤10-4,10-5,10-6时例5.3的计算结果Table 3 Results of example 5.3 with precision requirements |fk-f *|≤10-4,10-5,10-6方法ITfkNA14,15,164.801 9×10-5, 4.583 2×10-6, 4.217 3×10-7FR22,26,285.609 5×10-5, 5.728 7×10-6, 5.096 6×10-7PRP14,16,193.344 5×10-5, 3.2499×10-6, 6.644 6×10-7HS94,162,2249.834 6×10-5, 9.961 2×10-6, 9.9260×10-7CD17,19,249.915 0×10-5, 8.436 0×10-6, 2.212 7×10-7DY22,25,269.660 2×10-5, 2.072 5×10-6, 9.687 6×10-7SM103,139,1839.330 6×10-5, 9.941 6×10-6, 9.897 4×10-7由表1～表3可见, 本文提出的新算法不但理论上具有全局收敛性和线性收敛速率, 而且数值效果较好, 特别在要求精度较高和规模较大时, 新算法具有更好的效果.参考文献【相关文献】[1] 袁亚湘, 孙文瑜. 最优化理论与方法 [M]. 北京: 科学出版社, 1997.[2] 戴或虹, 袁亚湘. 非线性共轭梯度法 [M]. 上海: 上海科学技术出版社, 2000.[3] MA Ming-juan, HUANG Qing-dao, DENG Jian. Conjugate Gradient Method with the Inexact Line Search [J]. Journal of Jilin University: Science Edition, 2009, 47(3): 505-506. (马明娟, 黄庆道, 邓键. 非精确条件下的共轭梯度方法 [J]. 吉林大学学报: 理学版, 2009, 47(3): 505-506.)[4] Miele A, Cantrell J W. Study on a Memory Gradient Method for the Minimization of Functions [J]. JOTA, 1969, 3(6): 459-470.[5] TANG Jing-yong, SHI Zhen-jun. A Class of Global Convergent Memory Gradient Methods and Its Linear Convergence Rate [J]. Advances in Mathematics, 2007, 36(1): 67-75. (汤京永, 时贞军. 一类全局收敛的记忆梯度法及其线性收敛性 [J]. 数学进展, 2007, 36(1): 67-75.)[6] TANG Jing-yong, DONG Li, GUO Shu-li. A New Memory Gradient Method with Curve Search Rule [J]. Journal of Xinyang Normal University: Natural Science Edition, 2009, 22(2): 179-182. (汤京永, 董丽, 郭淑利. 一类新的曲线搜索下的记忆梯度法 [J]. 信阳师范学院学报: 自然科学版, 2009, 22(2): 179-182.)[7] TANG Jing-yong, DONG Li, ZHANG Xiu-jun. A New Class of Memory Gradient Methods with Wolfe Line Search [J]. Journal of Shandong University: Natural Science, 2009, 44(7): 33-37. (汤京永, 董丽, 张秀军. 一类新的Wolfe线性搜索下的记忆梯度法 [J]. 山东大学学报: 理学版, 2009, 44(7): 33-37.)[8] SHI Zhen-jun. A New Super-Memory Gradient Method for Unconstrained Optimization[J]. Advances in Mathematics, 2006, 35(3): 265-274.。

一类新的记忆梯度法

ｃｖｒｅｃａｅｏｎｅｇｎｅｒｔ
１引言
考虑无约束最优化问题
ｍｉ｛（）ｎｆｘｌｚ∈ Ｒ｝，（１）
其中ｄ为厂（在ｚ）点的搜索方向，ａ为ｆ（）ｚ沿
该方向的搜索步长．对ａ和ｄ的不同选择就构成了不同的迭代法．
果表明该方法是有效的．
关键词：无约束优化；忆梯度法；局收敛性；线性收敛速率记全中图分类号：Ｏ２１２．２文献标识码：Ａ文章编号：１０ — ８２１）４０３ — ５０１９８Ｘ（０００ — ０２０
ＡｂｔａｔＡｎｅｓｒｃ：ｗｃａｓｆｌｓｏｍｅｒｇｒｄｉｎｔｍｏｙａｅｍｅｈｏｆｒｎｃｓｒｉｄｔｄｓｏｕｏｎｔａｎｅｏｐｉｉａｉｎｔｍｚｔｏｐｒｂｌｍｔｄＩｓｇｏａｏｖｒｅｃｎｉｅｒｃｎｅｇｎｅｒｔｒｒｖｄｕｄｒｓｍｅｍｉｏｄｔｎ．Ｔｈｒｓｎｅ．ｔｌｂｌｎｅｇｎｅａｄｌａｏｖｒｅｃａｅａｅｐｏｅｎｅｏｌｃｎｉｉｓｃｎｄｏｅｍｅｈｄｐｓｅｓｓｔｅｓｆｉｉｎｅｃｎｒｐｒｙｗｉｈｕｎｉｅｓａｃｔｏｏｓｓｅｈｕｆｅｔｄｓｅｔｐｏｅｔｔｏｔａｙｌｅｒｈ，ａｄｔｅｓａｃｉｅｔｏｌｂｃｎｎｈｅｒｈｄｒｃｉｎｗｉｅｔｉｒｓｅｉｎａｔｍａｉａｌ．Ｍｏｅｖｒｔｉｍｅｈｄｉｈｒｔｎｉｐｒａｔｐｏｅｔｆｔｅｗｅｌｋｏｎａｔｕｔｒｇｏｕｏｔｃｌｙｒｏｅｈｓｔｏｎｅｉｓａｍｏｔｎｒｐｒｙｏｈｌｎｗｎ — Ｐｏａ — ｂｅｅＰｌａＰｌｋＲｉｉｉ— ｏｙｋ（ＲＰ）ｍｅｈｄ：ｔｅｔｎｅｃｏｔｒｏｒｓｔｅｓｅｐｓｅｃｎｉｅｔｏｆａｓｌｔｏｈｅｄｎｙｔｕｎｔｗａｄｈｔｅｅｔｄｓｅｔｄｒｃｉｎｉｍａｌｓｅｓｇｎｒｔｄ，ｐｅｅｔｇａｅｕｎｅｏｉｙｓｅｓｆｏｈｐｅｉｇＰｒｌｎｒｕｒｃｌｅｕｔｔｐｉｅｅａｅｒｖｎｉｓｑｅｃｆｔｎｔｐｒｍａｐｎｎ．ｎｅｉａｙｎｍｅｉａｒｓｌｍｉ

Armijo型线搜索下一种修正HS共轭梯度法的全局收敛性

４全局收敛性
ｉ￣ｌ设，Ｊｌｄ由算法１产生，则
（）８（）９
！
１ｏ＝．
０ｏ）
证明由式（知函数值序列｛（）是递减序列．７）厂｝从式（可得７）
∑ Ｉｏｆｏ＜．
ｋＯ＝
又由假设条件函数厂有下界，则我们有
（７）
３本文假设
（１Ｈ）水习集＝｛己ｘ∈Ｒ。）【）有界；／（ ≤ ｝ｘ
（２Ｈ）目标函数／连续可微有下界，且其梯度满足Ｌｐｈｚｉｉ条件，ｃｔ即存在—个常数ＬＯ使得＞，
Ｉｘ－（ｆ￡ — ，ｘ ∈ ．ｇ）ｇｙ ≤ ＪＹＶ，Ｑ（）Ｙ由设件知存一量０使（ｌ，ｘＱ假条可，在常＞，得１Ｖ ∈ ．）
件下，明了此修正Ｈ证ｓ算法具有全局收敛性．最后对算法进行了数值试验，结果表明该算法具有良好的收敛性和有效试验
性，适合求解大规模无约束优化问题．尤其
关键词：修正ＨＳ算法，ｒｏ型线搜索，ＡｍＵ全局收敛性中图分类号：２４０２文献标识码：Ａ
Ｔ
，
（ｃ４ ’
㈣
其中
Ｔ
，
由式（）得５和）
ｇ＝Ｉ－Ｔｌｇ
因此搜索方向ｄ具有充分下降性．
算法１
（６
步骤ｌ给定起始点，参数＞０Ｐ∈ Ｏ１， ∈（，，，（，Ｏ））１＞０令ｋ：，＝０．
步２若Ｊ，停；则步３骤则止否转骤．Ｊ ≤

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第16卷　第1期运　筹　与　管　理Vol.16,No.12001年2月OPERA TIONS RESEARCH AND MANA GEM EN T SCIENCEFeb.2007收稿日期:2006209204作者简介:张祖华(19742),男,山东济南人,研究生;时贞军(19632),男,山东新泰人,教授,主要研究方向:运筹学。

Armijo 搜索下的记忆梯度法及其收敛性张祖华,　时贞军(曲阜师范大学运筹与管理学院,山东日照276826)摘　要:本文提出一种新的无约束优化记忆梯度算法,在Armijo 搜索下,该算法在每步迭代时利用了前面迭代点的信息,增加了参数选择的自由度,适于求解大规模无约束优化问题。

分析了算法的全局收敛性。

关键词:无约束优化;记忆梯度法;Armijo 搜索;全局收敛性中图分类号:O221.2 文章标识码:A 文章编号:100723221(2007)0120024204Convergence of New Memory Gradient Method with Armijo SearchZHAN G Zu 2hua ,SH I Zhen 2jun(College of O perations Research and M anagement ,Qu f u N orm al U ni versit y ,Riz hao 278626,Chi na )Abstract :In t his paper we p resent a new memory gradient met hod for solving unconst rained optimization p roblems.We use t he previous iterative information to generate a new iterate at each iteration wit h Armijo search rule and add t he f reedom of some parameters.Therefore it is suitable to solve large scale optimization problems.We analyze t he global comvergence under some mild conditions.Key words :unconst rained optimizatio n ;memory gradient met hod ;Armijo seach rule ;global conver 2gence0　引言考虑无约束优化问题min f (x ),　x ∈R n(1)其中R n 为n 维欧氏空间,f :R n →R 1是一连续可微函数,大多数求解问题(1)的算法是迭代算法,最常用的是梯度算法,常采用如下形式x k +1=x k +αk d k ,　k =0,1,2,…(2)其中d k 是搜索方向,αk 是步长参数。

若x k 为当前迭代点,则分别记梯度 f (x k )为g k ,f (x k )为f k ,f (x 3)为f 3P (x |L 0)=max y ∈L 0‖y -x ‖P (5B |L 0)=inf x ∈5BP (x |L 0)5B 表示B 的边界。

一般情况下,共轭梯度法是求解无约束优化问题的有效算法之一,它能有效避免存贮和计算矩阵,适于求解大规模无约束优化问题.记忆梯度法也具有类似的性质[1,3,7,8]。

记忆梯度算法和超记忆梯度算法[6]实际上是共轭梯度法的一推广,它可更充分地利用前面迭代点的信息,增加了参数选择的自由度,由此可以构造稳定的收敛均匀的算法[2,4,5],对于求解大规模优化问题也是一种有效的算法。

但是,记忆步数越多,则计算公式越复杂。

在实际问题中,记忆二步到三步比较合适。

本文利用Armijo 搜索设计了一种新的记忆梯度算法,并在较弱的条件下证明了算法的全局收敛性。

1　记忆梯度法假设(H 1)目标函数f (x )在水平集L 0={x ∈R n |f (x )≤f (x 0)}上有下界,这里x 0为初始点。

(H 2)梯度函数g (x )= f (x )在包含L 0的开凸集B 上一致连续,B 满足P (5B |L 0)>0在以上假设基础上,提出新算法如下:算法(A )　给出0<ρ<23,0<μ<1,x 0∈R n 且置k :=0;步1　若‖g k ‖=0则停!否则转步2;步2　x k +1=x k +αk d k (αk ),这里αk 为满足下式的α∈{s k ,s k ρ,s kρ2,…}中的最大者f k -f (x k +αd k (α))≥-μα[g T k d k (α)+12α‖g k ‖2](3)其中d k (α)=-g k ,若k =0;-(1-α)g k +αd k -1,若k ≥1(4)s k =1若k =0;ρ‖g k ‖2‖g k ‖2+|g T k d k -1|若k ≥1(5)步3　置k :=k +1,转步1。

容易看出,该算法有一个重要特点,以每步迭代中,它的方向和步长是同时确定的。

这有利于找到更合适的搜索方向和步长。

为方便,有时记d k =d k (αk ).为以后证明需要,下面引入几个引理。

引理1　对任意k ≥0若α∈(0,s k )则有g T k d k (α)≤-(1-ρ)‖g k ‖2。

证明　当k =0时,上式显然成立。

当k ≥1时g Tk d k (α)=-(1-α)‖g k ‖2+αg T k d k -1≤-(1-α)‖g k ‖2+|αg T k d k -1|=-‖g k ‖2αρ‖g k ‖2/s k≤-(1-ρ)‖g k ‖2证毕引理2　对任意k ≥0,若α∈(0,s k ),则有g T k d k (α)+12α‖g k ‖2≤0证明　由引理1,及s k 定义可得。

引理3　对于k ≥0和α∈(0,s k ]有‖d k (α)‖≤max 0≤i ≤k{‖g i ‖}证明　利用(4)由数学归纳法即得。

引理4　步2中的搜索是可行的。

证明　假设不存在αk 为满足下式的α∈{s k ,s k ρ,s kρ2,…}中的最大者f k -f (x k +αd k (α))≥-μα[g T k d k (α)+12α‖g k ‖2]则知当αi =s kρi,i →+∞时f k -f (x k +αi d k (αk ))<-μαi [g T k d k (αi )+12αi ‖g k ‖2]对左边应用中值定理后,再对上述两边取极限,可得μ≥1,与已知矛盾,从而步2中的搜索是可行的。

证毕52第1期张祖华,等:Armijo 搜索下的记忆梯度法及其收敛性2　全局收敛性引理5　如果(H 1)和(H 2)成立,算法(A )产生无穷点列{x k },则序列{‖g k ‖}和{‖d k ‖}有界。

证明　由引理3可知,我们只要证明{‖g k ‖}有界即可。

令δk =max 0≤j ≤k{‖g j ‖}若{‖g k ‖}无界,则lim k →+∞δk =+∞因而必存在无穷子列N <{0,1,2,…}使δk =‖g k ′‖,Πk ′∈N (6)且‖g k ′‖=δk →+∞(k ′∈N ,k ′→+∞).(7)由引理1和(3)式可得f k -f (x k +αk d k )≥-μαk [g Tk d k (αk )+12αk ‖g k ‖2]≥μαk [(1-ρ)‖g k ‖2-12s k ‖g k ‖2]≥μαk [(1-ρ)‖g k ‖2-12ρ‖g k ‖2]≥μαk [(1-32ρ)‖g k ‖2由(H 1)可知∑∞k =0αk ‖g k ‖2<+∞(8)从而∑k ∈Nαk‖g k‖2≤∑∞k =0αk‖g k‖2<+∞.(9)由引理3和(6),当α∈(0,s k ]时有‖d k (α)‖2≤max 0≤i ≤k{‖g i ‖2}≤δ2k =‖g k ′‖2,Πk ′∈N.(10)由(9)和(10)可得∑k ∈Nαk‖d k(α)‖2<+∞,(11)故αk ‖d k (α)‖2→0(k ∈N ,k →+∞).(12)由引理1和Cauchy 2Schwarz 不等式得,当α∈(0,s k ]时有‖g k ‖・‖d k (α)‖≥-g T k d k (α)≤(1-ρ)‖g k ‖2从而‖d k (α)‖≥(1-ρ)‖g k ‖(13)由(7)和(13)式可得‖d k (α)‖→+∞(k ∈N ,k →+∞).再由(12)式可得αk ‖d k (α)‖→0(k ∈N ,k →+∞).(14)从而lim k ∈N ,k →∞αk =0这说明当k ∈N 充分大时,αk =αk /ρ∈(0,s k ]使得不等式(3)反向,即f k -f (x k +αk d k (αk ))<-μαk [g T k d k (αk )+12αk ‖g k ‖2]从而f k -f (x k +αk d k (αk )<-μαk g T k d k (αk ).在上式左端利用中值定理,则存在θk ∈[0,1]使f k -f (x k +αk d k (αk ))=-αk g (x k +θk αk d k (αk )Td k (αk )由此可得g (x k +θk αk d k (αk ))T d k (αk )>μg Tk d k (αk )由引理1,上式和(10)知当k ∈N 且充分大时,有62运　筹　与　管　理 2007年第16卷(1-ρ)(1-μ)‖g k ‖2≤(1-μ)(-g T k d k (αk ))≤[g (x k +θk αk d k (αk ))-g k ]Td k (αk )≤‖d k (αk )‖・‖g (x k +θk αk d k (αk ))-g k ‖≤‖g k ‖・‖g (x k +θk αk d k (αk ))-g k ‖,Πk ∈N.从而(1-ρ)(1-μ)‖g k ‖≤‖g (x k +θk αk d k (αk ))-g k ‖,Πk ∈N.由引理2可知f k -f (x k +1)≥-μαk [g Tk d k (αk )+12αk ‖g k ‖2]≥0从而x k ∈L 0<B ,再根据(H 2),P (5B |L 0)>0,因此由(14)式知,当k 充分大时,x k +θk αk d k (αk )∈B.故由g (x )在B 上的一致连续性,即得‖g k ‖→0(k ∈N ,k →+∞).这与(7)式相矛盾,故{‖g k ‖}有界,从而{‖d k ‖}有界。