第四章无约束最优化的直接方法解析

合集下载

第4章无约束优化方法

4-2 牛顿法及其改进
基本思想：
在Xk邻域内用一个二次函数 ( x ) 来近似代替原目标函数，并将 ( x )的极小点作为对目标函数 f ( x )求优的下一个迭代点 x k 1 。经多次迭代，使之逼近目标函数 f ( x )的极小点。牛顿法是求函数极值的最古老算法之一。
f ( X ) ( X ) f ( X k ) f ( X k )T ( X X k ) 1 ( X X k )T 2 f ( X k )( X X k ) 2
前途是光明的，道路是曲折的！
开始
给定
X 0 ,
k 0
s k f ( X k )
X k 1 X k k s k
k k k : min f ( X s ) k
k k 1
是
X k 1 X k
否
X * X k 1
结束
例4－1求目标函数
0
1. 基本思想
变量的尺度变换是放大或缩小各个坐标。通过尺度变换可以把函数的偏心程度降到最低限度。
2 2 f ( X ) x 25 x 例如在用最速下降法求 1 2
设 X k 1为 ( X )的极小点 ( X k 1 ) 0
f ( X k ) 2 f ( X k )( X k 1 X k ) 0
X k 1 X k [2 f ( X k )]1 f ( X k ) (k 0,1,2, )
这就是多元函数求极值的牛顿法迭代公式。对于二次函数，海赛矩阵H是一个常矩阵，其中各元素均为常数。因此，无论从任何点出发，只需一步就可找到极小点。
用直接法寻找极小点时，不必求函数的导数，只要计算目标函数值。这类方法较适用于解决变量个数较少的（n ≤20）问题，一般情况下比间接法效率低。间接法除要计算目标函数值外，还要计算目标函数的梯度，有的还要计算其海赛矩阵。

无约束最优化直接方法和间接方法的异同

无约束最优化直接方法和间接方法的异同一、什么是无约束最优化最优化方法（也称做运筹学方法）是近几十年形成的，它主要运用数学方法研究各种系统的优化途径及方案，为决策者提供科学决策的依据。

最优化方法的主要研究对象是各种有组织系统的管理问题及其生产经营活动。

其的目的在于针对所研究的系统，求得一个合理运用人力、物力和财力的最佳方案，发挥和提高系统的效能及效益，最终达到系统的最优目标。

实践表明，随着科学技术的日益进步和生产经营的日益发展，最优化方法已成为现代管理科学的重要理论基础和不可缺少的方法，被人们广泛地应用到公共管理、经济管理、工程建设、国防等各个领域，发挥着越来越重要的作用。

最优化问题分为无约束最优化和约束最优化问题，约束最优化问题是具有辅助函数和形态约束条件的优化问题，而无约束优化问题则没有任何限制条件。

无约束最优化问题实际上是一个多元函数无条件极值问题。

虽然在工程实践中，大多数问题都是具有约束的优化问题，但是优化问题的处理上可以将有约束的优化问题转化为无约束最优化问题，然后按无约束方法进行处理。

或者是将约束优化问题部分转化为无约束优化问题，在远离极值点和约束边界处按无优化约束来处理，在接近极值点或者约束边界时按照约束最优化问题处理。

所以无约束优化问题的解法不仅是优化设计方法的基本组成部分，也是优化方法的基础。

无约束最优化方法大致分为两类：一类是使用导数的间接方法，即在计算过程中要用到目标函数的导数；另一类是直接方法，即只要用到目标函数值，不需要计算导数。

这里我们比较这两类方法的异同。

二、无约束最优化方法1.使用导数的间接方法1.1 最速下降法函数的负梯度方向是函数值在该点下降最快的方向。

将 n 维问题转化为一系列沿负梯度方向用一维搜索方法寻优的问题，利用负梯度作为搜索方向，故称最速下降法或梯度法。

无约束优化问题的数学模型可以表示为：min f x x R n，我们假设函数xf x 具有一阶连续偏导数。

工程优化方法及应用第四章1-2节

2 x x -0f x 1/2
1 0 0
Page 8
第2次迭代：
-1 f x , -2
1
|| f x1 || 5 0.5,
1
2+1 x x -1f x = 1/2+2 1 ( )=f x1 -f x1 =f 2+ ,1/2+2
2、其基本思想和逻辑结构可以推广到约束问题；
3、约束问题可以转化成无约束问题求解。
f ( x), x D min f ( x) min F ( x), 其中F ( x) n xD 类
解析法：对简单问题，求解必要条件或充分条件；零阶法：只需计算函数值 f(x) 迭代算法一阶法：需计算 ▽f(x) 梯度法二阶法：需计算 ▽2f(x) 建立迭代算法的关键：确定迭代格式
3
5/2+22 3 x x -2f ( x )= = ， 3/2 2 5/4
继续迭代可得到函数的近似最优解。
Page 10
2 2 例用最速下降法求函数 f ( x1 , x2 )＝x1 的极小点（迭代两 4 x2 T 次）。并验证相邻两个搜索方向是正交的。初始点 x 0 1,1 。
No
Page 6
Yes stop. x* =xk
dk= －▽f(xk ) min f(xk+λdk) s.t. λ >0 得最佳步长因子λk 令： xk+1=xk+λkdk 解
最速下降法的算例
取 x 0 1,1T , =0.5. 解：函数的梯度为
Page 7
2 2 min f ( x ) x 2 x 例利用最速下降法求解 1 2 2 x1 x2 4 x1 ,

第四部分无约束优化方法教学课件

X X
(1) 1
(0) 2
X X
( 1
( 2
0 0
) )
X X
(1) 1
(1) 2
X X
( 1
( 2
2 2
) )
图4－12 坐标轮换法原理图（动画演示）
2. 搜索方向与步长的确定（1）搜索方向的确定
对于第k轮第i次的计算
xik xik1aikdik
第k轮第I次的迭代方向，它轮流取n维坐标的单位向量。
f x1xTGxbTxc
2
从点x k出发，沿G某一共轭方向d k 作一维搜索,到达x k 1
xk1xk akdk
xk1xk akdk 而在点x k 、x k 1处的梯度分别为：
gk Gxk b gk1Gxk1b
g k 1 g k G x k 1 x k a k G d k
dj TGdk1 0
fx k 1 f x k a k d k m i n f x k a d k
第四节共轭方向及共轭方向法
为了克服最速下降法的锯齿现象，提高收敛速度，发展了一类共轭方向法。搜索方向是共轭方向。一、共轭方向的概念
共轭方向的概念是在研究二次函数
f x1xTGxbTxc
2 时引出的。首先考虑二维情况
三、变尺度法的一般步骤
第七节坐标轮换法
坐标轮换法是每次搜索只允许一个变量变化，其余变量保持不变，即沿坐标方向轮流进行搜索的寻优方法。
它把多变量的优化问题轮流地转化成单变量的优化问题。
因此又称变量轮换法。
其基本原理是将一个多维的无约束最优化问题转化为一系列较低维的最优化问题来求解，简单地说，就是先将 (n-1)个变量固定不动，只对第一个变量进行一维搜索得到最优点x1（1）。然后，又保持(n-1)个变量不变，再对第二个变量向，会产生锯齿现象。为避免锯齿的发生，取下一次的迭代搜索方向直接指向极小点，如果选定这样的搜索方向，对于二元二次函数只需进行两次直线搜索就可以求到极小点。

04 无约束优化方法

F 1A C
向上的极小点，而非原函数的 -2 -1
0
1
2
3
x1
极小点。
解决办法：阻尼牛顿法。
7
二.阻尼牛顿法
1.迭代公式
沿牛顿方向-[H(X(k))]-1f(X(k))作一维搜索,迭代公式：
X (k1) X (k ) k [H ( X (k ) )]1f ( X (k ) )
其中λ k使
f ( X (k ) k s(k ) ) min f ( X (k ) k s(k ) )
S1
1 0 ,S2
0 1
正交不共轭
19
2.正定二次函数的特点
(1)正定二次二元函数的等值线是椭圆线簇,椭圆线簇的中心
即目标函数的极值点。
(2)过同心椭圆线簇中心作任意直线,此直线与诸椭圆交点处
的切线相互平行。
反之过两平行线与椭圆切点X(a)和
x2
X(b)的连线必通过椭圆的中心。因此
只要沿方向X(a)—X(b)进行一维搜索，
1、坐标轮换法具有程序简单，易于掌握的优点，但它的计
算效率较低，因此它虽然步步在登高，但相当于沿两个垂直方
向在爬山，路途迂迴曲折，收敛很慢，因此它适用于维数较低
(一般n<10)的目标函数求优。
2、有“脊线”的目标函数等值线的情形,沿坐标轴方向函数值
不一定下降。
脊线
x2
A
p
0
x1
13
五、练习用最优步长法求解 f (X)=(x1-2)4+(x1-2x2)2的极小点。初始点X(0)=[0,3]T，要求迭代一轮。请注意沿坐标轴移动的方向。
22
二、迭代过程
以二维问题为例： ① X(0)

最优化方法_chapter4 无约束最优化方法

预备知识
本章开始讨论多维无约束最优化问题：
min f(X) 其中 f:Rn→R1．这个问题的求解是指在Rn中找一点X*，使得对于任意的X∈Rn 都有，f(X*)≤f(X) ，成立，则点X* 就是问题的全局最优点。但是，大多数最优化方法只能求到局部最优点，即在Rn中找到一点X*，使得f(X*)≤f(X)在 X*的某个领域中成立．这个矛盾对于实际问题一般容易解决．根据问题的实际意义多半可以判定用优化方法求出的局部最优解是否为全局最优解．而在理论上这是个比较复杂的问题，本教材不涉及．
✓ 有些无约束优化方法只需略加处理，即可用于求解约束优化问题．
预备知识
无约束优化理论发展较早，比较成熟，方法也很多，新的方法还在陆续出现．把这些方法归纳起来可以分成两大类：
✓ 一类是仅用计算函数值所得到的信息来确定搜索方向，通常称它为直接搜索法，简称为直接法
✓ 另一类需要计算函数的一阶或二阶导数值所得到的信息来确定搜索方向，这一类方法称为间接法（解析法）
解：应沿由热变冷变化最剧烈(变化率最大)的地方（即梯度方向）爬行。
设函数z=f (x,y)在点P(x,y)的某一邻域U(P)内有定义。
自点P引射线l。设x轴正向到射线l的转角为θ，并设
Pˊ(x+∆x,y+∆y) 为l上的另一点且Pˊ∈U(P)．
考虑：limρ→0 (f(x+∆x,y+∆y)－f(x,y))/ρ。若此极限存在
特别是对于等值线（面）具有狭长深谷形状的函数，收敛速度更慢．其原因是由于每次迭代后下一次搜索方向总是与前一次搜索方向相互垂直，如此继续下去就产生所谓的锯齿现象．
即从直观上看，在远离极小点的地方每次迭代可能使目标函数有较大的下降，但是在接近极小点的地方，由于锯齿现象，从而导致每次迭代行进距离缩短，因而收敛速度不快.

四常用无约束最优化方法(精品PPT)

（3）用终止准则检测是否满足：若满足，则打印最优
解 X k 1 ，f ( X k1 ) ，结束；否则，置 k k 1，转
（2）．
，
最速下降法算法流程如图4.2所示．
Company Logo
最速下降法算法流程如图所示．
图4.2
开始选定X0
f0 f (X0) g0 g(X0)
X ls(X 0 ,g0 )
Company Logo
§4.1 最速下降法
对于问题（4.1）为了求其最优解，按最优化算法的基
本思想是从一个给定的初始点
X
出发，通过基本迭代公
0
式 X k1 X k tk Pk，按照特定的算法产生一串
点列{X k } ，如果点列收敛，则该点列的极限点为问题
（4.1）的最优解．
一、最速下降法基本原理
1个迭代点
X
k
，即
1
X k1 X k tk f ( X k ) ，
其中步长因子 tk 按下式确定
也可记为
fin
t
f
(Xk
tf
(Xk
))
，
X k1 ls( X k , f ( X k )) ．（4.3）
显然，令k 0, 1, 2, 就可以得到一个点列 X0, X1, X2 ，
g( X ) AX b ，(4.5)
因此，
gk g( X k ) AX k b．(4.6)
现在从X k 出发沿 g k 作直线搜索以确定 X k1 ，于是
X k1 X k tk gk ， (4.7) 其中tk 是最优步长因子．
Company Logo
又因式（4.2），有 g( X k1 )T gk 0 ，再利用式

第4章优化设计(无约束优化-直接法)

F3 F1 1 ( F1 2 F2 F3 )( F1 F2 ) (mk ) ( F1 F3 ) 2 2
(k ) 2 m
(4-43)
同时成立，则表明方向S 与原方向组线性无关，因此可将新方向 (k ) S ( k )作为下一轮的迭代方向，并去掉方向 S m 而构成第k+1轮迭代的搜索方向组；否则，仍用原来的方向组进行第k+1轮迭代。 (k ) F1 f ( X 0 ) —— 为第 k 轮起始点函数值；上式中： (k ) F2 f ( X n ) —— 为第 k 轮方向组一维搜索终点函数值； (k ) (k ) (k ) (k ) X —— 为对 Xn 的映射点函数值； 0 F3 f (2 X n X 0 ) k ) —— 为第 k 轮方向组中沿诸方向一维搜索所得的各函 (m (k )。数值下降量中之最大者，其相对应的方向记为 S m
•
若共轭方向不好，则不用它作为下一轮的迭代方向，而仍采用原来的一组迭代方向； • 若共轭方向好，则可用它替换前轮迭代中使目标函数值下降最多的一个方向，而不一定是替换第一个迭代方向。这样得到的方向组，其收敛性更好。
修正鲍威尔法对于是否用新的方向来替换原方向组的某一方向的判别条件为：在第 k 轮搜索中，若
进行第二轮迭代时，去掉第一个方向 S1(1) e1 ，将方向 S (1) 作为最末一个迭代方向，即从 X (1) X 0(2) 出发，依次沿着方向 S S e 及 S (2) S (1) X (1) X (1)
(2) 1 (1) 2 2
2
2
0
进行一维搜索，得到极小点： X1(2) 、X 2(2) ； ( 2) X2 然后利用 X 0(2) 、构成另一个迭代方向 (2) (2) S (2) X 2 X0 即 S ( 2) 并沿此方向搜索得到 X (2) 。

最优化方法(刘)第四章

阻尼牛顿法收敛定理
定理2: 设 f ( x) 二阶连续可微，又设对任意的x0 ∈Rn , 存在常数m > 0, 使得 f ( x) 在 L ={x f (x) ≤ f (x0 )} 2 T 2 上满足： ∇ f ( x)µ ≥ m µ ,∀ ∈Rn , x∈L( x0 ) µ µ 则在精确线搜索条件下，阻尼牛顿法产生的点列 {xk } 满足： (1) 当{xk } 是有限点列时，其最后一个点为 f ( x) 的唯一极小点． (2)当{xk } 是无限点列时，收敛到 f (x) 的唯一极小点．
) x0 = (9,1
T
g0 = ∇ ( x0 ) = (9,9) f
T
T 7.2 7.2 g0 g0 x = x0 − T g0 = 1 −0.8 g1 = −7.2 g0 G 0 g T 9×0.82 g1 g1 x2 = x − T g1 = 1 2 (−1 ×0.82 g1 G 1 g )
9 1 0 x = x0 −G g0 = − 1 1 0 9
1 − 0 −1
9 0 = = x* 9 0
牛顿法收敛定理
定理1: 设 f ( x) 二次连续可微， *是 f ( x) 的局 x 部极小点， f (x* ) 正定．假定 f ( x) 的海色阵 ∇
gk →0 .
证明：对于最速下降法， k = 0, 由以上定理立得． θ
收敛性分析
定理2: 设 f ( x) 二次连续可微， ∇2 f ( x) ≤ M, 且其中 M是个正常数，对任何给定的初始点 x0, 最速下降算法或有限终止，或者lim f ( xk ) = −∞ ,
k→ ∞

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

若把顶点vh去掉，则剩下的n个顶点v1， v2 ，v3 …vn+1(不含Vh)
构成n-1维空间中的单纯形，按下面公式求其中心：
v0
1 n1
n
vi
i 1,i h
2 反射。
按如下公式通过v0反射vh:vr v0 (v0 vh ) 0为反射系数,常,取vr称 1 为vh的反射点。因vh是坏点，则一般有f(vr)<f(vh)
收缩分以下两种情况
4.2.1 若f(vr) >=f(vh),即反射点比原来单纯形的坏点
还坏，则舍弃vr，对方向vh- v0进行收缩。如图d
计算公式为 vc v0 (vh v0 )
其中vc是vh的收缩点，而收缩常数常取为：
1 2
若f(vc)>f(vh)，即收缩点比原单纯形最坏点还坏，因此放弃vc 点，转5步进行棱长减半工作。否则以vc替换vh构成新单纯形，转6。
2）步长加速法。
3）方向加速法（又称共轭方向法）。
只要目标函数连续，这些方法就可以使用。由于这些方法无须计算目标函数的导数，因此又称为直接方法。但收敛速度比上一章的方法都要慢。
4.1单纯形替换法
1 单纯形：Rn中的单纯形指具有n+1个顶点的多面体，若
各棱长彼此相等，则称为正规单纯形。如：在R2中，三角
vi v1 2 l 2
vi
vj
2
z
i
z(
j
2
)?
zi
2
z j
2 ziz j ziz j
l2 l2 pq pq n 1q2 pq pq n 1q2
vi v1 2
将值代入上式得： vi vj 2 l2，i j 由上可知上面确定的单纯形为正规单纯形。
正规单纯形是一种特殊的单纯形，还有一种特殊的单纯形取
p l ( n 1 n 1)
如:z(2)=[p,q … q]T.z(n+1)=[q,q … p]T.其中 n 2
q l ( n 1 1) n2
证明：当i=2,3…n+1时
vi
v1
2
z1
z
i
2
z1 ?
z i 2 p2 n 1 q2
将 p , q 代入上式有当 i,j=2,3…n+1 时，
vl
vh e vl
5 减小棱长。将原单纯形的最好点保持不动，各棱长减半，计算公式为
vi
1 2
vi
v l
, i l, i 1, 2, 3
n 1
ห้องสมุดไป่ตู้
6
终止原则。计算
f
1 n1 n1 i
fi , v*
1 n 1
n!
vi
i1
，
若
n1 fi
f
2
e则v*为极小点，终止；否则，转1。
i 1
例：min f x1, x2 4x152 x2 62
（如在R中，由图a知以Ve、Vi、Vl为顶点的新单纯形已向极小点靠近了一步。）
否则，以反射点替换构成单纯形，转6步（如R中，由图b可知以Vr、Vi、Vl为顶点的新单纯形向极小点靠近了一步）
vi
vz
v0
vh
vl
a
ve
vi
vr
z
v0
vh
vl b
4 收缩。
若f(vr)>f(vl)，即反射点并不比原单纯形的最好点好，
4.2.2 若f(vr)<f(vh)，则对向量vr--vo进行收缩（如图e），计
算公式为 vc vo (vr vo )
若f(vc)>f(vh),即收缩点vc比反射点vr还坏，则放弃收缩点vc，
转5进行棱长减半工作，否则以vc替换vh构成新单纯形，转6。
vr
vi
vr
vr
vi
vi
vl
vh c
vh
从而得到比vh更好的点,这时应按3进行伸延，否则进入 4.2进行收缩工作。
3 延伸
经过反射，若不仅有f(vr)< f(vh),且进一步有 f(vr)<f(vl)，则说明沿vr- vo方向还可以向前迈一步，因此计算: ve= vo+r(vr -vo)
ve称为vh的延伸点，r>1是延伸系数，常取r=2,也可用直线搜索技术确定r. 此时若有f(ve)< f(vh),则以ve替换vh，而其余n个顶点不变, 构成新单纯形，转6.
则分下列两种情况处理：
4.1 若存在一个标点i，使得f(vr)<f(vi),即除最坏点vh 外，反射点vr比其他一个顶点好，因而可以用vr将vh替换构成新的单纯形，转6步（如R2中，图c所示，以Vr、Vi、 Vl为顶点的新单纯形向极小点迈进了一步）
4.2 若对i=1,2,3--n+1(但 i h )均有f(vr)>=f(vi),则要进行收缩。
形就是单纯形，正三角形就是正规单纯形。（正三角形是
R2中周长一定包围面积最大的布点方式）
结论：
对于任意给定初始点z1和正数l，按如下公式取定的单纯形是一个以为z 1顶点棱长为l的Rn中的正规单纯形：
v 1= z 1 , v i = z1+z(i) i=2,3,4…n+1
其中n 维向量z(i)=[q ~ q,pi-1,q … q]T
满意的极小点为止。
二算法过程
单纯形替换法由两步构成：形成初始单纯形和迭代。而迭代
过程又包括四项操作：反射，延伸，收缩和减小棱长。
已知目标函数f(z)和终止限
1 设初始单纯形顶点的位置向量为v1， v2 ，v3 ,…vn+1.计算： fi=f(vi). i=1，2，3 …,n+1
fl=min{fi}.fh=max{fi},其中分别为此单纯形的最好和最坏顶点。(取正规单纯形作为初始单纯形比取后一种形式好)
取初始点。为计算方便不取等边三角形为初始单纯形。
而取直角三角形为初始单纯形，其顶点为：
x0 8, 9T , x1 10,11T , x2 8,11T
相应函数值f0=45 , f1=125, f2=65
法：v1= z1,vi= z1 +lei-1.i= 2,3 … n+1,其中ei=[0 … 0,1,0 … 0]T 在R2中此特殊单纯形即为等腰直角三角形。
单纯形替换法的基本思想就是按上面取特殊单纯形的方法
形成初始单纯形。然后从此出发，每次迭代都设法构造新的以替
代旧的，使新单纯形不断向目标函数的极小点靠近，直到搜索到
第四章无约束最优化的
直接方法
本章仍讨论无约束最优化问题：min f (x) 在实际问题中 xRn
目标函数往往很复杂，从而导数表达式更加复杂，甚至难以推导或不存在。这种情况下用上一章介绍的方法就不行了，此时可用本章介绍的方法：
1）由Spendy,Hext和Himsworth(1962)提出，经Nelden 和Mend(1965)作出改进的单纯形替换法。