第三章 无约束最优化方法
第3章 无约束最优化方法 3-1 最速下降法 3-2 牛顿法

1
u f ( x)u m u
T 2
2
u R
n
则从任意的初始点 x 0 出发,阻尼牛顿法产 生的迭代点列 满足: (1)当 x k 为有穷点列时,其最后一个点 为 f ( x) 的唯一极小点。 (2)当 x k 为无穷点列时,收敛到 f ( x) 的
第3.2节 Newton法及其改进
第3.1节 最速下降法(Steepest Method)
对于最速下降法的几点说明 (1)第2.6节中介绍的关于下降算法的收敛 性定理对最速下降法都是成立的 。 (2)目标函数在负梯度方向下降得最快只 是局部性质。 (3)锯齿现象 (4)改进策略:在计算的开始阶段使用最 速下降法,在迭代数次后,改用其他算法。
本节的主要内容:
(1)牛顿法的基本思想
(2)阻尼牛顿法
(3)带保护措施的阻尼牛顿法
(4)吉尔-默里稳定牛顿法
(5)信赖域方法(一)
第3.2节 Newton法及其改进
(1)牛顿法的基本思想: * 在目标函数f ( x)的极小点 x 的近似点 x k 附近将 f ( x) 二阶Tayler展开,用展开的二次 函数去逼近 f ( x),将这个二次函数的极小点 * x 作为 的一个新的近似点 x k 1 ,依次下去, 用一系列二次函数的极小点 xk 1 去逼近 f ( x) 的极小点 x * 。
第3.2节 Newton法及其改进
设 f ( x)二次连续可微,则 f ( x) 在 x k 处的二次 近似为: 1 T f ( x) qk ( x) f ( xk ) f ( xk ) ( x xk ) ( x xk )T 2 f ( xk )( x xk ) 2 令
第三讲 无约束优化(多维无约束优化方法)

2019/10/21
5
1. 梯度法(最速下降法 )
(2)迭代公式 : X (k 1) X (k) k S (k) X k f X k
或
X (k1) X (k) k
f f
X k X k
f
X k
f ,f x1 x2
X (2) 1
S (1)
S为S(2)的共轭方向。
S即为S(1)的共轭方向。
2019/10/21
18
(2)共轭梯度法的基本原理
2)共轭方向的构造
S k1 f X k1 k S k
上式的意义是以新的负梯度方向 f X k1 ,加上原
负梯度的一部分k S k 来构造 S k1 。
2019/10/21
3
1. 梯度法(最速下降法 )
数值迭代格式
X (k 1) X (k ) k S (k )
从数值迭代格式可以看出,构造一种算法的关键 是如何确定一个有利的搜索方向。
梯度方向是函数值上升最快的方向,负梯度 方向是函数值下降最快的方向。
2019/10/21
以负梯度方向作为搜索方向
4)牛顿法不能保证函数值稳定下降,严重时还会造 成点列发散导致迭代失败。
2019/10/21
1 27
3. 多维牛顿法(阻尼牛顿法)
问题的提出
因函数不一定是二次函数,基本牛顿法的步长因子 恒为1,有时会导致迭代发散而失效。
改进方法
仍取牛顿方向,但改用最优步长因子:
X (k1) X (k ) k [H ( X (k ) )]1f ( X (k) ) 一维搜索求最优步长
'X 0
无约束优化方法

三. 内容:
一维搜索: 求最优步长因子α(k)
多维(变量)优化:确定搜索方向 S (k)
黄金分割 切线法 平分法 插值法 格点法
坐标轮换法 最速下降法 共轭方向法 鲍威尔法 梯度法 共轭梯度法 牛顿法 单形替换法 变尺度法
比较两试点函数值,由于 作前进搜索
此时,三个试点 函数值已经出现“高-低-高”特征, 得搜索区间为
3.2 一维搜索方法
α3(2)
黄金分割法 (0.618) :
序列消去原理:
f (α)
α
α3(1)
α12
α*
α1(1)
0
α11
α21 α22
α1(2)
α1(3)
α3(3)
1.解析法:
定义:
在第K次迭代时,从已知点 X(k)出发,沿给定方向求最优步长因子α(k),使 f (X(k) + α S(k) )达到最小值的过程,称为一维搜索。
பைடு நூலகம்
对α求导,令其为零。
01
直接法——应用序列消去原理:
02
分数法、黄金分割法
03
近似法——利用多项式函数逼近(曲线拟合)原理:
总结:将优化问题转化为一系列的一维搜索问题
沿方向S的一维搜索
3.2 一维搜索方法
单峰区间解析概念:
在区间 [α1,α3 ]内,函数只有一个峰值,则此区间为单峰区间。单峰区间内,一定存在一点α*,当任意一点α2>α*时,f(α2)>f(α*),
说明: 单峰区间内,函数可以有不可微点,也可以是不连续函数;
3.1 引言
无约束优化方法计算步骤:
若已经取得某设计点x(k),并且该点不是近似极小点,则在x(k)点根据函数f(x)的性质,选择一个方向S(k),并且沿此方向搜索函数值是下降的,称下降方向。 当搜索方向S(k)确定后,由x(k)点出发,沿S(k)方向进行搜索, 定出步长因子 (k),得到新的设计点:
第3章 无约束最优化方法 3-1 最速下降法 3-2 牛顿法

是局部性质。 n (3)锯齿现象 n (4)改进策略:在计算的开始阶段使用最
速下降法,在迭代数次后,改用其他算法。
第3.1节 最速下降法(Steepest Method)
n [引理3.2](康德洛维奇Kntorovich不等式)
第3.2节 Newton法及其改进
n [推论3.8]设 且对任意的 在水平集
在开凸集D上二阶连续可微, ,存在常数 ,使得
上满足
则从任意的初始点 出发,牛顿法产生的迭
代点列 满足
,且收敛到
的唯一极小点。
第3.2节 Newton法及其改进
n 阻尼牛顿法的优点与缺点: 阻尼牛顿法克服了牛顿法要求初始点充分靠
n
,则d是下降方向;
n
,则 是下降方向。
第3.2.4节 吉尔-默里稳定牛顿法
n Gill-Murray稳定牛顿法的基本思想: n 当Hesse矩阵 在迭代点
处为不定矩阵时,对其进行强迫正 定的 分解;当 趋于零时, 采用负曲率方向使函数值下降。
第3.2.4节 吉尔-默里稳定牛顿法
n [算法3.15](求负曲率方向的算法)
得到方向 ,令
。
n (6)精确线性搜索求 ,且令
n (7)若
,则进行步(8);否则,
令
,转步(2)。
n (8)输出
,停止计算。
第3.2.4节 吉尔-默里稳定牛顿法
n [定理3.18]设 二阶连续可微,且存在
,使得
为有界闭
凸集。假定在吉尔-默里稳定牛顿法中取
,且初始点
,则吉尔-默里稳
定牛顿法产生的迭代序列 满足:
第三章--无约束最优化的梯度方法

第三章 无约束最优化的梯度方法1.最速下降法假定我们已经迭代了k 次,获得了第k 个迭代点k x 。
从k x 出发,显然应沿下降方向进行,由于负梯度方向是最速下降方向,因此沿负梯度方向应该是有利的。
因此,取搜索方向)(k k x f p -∇=。
)(1k k k k x f t x x ∇-=+此时有:0)()(1=∇∇+k T k x f x f如将该方法应用于二次函数c x b Qx x x f T T ++=21)(,则可求出k t 的显式表达式。
)()()())(()(1k k k k k k k k k k x f Q t x f x f Q t b Qx b x f t x Q b Qx x f ∇-∇=∇-+=+∇-=+=∇+0)()()()(=∇∇-∇∇k T k k k T k x f Q x f t x f x fkTk kTk k T k k T k k Qg g g g x f Q x f x f x f t =∇∇∇∇=)()()()( 2.Newton 法适用条件:如果目标函数)(x f 在n R 上具有连续的二阶偏导数,其Hesse 矩阵)(x G 正定。
基本想法:考虑从k x 到1+k x 的迭代过程。
在k x 点处用二次函数来逼近)(x f ,即:))(()(21)()()()()(k k T k k T k k x x x G x x x x x g x f x Q x f --+-+=≈0)())(()(=+-=∇k k k x g x x x G x Q)()(11k k k k x g x G x x x -+-==3.共轭方向法与共轭梯度法 1) 共轭方向法定义1:设Q 是n n ⨯对称正定矩阵。
若n 维空间中非零向量系110,...,,-m p p p 满足0=j T i Qp p ,)(1,...,2,1,j i m j i ≠-= ,则称110,...,,-m p p p 是Q 共轭的,或称110,...,,-m p p p 的方向是Q 共轭方向。
第三章无约束问题的最优化方法

赋以0.618。
2 ,
;并计算其对应
的函数值。 3)根据区间消去法原理缩短搜索区间。为了能用原来的 坐标点计算公式,需进行区间名称的代换,并在保留区间 中计算一个新的试验点及其函数值。
如果
令 b , , f f 记N0=0; 2 2 1 2 1 如果 ,则新区间= ,
2
2
图2-5 黄金分割法
• 黄金分割法要求插入两点: a1 a (1 )(b a), f1 f (a1 )
a2 a (b a), f 2 f (a2 )
黄金分割法的搜索过程:
1)给出初始搜索区间及收敛精度 2)按坐标点计算公式计算 1
,将
在搜索区间内[a,b] 任取两点a1、b1,令f1=f(a1), f2=f(b1) • (1)如f1<f2, 则缩小的新区间为[a,b1]; • (2)如f1>f2, 则缩小的新区间为[a1,b]; • (3)如f1=f2, 则缩小的新区间为[a1,b1]
f(b1) f(a1) f(a1) f(b1) f(a1) f(b1)
a
a1
b
a
a1
b1 b
a
a1
b1
b
§3.2 一维搜索方法
黄金分割法: • 黄金分割法适用于[a,b]区间上的任何单谷函数求极小值问题。对 函数除要求“单谷”外不作其他要求,甚至可以不连续。因此,这种 方法的适应面相当广。 • 黄金分割法也是建立在区间消去法原理基础上的试探方法。 • 在搜索区间内[a,b]适当插入两点,将区间分成三段;利用区间消 去法,使搜索区间缩小,通过迭代计算,使搜索区间无限缩小,从而 得到极小点的数值近似解。 •
第三章 非线性规划无约束问题的最优化方法.ppt

College of Energy and Power Engineering
研究生课程《工程数学》之“最优化方法”
第三章 无约束问题的最优化方法
第三章 无约束问题的最优化方法
第一节 第二节 第三节 第四节
变量轮换法 最速下降法 牛顿法 共轭梯度法
本章主要介绍构造无约束问题(多维)搜索方向的方法。这些方 法大致可分为两类:
第二节 最 速 下 降 法
因为 x(1) - x(4) > 0.01 ,故以x(4)点作为新的x(1) ,进行新一轮迭代。
x(1) = x(4) = (0,0,0)T
轾犏0 轾犏1 轾犏l x(1) + l e1 = 犏犏0 + l 犏犏0 = 犏犏0
犏臌0 犏臌0 犏臌0
( ) f x(1) = 3l 2
式中f(x)具有一阶连续偏导数,有极小点x*。 若现已求得x*的第k次近似值x(k),为了求得第k+1次近似值x(k+1) ,需选定方向p(k)。 p(k)有什么特征呢?
令 x(k) + l p(k) = x ,其中 l > 0, p(k) = 1. p(k)为某个下降方向。
变量轮换法
min f (x)= 3x12 + 2x22 + x32
给定初始点
x(1) = (1, 2,3)T
当
x(n+1) - x(1) < 0.01
答案:
x(1) = (0, 0, 0)T
时,停止迭代
第二节 最 速 下 降 法
解: e1 = (1,0,0)T ,e2 = (0,1,0)T ,e3 = (0,0,1)T 从初始点 x(1) = (1, 2,3)T 出发,沿x1轴方向e1进行一维搜索:
第三章 非线性规划-无约束问题的最优化方法

f x( ) + l e1 = 3( + l ) + 2? 22 1
1
(
)
2
32 = 3( + l ) + 17 1
2
fl ' = 0 ? l 1
- 1
轾 轾 1 1 犏 犏 2 1 x( ) = x( ) + l e1 = 犏 + (- 1)犏 = 2 0 犏 犏 犏 犏 3 0 臌 臌
轾 0 犏 犏 ? f x(2) 2 犏 犏 3 臌
本章主要介绍构造无约束问题(多维 搜索方向的方法 本章主要介绍构造无约束问题 多维)搜索方向的方法。这些方 多维 搜索方向的方法。 法大致可分为两类: 法大致可分为两类:
第一类:直接搜索方法。在搜索过程中, 第一类:直接搜索方法。在搜索过程中,只用到目标函 数值,不需要计算其导数。例如, 数值,不需要计算其导数。例如,变量轮换法 第二类:解析方法。在搜索过程中, 第二类:解析方法。在搜索过程中,要用到目标函数的 导数。例如最速下降法 牛顿法、共轭梯度法等 最速下降法、 导数。例如最速下降法、牛顿法、共轭梯度法等。
第 一 节
一、基本思想
变
量
轮 换
法
认为最有利的搜索方向是各坐标轴的方向, 认为最有利的搜索方向是各坐标轴的方向,因此它轮流 按各坐标的方向搜索最优点。 按各坐标的方向搜索最优点。 过程:从某一个给定点出发,按第 个坐标轴 个坐标轴x 过程:从某一个给定点出发,按第i个坐标轴 i的方向搜 索时,假定有 个变量 则只有x 在变化,其余(n-1)个变量 个变量, 索时,假定有n个变量,则只有 i在变化,其余 个变量 都取给定点的值保持不变。这样依次从 做了n次单变 都取给定点的值保持不变。这样依次从x1到xn做了 次单变 量的一维搜索,完成了变量轮换法的一次迭代。 量的一维搜索,完成了变量轮换法的一次迭代。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x1 x 2
7
第三章 无约束最优化方法
凸函数 函数f(x)为凸集定义域内的函数,若对任何的
0 1
及凸集域内的任意两点
x1 x 2
存在如下不等式:
f x1 1 x2 f x1 1 f ( x2 )
2 f x 2 x 1 2 f x * f x x1x2 2 f x x1xn 2 f x x2x1 2 f x
2 x2
2 f x*
2 f x x2xn
称 f x 是定义在凸集上的一个凸函数。
8
第三章 无约束最优化方法
9
第三章 无约束最优化方法
凸规划
对于约束优化问题
min f x
s.t.
g j x 0
j 1, 2,..., m
若 f x g j x 都为凸函数,则此问题为凸规划。
10
第三章 无约束最优化方法
当x1 x*时,则
f x1 f x2
25
3-2
一维搜索(0.618法)
从图中可看出,假定不知道极小点 x* 的位臵,任取 两点 x1 x2,如果 f x1 f x2 ,则 x*必在x1 , x2 之间; 若 f x1 f x2 ,则 x* x2 ;若 f x1 f x2 ,则 x* x1 。
梯度方向与等值面的关系
13
第三章 无约束最优化方法
方向导数 沿d方向的方向向 量
即
cos 1 cos 2 d ... cos n
T
T
f d
f x 0 d f x 0 cos f , d
x0
14
2 f x xn x1 2 f x xn x2 2 f x 2 xn
函数 f x 取得极小的充分条件是函数 f x 的Hessian矩阵 为正定方阵
16
第三章 无约束最优化方法
方阵
2 f x*
第三章 无约束最优化方法
方向导数的正负决定了函数的升降,而升降的快慢就由 f x 它的绝对值大小来决定。方向导数 0 又称为函数 f x d 在点x0 处沿 d方向的变化率。下降最快的方向称为最速 下降方向。 15
第三章 无约束最优化方法
Hessian矩阵(函数f x 的梯度f x 是它的一阶导数, Hessian矩阵是函数 f x 的二阶导数)
min
f x
x
假定 f x R1 ,且函数可微,则由极限的必备条件得 f x 0 一维搜索又称为直线搜索。
24
3-2
0.618法
一维搜索(0.618法)
0.618法适用于一般的单峰函数。所谓单峰函数,是指 这样的函数:在极小点 x*的左边,函数是严格减小的; 在 x* 的右边,函数是严格增加的。也就是说,若 x1 x2 是任意两点: f x1 f x2 当x2 x*时,则
一个对称矩阵 是不是正定的,可以用Sylvester定理来判定。 定理(Sylvester ) 一个 n×n阶对称矩阵Q 是正定矩阵 的充分必要条件是,矩阵Q 的各阶主子式都是正的。 11
第三章 无约束最优化方法
多元函数的梯度和性质 定义 以 f x 的n偏导数为分量的向量称为f x 在 x处 的梯度,记为
k
lim xk x
*
或等价地
k
lim xk -x* 0
* 那么就说该算法所产生的序列收敛于 x
18
第三章 无约束最优化方法
下降迭代法:在给定初始点后,如果每迭代一步都使目标 函数有所下降,即 f xk 1 f xk ,那么这种迭代法称为下 降法。 假定我们已经迭代到点 x k 处,那么下一步迭代将有以 下两种情况之一发生:
为正定的定义是:若对任何向量d (d!=0),有
d T 2 f x* d 0
对称正定方阵 2 f x* 的检验方法是所有主子式均大于零。 二、迭代方法 求解 无约束最优化问题 T f x min x x1, x2 , , xn 的问题可以转变为求解n 元方程组
①、从 x k 出发沿任何方向移动,目标函数不再下降。x k 是局部极小点,迭代终止。
②、从 x k出发至少存在一个方向使目标函数有所下降。这 时,从中选定一个下降方向 pk ,再沿这个方向适当迈进 一步,即在直线
19
第三章 无约束最优化方法
x xk t pk
上适当选定一个新点 xk 1 xk tk pk
f x f x f x f x , , , x2 xn x1
T
梯度也可以称为函数 f x 关于向量 x的一阶导数。
12
第三章 无约束最优化方法
梯度的性质 ①、函数在某点的梯度若不为零,则必与过该点的等 值面‚垂直‛; ②、梯度方向是函数具有最大变化率的方向。 如图所示,证明上面性质①。为了证明性质②引入方 向导数的概念。
f x f x
*
所以函数f(x)在 x * 处取得局部极小值,称x *为
局部极小点。 而优化问题一般是要求目标函数在某一区域内 的全局极小点。 函数的局部极小点是不是一定是全局极小点呢?
5
第三章 无约束最优化方法
下凸的一元函数
可以证明凸规划问题的局部最小点就是其全局最小点。
6
第三章 无约束最优化方法
即
或
ax a x ax1 ' ab a1b1 ax1 1
' 1
' 1 2
2
(3-2.2) 30
3-2
一维搜索(0.618法)
28
3-2
一维搜索(0.618法)
设区间 a, b 的长为1,在与点 a 相距分别为 和 的点插 x1 和 x1 。为确定 和 ,我们提出一些条件:
应该怎样选取 xi 与 xi 呢?
a, b 中的位臵是对称的。这样一 第一,希望 xi 和 xi 两点在 来,无论删除哪一段,总是保留长为 的区间(板书所 示)。按这一条件有
正定矩阵 设 Q是n×n 阶对称矩阵。
若 x Rn 且 x 0 都有 x T Q x 0 ,则称矩阵Q 是正定的 若 x R
n n
T x 都有 Q x 0 ,则称矩阵Q 是半正定的
若 x R 且 x 0 都有 xT Q x 0 ,则称矩阵Q 是负定的 若 x Rn 都有 x T Q x 0 ,则称矩阵Q 是半负定的
21
第三章 无约束最优化方法
上述算法可用如Βιβλιοθήκη 框图表达开始选定x0 确定p使得
T f(x0) p 0
f(x0 tp) f(x0)
x x 0 tp
是
确定t使得
x满足终止准则 否
X,f(x)
22
x0 x
停
第三章 无约束最优化方法
三、无约束最优化方法的分类 可以处理复杂函数及没有数学表达式 直接法
j 1,2,
, m
, p
k m 1, m 2,
数学规划方法是在规定的约束条件下,用数学手段直 接求目标函数的极大、极小值。特殊情况:
2
第三章 无约束最优化方法
1、无约束最优化问题——不存在约束条件
2、线性规划——当目标函数、约束函数均是变量X的线 性函数时 3、非线性规划——当函数中至少有一个是非线性函数时
b ax1 x1
即
1
(3-2.1)
29
3-2
一维搜索(0.618法)
, b ,在保留下来的 第二,无论删除哪一段,例如删除 x1 ' a , x x x x1 区间里,再插入一个点 2 使得 2 , x1 在 1 中 的位臵与 在 a, b中的位臵具有相同的比例。这就保证每次迭代 和 x1 都以同一 的比率缩短区间。按这一条件有
第三章 无约束最优化方法
同济大学土木工程学院建筑工程系 杨 彬 Course_yb@
1
第三章 无约束最优化方法
最优化的数学模型为 求 min
x x1, x2 , , xn
T
x Rn
f x
subject to (or s.t.) g j x 0
hk x 0
26
3-2
一维搜索(0.618法)
设给定一个较小的步长δ,从α=0开始,先计算φ(0),然 后计算在 (1.618)0 的函数值φ(δ);如果φ(δ)<φ(0), 则讲步长δ增大1.618倍,得到一个新点 1.618 2.618 , 计算φ(2.618δ);如果φ(2.618δ)仍小于φ(δ),再继续增加 步长为原步长的1.618倍,如下图所示,从而得到一系列 j 点的αj的值为 '
3
第三章 无约束最优化方法
3-1 无约束最优化方法概述
无约束最优化问题是数学规划的基础。 无约束最优化问题的定义:求函数 f x 的极小(或极 n n维欧氏空间)。 大)值, x R( 求函数 极小值。
4
第三章 无约束最优化方法
一、最优性条件 根据函数极值条件确定了极小点
x*
则函数f(x)在 x * 附近的一切x均满足不等式
j (1.618)
i 0
(3.2- 1)
27
3-2