1无约束最优化问题的最优性条件(精)
最优化理论与算法 第7章 最优性条件

又Hessian阵2
f'(x)=
2x1 0
0 2x2-2
2
f'(x
(1))=
2 0
0 2
,
2
f'(x
(2))=
2 0
0 2
2
f'(x
(3))=
2
0
0 2
,
2
f'(x
(4))=
2 0
0 2
由于2f'(x(1)), 2f'(x(3)), 2f'(x(4))不定或负定,仅2f'(x(2) )正定,
证明. 因 f 在 x* 二次可微,故对任意 x, 有
f(x)=f(x*)+f(x*)(x-x*)+(x-x*)H(x*)(x-x*)/2+||x- x*||2(x*; x- x*),
这里 (x*; x- x*) 0,当 xx*.
假设命题不真, x* 不是局部极小, 则存在序列 {xk }收敛到 x* 并使得 f(xk)<f(x*) 对每一 k成立。定义序列 (xk- x*)/|| xk- x*||=dk.
证明. 由 f(x) 在 x* 可微, 则
f(x*+d)=f(x*) + f(x*)d+||d||(x*;d),
其中 (x*;d) 0(当 0).
2020/12/20
最优化理论
4
7. 最优性条件-无约束3
移项且两边同除以( 0),得
(f(x*+d)-f(x*))/ = f(x*)d+||d||(x*;d)
2x2
令f'(x)=0,即4x13 2x1 2 0,2x2=0
无约束问题的最优性条件

一阶必要条件的表述
若$x^*$是无约束问题的局部最 优解,则$x^*$处的梯度$nabla f(x^*)=0$。这意味着在最优解处, 目标函数的梯度向量必须为零向 量。
几何解释
一阶必要条件可以理解为,在最 优解处,目标函数的等值面(或 曲线)与任意方向的切线(或切 面)都相切,即没有下降方向。
一阶充分条件
04 二阶最优性条件
二阶必要条件
二阶导数矩阵半正定
在最优解处,目标函数的二阶导数矩阵(即海森矩阵)必须是半正定 的,这意味着对于所有非零向量,海森矩阵与其的乘积至少为零。
梯度为零
同时,目标函数在最优解处的梯度必须为零,这是一阶必 要条件的补充。
约束条件
对于约束优化问题,还需要考虑约束条件的二阶影响。在最优 解处,积极约束的拉格朗日乘子应满足相应的二阶条件。
06 最优性条件的应用举例
线性规划的最优性条件
可行域
线性规划问题的可行域是由线性约束条 件所围成的凸多边形区域。
最优解
在可行域中,使目标函数达到最小 (或最大)值的可行解。
基本可行解
满足所有约束条件的解,且所有非基 变量都取值为0的解。
最优性条件
对于线性规划问题,当且仅当所有非 基变量对应的检验数都小于等于0时, 基本可行解才是最优解。
一阶充分条件的表述
若目标函数$f(x)$在$x^*$处可微,且存在某个正数$alpha$,使得对于所有满足$||d||=1$的 方向$d$,都有$nabla f(x^*)^Td ge alpha$,则$x^*$是无约束问题的严格局部最优解。
几何解释与意义
一阶充分条件表明,在最优解处,不仅梯度为零向量,而且目标函数在最优解附近具有“凸 性”,即对于任意方向$d$,目标函数在$x^*$处的方向导数都大于零。这保证了最优解的 唯一性和全局最优性。
非线性规划山大刁在筠运筹学讲义

第四章非线性规划山大刁在筠运筹学讲义(共27页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--第四章 非线性规划教学重点:凸规划及其性质,无约束最优化问题的最优性条件及最速下降法,约束最优化问题的最优性条件及简约梯度法。
教学难点:约束最优化问题的最优性条件。
教学课时:24学时主要教学环节的组织:在详细讲解各种算法的基础上,结合例题,给学生以具体的认识,再通过大量习题加以巩固,也可以应用软件包解决一些问题。
第一节 基本概念教学重点:非线性规划问题的引入,非线性方法概述。
教学难点:无。
教学课时:2学时主要教学环节的组织:通过具体问题引入非线性规划模型,在具体讲述非线性规划方法的求解难题。
1、非线性规划问题举例 例1 曲线最优拟合问题已知某物体的温度ϕ 与时间t 之间有如下形式的经验函数关系:312c t c c t e φ=++ (*)其中1c ,2c ,3c 是待定参数。
现通过测试获得n 组ϕ与t 之间的实验数据),(i i t ϕ,i=1,2,…,n 。
试确定参数1c ,2c ,3c ,使理论曲线(*)尽可能地与n 个测试点),(i i t ϕ拟合。
∑=++-n1i 221)]([ min 3i t c i i e t c c ϕ例 2 构件容积问题通过分析我们可以得到如下的规划模型:⎪⎪⎩⎪⎪⎨⎧≥≥=++++=0,0 2 ..)3/1( max 212121222211221x x S x x x x a x x t s x x a V ππππ 基本概念设n T n R x x x ∈=),...,(1,R R q j x h p i x g x f n j i :,...,1),(;,...,1),();(==, 如下的数学模型称为数学规划(Mathematical Programming, MP):⎪⎩⎪⎨⎧===≤q j x h p i x g t s x f j i ,...,1,0)( ,...,1,0)( ..)( min 约束集或可行域X x ∈∀ MP 的可行解或可行点MP 中目标函数和约束函数中至少有一个不是x 的线性函数,称(MP)为非线性规划令 T p x g x g x g ))(),...,(()(1=T p x h x h x h ))(),...,(()(1=,其中,q n p nR R h R Rg :,:,那么(MP )可简记为⎪⎩⎪⎨⎧≤≤ 0)( 0 ..)( min x h g(x)t s x f 或者 )(min x f Xx ∈ 当p=0,q=0时,称为无约束非线性规划或者无约束最优化问题。
无约束问题的最优化条件

f
(x)
f
(xk ) f
(xk )T
(x
xk )
1 (x 2
xk )T 2
f
(xk )(x
xk )
Q(k) (x)
f
(xk ) f
(xk )T (x xk )
1 2
(
x
xk
)T
2
f
(xk )(x xk )
令
Q(k) (x) x
0
f
( xk
)
2
f
(
xk
)(
x
xk
)
0
x xk (2 f (xk ))1f (xk ) xk Gk1gk
k 满足:
f (xk
dk ) 0
T f (xk k dk )gdk 0
ห้องสมุดไป่ตู้
d
T k 1
gd
k
0
14
a
5.3 牛顿法
自动化学院
15
a
一、牛顿迭代公式
牛顿法的基本思想是利用目标函数在当前迭代点 xk 处 的二次近似的极小点作为 f (x) 的近似极小点。
16
a
设 xk 是当前迭代点, 2 f (xk ) 正定,
5.1 无约束问题的 最优性条件
自动化学院
1
a
一、极小点的概念
1.局部极小点 2.严格局部极小点 3.全局(总体)极小点 4.严格全局(总体)极小点。 注:在非线性规划中,大多数算法都致力于求最优化 问题的局部极小点,一般求全局极小点极为困难,仅 当问题为凸规划时,局部极小为全局极小。
2
a
二、无约束问题最优性条件
的极小值,0.01,x(0)(0,0)T ,只迭代一次
无约束常用优化方法

步长 ,作前进(或后退)试探.如试探成功(目
标函数值有所减小),则按步长序列
,加
大步长(注意每次加大步长都是由初始点算起),直
至试探失败(目标函数值比前一次的有所增加)时,
则取其前一次的步长作为沿这个坐标轴方向搜索的最
优步长,并计算出该方向上的终止点,而后以这个终
止点为始点再进行下一坐标轴方向的搜索,并重复上
处
显然 是二次函数,并且还是正定二次函数,所以 是凸函数且存在唯一全局极小点.为求此极小点,令
即可解得
即
(5.9)
对照基本迭代公式,易知,式(5.9)中的搜索方向
步长因子
方向
是直指点 处近似二次函数
的极小点的方向.此时称此方向为从点 出发的
Newton方向.从初始点开始,每一轮从当前迭代点出发,
沿Newton方向并取步长 的算法称为Newton法.
另外,共轭梯度法不要求精确的直线搜 索.但是,不精确的直线搜索可能导致迭代 出来的向量不再共轭,从而降低方法的效 能.克服的办法是,重设初始点,即把经过 n次迭代得到的Xn作为初始点重新迭代.
五、坐标轮换法
在坐标轮换法中,沿各个坐标轴方向进行一维搜索
时,常选用最优步长法或加速步长法.加速步长法从
初始点出发,沿搜索(坐标轴)方向先取一个较小的
三、共轭方向法
1、概念
通常,我们把从任意点
出发,依次沿某组共轭
方向进行一维搜索的求解最优化问题的方法,叫做共
轭方向法.
2、特点
• 一般地,在n维空间中可以找出n个互相共轭的方向,对于n元正 定二次函数,从任意初始点出发,顺次沿这n个共轭方向最多作n 次直线搜索就可以求得目标函数的极小点.这就是共轭方向法的 算法形成的基本思想.
《最优化方法》课程复习考试

《最优化方法》复习提要 第一章 最优化问题与数学预备知识§1. 1 模型无约束最优化问题 12min (),(,,,)T n n f x x x x x R =∈.约束最优化问题(},,2,1,0)(;,,2,1,0)(,|{l j x h m i x g R x x S j i n ===≥∈=∧)min ();...f x s t x S ⎧⎨∈⎩ 即 m i n ();..()0,1,2,,,()0,1,2,,.i j f x s t g x i m h x j l ⎧⎪≥=⎨⎪==⎩其中()f x 称为目标函数,12,,,n x x x 称为决策变量,S 称为可行域,()0(1,2,,),()0(1,2,,)i j g x i m h x j l ≥===称为约束条件.§1. 2 多元函数的梯度、Hesse 矩阵及Taylor 公式定义 设:,n n f R R x R →∈.如果n ∃维向量p ,n x R ∀∆∈,有()()()T f x x f x p x o x +∆-=∆+∆.则称()f x 在点x 处可微,并称()T df x p x =∆为()f x 在点x 处的微分.如果()f x 在点x 处对于12(,,,)T n x x x x =的各分量的偏导数(),1,2,,if x i n x ∂=∂都存在,则称()f x 在点x 处一阶可导,并称向量12()()()()(,,,)Tnf x f x f x f x x x x ∂∂∂∇=∂∂∂ 为()f x 在点x 处一阶导数或梯度.定理1 设:,n n f R R x R →∈.如果()f x 在点x 处可微,则()f x 在点x 处梯度()f x ∇ 存在,并且有()()T df x f x x =∇∆.定义 设:,n n f R R x R →∈.d 是给定的n 维非零向量,de d=.如果 0()()lim()f x e f x R λλλλ→+-∈存在,则称此极限为()f x 在点x 沿方向d 的方向导数,记作()f x d∂∂. 定理2 设:,n n f R R x R →∈.如果()f x 在点x 处可微,则()f x 在点x 处沿任何非零方向d 的方向导数存在,且()()T f x f x e d ∂=∇∂,其中de d=. 定义 设()f x 是n R 上的连续函数,n x R ∈.d 是n 维非零向量.如果0δ∃>,使得(0,)λδ∀∈,有()f x d λ+<(>)()f x .则称d 为()f x 在点x 处的下降(上升)方向.定理3 设:,n n f R R x R →∈,且()f x 在点x 处可微,如果∃非零向量n d R ∈,使得()T f x d ∇<(>)0,则d 是()f x 在点x 处的下降(上升)方向. 定义 设:,n n f R R x R →∈.如果()f x 在点x 处对于自变量12(,,,)T n x x x x =的各分量的二阶偏导数2()(,1,2,,)i j f x i j n x x ∂=∂∂都存在,则称函数()f x 在点x 处二阶可导,并称矩阵22221121222222122222212()()()()()()()()()()n n n n n f x f x f x x x x x x f x f x f x f x x x x x x f x f x f x x x x x x ⎛⎫∂∂∂ ⎪∂∂∂∂∂ ⎪ ⎪∂∂∂ ⎪∇=∂∂∂∂∂ ⎪ ⎪⎪ ⎪∂∂∂⎪∂∂∂∂∂⎝⎭为()f x 在点x 处的二阶导数矩阵或Hesse 矩阵. 定义 设:,n m n h R R x R →∈,记12()((),(),,())T m h x h x h x h x =,如果 ()(1,2,,)i h x i m =在点x 处对于自变量12(,,,)T n x x x x =的各分量的偏导数()(1,2,,;1,2,,)i jh x i m j n x ∂==∂都存在,则称向量函数()h x 在点x 处是一阶可导的,并且称矩阵111122221212()()()()()()()()()()n n m n m m m n h x h x h x xx x h x h x h x x x x h x h x h x h x xx x ⨯∂∂∂⎛⎫ ⎪∂∂∂⎪⎪∂∂∂⎪∂∂∂∇= ⎪ ⎪⎪∂∂∂ ⎪ ⎪∂∂∂⎝⎭为()h x 在点x 处的一阶导数矩阵或Jacobi 矩阵,简记为()h x ∇.例2 设,,n n a R x R b R ∈∈∈,求()T f x a x b =+在任意点x 处的梯度和Hesse 矩阵.解 设1212(,,,),(,,,)TTn n a a a a x x x x ==,则1()nk k k f x a x b ==+∑,因()(1,2,,)k kf x a k n x ∂==∂,故得()f x a ∇=.又因2()0(,1,2,,)i jf x i j n x x ∂==∂∂,则2()f x O ∇=.例3 设n n Q R ⨯∈是对称矩阵,,n b R c R ∈∈,称1()2TT f x x Qx b x c =++为二次函数,求()f x 在任意点x 处的梯度和Hesse 矩阵.解 设1212(),(,,,),(,,,)T T ij n n n n Q q x x x x b b b b ⨯===,则121111(,,,)2n nnn ij i j k k i j k f x x x q x x b x c ====++∑∑∑,从而111111111()()()nn j j j j j j n n n nj j n nj j j j n f x q x b q x x bf x Qx b f x b q x b q x x ====⎛⎫⎛⎫∂⎛⎫+ ⎪ ⎪ ⎪∂⎛⎫ ⎪ ⎪⎪ ⎪ ⎪ ⎪ ⎪∇===+=+ ⎪ ⎪ ⎪ ⎪ ⎪∂⎝⎭ ⎪ ⎪ ⎪+ ⎪ ⎪ ⎪∂⎝⎭⎝⎭⎝⎭∑∑∑∑.再对1()(1,2,,)nij j i j i f x q x b i n x =∂=+=∂∑求偏导得到2()(,1,2,,)ij i jf x q i j n x x ∂==∂∂,于是1112121222212()n n n n nn q q q q q q f x Q q q q ⎛⎫⎪ ⎪∇== ⎪⎪⎝⎭. 例 4 设()()t f x td ϕ=+,其中:n f R R →二阶可导,,,n n x R d R t R ∈∈∈,试求(),()t t ϕϕ'''.解 由多元复合函数微分法知 2()(),()()T T t f x td d t d f x td d ϕϕ'''=∇+=∇+. 定理4 设:,n n f R R x R →∈,且()f x 在点x 的某邻域内具有二阶连续偏导数,则()f x 在点x 处有Taylor 展式21()()()(),(01)2T T f x x f x f x x x f x x x θθ+∆=+∇∆+∆∇+∆∆<<.证明 设()(),[0,1]t f x t x t ϕ=+∆∈,则(0)(),(1)()f x f x x ϕϕ==+∆.按一元函数Taylor 公式()t ϕ在0t =处展开,有21()(0)(0)(),(0)2t t t t ϕϕϕϕθθ'''=++<<.从例4得知2(0)(),()()()T T f x x x f x x x ϕϕθθ'''=∇∆=∆∇+∆∆.令1t =,有21()()()(),(01)2T T f x x f x f x x x f x x x θθ+∆=+∇∆+∆∇+∆∆<<.根据定理1和定理4,我们有如下两个公式()()()()()T f x f x f x x x o x x =+∇-+-,221()()()()()()()()2T T f x f x f x x x x x f x x x o x x =+∇-+-∇-+-.§1. 3 最优化的基本术语定义 设:n f R R →为目标函数,n S R ⊆为可行域,x S ∈.(1) 若x S ∀∈,都有()()f x f x ≥,则称x 为()f x 在S 上的全局(或整体)极小点,或者说,x 是约束最优化问题min ()x Sf x ∈的全局(或整体)最优解,并称()f x为其最优值.(2) 若,x S x x ∀∈≠,都有()()f x f x >,则称x 为()f x 在S 上的严格全局(或整体)极小点.(3) 若x ∃的δ邻域(){}(0)n N x x R x x δδδ=∈-<>使得()x N x S δ∀∈,都有()()f x f x ≥,则称x 为()f x 在S 上的局部极小点,或者说,x 是约束最优化问题min ()x Sf x ∈的局部最优解.(4) 若x ∃的δ邻域()(0)N x δδ>使得(),x N x S x x δ∀∈≠,都有()()f x f x >,则称x 为()f x 在S 上的严格局部极小点.第二章 最优性条件§2.1 无约束最优化问题的最优性条件定理 1 设:n f R R →在点x 处可微,若x 是问题min ()f x 的局部极小点,则()0f x ∇=.定义 设:()n f S R R ⊆→在int x S ∈处可微,若()0f x ∇=,则称x 为()f x 的平稳点.定理2 设:n f R R →在点x 处具有二阶连续偏导数,若x 是问题min ()f x 的局部极小点,则()0f x ∇=,且2()f x ∇半正定.定理3 设:n f R R →在点x 处具有二阶连续偏导数,若()0f x ∇=,且2()f x ∇正定,则x 是问题min ()f x 的严格局部极小点. 注:定理2不是充分条件,定理3不是必要条件.例1 对于无约束最优化问题2312min ()f x x x =-,其中212(,)T x x x R =∈,显然 2212()(2,3),T f x x x x R ∇=-∀∈,令()0f x ∇=,得()f x 的平稳点(0,0)T x =,而且2222020(),()0600f x f x x ⎛⎫⎛⎫∇=∇= ⎪ ⎪-⎝⎭⎝⎭.易见2()f x ∇为半正定矩阵.但是,在x 的任意δ邻域x x δ-<,总可以取到(0,)2T x δ=,使()()f x f x <,即x 不是局部极小点.例2 对于无约束最优化问题42241122min ()2f x x x x x =++,其中212(,)T x x x R =∈, 易知3223112122()(44,44)Tf x x x x x x x ∇=++,从而得平稳点(0,0)T x =,并且 22221212221212001248(),()008412x x x x f x f x x x x x ⎛⎫+⎛⎫∇=∇=⎪ ⎪+⎝⎭⎝⎭. 显然2()f x ∇不是正定矩阵.但是,22212()()f x x x =+在x 处取最小值,即x 为严格局部极小点.例3 求解下面无约束最优化问题332122111min ()33f x x x x x =+--,其中212(,)T x x x R =∈, 解 因为21212222201(),()0222x x f x f x x x x ⎛⎫-⎛⎫∇=∇= ⎪ ⎪--⎝⎭⎝⎭,所以令()0f x ∇=,有2122210,20.x x x ⎧-=⎪⎨-=⎪⎩解此方程组得到()f x 的平稳点(1)(2)(3)(4)1111,,,0202x x x x --⎛⎫⎛⎫⎛⎫⎛⎫==== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭.从而2(1)2(2)2020(),()0202f x f x ⎛⎫⎛⎫∇=∇= ⎪ ⎪-⎝⎭⎝⎭,2(3)2(4)2020(),()0202f x f x --⎛⎫⎛⎫∇=∇= ⎪ ⎪-⎝⎭⎝⎭.由于2(1)()f x ∇和2(4)()f x ∇是不定的,因此(1)x 和(4)x 不是极值点.2(3)()f x ∇是负定的,故(3)x 不是极值点,实际上它是极大点.2(2)()f x ∇是正定的,从而(2)x 是严格局部极小点.定理4 设:n f R R →是凸函数,且()f x 在点n x R ∈处可微,若()0f x ∇=,则x 为min ()f x 的全局极小点.推论5 设:n f R R →是凸函数,且()f x 在点n x R ∈处可微.则x 为min ()f x 的全局极小点的充分必要条件是()0f x ∇=. 例 4 试证正定二次函数1()2TT f x x Qx b x c =++有唯一的严格全局极小点1x Q b -=-,其中Q 为n 阶正定矩阵.证明 因为Q 为正定矩阵,且(),n f x Qx b x R ∇=+∀∈,所以得()f x 的唯一平稳点1x Q b -=-.又由于()f x 是严格凸函数,因此由定理4知,x 是()f x 的严格全局极小点.§2.2 等式约束最优化问题的最优性条件定理1 设:n f R R →在点x 处可微,:(1,2,,)n j h R R j l →=在点x 处具有一阶连续偏导数,向量组12(),(),,()l h x h x h x ∇∇∇线性无关.若x 是问题min ();..()0,1,2,,j f x s t h x j l ⎧⎨==⎩的局部极小点,则,1,2,,j v R j l ∃∈=,使得1()()0lj j j f x v h x =∇-∇=∑.称(,)()()T L x v f x v h x =-为Lagrange 函数,其中12()((),(),,())T l h x h x h x h x =.称12(,,,)T l v v v v =为Lagrange 乘子向量.易见(,)x v L L x v L ∇⎛⎫∇= ⎪∇⎝⎭,这里1(,)()(),(,)()lx j j v j L x v f x v h x L x v h x =∇=∇-∇∇=-∑.定理 2 设:n f R R →和:(1,2,,)n j h R R j l →=在点n x R ∈处具有二阶连续偏导数,若l v R ∃∈,使得(,)0x L x v ∇=,并且,,0n z R z ∀∈≠,只要()0,1,2,,T j z h x j l ∇==,便有2(,)0T xx z L x v z ∇>,则x 是问题min ();..()0,1,2,,j f x s t h x j l ⎧⎨==⎩的严格局部极小点.例1 试用最优性条件求解 221212min ();..()80.f x x x s t h x x x ⎧=+⎨=-=⎩解 Lagrange 函数为221212(,)(8)L x v x x v x x =+--,则1221122(,)2(8)x vx L x v x vx x x -⎛⎫⎪∇=- ⎪ ⎪--⎝⎭, 从而得(,)L x v 的平稳点(8,8,2)T 和(8,8,2)T --,对应有(8,8),2T x v ==和(8,8),2T x v =--=.由于221222(,),()222xx x v L x v h x x v--⎛⎫⎛⎫⎛⎫∇==∇= ⎪⎪ ⎪--⎝⎭⎝⎭⎝⎭. 因此1212(){(,)|(,)()0}T M x z z z z h x =∇=121221{(,)|0}T z z z x z x =+= 1212{(,)|}T z z z z ==-.并且(),0z M x z ∀∈≠,有222211221(,)24280T xx z L x v z z z z z z ∇=-+=>.利用定理2,所得的两个可行点(8,8)T x =和(8,8)T x =--都是问题的严格局部极小点.§2.3 不等式约束最优化问题的最优性条件定义 设,,,0n n S R x clS d R d ⊆∈∈≠,若0δ∃>,使得,,(0,)x d S λλδ+∈∀∈, 则称d 为集合S 在点x 处的可行方向. 这里{|,(),0}n clS x x R SN x δδ=∈≠∅∀>.令 {|0,0,,(0,)}D d d x d S δλλδ=≠∃>+∈∀∈使,0{|()0}T F d f x d =∇<.定理 1 设n S R ⊆是非空集合,:,,()f S R x S f x →∈在点x 处可微.若x 是问题min ()x Sf x ∈的局部极小点,则 0F D =∅.对于min ();..()0,1,2,,,i f x s t g x i m ⎧⎨≥=⎩ (1)其中:,:(1,2,,)n n i f R R g R R i m →→=.令(){|()0,1,2,,}i I x i g x i m ===,其中x 是上述问题(1)的可行点.定理 2 设x 是问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(())i g x i I x ∉在点x 处连续,如果x 是问题(1)的局部极小点,则 00F G =∅,其中0{|()0,()}T i G d g x d i I x =∇>∈.定理 3 设x 是问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(())i g x i I x ∉在点x 处连续,若x 是问题(1)的局部极小点,则存在不全为0的非负数0,(())i u u i I x ∈,使0()()()0iii I x u f x u g x ∈∇-∇=∑. (x 称为Fritz John 点)如果()(())i g x i I x ∉在点x 处也可微,则存在不全为0的非负数01,,,m u u u ,使01()()0,()0,1,2,,.mi i i i iu f x u g x u g x i m =⎧∇-∇=⎪⎨⎪==⎩∑ (x 称为Fritz John 点) 例1 设1311222min ();..()(1)0,()0.f x x s t g x x x g x x =-⎧⎪=--≥⎨⎪=≥⎩试判断(1,0)T x =是否为Fritz John 点. 解 因为12100(),(),()011f x g x g x -⎛⎫⎛⎫⎛⎫∇=∇=∇= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭,且(){1,2}I x =,所以为使Fritz John 条件01210000110u u u -⎛⎫⎛⎫⎛⎫⎛⎫--= ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭⎝⎭成立,只有00u =才行.取0120,0u u u α===>即可,因此x 是Fritz John 点.定理 4 设x 是问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(())i g x i I x ∉在点x 处连续,并且()(())i g x i I x ∇∈线性无关.若x 是问题(1)的局部极小点,则存在0(())i u i I x ≥∈,使得()()()0iii I x f x u g x ∈∇-∇=∑. (x 称为K-T 点)如果()(())i g x i I x ∉在点x 处也可微,则存在0(1,2,,)i u i m ≥=,使得1()()0,()0,1,2,,.mi i i i if x ug x u g x i m =⎧∇-∇=⎪⎨⎪==⎩∑ (x 称为K-T 点) 例2 求最优化问题21211222min ()(1);..()20,()0f x x x s t g x x x g x x ⎧=-+⎪=--+≥⎨⎪=≥⎩的K-T 点. 解 因为1122(1)10(),(),()111x f x g x g x --⎛⎫⎛⎫⎛⎫∇=∇=∇= ⎪ ⎪ ⎪-⎝⎭⎝⎭⎝⎭,所以K-T 条件为111211222122(1)0,10,(2)0,0,0,0.x u u u u x x u x u u -+=⎧⎪+-=⎪⎪--+=⎨⎪=⎪⎪≥≥⎩ 若20u =,则11u =-,这与10u ≥矛盾.故20u >,从而20x =;若120x -+=,则12u =-,这与10u ≥矛盾.故10u =,从而211,1u x ==; 由于120,0u u ≥≥,且(1,0)T x =为问题的可行点,因此x 是K-T 点. 定理5 设在问题(1)中,()f x 和()(1,2,,)i g x i m -=是凸函数,x 是可行点,并且()f x 和()(())i g x i I x ∈在点x 处可微.若x 是问题(1)的K-T 点,则x 是问题(1)的全局极小点.§2.4 一般约束最优化问题的最优性条件考虑等式和不等式约束最优化问题min ();..()0,1,2,,,()0,1,2,,,i j f x s t g x i m h x j l ⎧⎪≥=⎨⎪==⎩(1) 其中:,:(1,2,,),:(1,2,,)n n n i j f R R g R R i m h R R j l →→=→=.并把问题(1)的可行域记为S .,(){|()0,1,2,,}i x S I x i g x i m ∀∈==.定理 1 设x 为问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(1,2,,)j h x j l =在点x 处具有一阶连续偏导数,()(())i g x i I x ∉在点x 处连续,并且向量组12(),(),,()l h x h x h x ∇∇∇线性无关.若x 是问题(1)的局部极小点,则 00F G H =∅,这里0{|()0}T F d f x d =∇<,0{|()0,()}T i G d g x d i I x =∇>∈,0{|()0,1,2,,}T j H d h x d j l =∇==.定理 2 设x 为问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(1,2,,)j h x j l =在点x 处具有一阶连续偏导数,()(())i g x i I x ∉在点x 处连续.若x 为问题(1)的局部极小点,则存在不全为0的数0,(())i u u i I x ∈和(1,2,,)j v j l =,且0,0(())i u u i I x ≥∈,使0()1()()()0liijji I x j u f x u g x v h x ∈=∇-∇-∇=∑∑. (x 称为Fritz John 点)若()(())i g x i I x ∉在点x 处也可微,则存在不全为0的数0,(1,2,,)i u u i m =和(1,2,,)j v j l =,且0,0(1,2,,)i u u i m ≥=,使011()()()0,()0,1,2,,.m li i j j i j i iu f x u g x v h x u g x i m ==⎧∇-∇-∇=⎪⎨⎪==⎩∑∑ (x 称为Fritz John 点)例1 设2212311222212min ();..()0,()0,()(1)0.f x x x s t g x x x g x x h x x x ⎧=+⎪=-≥⎪⎨=≥⎪⎪=--+=⎩试判断(1,0)T x =是否为Fritz John 点.解 (){2}I x =,且2200(),(),()011f x g x h x ⎛⎫⎛⎫⎛⎫∇=∇=∇= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,且(){1,2}I x =,因此为使Fritz John 条件022*******u u v ⎛⎫⎛⎫⎛⎫⎛⎫--= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭成立,只有00u =才行.所以取020,1,1u u v ===-,即知x 是Fritz John 点.定理 3 设x 为问题(1)的可行点,()f x 和()(())i g x i I x ∈在点x 处可微,()(1,2,,)j h x j l =在点x 处具有一阶连续偏导数,()(())i g x i I x ∉在点x 处连续,且向量组()(()),()(1,2,,)i j g x i I x h x j l ∇∈∇=线性无关.若x 是问题(1)的局部极小点,则存在数0(())i u i I x ≥∈和(1,2,,)j v j l =,使()1()()()0liijji I x j f x u g x v h x ∈=∇-∇-∇=∑∑. (x 称为K-T 点)如果()(())i g x i I x ∉在点x 处也可微,则存在数0(1,2,,)i u i m ≥=和(1,2,,)j v j l =,使11()()()0,()0,1,2,,.m li i j j i j i if x ug x vh x u g xi m ==⎧∇-∇-∇=⎪⎨⎪==⎩∑∑ (x 称为K-T 点) 令 1212()((),(),,()),()((),(),,())T T m l g x g x g x g x h x h x h x h x ==,1212(,,,),(,,,)T T m l u u u u v v v v ==,称u 与v 为广义Lagrange 乘子向量或K-T 乘子向量.()()()0,()0,0.T T Tf xg x uh x v u g x u ⎧∇-∇-∇=⎪=⎨⎪≥⎩令(,,)()()()T T L x u v f x u g x v h x =--为广义Lagrange 函数.称(,,)L x u v 为广义Lagrange 函数.则K-T 条件为(,,)0,()0,0.x TL x u v u g x u ∇=⎧⎪=⎨⎪≥⎩定理 4 设在问题(1)中,()f x 和()(1,2,,)i g x i m -=是凸函数,()(1,2,,)j h x j l =是线性函数,x 是可行点,并且()f x 和()(())i g x i I x ∈在点x 处可微.若x 是问题(1)的K-T 点,则x 是问题(1)的全局极小点.例2 求解最优化问题221221212min ()(3)(1);..()0,()230.f x x x s t g x x x h x x x ⎧=-+-⎪=-+≥⎨⎪=+-≥⎩ 解 广义Lagrange 函数为222121212(,,)()()()(3)(1)()(23)L x u v f x ug x vh x x x u x x v x x =--=-+---+-+-.因为111(,,)2(3)22L x u v x ux v x ∂=-+-∂,22(,,)2(1)L x u v x u v x ∂=---∂.所以K-T 条件及约束条件为112212212122(3)220,2(1)0,()0,0,230,0.x ux v x u v u x x x x x x u -+-=⎧⎪---=⎪⎪-+=⎪⎨-+≥⎪⎪+-=⎪≥⎪⎩ 下面分两种情况讨论. (1) 设0u =,则有12122(3)20,2(1)0,230.x v x v x x --=⎧⎪--=⎨⎪+-=⎩ 由此可解得12718,,555x x v ===-,但71(,)55T x =不是可行点,因而不是K-T 点.(2) 设0u >,则有112212122(3)220,2(1)0,0,230.x ux v x u v x x x x -+-=⎧⎪---=⎪⎨-+=⎪⎪+-=⎩ 由此可得211230x x --+=,解得11x =或13x =-。
最优化计算方法(工程优化)第4章
点。
如果 2 f x 负定,则 x 为 f (x) 的严格局部极大点。
无约束优化的最优性条件----凸优化的一阶条件
定理(一阶充要条件)
设 f : Rn R 是凸函数且在 x 处连续可微,则 x 为 f (x)的全局极小点的充要条件是 f (x*) 0.
f (x p) f (x)+f (x)T p o( )
P是什么方向时,函数值 f (x p) 下降最快?也就是
p是什么方向时,f (x)T p 取得最小值?
f (x)T p f (x) p cos(f (x), p)
当 cos(f (x), p) 1 时,f (x)T p 最小,最小值为
令 f x 0, 即:
利用一阶条件 求驻点
利用二阶条件 判断驻点是否 是极小点
x12 1 0
x22
2x2
0
得到驻点: 1 1 1 1
x1
0 ,
x2
2 ,
x3
0
,
x4
2
.
无约束优化的最优性条件
函数 f x 的Hesse阵:
2
f
x
2x1
0
0
2
x2
2
利用二阶条件 判断驻点是否 是极小点
2 0
0 2
的行列式小于0;
x1, x4是鞍点;
2
f
x2
2 0
0
2
是正定矩阵;
x2 是极小点;
2
f
x3
2 0
0 2
是负定矩阵;
x3 是极大点。
• 对某些较简单的函数,这样做有时是可行的;
最优化方法第六讲 无约束(多维)最优化
step4. 若 || f ( xk1) || ,停止,x* xk1 ;
否则,令 k : k 1, 转step 2 。
14
➢算法框图
给定初始点x0和精度 || f ( x0 ) ||
停止,输出x1
否
是
| x1 x0 |
是 停止,输出x0
否 否
2 f (x0) 0
计算x1
x0
f ( x0 ) 2 f (x0)
1
13 62
x2
x1
1d 1
(
36 , 31
8 31
)T
7
三、最速下降法的特点
1.性质. 设 f ( x) 有一阶连续偏导数,若 步长 满足 k
f ( xk d k ) min f ( xk d k )
k
则有 f ( xk d k )T d k 0。 k
证明:令 ( ) f ( xk d k ),所以
5
一、梯度法(最速下降法):
1. 搜索方向:d k f ( xk ) ,也称为最速下降方向;
2. 搜 索 步 长: k 取 最 优 步 长, 即 满 足
f (xk
kd k )
min
f
(xk
d k ) 。
二、梯度法算法步骤:
1. 给定初始点 x1 Rn ,允许误差 0, 令k 1。
2. 计算搜索方向 d k f ( xk ) ;
Step3. 令 xk 1 xk kd k , 其中tk : f ( xk kd k ) min f ( xk d k )。
24
Step 4. 判断 xk 1 是否满足终止准则: yes: 计算 stop, 则x* : xk1
No : 转 step 5 。
无约束问题的最优化条件
即,在算法每次迭代中,求解信赖域子问题:
1 T min (d ) f ( xk ) g k d d Gk d 2
(k ) T
s.t
d hk
在信赖域算法中,信赖域半径 hk 采用自适应方式调整, 若
(k )
(d ) 与 f ( xk d ) 近似程度好,则 hk 尽可能取大,
T (0)
2)方向
d
(0)
(G( x )) f ( x ) 1, 3 2
(0) 1 (0)
T
3)求最优步长
x
(0) dFra bibliotek(0)代入目标函数得:
(1)
1 0 3 3 0 2 2
(0)
三、最速下降算法收敛性定理
定理 5 设 f C1 (一阶连续可微), S x f ( x ) f ( x0 )
有界,则由最速下降法得到的迭代点列 xk 具有如下性质: 1) 数列 f ( xk ) 严格单调下降; 2) xk 的任何极限点(聚点) x 都是 f ( x ) 的驻点,
T k 1
d k 0
5.3 牛顿法
自动化学院
一、牛顿迭代公式
牛顿法的基本思想是利用目标函数在当前迭代点 xk 处 的二次近似的极小点作为 f ( x ) 的近似极小点。
设 xk 是当前迭代点, 2 f ( xk ) 正定,
1 f ( x) f ( xk ) f ( xk ) ( x xk ) ( x xk )T 2 f ( xk )( x xk ) 2 1 (k ) T Q ( x) f ( xk ) f ( xk ) ( x xk ) ( x xk )T 2 f ( xk )( x xk ) 2
约束优化问题的最优性条件
{
}
连续,若 x 是(NLP1)的局部最优解,则存在不全 为零的非负数 w0 , wi (i ∈ i ) ,使得
w0∇f ( x) − ∑ wi ∇gi ( x) = 0
i∈I
证明:参见陈宝林书 page 239
注:运用Fritz John 条件时,可能出现 w0 = 0 的情形。这时Fritz John 条件中实际上不包含 目标函数的任何数据,只是把起作用约束的梯 度组合成零向量。这样的条件,对于问题的解 的描述,没有多大价值。我们感兴趣的是
w0 ≠ 0 的情形,所以为了保证 w0 ≠ 0 ,还需
要对约束施加某种限制。这种限制条件通常称 为约束规格。在定理7.3中,如果增加起作用 约束的梯度线性无关的约束规格,则给出不等 式约束问题的著名的K-T条件。
定理7.8 (K-T 必要条件) 考虑约束问题(NLP) , x 为可行点,I = i gi ( x) = 0 , f (x) 和 gi (x) (i ∈ I ) 在 x 处可微, gi (x) (i ∉ I ) 在 x 处连续, hj (j=1,…,l) 在 x 处连续可微。向量集
∂f = d T ∇f ( x ) ≥ 0 ∂d
(d
= 1)
即在极小点处的可行方向一定不是下降方向
n R 定理7.1 考虑约束极值问题 (NLP) , 设 S 是 中的非空集合,x ∈ S , f (x) 在 x 处可微。如果 x
是局部最优解,则
F0 ∩ D = ∅
证明:参见陈宝林书 page236
定理7.5 设在问题(NLP1)中, f 是凸函数, gi(x)(i=1,2,…,m) 是凹函数,S为可行域,x ∈ S
I = i gi ( x) = 0 , f (x) 和 gi (x) (i ∈ I )在 x 处可微,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无约束最优化问题的最优性条件
二阶必要条件 (3) 定理3.1.2仅仅是必要条件而非充分条件.
3 例 f ( X ) f ( x1 , x2 ) x13 x2 在x0=(0,0)T处,有
2 0 f ( X 0 ) (0,0) , f ( X 0 ) 0 0 , 即 2 f ( X 0 )半正定. 但x 0 不是局部极小点.
无约束最优化问题的最优性条件
例 1: 利用极值条件解下列问题:
1 3 1 3 2 min f x x1 x2 x2 x1 3 3 f f 2 2 解: x1 1 x2 2 x2 x1 x2 令f x 0 , 即: 2 x 1 1 0 2 x2 2 x2 0 1 1 1 1 x1 得到驻点: 0 , x2 2 , x3 0 , x4 2 .
0 , 2
2 f x3 0
2
0 2 2 , f x4 0 2
0 . 2
无约束最优化问题的最优性条件
由于矩阵 2 f x1 , 2 f x4 不定,则
x1 , x4 不是极小点.
第三章 最优性条件
Optimality Conditions
所谓最优性条件,是指最优化问题的最优解所要满足的 必要条件或充分条件,这些条件对于最优化算法的建立 和最优化理论的推整都是至关重要的.
第三章 最优性条件
无约束最优化问题的最优性条件 等式约束最优化问题的最优性条件 不等式约束最优化问题的最优性条件 一般约束最优化问题的最优性条件
Point 0 的点称为驻点. 平稳点
驻点分为:极小点,极大点,鞍点.
Saddle Point
无约束最优化问题的最优性条件
一阶必要条件
f ( x ) 0的几何意义:函数曲面在x*处的切平面是水平的.
*
所谓x*是鞍点,从直观上说曲面在x*处沿某方向 “向上弯曲”,而沿另一方向“向下弯曲”.
无约束最优化问题的最优性条件
函数 f x 的Hesse阵:
0 2 x1 f x 0 2 x 2 2 故, 在点 x1 , x2 , x3 , x4处的Hesse阵依次为:
2
2 f x1 0
2
0 2 2 , f x2 0 2
无约束最优化问题的最优性条件
二阶必要条件 定理3.1.2 若 x 为f x 的局部极小点, 且在 N x
*
*
内 f x 二阶连续可微, 则 f ( x * ) 0 , 2 f ( x * ) 半正定. 注: (1) f ( X ) 刻画了f(x)在x处切平面的法向.
2 (2) f ( X ) 刻画了曲面f(x) 的弯曲方向.
T 2
无约束最优化问题的最优性条件
二阶充分条件
且 定理3.1.3 若在 N x* 内 f x 二阶连续可微, * * 2 * x f ( x ) 0 , f ( x ) 正定, 则 为严格局部 极小点. 注:(1)如果 G * 负定, 则 x * 为严格局部极大点. (2) 定理3.1.3仅仅是充分条件而非必要条件.
无约束最优化问题的最优性条件
无约束最优化问题 min f(x) (3.1.1) 其中f:R R.
n
无约束最优化问题的最优性条件
若n=1,则f(x)为一元函数. 回顾:一元函数的最优性条件 必 (1) 若 x * 为 f x 的局部极小点, 则 f x * 0 ; 要 * (2) 若 为 f x 的局部极小点, 则: x 条 件 f x * 0 , f x * 0. 充分 条件 (3) 若 f x * 0 , f x * 0, 则 x * 为 f x 的严格局部极小点;
无约束最优化问题的最优性条件
一阶必要条件 定理3.1.1 若 x * 为f x 的局部极小点, 且在 N x* 内 f x 一阶连续可微, 则 g * f x* 0 . 注: (1) 仅仅是必要条件,而非充分条件.Stationary (2) 满足 g * f x*
4 2 2 4 例 f ( x ) x1 2 x1 x2 x2
Байду номын сангаас
分析: x0=(0,0)T为其严格局部极小点. 但有
0 0 f ( X 0 ) (0,0) , f ( X 0 ) 0 0 .
T 2
无约束最优化问题的最优性条件
凸优化问题-----一阶充要条件 定理3.1.4 设 f x 在 R n上是凸函数且在x*处一阶 连续可微, 则 x * 为 f x 的全局极小点的充要条件 是 f ( x * ) 0 . 定理3.1.5 设 f x 在 R n上是严格凸函数,在x*处 * 且 f ( x ) 0 , 则 x*为 f x 一阶连续可微, 的惟一全局极小点.
则 x 3 不是极小点, 2 f x3 负定, 实际上它是极大点.
f x2 正定, 则 x 2 是局部极小点.
2