第五章-03 惩罚函数法

合集下载

惩罚函数法概述_内点法ppt课件

8
内点法的计算步骤和程序框图
1) 选择 • 可行的初始点; • 惩罚因子的初始值;
• 缩减系数; • 收敛精度;
• 取迭代次数k<-0.
2) 构造惩罚函数,选择无约束优化方法求解方法,求出无约束极值.
3) 判断所得极值点是否满足收敛条件
满足:取极值点为最优点,迭代终止
不满足:缩小惩罚因子,将极值点作为初始点,增加迭代
2.用解析法求内惩罚函数的极小点
( X , r)

[2x1

x2
10

x1

r x2
8
r 2x2 x1 4 x1 x2 8
]T
令( X , r) 0得 :

2x1 x2 10 2x2 x1 4

x1 x1

r
x2 r
x2
(x, r) x12 x22 r ln((1 x1))
11
(x, r) x12 x22 r ln((1 x1))
r4
r=1.2
r=0.36
12
例：用内点惩罚函数法求下列约束优化问题的最优解,取迭代初始X0=[0,0]T,惩罚因子的初始值r0=1,收敛终止条件: ||Xk-Xk-1||<ε, ε=0.01。
次数,转步骤2),直到满足收敛条件为止.
9
内点法程序框图
10
举例
用内点法求最优点: 解：
min f (x) x12 x22 s.t.g (x) 1 x1 0
(x, r) f (x) r
g(x)
( x,
r)

x12

惩罚函数法

内点法的程序框图如下：
k k 1
r k 1 cr k
否
X 0 X *(rk )
开始
输入 X 0、r0、c、
k←0
求 min(X , rk )
满足收敛条件？是
X * X *(rk ) f ( X *) f X *(rk )
结束
3.外点惩罚函数法
求解策略
外点惩罚函数法简称外点法。这种方法和内点相反，
3.外点惩罚函数法
外点法程序框图：
Yes
X * X *(rk )
Yes
f ( X *) f X *(rk )
结束
开始
输入 X 0, r0, c,1,2
k 0
求 min ( X , rk ) 得X *(rk )
Q max g j ( X *(rk ))
Q 1 ?
No
X * (r k ) X * (r k1) 2
(X , r) f (X ) rmax 0, g j (X ) rhk (X )
j 1
k 1
式中：r为惩罚因子，它是由小到大，且趋近于∞的数列
3.外点惩罚函数法
l
2m
2
即 r0＜r1＜r2＜··· ,hk (X ) 、max 0, g j (X )分别对
应为对应于不等式约束和等k式1 约束函数j1的惩罚项，其中
当 r , lim(1 1 ) 1。
r 4r
当逐步增大r值，直至趋近于无穷时，逼近原问题的约束最优
解，当r=0.25,0.5,1,2时，惩罚函数 (X , r) 的等值线图
下如
3.外点惩罚函数法
当r逐渐增大时，极值
点 X *(r)的序列将沿一直线轨迹 ( X *(r), r) 1 X *(r) 在可行域外逐步逼近2 最优2 点。

《惩罚函数法》PPT课件

那么该点x就不会是(*)的最优解。
这样的存在迫使最优解在可行域内取得。随着的增大或更特殊地取为+∞，则问题(*)就成为：
min (x12+x22) 当(x1+x2-2)=0.
这恰为所要求解的原问题.
引例求解思想的理论支持
问题 min (x12+x22)+(x1+x2-2)2
最优解的解析式为：
x1() x2 () 221
一般地，对于等式约束问题， min f(x) s.t. hj(x)=0, j=1:n
将此问题改造成一个新问题(**)：
n
min F( x),f(x )h2 j(x),其中为一个大正数 j1
这个新问题的最优解必定使～x得hj( )接近于0 ～x 否则的话式子中的第二项就会是一个很大的正数现在的这个点就不～会x 是这个无约束问题的极小点
[max2 {(x0 )},2-]s.....[.maxm {(x 0),}2 -]s
h12(x)h22(x).....h .n2(x)）
m
n
f(x )( [mai( x x ){ } 2 0 ] ,h -j2 s (x ))
i 1
j 1
P( x)
F(x, )-----增广目标函数
P(x)-----惩罚函数（惩罚项） ----罚因子
min x12+x22 s.t. x1+x2-2=0
由图解法易见最优解为(1,1)T
将这个问题改造为一个无约束问题如下：
min (x12+x22)+(x1+x2-2)2 (*)
为一个充分大的正的参数
min x12+x22 s.t. x1+x2-2=0

罚函数-原理与应用

定理3.37
定理3.37 设对给定的参数μ,F(x,μ)的无约
束极小值为xμ。那么，xμ成为f(x)的约束极小点的
充要条件是：xμ是原问题的可行点。
罚函数法算法
2.罚函数算法
1) 取初始点X0为非可行点,μ0＞0(通常取μ0=1), ε＞0,c＞1(通常取
c=10),k=0
2) 以Xk为出发点，求解无约束极小化问题：
= 12 + 222 + 21 + (1 + 2 − 1)2
(, )
= 12 + 222 + 21
+ (1 + − 1)2
例题
= 2, 2 = 100
(1) = (−0.2,0.4), ( (1) ,μ0 ) = 1.5237
任选一种无约束极小化算法，可解得F(X, μ0)的
问题转化为：
minF(x)
min() = 12 + 222 + 21
..
(3-98)
基本原理
F(x)的等价表达式：
F(x,μ)=x+μ[max(0,-0+2)]²
其中，μ是一个充分大的正数。记
α(x)=[max(0,-x+2)]²
(3-98)
(3-99)
通常将μα(x)称之为罚函数，记为
点正是X=2
解题步骤
一般情况下：
设原问题为
minf(x)
(3-100)
s.t. gi(x)≤0,i=1,2,…,m (3-101)
hj(x)=0,j=1,2,…,l (3-102)
则可以构造无约束极小化问题：
minF(x,μ)=f(x)+μα(x) (3-103)

罚函数法

外罚函数法算法
Step1: 给出 x0 ∈ Rn (可是不可行点)， > 0(ε =10−4 ) ε 罚因子 σ1(σ1 =1) , 放大系数 C(C =10) , k =1. Step2: 以 xk−1 为初始点求无约束问题： ~ m P( x,σk ) = f ( x) +σk P( x) 得 xk = x(σk ). in ~ Step3: 若 σk P(xk ) < ε , 则 x* = xk ,停；否则转step4 Step4: 令 σk+1 = Cσk , k = k +1, 转step2.
Q f (xk ) ≤ P(xk ,σk ) ≤ f x
设其极限为 f . ∴ { f (xk )} 亦为单调有界序列， ~ ∴ lim σk P(xk ) = lim [P(xk ,σk ) − f (xk )] = p0 − f 0 k→+∞ k→+∞ ~ Q σk →+∞ ∴ lim P(xk ) = 0 k→+∞ ~ ~ ~ 且 P(x) 连续； P(~) = 0 即 ~ 为可行解 x ∴ x Q x →x
0
( )
*
Q x 为最优解；∴ f x* ≤ f (~) x ~, f (x) 连续； f (~) = lim f (x ) ≤ f (x* ) ∴ x Q xk → x k k→+∞ * ~) 即 ~ 为(3)的整体最优解． ∴ f x = f (x x
k *
( )
( )
外罚函数法评价
(1) 如果有了求解无约束问题的好算法，利用外罚函数法求解约束问题很方便． (2) 每个近似解 x(σk ) 往往不是可行解，这是某些实际问题所无法接受的．内罚函数法可以解决． (3) 由收敛性定理 σk 取越大越好， σk 越大将而造成增广目标函数 P( x,σ ) 的Hesse阵条件数越大，趋于病态，给无约束问题求解增加很大困难，甚至无法求解．乘子法可解决这个问题．

惩罚函数法简介

惩罚函数法简介罚函数法它将有约束最优化问题转化为求解无约束最优化问题：其中M为足够大的正数，起"惩罚"作用，称之为罚因子，F(x,M)称为罚函数。

定理对于某个确定的正数M,若罚函数F(x,M)的最优解x*满足有约束最优化问题的约束条件，则x*是该问题的最优解。

序列无约束最小化方法罚函数法在理论上是可行的，在实际计算中的缺点是罚因子M的取值难于把握，太小起不到惩罚作用；太大则由于误差的影响会导致错误。

改进这些缺点，可根据上述定理加以改进，先取较小的正数M，求出F(x,M)的最优解x*。

当x*不满足有约束最优化问题的约束条件时，放大M(例如乘以10)重复进行，直到x*满足有约束最优化问题的约束条件时为止。

种类传统的罚函数法一般分为外部罚函数法和内部罚函数法。

外部罚函数法是从非可行解出发逐渐移动到可行区域的方法。

内部罚函数法也称为障碍罚函数法，这种方法是在可行域内部进行搜索，约束边界起到类似围墙的作用，如果当前解远离约束边界时，则罚函数值是非常小的，否则罚函数值接近无穷大的方法。

由于进化计算中通常采用外部罚函数法，因此本文主要介绍外部罚函数法。

在进化计算中，研究者选择外部罚函数法的原因主要是该方法不需要提供初始可行解。

需要提供初始可行解则是内部罚函数法的主要缺点。

由于进化算法应用到实际问题中可能存在搜索可行解就是NP难问题，因此这个缺点是非常致命的。

外部罚函数的一般形式为B(x)=f(x)+[∑riGi+∑cjHj]其中B(x)是优化过程中新的目标函数，Gi和Hj分别是约束条件gi(x)和hj(x)的函数，ri和cj是常数，称为罚因子。

Gi和Hj最常见的形式是Gi=max[0,gi(x)]aHj=|hj(x)|b其中a和b一般是1或者2。

理想的情况下，罚因子应该尽量小，但是如果罚因子低于最小值时可能会产生非可行解是最优解的情况（称为最小罚因子规则）。

这是由于如果罚因子过大或者过小都会对进化算法求解问题产生困难。

罚函数法

x ∂ 2φ ' ∂ (∂y x ) 2

就是Hesse矩阵，这时大于零（或小于零）与Hesse的正矩阵，这时大于零（或小于零）就是矩阵的正或负定）是一致的，定（或负定）是一致的，二者都可作为判定泛函数极值的充分条件。充分条件。
式中：式中：x(t)---m维状态函数向量； w(t)---r维决策函数向量； f---微分形式状态方程； t---时间变量； t0---初始时刻； tf---终止时刻。
目标函数随状态变量和决策变量的不同而不同，也就是说目标函数是函数都是函数。在不同，也就是说目标函数是函数都是函数。数学上，这种函数称为泛函，数学上，这种函数称为泛函，求泛值的问题称为变分问题。为变分问题。因此，因此，连续系统的最优化问题就是一个变分问题。分问题。由于求泛函的极小问题也是一种极值问题。问题。对于无约束问题，对于无约束问题，根据极值存在的充分必要条件求极值；对于有约束的最优化问题，要条件求极值；对于有约束的最优化问题，则先利用拉格朗日函数或罚函数，先利用拉格朗日函数或罚函数，将其转化成无约束最优化问题后再求解。约束最优化问题后再求解。
动态系统参数的最优化又称连续系统最优化，因为优化问题的解是t的连续函数。动态参数优化问题的一般模型：
min J = min{
∫
tf
t0
F [ x ( t ), w ( t ), t ] dt + s [ x ( t f ), t f ]}
dx ( t ) s .t . = f [ x ( t ), w ( t ), t ] dt g [ x ( t ), w ( t ), t ] ≥ 0 c [ x ( t ), w ( t ), t ] = 0 初始条件： x (t 0 ) = x 0

惩罚函数法

解出x1,x2
5M 4 M 5 x1 x2 2.5 2M 1 2
此时x1,x2则满足约束条件，是原问题的解。
§2惩罚函数法
§2惩罚函数法
§2惩罚函数法
§2惩罚函数法
§2惩罚函数法
§2惩罚函数法例：内点法求解约束问题 min f (u ) au(a 0) s.t.g (u ) b u 0(b 0)
§2惩罚函数法
§2惩罚函数法
§2罚函数法
§2惩罚函数法
§2惩罚函数法
§2惩罚函数法
s.t. h (xi)=x1+ x2-5=0
该问题只有等式约束解：首先建立罚函数：
F ( x, M ) f ( x) Mp( x)
P( x)
(max( 0, g
i 1
l
i
( x )))
2
( h j ( x ))
j 1
m
2
( x1 x 2 5) 2
F ( x, M ) ( x1 4) 2 ( x2 4) 2 M ( x1 x2 5) 2
此时的x1,x2不满足约束条件，不是原问题的解。
当x 不属于 S 时
F§2惩罚函数法 ( x2 4) 2 M ( x1 x2 5) 2 ( x, M ) ( x1 4) 2
F 2( x1 4) 2M ( x1 x 2 5) 0 x1 F 2( x 2 4) 2M ( x1 x 2 5) 0 x 2
*
rk a 2 (b u )
rk a
F (u , rk ) f (u ) rk a (b rk 0
1 1 au rk g (u ) bu

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2 j 1
n
f ( x) ( [max{0,-s i ( x)}]
i 1
m
2

h
j 1
n
2 j
( x ))
F(x, )-----增广目标函数 P(x)-----惩罚函数（惩罚项） ----罚因子
外部罚函数法初步框架
给定初始点x(0)，初始惩罚因子1，放大系数c>1,置k=1
(充分性)若x是原问题的极小点,则对于原问题的任意容许点x,总有
f(x)=F(x, ) =f(x)
(≧在x处罚项=0) (≧在x处罚项=0)
≤F(x, ) (≧x是F的极小点) 这就说明x是原约束问题的最优解。
所谓“符合要求”可作如下的解释：
解min F(x, k)=f(x)+罚项，得解x(k),要看它是否是容许点, 而这只要看是否罚项<, 若是，则x(k)就是原约束问题的一个好的近似解 .
转换原则的解释在极小化新无约束问题时所考虑的是整个空间上的点，而这些点其实是两大块：原可行域D和Rn-D 当任取一点x0时F(x0,)显然是要比 F(x, )(xD)大的，所以min F(x, )时总体上就是从D 外边向D里边(或是边界)“跑”！ · x0
比如一个具体的例子：min (x-1)2 s.t. x-2≥0 构造F(x,)=(x-1)2+[max(0,-(x-2)]2 取0,1,10时F的极小点如图
即 P(x(k)) ≥P(x(k+1))。
从而 f(x(k)) ≤f(x(k+1))
内惩罚函数
外点法是对不可行点施加惩罚，迫使不可行点跑向可行域，而对可行点不加惩罚，由此想法构造出外惩罚函数。内点法也要构造惩罚函数：初始点要求是一个可行的内点由此初始点开始迭代，迭带过程中若有点要离开可行域则对该点施加无穷大的惩罚以不让它离开，这样就保证整个迭代过程都是在可行域内完成的。
直观引例
min x12+x22 s.t. x1+x2-2=0
由图解法易见最优解为(1,1)T
将这个问题改造为一个无约束问题如下：
min (x12+x22)+(x1+x2-2)2 (*)
为一个充分大的正的参数
min x12+x22 s.t. x1+x2约束，则(*)第二项就会非常大
问题“粗放”想法的进一步深入分析
理论上特殊地取为+∞，则
min (x12+x22)+(x1+x2-2)2 (*)
为一个较大的正的参数
的最优解即是原问题的最优解，但是为+≦在计算机上无法实现。实际上充分大时，(*)的最优解即可为原问题的最优解。
引例的计算机处理方法
先给定，求解问题
min (x12+x22)+(x1+x2-2)2.
判断得到的点是否是原问题的解，若还不是，则增大再求上述问题，若还不是，继续。比如本例：取为0,1,10,100,1000时的解如图,趋于(1,1)T.
引例的计算机处理方法
引例求解思想推广到一般的等式约束问题
一般地，对于等式约束问题， min f(x) s.t. hj(x)=0, j=1:n 将此问题改造成一个新问题(**)：
min F(x, ) f(x) h 2 j ( x ) , 其中为一个大正数
j1
n
新目标函数的特征：在任意原问题的可行点x’处：F(x’, )=f(x’); 在任意原问题的不可行点x”处： F(x”, )=f(x”)+大正数。
不等式约束问题改造为相应无约束优化问题的方法根据这样的原则，对不等式约束问题可以类似构造： min f(x) s.t. si(x) ≥0,i=1;m 转化为(易验证满足上述原则)
We do it!
算法流程图初始x(0)， 1>0, c>1,ε>0,k：=1 k:=k+1
以x(k-1)为初始点，解 min f(x)+ KP(x)得x(k)
k+1 :=ck No
k P(x(k))<ε
yes
停； x(k)=opt
小结
外部罚函数法的基本思想
根据约束条件的特点，构造某种“惩罚函数”，然后把这个函数加入到目标函数中，将约束函数的求解转化为一系列无约束问题的求解。
内点法的一个性质 0< k+1< k, F(x, ) =f(x)+ (x), min F(x, k)得x(k), Min F(x, k+1)得x(k+1), 则 F(x(k+1), k+1) ≤ F(x(k), k) Proof F(x(k+1), k+1) =f(x(k+1))+ k+1 (x(k+1)) ≤ f(x(k+1))+ k (x(k+1)) ≤ f(x(k))+ k (x(k)) = F(x(k), k)
min
F(x, ) f(x) （[max{0,-s 1 ( x )}]2 [max{0,-s 2 ( x )}]2 ...... [max{0,-s m ( x )}]2）
2 m in F(x, ) f(x) （ [max{0,-s ( x )}] 1 2 2 [max{0,-s ( x )}] ...... [max{0,-s ( x )}] ） 2 m 2 f ( x ) [max{0,-s ( x )}] i i 1 m
那么该点x就不会是(*)的最优解。
这样的存在迫使最优解在可行域内取得。随着的增大或更特殊地取为+≦，则问题(*)就成为：
min (x12+x22) 当(x1+x2-2)=0.
这恰为所要求解的原问题.
引例求解思想的理论支持
问题
min (x12+x22)+(x1+x2-2)2
最优解的解析式为：
易见,这种解法只能用于不等式约束问题：
min f(x) s.t. si(x) ≥0,i=1:m
min f(x) s.t. si(x) ≥0,i=1:m，可行域记为D 可转化为 min F(x,)=f(x)+ (1/s1(x) + 1/s2(x) +… + 1/sm(x)) 其中为一个小正数。易见，当解这个新问题时，若x由内部接近边界时，则必有某个si(x)接近于0，这样就使得第二项式子的值近于无穷大由此，就保证了迭代只能在D的可行域内，当x试图出去时会遇到一个无穷大的“障碍”而出不去，将F(x, )称为障碍函数，其中的第二项称为惩罚项， >0 称为惩罚因子。仿此，可定义F(x, )= f(x)+ (1/s12(x) +1/s22(x) +…+ 1/sm2(x)) 或F(x, )= f(x)+ (ln1/s1(x) +ln1/s2(x) +…+ ln1/sm(x)) 等
min
F(x, ) f(x) （ [max{0,-s 1 ( x )}]2 [max{0,-s 2 ( x )}]2 ...... [max{0,-s m ( x )}]2 h1 ( x ) h2 ( x ) ...... hn ( x ) ）
2 2 2
这种“惩罚”策略，对于在求解过程中，那些违反约束的迭代点给予很大的目标函数值，(惩罚策略) 迫使一系列无约束问题的极小点或者无限地靠近可行域，直至迭代点列收敛到原约束问题的极小点。
设约束优化问题(I)
min f(x) s.t. si(x)≥0,i=1:m hj(x)=0,j=1:n.
与无约束优化问题(II)
整体最优解分别为x*,x(k), 则对正数序列{k}, k+1> k, 外部罚函数法产生的点列{x(k)}的任意聚点均为(I)的最优解。
外点法的一个重要性质 0<k< k+1, 记F(x, ) =f(x)+ P(x), min F(x, k)得x(k), min F(x, k+1)得x(k+1), 则 (i)F(x(k), k) ≤ F(x(k+1), k+1) (ii)P(x(k)) ≥P(x(k+1)) (iii)f(x(k)) ≤f(x(k+1)) Proof (i)F(x(k), k) =f(x(k))+ kP(x(k))
惩罚函数法
（Penalty Function Mehthod）
南京邮电大学
理学院信息与计算科学系
数学模型
min s.t.
f(x) s1(x) ≥0 …… sm(x) ≥0 h1(x)=0 …… hn(x)=0
求解约束问题的方法分类
将这种约束问题转化为无约束问题（罚函数法等）因无约束问题已有较好的求解方法比如BFGS,DFP 将约束条件对问题的限制作用按一定的规则转换到目标函数上，然后对转换后得到的新的无约束问题求解, 然后将求解的结果反映到原问题. 直接从这种约束问题出发来求解。仿照无约束优化问题的求解思想，构造“下降迭代算法”但是构造的方向满足下降要求前，首先要满足可行域！所以这类方法我们称为可行下降方向法。
外部罚函数法给定初始点x(0)，初始惩罚因子1，放大系数c>1, >0,置k：=1
STEP 1:以x(k-1)为初始点求解 min F(x,k) 得极小点x(k) STEP 2: 若KP (x(k)) < ，stop STEP 3: k+1= c· k,置k：=k+1 转STEP 1
≤ f(x(k+1))+ kP(x(k+1)) ≤ f(x(k+1))+ k+1P(x(k+1))