最优控制汉密尔顿函数问题

第十章_具有约束的最优控制问题

G ( t , y , u ) [ 的运动方程
T
]
(t )
在计划时期内的初始值和终结值是：
0 0
( 0 ) G ( , y , u ) d 0
(T ) G ( , y , u ) d k
0
上页的最优控制问题变为：T 最优控制问题：最大化 0 F ( t , y , u ) dt
T
例2 解以下最优控制问题：

最大化 0 1 dt y yu 满足
y (0) 5 y ( T ) 11 T 自由
T

和
u ( t ) [ 1,1]
它具有一个受约束的控制变量，该控制集合可视为两个不等式约束：
1 u (t ) 和 u (t ) 1
汉密尔顿函数： H 拉格朗日函数：
u
对于所有 t [ 0 , T ]
]
H y [ 的运动方程 ]
y
H
[ y 的运动方程
(t ) 常数
( T ) 0 [ 横截条件 ]
四、不等式积分约束 T 最优控制问题：最大化 0 F ( t , y , u ) dt y f (t, y , u ) 满足
y H H
u
F (t, y , u ) f (t, y , u ) G (t, y , u )
[ y 的运动方程
[ 的运动方程
]

[ 的运动方程
]
[ 的运动方程
]
( T ) 0 [ 横截条件 ]
上页的最大值原理可简化为：
Max H
]
]
( T ) 0 , ( T ) k 0 , ( T )[ ( T ) k ] 0 [ 的横截条件

hamilton–jacobi–bellman 方程

hamilton–jacobi–bellman 方程Hamilton-Jacobi-Bellman方程（简称HJB方程）是一个偏微分方程，是最优控制的核心。

其解是针对特定动态系统及相关代价函数下，有最小代价的实值函数。

若只在某一个区域求解，HJB方程是一个必要条件，若是在整个状态空间下求解，HJB方程是充份必要条件。

其解是针对开回路的系统，但也允许针对闭回路系统求解。

HJB方程也可以扩展到随机系统。

一些经典的变分问题，例如最速降线问题，可以用此方法求解。

HJB方程的基础是以1950年代由理查德·贝尔曼及其同仁提出的动态规划。

对应的离散
系统方程式一般称为贝尔曼方程。

第十章_具有约束的最优控制问题

对于给定的，或者关于( y , u ) 对所有t [ 0 , T ] 是凹的，或者 H 0 关于 y 对于所有t [ 0 , T ] 是凹的。
如果是无限水平问题，充分性定理仍然适用，但是要加上一个补充性条件：
T
lim ( t )[ y ( t ) y ( t )] 0
G ( t , y , u ) [ 的运动方程
T
]
(t )
在计划时期内的初始值和终结值是：
0 0
( 0 ) G ( , y , u ) d 0
(T ) G ( , y , u ) d k
0
上页的最优控制问题变为：T 最优控制问题：最大化 0 F ( t , y , u ) dt
]
H y [ 的运动方程 ]
y
H
[ y 的运动方程
( T ) 0 [ y 的横截条件
( t ) 常数 0
和
]
k
G ( t , y , u ) dt
0
T
0
k
G ( t , y , u ) dt 0 0
T
]
(t )
在计划时期内的初始值和终结值是：
0 0
( 0 ) G ( , y , u ) d 0
(T ) G ( , y , u ) d k
0
上页的最优控制问题变为：最优控制问题：最大化 F ( t , y , u ) dt 0 y f (t, y , u ) 满足
(10 . 43 ) (10 . 44 ) (10 . 45 ) (10 . 47 )

最优控制理论与系统胡寿松版课后习题答案

3－ 6 已知二阶系统方程
?
x1(t)
?
x2(t)
x2(t ) u(t ),
x1 (0) 0
x1(t f )
2
式中
x2 (0) 0, x2 (t f ) 2,
u(t)
1,t f 自由。试求使性能指标 J
1 2
t 0
f
[
x12
(t
)
x
2 2
(t
)
u 2(t)] dt 为极小
的最优控制 u (t ) ，最优轨线 x (t) 以及最优指标 J 。解：本例为线性定常系统，积分型性能指标， t f 自由，末端
e
*
J
1
1
[ x(t) u(t)]dt
ln
2 (2 e
t
1 )dt
11
t
32 e
e[ (2 e)e ]dt
ln 0.45
0
2
0
2
ln 2
2
2e 2
最优解曲线如下：
3-5 控制系统
x&1 x&2
u1, x1(0) 0, x1(1) 1 ，试求最优控制
x1 u2 , x2 (0), x2 (1) 1
u1* (t) ,
x2
H u1 2u1 H u2 2u2
10
u1 ( t )
，解得
20
u2 (t)
1 (1 c1)t
2 1 2 c1
c2
，由状态
方程有
x&1(t )
1
(1 2
c1 )t
c2
，
解得
x&2 ( t )
x1(t )
1 c1

动态最优化第10讲具有约束的最优控制问题

最大值原理条件：
0 对于所有的t 0,T
u
c g 0, 0, 0
dy dt
d
dt y
第十讲具有约束的最优控制问题
（一）涉及控制变量的约束
（5）现值哈密尔顿函数和拉格朗日函数
引入新的乘子： m et （隐含 met）
n et （隐含 net）
汉密尔顿函数和拉格朗日函数：
Gt,
y, u dt
0
Γ
T
T
0
Gt,
y,
u
dt
k
第十讲具有约束的最优控制问题
（一）涉及控制变量的约束
（4）不等式积分约束
问题重新表述为：
（2个状态变量的无约束问题，新变量具有截断终结线）
Max
T
0
F
t,
y,
u
dt
S.T. dy f t, y,u
dt
dΓ Gt, y,u
dt
y0 y0 yT 自由（y0 ,T给定）
dt
又由于：汉密尔顿函数H独立于Γ ,
所以有：d H 0 t 常数
dt Γ 最大值原理条件重新表述为：
Max H u
dy H
dt
对于所有的t 0,T
d H t 常数
dt y
T 0
第十讲具有约束的最优控制问题
（一）涉及控制变量的约束
（3）等周问题
等周问题简便解法：
构造拉格朗日函数（增广汉密尔顿函数）：
u1
0
u1
3
0
0 0 0
u2
u2
0 i
0,i
0,i
0 i
0
i
0,i
0,i

第八章_对最优控制的进一步讨论

T
0
* [ f ( t , y , u ) f ( t , y * , u * ) f y ( t , y * , u * )( y y * ) f u ( t , y * , u * )( u u * )] dt 0
*
V V 0
b)若 f 关于 y 和 u 线性，那么 (t ) 无须不等式约束。
0
f u ( t , y , u )( u u )] dt
* * *
( 8 .3 1)
以上推导得到：
[ f ( t , y , u ) f ( t , y , u ) f y ( t , y , u )( y y ) (8 .3 1) 0 * * * f u ( t , y , u )( u u )] dt * * * * * * * * f ( t , y , u ) f ( t , y , u ) f y ( t , y , u )( y y ) f u ( t , y , u )( u u ) (8 .3 0)
f ( t , y , u ) f ( t , y , u ) f y ( t , y , u )( y y ) f u ( t , y , u )( u u ) 0 (8 .3 0)
* * * * * * * *
V V 0
*
曼加萨林充分性定理不但适用于垂直终结线问题，也适用于固定端点或截断垂直终结线问题。
*
(8.29)
以上推导得到： Fu ( t , y , u ) f u ( t , y , u ) * * * * f ( t , y * , u * ) Fy (t , y , u ) y

保险保障基金最优规模的积累规律及影响因素_基于动态视角和SYS_GMM方法的研究

— 83 —
要指出，即使在 2004 年以前，各家保险公司为维护行业稳定发展，已经开始提取保险保障基金。图 1 显示将 1999 年～ 2007 年间财险业和寿险业提取的历年保险保障基金总额进行汇总。可以发现寿险业的保障基金规模呈现出增长趋势，而财险业则出现下降趋势；但从对保障基金规模的贡献上看，财险业的贡献一直超过寿险业。国际上关于保险保障基金的研究主要集中于以下几方面：从保险保障基金的设立目的、潜在缺陷等角度 1999 ）；研究保险保障制度发挥作用时的保险公司道德风研究各国的保险保障基金制度特点（ Jean Lemaire， Ejijah； 1988 ）； J． David． Cummins（ 1988 ）从精算技术角度研究基于风险分摊的保障基金的保险问题（ Brewer，指出了按照资本或者保费收入的一定比率来交纳保险保障基金的筹资方法有弊端，这种方法使费定价方法， Duan＆Yu（ 2005 ）将 Cummins 的单一时期模型扩展到多时期，保险市场正常的惩戒机制受到了破坏；此后，并 Russell＆Ross（ 1989 ）通过对保险市场脆弱性的分析，采用了随机利率假设； Cooper，提出由公共部门、私人部门建立保险保障基金的选择问题，阐述了在不存在保险保障制度的情形下，市场自发形成的均衡并不符合帕； Krogh ， Harold C＆Levin ， Murray （ 1986 ）累托最优研究美国财产和责任保险保障基金，对美国所有建立保险保 David Mayers， Clifford W． Smith（ 1997 ）将保险保障基金障基金州的制度情况进行了详细的介绍； Soon jae Lee，作为风险津贴，认为公司的组织形式不同（主要是指股份与相互保险公司的差别）则基金的作用方式也各不 2003 ；孙祁祥等，相同。国内对保险保障基金的研究成果较少有涉及到保险保障基金的定量分析（李成明， 2003 ；朱铭来等， 2005 ），邵全权（ 2010 ）从保险市场的视角研究了保障基金造成的道德风险问题，以及作为外部因素的保障基金对保险业产业组织的影响。从总体上看，国内外对保险保障基金的研究已取得多方面的从不确定经济学角度和纯理论方面研究的较多，但成果。国外研究运用了很多数学方法研究保险保障基金，是应用的领域局限性较大；国内研究侧重概念和制度方面的探讨。我们认为，在涉及保险保障基金的一系列问题中，以保险保障基金的规模问题最为突出，而这恰好是国内外研究都没有涉及的。从世界各国的保险业实践经验看，虽有国家和地区（如英、美、日、加等国）建立了保险保障基金制度，但也有不少国家和地区并没有实行保险保障基金制度，出现这种情况的理论基础在于保险保障基金存在产生的保险公司道德风险。保险保障基金制度产生的道德风险程度主要依赖于其对保险公司提供保障的程度，反映在保险公司上则体现为各家保险公司保险保障基金的提取额，在保险保障基金制度方面反映为对保险，保障基金的提取与运用这实际上是一个保险保障基金最优规模的问题。保险保障基金的规模过小，则无法实现保险行业最后一道安全网的功能；规模过大，则又会造成保险资源的闲置和浪费。本文将回答保险保障基金是否存在一个最优规模，以及保险保障基金规模的影响因素。相比前人研究，本文的主要贡献在于首次从动态视角研究保险保障基金的最优规模，体现在构建动态模型研究保险保障基金最优规模的积累规律，又采用动态面板数据模型进行实证分析；提出保险保障基金理论上的最优规模和现实中的实际规模在一定条件下可以一致；将保险公司的竞争战略引入保险保障基金规模模型，从公司战略的角度研究作为风险管理战略组成部分的提取规模和反应竞争战略变量间的关系。本文第二部分建立保险保障基金最优规模的理论模型，第三部分介绍计量模型的设计和数据处理，第四部分报告实证分析结果，最后对全文进行简要总结并提出政策建议。二、保险保障基金最优规模的规律：基于动态视角的解释邵全权等（ 2010 ）通过构建静态模型，发现在存在竞争的条件下，保险保障基金制度容易引发道德风险，通过降低基金保障程度的方式，可以降低保险保障基金制度引发的道德风险，由此间接提出保险保障基金最优规模的概念。本部分采用最优控制的方法，通过建立和保险保障基金规模有关的社会福利函数，并将涉及到保险保障基金最优规模的运动和变化规律作为相应的条件，构建保险保障基金最优规模的理论模型。保险业是经营和管理风险的特殊行业，保险公司经营不善导致偿付能力危机甚至破产倒闭，会严重危害社会稳定，损害被保险人利益。保险保障基金制度的存在可以最大程度地减轻这种风险的社会危害和行业影响。因此，保险保障基金制度的存在会因为其对问题保险公司的救助而改善社会福利水平。根据我国现阶段保险保障基金制度的有关规定，保险保障基金的构成是由各家保险公司共同出资形成的，保险保障基金的规模也即各家保险公司保险保障基金的提取额应该是和保费收入成比例的。鉴于保险保障基金规模的以 — 84 —

《高级宏观经济学》习题和答案3

✧ 2.1考虑N 个厂商，每一厂商均有规模报酬不变的生产函数(),Y F K AL =，或采用密集形式()Y ALf k =。

假定()()0,0f f '''>< 。

假定所有厂商均可以工资wA 雇佣劳动，以成本r 租用资本，且所有厂商均有相同的A 值。

a) 考虑一厂商试图以最小成本生产Y 单位产品的问题。

证明成本最小化时的k 值为唯一的且与Y 无关，并证明所有厂商因此均选择相同的k 值。

b) 证明：这N 个成本最小化厂商的总产量，等于一个具有相同生产函数、雇佣这N 家厂商所雇佣的全部劳动和资本的单个厂商的产量。

答：a) 本问题为如下的最优化问题：min wAL rK +st()Y ALf k =易知其FOC 条件为：()()()()()*******1/f k f k r w k w rf k k f k f k ''=⇒=+'- 所以可见成本最小化时的k 值（如果有解）必然和Y 无关。

b) 证明：对任意厂商来说，()**,k kw r =，故()()**i i Y AL f k ALf k ==∑∑()()**,1i Y ALf k ALF k ⇒==∑因为生产函数为规模报酬不变的，所以有()()()**,1,,iiiY ALF k F ALk AL F K A L Y ====∑∑∑该厂商利用N 个厂商拥有的全部资本与劳动的产出为N 个厂商产量之和。

✧ 2.2不变相对风险回避系数效用函数的替代弹性。

考虑一个人，他只存活两期，且其效用函数由（2.46）给出。

令12,P P 代表消费品在这两期的价格，W 代表他一生收入的价值；因此他的预算约束为1122PC P C W +=。

a) 若12,P P 和W 给定，则使他效用最大化的1C 和2C 是多少？b) 两期消费之间的替代弹性为()()1212ln //ln /C C P P -∂∂。

最优控制汉密尔顿函数问题

第十章_具有约束的最优控制问题

hamilton–jacobi–bellman 方程

第十章_具有约束的最优控制问题

最优控制理论与系统胡寿松版课后习题答案

动态最优化第10讲 具有约束的最优控制问题

第八章_对最优控制的进一步讨论

保险保障基金最优规模的积累规律及影响因素_基于动态视角和SYS_GMM方法的研究

《高级宏观经济学》习题和答案3

动态最优化第10讲具有约束的最优控制问题