宏观经济学分析方法系列:(课堂放映版、11硕已讲)动态规划的Bellman原理

合集下载

宏观经济学 数学基础-3-动态规划

宏观经济学 数学基础-3-动态规划

第一部分高级宏观经济学的数学基础高级宏观经济学中许多模型用到了动态最优化理论。

这一部分主要介绍动态最优化理论的基本原理和方法,作为学习高级宏观经济学的必要准备知识。

动态最优化理论主要包括变分法、最优控制论和动态规划。

第三讲动态规划前面两节介绍了用变分法和最优控制理论(即极大值原理)求解动态最优化问题(我们主要介绍的是连续时间问题)。

同样,动态最优化问题也可以用动态规划方法来求解。

动态规划是美国数学家贝尔曼1957年提出的,同最优控制论一样,动态规划也被说成现代变分法。

动态规划包括离散时间和连续时间两种情形,它在解决离散时间问题时较为方便,我们这里重点讲离散时间下的方法。

此外,动态规划可以解决确定性条件下和不确定条件下的动态最优化问题,与变分法和最优控制相比,动态规划是求解不确定下动态最优化问题很方便的工具,但由于要涉及大量其他数学工具以及课程时间所限,我们这里只介绍解决确定性问题的方法。

一、动态规划原理与贝尔曼方程(一)动态规划问题的特点(二)贝尔曼方程二、离散时间无限界期的动态规划贝尔曼方程的形式动态规划的解三、经济学应用:新古典增长模型中的消费者最优化问题模型设定消费者储存资本并进行投资,即消费者的财富是以资本的形式表示的。

在每一期里,消费者都会把资本租给厂商并向厂商出售自己的劳动。

假设劳动并不会给消费者带来任何负效用,因此,不论工资率为多少,劳动供给始终是1单位。

消费者实际上就相当于在求解如下一个跨期最优化问题:{}1,0max ()t t t t c k t U c β+∞=∑s.t. 1(1)t t t t t c k w r k ++=++0lim 0(1)tt t t t k r →∞==+∏这里,0k 给定,t w 是工资率,t r 是资本的租金率。

如果把消费者的这个最优化问题用贝尔曼方程的方法表示出来,为{}11,()max[()()]t t t t t c k v k u c v k β++=+s.t. 1(1)t t t t t c k w r k ++=++ (1)0lim 0(1)tt t t tk r →∞==+∏把约束条件(1)代入目标函数中,有{}111()max [(1)]()t t t t t t t k v k u w r k k v k β+++=++-+ (2)式(2)的一阶条件(对1t k +求偏导)是11[(1)]()0t t t t t u w r k k v k β++''-++-+= (3)让式(2)两边对t k 求偏导,并应用包络定理,可以得到1()[(1)](1)t t t t t t v k u w r k k r +''=++-+ (4)把式(4)往后挪一期,有111121()[(1)](1)t t t t t t v k u w r k k r ++++++''=++-+ (5)用式(5)代替式(3)中的1()t v k +',可以得到11()()(1)0t t t u c u c r β++''-++=该方程就是实现消费者最优的欧拉方程。

宏观经济学-第十一章IS-LM的运用

宏观经济学-第十一章IS-LM的运用
随着时间的推移,IS-LM模型不断被 完善和扩展,以适应经济学的理论发 展和实际应用的需要。
02 IS曲线
IS曲线的定义与特点
定义
IS曲线是描述货币市场和商品市 场同时均衡时,利率和国民收入 之间关系的曲线。
特点
IS曲线向右上方倾斜,表示在商 品市场上,利率上升时,国民收 入会减少;利率下降时,国民收 入会增加。
IS-LM模型可以用来分析菲利普斯曲线,即通货膨胀与失业率之间的关系。通 过调整模型中的参数,可以解释不同经济环境下菲利普斯曲线的形状和位置。
政策选择
根据菲利普斯曲线,政府可以根据经济状况选择适当的政策组合来平衡通货膨 胀和失业率之间的关系。
经模型可以用来划分经济周期的不同阶段,如繁荣期、 衰退期、萧条期和复苏期。
IS曲线的移动及影响因素
政府购买
增加政府购买将导致IS曲线向右 移动,因为政府购买增加会刺激 总需求,从而增加国民收入。
税收政策
减税政策将导致IS曲线向右移动, 因为减税会增加居民的可支配收 入,从而增加消费和投资,进而 增加国民收入。
货币供应
增加货币供应将导致IS曲线向右 移动,因为货币供应增加会导致 利率下降,从而刺激投资和消费, 进而增加国民收入。
IS-LM模型的重要性
01
IS-LM模型是宏观经济分析的重 要工具,用于分析经济政策对总 体经济活动的影响。
02
通过IS-LM模型,可以理解货币 政策和财政政策如何影响经济, 以及政策如何相互作用。
IS-LM模型的历史与发展
IS-LM模型最初由英国经济学家约翰· 理查德·希克斯提出,后来经过其他 经济学家的改进和发展。
03 LM曲线
LM曲线的定义与特点
定义

宏观经济学分析方法系列:变分法、欧拉方程、极值路径与动态经济模型分析

宏观经济学分析方法系列:变分法、欧拉方程、极值路径与动态经济模型分析

宏观经济学分析⽅法系列:变分法、欧拉⽅程、极值路径与动态经济模型分析附录:宏观经济学分析⽅法:变分法、极值路径与动态最优化(08、09 、10、11 硕已讲,精细订正版)⼀、动态最优化在静态最优化问题中,我们寻找在⼀个特定的时间点或区间上,使⼀个给定的函数最⼤化和最⼩化的⼀个点或⼀些点:给定⼀个函数y y(x),最优点x 的⼀阶条件是y(x)0.在动态最优化问题中,我们要寻找使⼀个给定的积分最⼤化或最⼩化的曲线x (t).这个最⼤化的积分定义为独⽴变量t、函数x(t)及它的导数dx/dt的函数F下的⾯积。

简⾔之,假设时间区域从t0 0到t1 T,且⽤x表⽰dx/dt,我们寻找最⼤化或最⼩化T0 F[t,x(t), x(t)]dt (20.1 ) 这⾥假定F对t、x(t)、x(t)是连续的,且具有对x和x的连续偏导数.将形如(20.1),对每⼀个函数x(t)对应着⼀个数值的积分称为“泛函”.⼀个使泛函达到最⼤或最⼩值的曲线称为“ 极值曲线”.极值可接受的“候选”极值曲线是在定义域上连续可微,且特别地满⾜⼀些固定端点条件的函数类x(t) .(讲!)例1 ⼀家公司当希望获得从时间t 0到t T的最⼤利润时发现,产品的需求不仅依赖于产品的价格p ,⽽且也依赖于价格关于时间的变化率如dp/dt。

假设成本是固定的,并且每个p和dp/dt是时间的函数,p 代表dp/dt ,公司的⽬标可以作如下数学表⽰TMax 0 [t, p(t), p(t)] dt另⼀家公司发现它的总成本依赖于⽣产⽔平x(t) 和⽣产的变化率dx/dt x .假设这个公司希望最⼩化成本,且x和x是时间t的函数,公司的⽬标可以写成t1min C[t, x(t), x(t)]dtt满⾜x(t o) X o,且X(tJ X i这些初始和终值约束称为端点条件.例2 Ramsey经济:消费最优化问题从家庭终⽣效⽤函数的集约形式u u(c)出发,在消费预算约束的集约形式下求解家庭终⽣效⽤最⼤化问题,就是所谓“ Ramsey问题”⼀找出⼀条消费路径c(t),使家庭终⽣效⽤函数U U(c)最⼤化:1max B e t [c(t)] dtc 0 1k0 o ( (t) c(t))e(n g)t R(t)dt 0⼆、欧拉⽅程:动态最优化的必要条件(三种形式)定理(泛函极值曲线即最优化)的必要条件):对于⼀个泛函t it F[t,x(t),x(t)]dtt连接点(t o, X o)和(t i, X i)的曲线x x (t)是⼀个极值曲线(即最优化)的必要条件是F F(20 . 2a)x dt x称之为欧拉⽅程.尽管该定理等价于静态最优化的⼀阶必要条件,但是由式中稍微不同的记号可以容易了解,欧拉⽅程实际上是⼀个⼆阶微分⽅程.⽤下标表⽰偏导数,并列出其⾃变“量”,它们本⾝也可能是函数.(20 . 2a)的欧拉⽅程表⽰为F x(t,x,x)⾟[F x(t,x,x)](20 .2b)dt然后,⽤链式法则求F x关于t的导数,并且省略⾃变“量”,得F x F xt F xx(x) F xx(x)(20 . 2c)这⾥,x d2x/dt2F⾯给出欧拉⽅程是极值曲线的必要条件的证明图20-2证明:(重点!09、10、11硕,已讲)设x x (t)是图20-2中连接点(t°,x°)和(t i,xj的曲线,并且它使F⾯泛函取得最⼤值;F[t,x(t),x(t)]dt(20 . 3)T即x x (t)为极值曲线,欧拉⽅程(20 . 2a)是x x (t)为极值曲线的⼀个必要条件.取X x (t) mh(t)是x x (t)的相邻曲线,这⾥m 是任意常数,h(t) 是⼀个任意函数.为了使曲线刃也通过点(t o ,x o )和(切禺),则卞也满⾜端点条件:h(t o ) 0h(t i ) 0(20 . 4)⼀旦取定x (t)和h(t)之后,因x (t)和h(t)固定,则积分值^F[t,x(t), x(t)]dt 仅为m 的函数,不妨改写成tt lg(m) t F[t,x (t) mh(t) ,x (t) mh(t)]dt(20 . 5)t由于x (t)使(20 . 3)中的泛函fl F[t,x(t), x(t)]dt 实现最优化,所以t(20 .5)中的函数g(m)仅当m 0时 g(m) 1F[t,x (t) mh(t) ,x (t) mh(t)]dt 才能还原为t最优化,即有dg dm对(20 . 5)即 g(m) :F[t,x(t) mh(t),x(t) mh(t)]dt ⽤链式法则求F / m .由于F 是x 和x 的函数,依次⼜是m 的函数,代⼊(20 . 7)得dg t1上(x mh) F (x mh) dtdmt0x mx m(因为m 0时的:F[t,x(t), x(t)]dt )实现t(20 . 6)由于旦』h 且旦上h ,⽤条件(20 . 6)即岂|m0 0,有mmdm—m o th(t) h (t) dt 0(20 . 8)dm t0xx(注:u h(t)所以,去掉,合并其余两项,有由于h(t)是不必为零的任意函数,因此推出,对于极值曲线的必要条件为⽅括号中式⼦为零,即这就是欧拉⽅程.定理证毕⽅括号中的第⼀项不动,第⼆项的积分⽤分部积分,分部积分公式即vdu vu udv u u(t),v v(t)dv dv dt dtdu dF xdt⽕ dt h(t) dtdt dg dmt i tFh(t)dt xttdt-h(t)dt 0 x由(20 . 4)知,h(t 。

bellman 方程

bellman 方程

bellman 方程Bellman程是有效的非线性方程,它可以用于描述最优化问题。

它最早被写在 1950由 Richard Bellman出,并被大量地应用于经济学,控制论,数学和统计研究中。

Bellman程可以被概括为一个系统的动态规划方程。

此方程的本质是建立在某种有限的时间步长和有效的决策规则下的,其目的是尽可能得到最优的结果。

种方程的省政机关有:状态,决策,最大化的一般性;它用于描述在有限时间步长内,一个具有有利状态转换的多阶段规划问题。

Bellman程通常以一种变量来表征系统动态,即状态变量。

状态变量是系统可以改变的变量,它可以在一段时间内改变,而另一些变量可以在一段时间内保持不变。

Bellman程用一种表示实际情况的模型,即状态转移方程来表示状态变量的变化情况。

例如,当你处于某个状态时,它可能在下一个时间步骤发生变化;状态转移方程可以用来描述这种情况。

另外,状态转移方程还可以用来表征决策函数,即它表明一个状态如何转换到另一个状态。

因此,状态转移方程中代表了最佳决策的变量,它可以指导系统如何最有效地实现期望的状态。

最后,Bellman程还可以用来解决现实的问题。

例如,它可以用来帮助机构更有效地分配资源,优化工厂运作,管理金融资产等等。

最终,Bellman程的应用可以最大限度的优化系统的状态。

在经济学研究中,Bellman程已经成为了最常用的方法,用于描述多阶段决策系统的动态行为。

它可以帮助研究者研究资源分配问题,解读经济环境下的策略有效性,确定有利的组织机构等等。

另一方面,Bellman程也可以用于控制论研究。

使用这一方程,研究者可以解决有限控制问题,比如更快更准确地计算最优解。

另外,它也可以被用来研究一种非线性系统,比如机器人系统或智能控制系统。

总之,Bellman程是一种有效的动态规划方法,它可以用于经济学和控制论研究,以及计算建模和机器学习中。

它提供了一种有用的技术,有助于我们更有效地分析最优控制问题,为政府和机构提供更有效的解决方案。

中级宏观经济学之无限期动态模型与动态规划 (PPT 73页)

中级宏观经济学之无限期动态模型与动态规划 (PPT 73页)

(4.47)
再一次提醒大家,函数 v 和函数 w 是两个完全
不同的函数:函数 v 是以递归形式表述的社会计划
者最优问题中的值函数,而函数 w 是以序列形式表
述的社会计划者最优问题中的函数。
2020/6/17
第四讲 三期动态模型
25
计划者带进当前期的资本存量 k ,是过去决策的一个直接 后果,实际上凝结了所有过去决策的信息,它完全地决定 了从今往后可用于支配的资源数量。因此,它经常被称为 “状态变量(state variable)”:她完全地把当前的经济状态 刻画出来了(也就是说,计划者可以在此基础上进行未来 的选择)。变量 k 是计划者在当前所需要决定(或者说控制) 变量,因此,她经常被成为“控制变量(control variable)”, 因为,这个变量是计划者在当前能控制的变量。
2020/6/17
第四讲 三期动态模型
31
让我们猜: v(k) A B ln(k)
(4.49)
其中,A 和 B 都是待定系数。我们可以分如下
三个步骤来解它:
第一步:给定我们猜测的 v,求解函数方程中右
边的最大化问题,也即求解:
max ln(k k) A B ln(k)
0kk
1
B
FOC k k k k
2020/6/17
第四讲 三期动态模型
10
二、动态规划简介
2020/6/17
第四讲 三期动态模型
11
2.1序列形式表述的社会计划 者问题
因为我们在前面已经证明了竞争均衡解 也是帕雷托最优解。因此,我们可以通 过求解社会计划者问题来获得竞争均衡 的有关数量解,这样,上面这个无限期 模型中的社会计划者最优化问题可以正 规地描述如下:

贝尔曼方程

贝尔曼方程

贝尔曼方程基本原理 动态规划的理论基础是最优化原理和嵌入原理。

最优化原理 一个最优策略,具有如下性质:不论初始状态和初始决策(第一步决策)如何,以第一步决策所形成的阶段和状态作为初始条件来考虑时,余下的决策对余下的问题而言也必构成最优策略。

最优化原理体现了动态规划方法的基本思想。

嵌入原理 一个具有已知初始状态和固定步数的过程总可以看作是初始状态和步数均不确定的一族过程中的一个特殊情况。

这种把所研究的过程嵌入一个过程族的原理称为嵌入原理。

通过研究过程族的最优策略族的共同性质得出一般通解,此通解自然也适用于原来的特殊问题。

动态规划的基本方法就是根据嵌入原理把一个多步决策问题化为一系列较简单的一步决策问题,可显著降低数学处理上的难度。

贝尔曼方程 应用最优化原理和嵌入原理可推导出动态规划的基本方程,称为贝尔曼方程。

它具有下面的形式:式中N表示多段决策过程的总段数,F(xk,uk)为标量函数,表示由第k段到第k+1段的过程中基于状态xk和决策uk的性能损失,表示以xk+1为初始状态的后N-(k+1)段分过程的最优性能目标,xk+1=f(xk,uk)是基于第k段的状态 xk和决策uk而得到的第k+1段的状态向量,【·】表示选择决策uk使【·】取极小值。

这是一个逆向递推方程。

采用迭代法按k=N-1,N-2,…,1,0顺序求解贝尔曼方程,即可得到N段决策过程的最优策略{uk,k=0,1,2,…,N-1}和最优轨线{xk,k=0,1,2,…,N },而最优性能值为J壨(x0)。

对于图1中的例子,贝尔曼方程的形式如下:经迭代计算后,得………………………这就是所求的最短距离。

从S到G的最短路径是SA2B1C2G。

而A2B1C2G,B1C2G,C2G 则分别是从A2,B1,C2到G 的最短路径。

贝尔曼方程是关于未知函数(目标函数)的函数方程组。

应用最优化原理和嵌入原理建立函数方程组的方法称为函数方程法。

bellman 方程

bellman 方程

bellman 方程bellman程是近半个世纪来机器学习和运筹学领域的核心数学模型,它的应用可以找到世界上最优的决策顺序。

这一发现由美国经济学家Richard Bellman提出,他在20世纪50年代末期向用以应用到经济和优化学问题的动态规划的一系列的概念中提出了bellman程,并且由此被普遍公认为是动态规划中最重要的一环。

这一概念的基本原理指出:当一个规划问题改变时,最优解也会发生变化,从而形成一个多项式中的一系列突变,而Bellman方程就是这种多变性的规范。

它的运用涉及穷举法,从而把一系列的最优解组合成一个整体,以期获得最终的最优解。

首先,让我们先来简单了解一下Bellman方程。

Bellman方程是一种有限状态自动机由一系列特定的状态和转移函数组成。

它简化了动态规划的复杂性,使得某一问题的最优解可以通过这种有限状态自动机来获得。

Bellman方程实际上也是一种非常有效的最优化算法,可以用来求解一个指定问题的最优状态。

Bellman方程一般具有以下几个特点:(1)Bellman方程不仅可以应用于经济学和动态规划的问题,而且也可以用来解决更加复杂的机器学习问题。

(2)Bellman方程把一个复杂的步骤分解成了一系列简单的计算步骤,每一步都可以独立用来获得最优解。

(3)Bellman方程把一个问题的全局最优解作为一个多项式的值,而每一个子问题的最优解可以通过这个多项式的系数来表达。

(4)Bellman方程不只是用来求解最优解,它还可以用来找到满足特定条件的最优解。

Bellman方程的应用已经扩展到许多领域,特别是机器学习。

最近,它被大量用于解诸如机器人学习、强化学习、博弈论等问题。

这是因为它可以提供一种有效的最优化算法,而且可以在诸如深度学习算法之类的复杂算法中大量利用。

总之,Bellman方程是近半个世纪来在经济学、机器学习和运筹学领域的重要数学模型,其应用可以帮助找到最优的决策顺序。

Bellman方程通过穷举法把一系列最优解组合起来,从而得到最终的最优解。

《宏观经济学教学课件》2012macro(4)

《宏观经济学教学课件》2012macro(4)
2
第四讲 产品市场和货币市场的 一般均衡
4.1 投资函数 4.2 IS曲线 4.3 货币需求函数与货币供给 4.4 LM曲线 4.5 IS-LM曲线分析 4.6 凯恩斯的基本理论框架
3
4.1 投资函数
4.1.1 投资的含义 4.1.2 决定投资的因素 4.1.3 资本的边际效率MEC 4.1.4 投资的边际效率MEI 4.1.5 投资曲线
3)利率与利润率反方向变动。 4)折旧与投资同方向变动。折旧是现有设备、厂房的
损耗,资本存量越大,折旧也越大,越需要增加投资以 更换设备和厂房,这样,需折旧的量越大,投资也越大
5)预期的通货膨胀率与投资同方向变动,在发生通货 膨胀的情况下,短期内是对企业有利的,因为可以增加 企业的实际利润总量,减少实际工资总量,因而在预期 即将到来的通货膨胀,即预期价格即将上涨的情况下, 企业会增加投资,反之则相反。
4
4.1.1 投资的含义
投资:称为资本形成,即社会 实际资本的增加,它是表示在 一定时间内资本的增量,即生 产能力的增量(厂房、设备和 存货等)
主要是建设新企业、购买设备 、厂房等各种生产要素的支出 以及存货的增加,其中主要指 厂房和设备。
在AE=C+I+G+NX中,把I=I0 看作外生变量;但现实中I应该 是内生变量。
如果经济处于IS曲线 右侧,即现行的利率 水平过高,从而导致 投资规模小于储蓄规 模。经济要萎缩。
在IS曲线左下有 I>S 即现行的利率水平 过低,从而导致投 资规模大于储蓄规 模。经济Y要扩张
28
4.2.2 影响IS曲线移动的主要因素
r
Y=KA0-Kdr
纵轴截距A0/d 横轴截距KA0 斜率1/Kd
6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

==================================附录:宏观经济学分析方法:动态规划的Bellman原理(10、11硕已讲,精细订正版)二、一个简化的例子欲对Bellman原理有一个快速的理解,这里通过一个简化的例子,以勾勒出动态规划方法所特有的向后追溯(backward recursion,逆向递归,逆向归纳)的特征。

假定:(1)典型个人生存两个时期,他可以在两个时点上,即1t=0、上做决策(3=t时,他就死亡了);他被赋予一定量的初始资源0W。

)0(>(2)理想化的资本市场上存在两种资产1。

一种是无风险的1所谓理想化资本市场如上一章中的要求,即无交易成本、GAGGAGAGGAFFFFAFAF现金或者债券,它的价格在任何时刻都没有变化,始终为1;另一种是有风险的股票,它的价格过程假定由以下二项树描绘(参见下图)。

制度限制、操纵行为等。

GAGGAGAGGAFFFFAFAFGAGGAGAGGAFFFFAFAF简单地说,它表示在每一时点上,股票价格要么以 9/4的概率上涨一倍,要么以 )9/41(-的概率下跌一半。

用)0(w 和)1(w 表示该投资者在10、时刻上,投资于风险资产(股票)上的财富分额。

(3)投资者的非资本收入为 0,效用函数具有以下特定形式: x x u =)((4)为了简化求解,假定投资者不进行任何消费,这样最优决策的惟一目标就是最大化他来自最终财富的期望效用。

至此,最优化问题就可以简化为:⎣⎦)2(..)2(max )1(),0(>W t s W E w w我们的任务就是找到最优的投资决策变量(最优控制)图 股票价格运动的二项树模型100 1)0(w和)1(w,使以上最优化问题得以解决。

可以尝试采用“向前”推导的方法,即从0 t时刻开始,事先决定一个策略GAGGAGAGGAFFFFAFAFGAGGAGAGGAFFFFAFAF)0(w ,但它是不是最优还不清楚,根据)0(w 我们仅仅能够知道1=t 时刻的期望财富水平的函数表达式,但是最大化这个函数得到的“最优的”)0(w ,并不一定是最优决策过程)]1(),0([w w 的必然组成部分,除非可以明确地知道在所有不同情况状态下的)1(w ,并且它是惟一的。

因此,向前推导的方法是行不通的。

换一种思路,我们可以试着从倒数第一期,即1-T 期开始。

这就是说,我们必须获得 1=t 时期,股票价格在200=p 或者50=p 两种情况下的最优投资比例,而这是一个单期静态优化问题。

一旦获得了1=t 时的相应结果)1(w 和)1(W ,就可以按照同样的手续,进一步推导0=t 时刻的最优投资比例,从而一层层地逐步解决问题。

具体求解如下:第一步:1=t 时刻假定此时的财富)1(W 为任意一正数(它是由上一期0=t 时的最优决策所产生的)。

投资到股票上的财富比例为)1(w ,则投向无风险资产上的就是)1(1w -。

我们来计算最后的2=tGAGGAGAGGAFFFFAFAF时刻,积累的财富的期望效用是多少。

先考虑当股票价格200=p 时的情形,根据二项树模型: )1()]1([)1()1()2/1(1951)1(94)1()]1(1[)1()1()2/1(95)1()]1(1[)1()1(294]200)2([W w f W w w W w W w W w W w p W E =⎥⎦⎤⎢⎣⎡-++=-++-+==GAGGAGAGGAFFFFAFAF为了找到最优投资比例)1(w ,只要对)]1([w f 求导,并令一阶导数于0就可以了,容易得到:19/13)1(=w 和383/19)]1([=w f再考察当股票价格50=p 时的情形 , 我们发现仍旧可以使用上式 。

因为 )1()]1(1[)1()1((2W w W w -+依然表示股票价格上涨一倍的情况下,投资在两种资产上,给投资者带来的期末财富的期望效用;而)1()]1(1[)1()1((2/1W w W w -+则是投资机会相对较差即下跌 一半时,期末财富的期望效用水平。

因此最优解还是19/13)1(=w ,因此这个最优投资比例决策独立于1时刻股票价格和财富的绝对水平。

第二步:0=t 时刻根据上面的推理,我们只要知道1时刻的财富水平)1(W ,就可以知道最终财富的期望效用水平是多少,而1时期的财富水平)1(W ,也是由同第一步类似的决策过程所决定的, 即:GAGGAGAGGAFFFFAFAF[][])0()]0([)]1([)0()0()2/1(1951)0(94)]1([)0()]0(1[)0()0()2/1(95)0()]0(1[)0()0(294)]1([)1()]1([)2(W w f w f W w w w f W w W w W w W w w f W E w f W E =⎭⎬⎫⎩⎨⎧⎥⎦⎤⎢⎣⎡-++=⎭⎬⎫⎩⎨⎧-++-+==同样对)]0(f求导数,并令一阶导数等于0,得到最优化[w条件19w,因此动态最优投资决策方案就是:)0(=13/)1(=w)0(=w,19/131319/尽管实际的问题要比这个简单的例子复杂得多,但从上述求解过程中,仍然可以归纳出最优个人消费(投资)决策的动态规划解法的最显著特征,即它是向后追溯的。

而这正是贝尔曼最优化原理的体现。

三、一般情形现在考察多期(多阶段)离散时间情况下,个人最优消费/投资决策问题的标准建模方法和它的一般解法。

假定:(1)有限生命GAGGAGAGGAFFFFAFAF典型个人生命时期(lifetime)为],0[T,他可以在=T,2,1,0-t 这些离散的时点上做决策2;他被赋予一定量的,1初始资源0W。

)0(>(2)单一消费品2也称交易期界(trading horizon)。

GAGGAGAGGAFFFFAFAFGAGGAGAGGAFFFFAFAF只有一种用于当期消费的易腐消费品。

它不可以储藏,暂时不考虑它是如何生产出来的。

(3)资产价格运动理想化的资本市场上存在1+n 种资产,第 0种资产是无风险的债券,它的单位时间总收益率为f R ;其他n 种都是风险资产,它们的总收益率定义为:n i t P t P t P t R i i i i ,,2,1%,100)()()1()( =⨯-+=)(t R i 是由外部经济环境外生决定的。

(4)资产组合令)(t w i 为投资在第i 种风险资产上的财富占总财富数量的相对份额,则∑=-ni i t w 1)(1就是投资在无风险资产上的财富份额。

因此整个资产组合的总收益率P R 就是:f f i n i i f n i i i n i i R R t R t w R t w t R t w +-=⎥⎦⎤⎢⎣⎡-+∑∑∑===])([)()(1)()(111 (2-2)(5)令)(t ς为非资本收入,如果假定这个收入来源是随机的,也可以称之为外生禀赋过程(endowment process )。

注意,我们定义)0()0(ς=W 。

根据上述设定,可以把财富积累方程,也即约束条件表GAGGAGAGGAFFFFAFAF 述为:P R t C t t W t W )]()()([)1(-+=+ς (2-3)(6)非负条件要求在任何时刻,不可以出现负的财富和消费,即GAGGAGAGGAFFFFAFAF],0[,0)(;0)(T t t W t C ∈≥≥这样一来,最优化问题(2-1)式就可以表述为:],0[,0)(,0)()]()()([)1(..]),([]),([max 10210)(),(T t t W t C R t C t t W t W t s T T W u t t C u E PT t t w t C ∈≥≥-+=+⎥⎦⎤⎢⎣⎡+∑-=ς (2-4)=============================1、这里有一个非常重要的假定,即效用函数(.)u 是时间可加的(time-additive )。

时间可加性是一个很强的假设,它假定多期效用函数采取如下这种形式)(),,(11∑==ti i t C u C C u 2、人们可能会对于没有贴现这些期望效用存在疑问,实际上加上时间变量的),(t C u 也是一个效用函数,它的具体形式可以是)(C u e t ρ-。

但是需要注意的是: e 的上角t 指的是一个时间长度,不要把它同作为时点的t 相混淆。

3、]),([2T T W u 也是一种效用函数,形如)(W u e t ρ-。

当然个人完全可以决定不留下任何遗产,即0)(=T W ,那么这一项就从个人视野中消失了。

=============================根据动态规划Bellman原理,我们仍然从倒数第一期开始解,这样它就变成了熟悉的单期问题。

引入1-T时刻的价值函数(valuation function)]1T-TWJ3,即([-),13J 是一个基于财富的引致(derived)效用函数。

GAGGAGAGGAFFFFAFAFGAGGAGAGGAFFFFAFAF]}),([]1),1([{max ]}),([]1),1([{max ]1),1([211,211,T T W u E T T C u T T W u T T C u E T T W J T wC T wC --+--=+--=-- (2-5)为简化求解,目前暂时假定非资本收入()t ς为 0,把财富积累方程(2-3)式代入上式,注意到:⎭⎬⎫⎩⎨⎧+------=∑=f n i f i i R R T R T w T C T W T W 1])1()[1()]1()1([)( 则(2-5)式可改写为:>⎭⎬⎫⎩⎨⎧+------+--<=--∑=---f n i f i i T T w T C R R T R T w T C T W u E T T C u T T W J 1211)1(),1(])1()[1()]1()1([]1),1([max ]1),1([ (2-6) 为简便起见,可将对时间的函数形式都省略掉时点变量不计。

接下来对可供选择的决策变量)1(),1(--T w T C i 求导(注意由于)]}1([{12-=-T C W f u T ,因此要用到复合函数求导法则,即链式法则), 于是得到最优化的一阶条件4:4 因为效用函数和遗产函数都是凹的,所以二阶条件自动得到满足。

GAGGAGAGGAFFFFAFAF⎪⎪⎪⎩⎪⎪⎪⎨⎧==-=∂∂=⎭⎬⎫⎩⎨⎧⎥⎦⎤⎢⎣⎡+---=∂∂-=-∑n i R R u E w J R R R w u E T C u C J f i T W T i n i f f i i T W T C ,,2,10)](.)([0)((.))1,()(,211)(,21,1 (2-7)根据上式中的第二个一阶条件,第一个一阶条件又可以表示为:GAGGAGAGGAFFFFAFAF)(,21,1W T f C u E R u -= (2-8)如果用 1-T 期的价值函数(2-6)式对W 做微分(使用链式法则和导数基本运算法则),就有: ⎭⎬⎫⎩⎨⎧⎥⎦⎤⎢⎣⎡+-+--∂∂+∂∂⎭⎬⎫⎩⎨⎧⎥⎦⎤⎢⎣⎡+--=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-∂∂-+⎥⎦⎤⎢⎣⎡+-∂∂-+∂∂=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧'⎥⎦⎤⎢⎣⎡+--+⎥⎦⎤⎢⎣⎡+-'-+∂∂=∑∑∑∑∑∑∑=--==-==-==-n i f f i i W T f i W T ni i n i f f i i W T C n i f i i n i f f i i W T Cn i f f i i n i f f i i W T C W R R R w u E R R C W u E W w W C R R R w u E u R R W w C W R R R w W C u E W C u R R R w C W R R R w C W u E W C u J 1,21,2111,21,111,21,111,21,1)((.))])((.)([)((.))()()()1((.))()()()((.)把一阶条件(2-7)式代入上式,则上式右边第一、二项均为 0。

相关文档
最新文档