关于动态规划方法的最优消费路径
物流配送中的最优路径规划算法

物流配送中的最优路径规划算法一、引言物流配送中的最优路径规划算法是优化物流配送过程中不可或缺的环节。
传统的物流配送方式往往会浪费大量的时间和资源,而采用最优路径规划算法可以在最短时间内完成配送任务,实现资源的最大利用。
因此,在实际生产和物流配送中,应用最优路径规划算法已成为不可或缺的一部分。
二、最优路径规划算法的意义1. 提高效率最优路径规划算法可以帮助企业将配送路线进行有效的规划和管理,避免出现重复、浪费和错误的现象。
在相同的时间内完成更多的物流配送任务,提高了企业的效率和竞争力。
2. 降低成本采用最优路径规划算法可以有效地减少车辆的行驶路程和时间,降低了物流配送的成本和费用。
同时能够使车辆的装载率得到有效提升,进一步减少运输次数,降低了人力、燃料等成本。
3. 增加客户满意度通过最优路径规划算法规划出最为合适的路线,能够在最短时间内将物品送达客户手中。
这不仅可以提高客户的满意度,更能为企业赢得更多的客户和市场份额。
三、最优路径规划算法的实现方式1. 蚁群算法蚁群算法是一种优化算法,它模拟了蚂蚁在寻找食物时所留下的信息素。
在物流配送中,蚂蚁代表着车辆,信息素代表着路径上的距离和成本。
蚁群算法通过不断地更新和优化路径上的信息素,从而实现了最优路径规划。
2. 遗传算法遗传算法是一种通过模拟自然进化规律,寻找问题最优解的优化算法。
在物流配送中,遗传算法可以将路径规划问题转化成染色体编码问题,通过遗传操作(交叉、变异)寻找最优解。
3. 动态规划算法动态规划算法是一种利用递推关系、大量重复的计算和记忆化技术求解计算问题最优解的方法。
在物流配送中,可以将路径规划问题转化成最短路径问题,并通过动态规划求解。
四、最优路径规划算法的应用1. 物流仓储通过最优路径规划算法优化仓库的出库路径,可以缩短仓库出库时间,减少人力等资源的浪费,提高了仓库的操作效率。
2. 路径规划通过最优路径规划算法,实现货物从起点到终点的最优路径规划,减少行驶时间和路费,降低物流配送的成本。
经典算法——动态规划教程

动态规划是对最优化问题的一种新的算法设计方法。
由于各种问题的性质不同,确定最优解的条件也互不相同,因而动态规划的没计法对不同的问题,有各具特色的表示方式。
不存在一种万能的动态规划算法。
但是可以通过对若干有代表性的问题的动态规划算法进行讨论,学会这一设计方法。
多阶段决策过程最优化问题——动态规划的基本模型在现实生活中,有一类活动的过程,由于它的特殊性,可将过程分成若干个互相联系的阶段,在它的每一阶段都需要作出决策,从而使整个过程达到最好的活动效果。
因此各个阶段决策的选取不能任意确定,它依赖于当前面临的状态,又影响以后的发展。
当各个阶段决策确定后,就组成一个决策序列,因而也就确定了整个过程的一条活动路线。
这种把一个问题看做是一个前后关联具有链状结构的多阶段过程就称为多阶段决策过程,这种问题称为多阶段决策最优化问题。
【例题1】最短路径问题。
图中给出了一个地图,地图中每个顶点代表一个城市,两个城市间的连线代表道路,连线上的数值代表道路的长度。
现在,想从城市A到达城市E,怎样走路程最短,最短路程的长度是多少?【分析】把从A到E的全过程分成四个阶段,用k表示阶段变量,第1阶段有一个初始状态A,两条可供选择的支路ABl、AB2;第2阶段有两个初始状态B1、 B2,B1有三条可供选择的支路,B2有两条可供选择的支路……。
用dk(x k,x k+1)表示在第k阶段由初始状态x k到下阶段的初始状态x k+1的路径距离,Fk(x k)表示从第k阶段的x k到终点E的最短距离,利用倒推方法求解A到E的最短距离。
具体计算过程如下:S1:K=4,有:F4(D1)=3,F4(D2)=4,F4(D3)=3S2: K=3,有:F3(C1)=min{d3(C1,D1)+F4(D1),d3(C1,D2)+F4(d2)}=min{8,10}=8F3(C2)=d3(C2,D1)+f4(D1)=5+3=8F3(C3)=d3(C3,D3)+f4(D3)=8+3=11F3(C4)=d3(C4,D3)+f4(D3)=3+3=6S2: K=2,有:F2(B1)=min{d2(B1,C1)+F3(C1),d2(B1,C2)+f3(C2),d2(B1,C3)+F3(C3)}=min {9,12,14}=9F2(m)=min{d2(B2,c2)+f3(C2),d2(B2,C4)+F3(C4)}=min{16,10}=10S4:k=1,有:F1(A)=min{d1(A,B1)+F2(B1),d1(A,B2)+F2(B2)}=min{13,13}=13因此由A点到E点的全过程的最短路径为A—>B2一>C4—>D3—>E。
动态规划算法在路径规划中的应用

动态规划算法在路径规划中的应用路径规划在日常生活中随处可见,比如搜索最短路线、规划旅游路线、寻找交通路线等等。
其中,动态规划算法被广泛应用于路径规划领域,可解决诸如最短路径、最小花费路径等问题。
这篇文章将介绍动态规划算法在路径规划中的应用。
一、动态规划算法的基本原理动态规划算法是一种求解多阶段决策问题的优化方法。
它将问题分成多个子问题,并分别求解这些子问题的最优解。
最后通过不断合并子问题的最优解得到原问题的最优解。
其基本思想可以用以下三个步骤来概括:1.确定状态:将原问题分解成若干个子问题,每个子问题对应一个状态。
2.确定状态转移方程:确定每个状态之间的转移关系。
3.确定边界条件:确定初始状态和结束状态。
动态规划算法通常包括两种方法:自顶向下的记忆化搜索和自底向上的迭代法。
其中,自顶向下的记忆化搜索依赖于递归调用子问题的解,而自底向上的迭代法则通过维护状态表来解决问题。
二、动态规划算法在路径规划中的应用路径规划是动态规划算法的一个重要应用场景。
动态规划算法可以用来求解最短路径、最小花费路径、最大价值路径等问题。
这里以求解最短路径为例,介绍动态规划算法在路径规划中的应用。
1.问题定义假设我们需要从城市A走到城市B,中途经过若干个城市。
每个城市之间的距离已知,现在需要求出从城市A到城市B的最短路径。
这个问题可以用动态规划算法来求解。
2.状态定义在这个问题中,我们可以用一个二元组(u, v)表示从城市u到城市v的一条路径。
因此,在求解最短路径问题时,我们需要进行状态定义。
通常情况下,状态定义成一个包含一个或多个变量的元组,这些变量描述了在路径中的某个位置、某种状态和其他有关的信息。
在这个问题中,状态定义为S(i,j),它表示从城市A到城市j的一条路径,该路径经过了城市集合{1, 2, …, i}。
3.状态转移方程状态转移方程描述了相邻状态之间的关系,即从一个状态到另一个状态的计算方法。
在求解最短路径问题时,状态转移方程可以定义为:d(i, j) = min{d(i-1, j), d(i, k) + w(k, j)}其中,d(i,j)表示从城市A到城市j经过城市集合{1, 2, …, i}的最短路径长度。
最优控制问题的动态规划法

最优控制问题的动态规划法动态规划法是一种常用的最优控制问题求解方法。
它通过将问题分解为子问题,并保存子问题的最优解,最终得到整体问题的最优解。
本文将介绍最优控制问题的动态规划法及其应用。
一、概述最优控制问题是指在给定控制目标和约束条件下,通过选择一组最优控制策略来实现最优控制目标。
动态规划法通过将问题分解为若干个阶段,并定义状态和决策变量,来描述问题的动态过程。
并且,动态规划法在求解过程中通过存储子问题的最优解,避免了重复计算,提高了计算效率。
二、最优控制问题的数学模型最优控制问题通常可以表示为一个关于状态和控制的动态系统。
假设系统的状态为$x(t)$,控制输入为$u(t)$,动态系统可以表示为:$$\dot{x}(t) = f(x(t), u(t))$$其中,$\dot{x}(t)$表示状态$x(t)$的变化率,$f$为状态方程。
此外,系统还有一个终止时间$T$,以及初始状态$x(0)$。
最优控制问题的目标是找到一个控制策略$u(t)$,使得系统在给定时间$T$内,从初始状态$x(0)$演化到最终状态$x(T)$,同时使得性能指标$J(x,u)$最小化。
性能指标通常表示为一个积分的形式:$$J(x,u) = \int_0^T L(x(t), u(t)) dt + \Phi(x(T))$$其中,$L$表示运动代价函数,$\Phi$表示终端代价函数。
三、最优控制问题的动态规划求解最优控制问题的动态规划求解包括两个主要步骤:状态方程的离散化和动态规划递推。
1. 状态方程的离散化将状态方程离散化可以得到状态转移方程。
一般来说,可以使用数值方法(如欧拉方法、龙格-库塔方法)对状态方程进行离散化。
通过选择适当的时间步长,可以平衡计算精度和计算效率。
2. 动态规划递推动态规划递推是最优控制问题的关键步骤。
假设状态函数$V(t,x)$表示从时刻$t$起,状态为$x$时的最优性能指标。
动态规划递推过程通常可以描述为以下几个步骤:(1)递推起点:确定最终时刻$T$时的值函数$V(T,x)$,通常可以根据终端代价函数$\Phi$直接得到。
动态优化模型

动态优化模型动态优化模型是一种利用动态规划理论对优化问题进行建模与求解的方法。
它能够在不同环境下进行模型的动态调整,以求得最优解。
本文将介绍动态优化模型的基本概念与原理,并讨论其在实际问题中的应用。
一、动态规划的基本原理动态规划是一种以递归的方式进行求解的优化方法。
它将大问题分解为一系列子问题,并从子问题的最优解递归地求解出整个问题的最优解。
动态规划的核心思想是"最优子结构"和"重叠子问题"。
1. 最优子结构动态规划中的每个子问题必须具备最优子结构的特点,即如果一个问题的最优解包含了它的子问题的最优解,则称其具有最优子结构。
通过求解子问题得到的最优解可以作为整个问题的最优解的一部分。
2. 重叠子问题动态规划中的子问题往往是重叠的,即包含相同的子问题。
为避免重复计算,可以使用备忘录或者动态规划表来记录已求解的子问题的结果,在需要时直接检索以节省计算时间。
二、动态优化模型的建立动态优化模型通常包括三个基本要素:状态、状态转移方程和边界条件。
1. 状态状态是指问题中的一个变量或一组变量,它能够完整地描述问题的某个特定场景。
状态的选择对模型的性能和求解效果有着重要的影响。
2. 状态转移方程状态转移方程描述了问题中的状态如何转移到下一个状态。
它是建立动态规划模型的核心,通过定义合适的状态转移方程,可以准确地描述问题的演变过程。
3. 边界条件边界条件指定了问题的起始状态和终止状态,以及在某些特定情况下的处理方式。
它是动态规划模型中必不可少的部分,可以确定问题的边界和约束条件。
三、动态优化模型的应用动态优化模型广泛应用于各个领域,如经济学、管理学、运筹学等。
下面以背包问题和路径规划问题为例,说明动态优化模型的具体应用。
1. 背包问题背包问题是一个常见的优化问题,其目标是在给定的背包容量下,选择一定数量的物品放入背包中,使得背包内的物品总价值最大化。
动态优化模型中,可以将背包问题转化为一个二维的状态转移方程,并通过动态规划的方法求解最优解。
动态规划-最优化原理和无后效性

动态规划-最优化啊原理和无后效性上面已经介绍了动态规划模型的基本组成,现在需要解决的问题是:什么样的“多阶段决策问题”才可以采用动态规划的方法求解?一般来说,能够采用动态规划方法求解的问题必须满足.最优化原理和.无后效性原则。
(1)动态规划的最优化原理。
作为整个过程的最优策略具有如下性质:无论过去的状态和决策如何,对前面的决策所形成的当前状态而言,余下的诸决策必须构成最优策略。
可以通俗地理解为子问题的局部最优将导致整个问题的全局最优,即问题具有最优子结构的性质,也就是说一个问题的最优解只取决于其子问题的最优解,非最优解对问题的求解没有影响。
在例题1最短路径问题中,A到E的最优路径上的任一点到终点E的路径也必然是该点到终点E的一条最优路径,满足最优化原理。
下面来讨论另外一个问题。
【例题2】余数最少的路径。
如图所示,有4个点,分别是A、B、C、D,相邻两点用两条连线C2k,C2k-1(1≤k≤3)表示两条通行的道路。
连线上的数字表示道路的长度。
定义从A到D的所有路径中,长度除以4所得余数最小的路径为最优路径。
求一条最优路径。
【分析】在这个问题中,如果还按照例题1中的方法去求解就会发生错误。
按照例题1的思想,A的最优取值可以由B的最优取值来确定,而B的最优取值为(1+3) mod 4 = 0,所以A的最优值应为2,而实际上,路径C1-C3-C5可得最优值为(2+1+1) mod 4 = 0,所以,B的最优路径并不是A的最优路径的子路径,也就是说,A的最优取值不是由B的最优取值决定的,即其不满足最优化原理,问题不具有最优子结构的性质。
由此可见,并不是所有的“决策问题”都可以用“动态规划”来解决,运用“动态规划”来处理问题必须满足最优化原理。
(2)动态规划的无后效性原则。
所谓无后效性原则,指的是这样一种性质:某阶段的状态一旦确定,则此后过程的演变不再受此前各状态及决策的影响。
也就是说,“未来与过去无关”,当前的状态是此前历史的一个完整总结,此前的历史只能通过当前的状态去影响过程未来的演变。
动态规划问题常见解法

动态规划问题常见解法
动态规划是一种高效解决优化问题的方法。
它通常用于涉及最
优化问题和最短路径的计算中。
下面是一些常见的动态规划问题解法:
1. 背包问题
背包问题是动态规划中的经典问题之一。
其目标是在给定的背
包容量下,选择一些物品放入背包中,使得物品总价值最大。
解决
这个问题的常见方法是使用动态规划的思想,定义一个二维数组来
记录每个物品放入背包时的最大价值,然后逐步计算出最终的结果。
2. 最长公共子序列问题
最长公共子序列问题是寻找两个字符串中最长的公共子序列的
问题。
解决这个问题的常见方法是使用动态规划的思想,定义一个
二维数组来记录两个字符串中每个位置的最长公共子序列的长度。
然后通过递推关系来计算出最终的结果。
3. 矩阵链乘法问题
矩阵链乘法问题是计算一系列矩阵相乘的最佳顺序的问题。
解
决这个问题的常见方法是使用动态规划的思想,定义一个二维数组
来记录每个矩阵相乘时的最小乘法次数,然后逐步计算出最终的结果。
4. 最长递增子序列问题
最长递增子序列问题是寻找一个序列中最长的递增子序列的问题。
解决这个问题的常见方法是使用动态规划的思想,定义一个一
维数组来记录每个位置处的最长递增子序列的长度,然后通过递推
关系来计算出最终的结果。
以上是一些常见的动态规划问题解法。
通过灵活运用这些方法,我们可以更高效地解决优化问题和最短路径计算等相关任务。
学习与动态规划如何规划学习路径和目标

学习与动态规划如何规划学习路径和目标学习是人类不断进步的核心方式之一,而动态规划则是一种数学优化方法,通过将复杂问题分解为简单的子问题来解决。
在当今信息爆炸的时代,如何有效地规划学习路径和目标成为了一个重要课题。
本文将探讨学习与动态规划的结合,帮助读者更好地规划学习,实现学习目标。
首先,了解学习目标是规划学习路径的第一步。
无论是学习一门新的技能,提升专业能力,还是追求个人兴趣爱好,都需要设定明确的学习目标。
这些目标可以是短期的,如学习一项技能;也可以是长远的,如成为某一领域的专家。
动态规划的思想是将问题分解为多个阶段,从而逐步实现最终目标。
在规划学习路径时,可以借鉴动态规划的思想,将长期目标分解为短期目标,逐步实现。
其次,制定学习计划是规划学习路径的重要环节。
在确定学习目标的基础上,需要制定详细的学习计划,包括学习内容、学习方法、学习时间等。
动态规划的核心思想是最优子结构和重叠子问题,即在解决问题的过程中,可以利用已经解决的子问题的解来解决更大规模的问题。
在学习过程中,也可以利用这种思想,通过总结已学知识和经验,优化学习路径,提高学习效率。
此外,动态规划还注重阶段性的决策和最优解的选择。
在学习过程中,也需要灵活地调整学习计划,根据实际情况进行阶段性的调整和决策。
有时候可能会遇到挫折和困难,需要及时调整学习方法和策略,保持学习的动态性。
只有不断优化学习路径,才能更好地实现学习目标。
最后,实践是检验学习效果的最好方式。
动态规划的思想在于不断迭代,通过反复试错来逐步优化解决方案。
在学习过程中,也需要不断地实践和应用所学知识,检验学习效果。
只有将理论知识与实际应用相结合,才能更好地提高学习水平,实现学习目标。
综上所述,学习与动态规划相结合,可以帮助我们更好地规划学习路径和目标。
通过设定明确的学习目标、制定详细的学习计划、灵活调整学习策略和不断实践、检验学习效果,我们可以更高效地实现学习目标,不断提升个人的学习能力和综合素质。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于动态规划方法的最优消费路径有些学者从微观经济理论的角度探索消费和投资的最优比率。
例如,Phelps构建了不确定收入下的最优消费率[2 ]。
基于这一模型,Me r t o n以布朗运动模拟不确定收益,利用动态规划建模的方式,求出在连续时间假设下获得最大消费效用的消费和资产投资组合[3 ]。
然而M e r t o n的模型采用了P r a t t的绝对风险厌恶度(absolute risk aversion)[4], 即假设投资者的风险偏好是和年龄、财富无关的常数,从而把家庭总财富比率设计成常数。
为了改进过于严格的常系数风险厌恶假设,F a r h i和Pan — ageas假设投资者可以通过控制退休时间来调整劳动供给,从而实现最优消费和投资[5]。
另外有些学者拓展了M e F t o n等人的模型,如Ilakansso n和Ri c h a r d研究了存在保险时的生命周期最优消费[6 ][ 7 ]; Karat z a s使用鞅方法研究了个人如何选择消费率来实现消费和财富效用最大化[8 ];B o d i e等人探讨了退休期间的最优消费投资问题[9]。
有些学者则从宏观经济学的角度阐述消费和投资对消费效用最大化的影响。
李嘉图的古典消费理论强调了消费对经济的刺激。
凯恩斯绝对收入假说认为消费主要取决于当期绝对收入,平均消费倾向(APC)随收入增加而减少。
按此假说,一战后,美国人民收入增加,储蓄应随之增加。
但是,K u z n e t s实证研究发现战后储蓄并未增加,长期A P C稳定[10]。
为解析上述矛盾现象,D u esenberr y提出相对收入假说,家庭会比较其他家庭的收入, 即相对水平,来决定自己的消费水平[1 1 ] ( P 3 )。
相对收入假说的缺陷在于家庭的消费是短视行为,没有考虑未来收入。
为克服相对收入假说存在的问题,F r i e dma n提出了家庭将根据终生收入来决定消费的持久收入假说[1 2] (P 2 6 - 1 3 5 )。
内生增长理论被广泛用于分析投资和消费的最优分配。
该理论假设在生产过程中的规模收益不变,即凸性生产技术,经济增长的决定因素是生产要素, 生产率是由模型内生所决定的,而不是由资源、人口等外部因素决定。
典型的内生增长模型有A K模型、R e b e 1 o模型等[13]。
曾经有人质疑AK模型是否可以用来评估经济增长。
Jones 建立了技术为常数的A K模型,对函数关于物质资本和人力资本求最大值,并基于1 9 5 0〜1 9 8 8年加拿大、法国、德国等1 5个0 E C D国家的时间序列数据,研究发现战后投资额同经济增长无关, 并由此推断AK模型对投资和经济增长关系的预测是短期的或不正确的[14]。
为了反驳A K 模型不适用于研究经济增长的结论,M c G r a t t a n建立了技术为常数的A K模型,对函数关于消费和资本求最大值。
M c G r a t t a n用187 0〜1989年1 1个国家的数据验证了投资率和经济增长之间的正相关关系,证明政府投资诱导政策会永久性影响经济增长[15]°McG 「at-tan 发现J o n e s之所以用AK模型测不出投资和经济增长的相关性, 一是数据期限短,二是模型设计存在缺陷。
M c G r a t t a n的模型假设如下:(1)代表性家庭选择投资和消费,从而实现生命周期效用最大化;(2 )家庭有两种资木,分别是结构资木和设备资木,家庭收入来源于把结构资木和设备资木租给公司的租金;(3)家庭收入要向政府缴纳稅收,因此政府政策可以影响投资产出比和劳动闲暇选择。
这样一来,M c G r a t t a n就解释了Jones观察到的投资增加而产出稳定的短期离差,并从理论和实证角度验证jAK 模型的有效性。
木文在持久收入假设和内生增长理论框架下,研究经济增长的最优消费投资比率,从理论上指导国民收入的合理分配。
之所以选择资本产出弹性为单位弹性的A K模型,是因为资本对发展中国家很重要。
发展中国家可以通过购买技术先进的国家的设备得到知识,这种由投资带来的技术溢出可以加速整个国家的现代化。
另外, 由于行业间存在溢出效应,当资本提高某个行业的生产率时,与之相关行业的生产率也随之提高[16],所以不仅要考虑资本对单个行业的作用,还需要考虑资本的社会回报。
L j u n g q v i s t和S argent建立的A K模型与本文有类似的目标函数y t = A k a t ,也猜测了相同的值函数形式,并得到了类似的策略函数[1 7 ], 但本文与之不同的是:第一,他们假设资本产出弹性大于零而小于1(0 <a< 1 ),从而使资木边际效用递减,通过数学推导发现资木收敛,而本文假设资木产岀弹性等于1 (a= 1),从而使资本没有边际效用递减,通过数学推导发现资木不收敛,而值函数收敛;第二,木文考虑了资本折旧;第三,木文通过真实数据,再现改革开放以来消费和投资对提高社会效用的贡献。
本文余下部分的结构安排如下:第二部分建立包含资本折旧率和贴现因子的最优消费模型,通过猜解求出策略函数,讨论了消费、资木积累序列的意义,并通过求导分析了各变量对值函数的影响;第三部分比较了不同贴现因子下的值函数, 并用三维效果图展示了1 9 7 8〜2 0 1 0年中国消费、资本和值函数的演变关系;最后是木文的结论。
模型木文考虑生产单一商品的经济,此商品既可消费又可投资,投资以资木的形式体现,消费品和资本品可以相互转换。
消费数量和消费投资比决定代表性行为人的效用,社会计划者的目标是通过政策引导消费路径,使代表性行为人在任意时期都能获得最大效用。
经济增长由资本驱动,因此设生产函数为y t=Ak t,其中A反映技术水平, y t、k t和c t分别表示在时期t的生产量、资本存量和消费。
对于任意t期,有c t > 0 , k t > 0 ;且初始资本k 0己知。
由此,可得模型:max》!t = OBtln c ( t ) s. t . kt + l= y t + 1 — (6) k t — c t , y t = A k 烦姣怖t ( 1 )其中6 为资本折旧率,0 1 ; p为贴现因子,0 <B< 1 ; pt In c(t )是消费效用。
式(1 )是终生消费效用,资本积累规则为下期资本的数量取决于本期的有效商品总供给和木期的消费。
令f k(t)=Akt + l— (6) kt=(A+l—6) k t 表示包含资本折旧的有效商品总供给,则式(1 )可转化为:max》!t = Opt1 n c ( t ) s. t ・kt + l = f ( k t ) — c t , f (k t ) = ( A+ 1 -6) k畑煖灼t (2 )式(2 )目标函数的含义是代表性行为人追求一生消费的贴现效用最大化,其中消费c t是控制变量,资木k t 为状态变量。
由约束条件k t + 1 = f (kt)- c t ,可得c t = f ( k t ) -k t + 1 ,即控制变量可表示为状态变量的函数。
求式(2 )的最优解,就是在给定约束条件下,找到一个恰当的序列c t , k { t +1 } ! t = 0 ,使目标函数刃t = 0 Bt 1 n (ct)取得最大值。
(一)猜解求值函数和策略函数为方便求极值,将式(2)由离散形式转化为连续形式,并定义值函数()V k为投资者在给定财富下所能达到的期望终生总效用。
在竞争性均衡中投资者的效用得到了最大化,则根据汉密尔顿一雅可比一贝尔曼方程(II ami 1 ton—Jacobi—Be 1 Iman e q ua t i on,IIJBE)可得:()V k=ma x k z() 1 n [ f k-k]z +p {V (k)},()=ln [f k - g ( k )] +pV[g (k)] (3)式(3 )中,k是当前时期的资本存量(相当于k t ), k '是下一时期的资本存量(相当于k t + 1 )o g ( k ) 是利用II J B E进行递归迭代的策略函数,且g ( k ) = k \表示计划者而临的决策为:究竟是应该用政策引导代表性行为人当期多消费一些,还是当期少消费,留作下一期的资木,从而使下一期能消费更多。
()V k和g (k)都是连续可微的。
根据动态规划理论,可猜测值函数的形式为:()()V k = E + F 1 n k (4 )其中,E、F是待定常数。
对式(3 )和(4 )计算一阶最优的必要条件, 并根据式(2 )可得:g ( k ) = k 7 =pF A+ 1 - (6) k 1 + pF (5)() c = f k - k 7 =A+1 —(6) k 1 +pF (6)式(5)是策略函数g (k)关于k的显式解,F是待定系数。
(二) 最优消费、资本累积序列令n = 1 ,式(3 )变成式(7 )。
由式(2 ) 可知当t = 1时,以下两式成立:V 1 () k=maxk'() 1 n f k-k (7) VI ()k=maxk, () 1 n f k - k [丁+pV 0 k ()z ( 8 )式(7 )是目标函数(2 )的最大值, 即社会计划者最优问题中的值函数;式(8 )表示代表性行为人一生的效用贴现值等于当期效用、未来效用的贴现值之和。
当期消费和期末资本的选择c, k { 丫产生了当期效用1 n ( c ),下期的资本k ' 将按照策略函数g( k )来选择。
此处可获得的最大期望效用是V k()',而k‘的贴现值为pV 0 k ()\类似的,利用式(5)、式(3 )逐期递归迭代可得到值函数V n () k序列。
对任意t期,有:V n () k=》n— 1 i = l (p) i — 1 1 n A + 1 —6 1 +p () F +p n — lln (A+l—6)+ — lj=lj (p)j 1 n pF A+l — (6)l+p[]F+》ns = l(B)s — 1O 1 n k由于0 <卩<1 ,根据级数理论容易证明:当nT!时,V n () k是收敛的,且其极限值()V k = 1 i m n V n ()k就是无穷序列的唯一解。
也就是说,得到的函数方程与式(4)的猜测完全符合。
可以解出E= 1 1 —[3 1 n ( 1 -)pA+ 1 -[(6)] + 卩1 一(p) 2 1 npA+ 1 - [(6)], F = 1 1 -p o将E 和F代入式(4 )可得到函数方程(3 )的具体表达式和相应的策略函数:()V k = 1 1 一卩1 n ( 1 —)卩A + 1 — [(6)] +B 1 —(卩)21 npA+ 1 - [(6)] + 1 1 -p () In k ( 9 ) g ( k ) =p A+ 1 - (6) k ( 1 0 )式(9 )也就是式(1 )的解。