3连续时间动态最优化问题

合集下载

最优控制理论的发展与展望.

最优控制理论的发展与展望.

最优控制理论的发展与展望[1]最优控制理论是20 世纪60 年代迅速发展起来的现代控制理论中的主要内容之一,它研究和解决的是如何从一切可能的方案中寻找一个最优的方案。

1948 年维纳等人发表论文,提出信息、反馈和控制等概念,为最优控制理论的诞生和发展奠定了基础。

我国著名学者钱学森在1954 年编著的《工程控制论》直接促进了最优控制理论的发展。

美国著名学者贝尔曼的“动态规划”和原苏联著名学者庞特里亚金的“最大值原理”是在最优控制理论的形成和发展过程中,最具开创性的研究成果,并开辟了求解最优控制问题的新途径。

此外,库恩和图克共同推导的关于“不等式约束条件下的非线性最优必要条件(库恩—图克定理) ”及卡尔曼的关于“随机控制系统最优滤波器”等是构成最优控制理论及现代最优化技术理论基础的代表作。

[1][1]鲁棒控制是针对不确定性系统的控制系统的设计方法,其理论主要研究的问题是不确定性系统的描述方法、鲁棒控制系统的分析和设计方法以及鲁棒控制理论的应用领域。

鲁棒控制理论发展的最突出的标志之一是H∞控制。

H∞控制从本质上可以说是频域内的最优控制理论。

鲁棒控制与最优控制结合解决许多如线性二次型控制、电机调速、跟踪控制、采样控制、离散系统的镇定、扰动抑制等实际问题。

[2]近年来,最优控制理论[1,2]的研究,无论在深度和广度上,都有了很大的发展,已成为系统与控制领域最热门的研究课题之一,取得了许多研究成果。

同时,也在与其他控制理论相互渗透,出现了许多新的最优控制方式,形成了更为实用的学科分支。

例如鲁棒最优控制[3]、随机最优控制[4]、分布参数系统的最优控制[5]、大系统的次优控制[6]、离散系统的最优控制及最优滑模变结构控制[7,8]等。

而对于非线性系统,其最优控制求解相当困难,需要求解非线性HJB 方程或非线性两点边值问题,除简单情况外[9],这两个问题都无法得到解析解。

因此,许多学者都致力于寻求近似的求解方法[10~13],通过近似解得到近似的最优控,即次优控制。

动态规划

动态规划
f1(A)=MIN r(A,B1)+ f2(B1) r(A,B2)+ f2(B2)
=MIN(3+12,4+10)=14
最短路线: A—— B2 ——C2——D2——E2——F 最优解: d1*(A)= B2,最短用时14
1
B2
C3
4 2
D3
5
E2
4
A
2
C2
3 3 3
D2
2
F
3
B1
5 4
C1
4
2
E1
最优解: d2*(B1)= C1
1
B2
C3
4 2
D3
5
E2
4
A
2
C2
3 3 3
D2
2
F
3
B1
5 4
C1
4
2
E1
4
3
D1
A
B
C
D
E
F
如果S2=B2,则下一步能取C2或C3,故
f2(B2)=MIN r(B2,C2)+ f3(C2)
r(B2,C3)+ f3(C3) =MIN(2+8,1+11)=10
最短路线: B2 ——C2——D2——E2——F
1
B2
C3
4 2
D3
5
E2
4
A
2
C2
3 3 3
D2
2
F
3
B1
5 4
C1
4
2
E1
4
3
D1
A
B
C
D
E
F
如果S4=D3,则下一步只能取E2,故

电力系统最优潮流分析

电力系统最优潮流分析

电力系统最优潮流分析电力系统是现代社会中最重要的系统工程之一,为社会生产和人民生活提供了绝大部分能量。

电能的生产需要耗费大量的燃料,而目前电能在输送、分配和消费过程中存在着大量的损耗。

因此如何采取适当措施节约能源,提高整个电力系统的运行效率,优化系统的运行方式,是国内外许多学者一直关注与研究的热点。

电力系统的最优化运行是指在确保电力系统安全运行、满足用户用电需求的前提下,如何通过调度系统中各发电机组或发电厂的运行,从而使系统发电所需的总费用或所消耗的总燃料达到最小的运筹决策问题。

数学上可将此问题描述为非线性规划或混合非线性规划问题。

最优潮流问题是指在满足必须的系统运行和安全约束条件下,通过调整系统中可利用控制手段实现预定目标最优的系统稳定运行状态。

同经典的经济调度法相比,最优潮流具有全面规划、统筹考虑等优点,它可将安全运行和最优经济运行等问题进行综合考虑,通过统一的数学模型来描述,从而将电力系统对经济性、安全性以及电能质量等方面的要求统一起来。

最优潮流问题的提出把电力系统的最优运行理论提高到一个新的高度,受到了国内外学者高度重视。

最优潮流已在电力系统中的安全运行、电网规划、经济调度、阻塞管理、可靠性分析以及能量管理系统等方面得到了广泛应用,成为了电力系统网络运行分析和优化中不可或缺的工具。

一、最优潮流问题研究的意义最优潮流可将电力系统可靠性与电能质量量化成相应的经济指标,并最终达到优化资源配置、降低成本、提高服务质量的目的。

因此最优潮流研究具有传统潮流计算无法比拟的意义,主要体现在以下两个方面。

一方面,通过最优潮流计算可指导系统调度员的操作,保证系统在经济、安全、可靠的状态下运行。

具体表现为:第一,当所求问题以目标函数、控制变量和约束条件的形式固定下来后,就一定可以求出唯一最优解,并且该结果不受人为因素的影响。

第二,最优潮流的寻优过程可以自动识别界约束,在解逐渐趋于最优的过程中可得到网络传输瓶颈信息,从而可以指导电网扩容与规划。

连续优化、离散优化、组合优化与整数优化

连续优化、离散优化、组合优化与整数优化

连续优化、离散优化、组合优化与整数优化最优化问题(optimization problem)⾃然地分成两类:⼀类是连续变量的问题,称为连续优化问题;另⼀类是离散变量的问题,称为离散优化问题。

1. 连续优化(continuous optimization)连续优化是求解连续优化是求解在连续变量的问题,其⼀般地是求⼀组实数,或者⼀个函数。

离散优化(discrete optimization)2. 离散优化连续优化是求解离散变量的问题,是从⼀个⽆限集或者可数⽆限集⾥寻找⼀个对象,典型地是⼀个整数,⼀个集合,⼀个排列,或者⼀个图。

3. 组合优化(combinatorial optimization)组合优化问题的⽬标是从组合问题的可⾏解集中求出最优解,通常可描述为:令Ω={s1,s2,…,sn}为所有状态构成的解空间,C(si)为状态si对应的⽬标函数值,要求寻找最优解s*,使得对于所有的si∈Ω,有C(s*)=minC(si)。

组合优化往往涉及排序、分类、筛选等问题,它是运筹学的⼀个重要分⽀。

典型的组合优化问题有旅⾏商问题(Traveling Salesman Problem-TSP)、加⼯调度问题(Scheduling Problem,如Flow-Shop,Job-Shop)、0-1背包问题(Knapsack Problem)、装箱问题(Bin Packing Problem)、图着⾊问题(Graph Coloring Problem)、聚类问题(Clustering Problem)等。

这些问题描述⾮常简单,并且有很强的⼯程代表性,但最优化求解很困难,其主要原因是求解这些问题的算法需要极长的运⾏时间与极⼤的存储空间,以致根本不可能在现有计算机上实现,即所谓的“组合爆炸”。

正是这些问题的代表性和复杂性激起了⼈们对组合优化理论与算法的研究兴趣。

4. 整数优化(integer programming, IP)要求所有的未知量都为整数的线性规划问题叫做整数规划 (integer programming, IP) 或整数线性规划 (integer linear programming, ILP) 问题。

mpc 贝尔曼方程

mpc 贝尔曼方程

mpc 贝尔曼方程全文共四篇示例,供读者参考第一篇示例:MPC 贝尔曼方程是一种经济学和数学领域中常用的模型,用于描述在连续时间内进行决策的最优化问题。

MPC 是Model Predictive Control(模型预测控制)的缩写,是一种控制策略,将系统建模为离散时间步的状态空间模型,通过动态规划和优化算法来找到最佳的控制策略。

贝尔曼方程则是动态规划问题的关键方程,首次由数学家理查德·贝尔曼在上世纪50年代提出。

贝尔曼方程描述了一个动态系统中的最优值函数(value function)满足的递归关系式。

通过求解贝尔曼方程,可以得到系统的最优控制策略,从而在给定的约束条件下,找到最佳的决策方案。

MPC 贝尔曼方程的核心思想是在每个时间步上,通过计算当前时刻的值函数和未来时刻的预测模型,来优化控制策略。

具体来说,MPC 贝尔曼方程可以表达为以下形式:V*(x,k) = min u(k) [ c(x(k),u(k)) + V*(f(x(k),u(k)), k+1) ]V*(x,k) 是在时间步k 时状态x 下的最优值函数;u(k) 是在时间步k 时的控制策略;c(x(k),u(k)) 是在状态x(k) 和控制策略u(k)下的成本函数;f(x(k),u(k)) 是状态转移函数,描述了系统在当前状态和控制策略下的演化过程。

通过不断迭代求解上述方程,可以逐步计算出系统在每个时间步上的最优控制策略,从而实现对系统的最优控制。

MPC 贝尔曼方程的优势在于能够处理具有非线性、动态和不确定性特性的系统,并且可以灵活地调整控制策略以应对不同的情况。

在实际应用中,MPC 贝尔曼方程被广泛应用于工业控制、机器人控制、交通信号优化等领域。

在工业控制中,MPC 贝尔曼方程可以优化生产过程中的控制策略,提高生产效率和产品质量;在机器人控制中,MPC 贝尔曼方程可以优化机器人的运动路径,提高工作效率和安全性;在交通信号优化中,MPC 贝尔曼方程可以优化信号灯的控制策略,减少交通拥堵和排放。

第10章 动态规划

第10章  动态规划
②某些情况下,用动态规划处理不仅能定性描 述分析,且可利用计算机给出求其数值解的 方法。
管理运筹学
7
缺点
①没有统一的处理方法,求解时要根据问题的 性质,结合多种数学技巧。因此实践经验及 创造性思维将起重要的引导作用;
②“维数障碍”,当变量个数太多时,由于计 算机内存和速度的限制导致问题无法解决。 有些问题由于涉及的函数没有理想的性质使 问题只能用动态规划描述,而不能用动态规 划方法求解。
盈利 工厂 设备台数
0 1 2
3 4 5
甲厂
0 3 7 9 12 13
乙厂
0 5 10 11 11 11
管理运筹学
29
第一阶段:只有1个始点A,终点有B1,B2,B3,B4 。对始点和终 点进行分析和讨论分别求A到B1,B2,B3,B4的最短路径问题:
表10-4
本阶段始 点(状态)
A
阶段1 本阶段各终点(决策)
B1
B2
B3
B4
4+12=16 3+13=16 3+14=17 2+12=14
到E的最 本阶段最优终 短距离 点(最优决策)
第四阶段:两个始点D1和D2,终点只有一个;
表10-1
阶段4
本阶段始点 本阶段各终点(决策) 到E的最短距离
(状态)
E
D1
10
10
D2
6
6
分析得知:从D1和D2到E的最短路径唯一。
本阶段最优终点 (最优决策)
E E
管理运筹学
27
第三阶段:有三个始点C1,C2,C3,终点有D1,D2,对始点
和终点进行分析和讨论分别求C1,C2,C3到D1,D2 的最短路

马尔可夫决策过程中的连续时间建模方法(Ⅱ)

马尔可夫决策过程中的连续时间建模方法(Ⅱ)

马尔可夫决策过程(Markov Decision Process, MDP)是一种用来描述随机决策过程的数学模型。

在实际应用中,很多问题都可以被建模成MDP并通过合适的算法进行求解。

在MDP中,状态空间、动作空间和奖励函数的离散性是基本前提,但在某些应用中,这些变量可能是连续的。

本文将介绍马尔可夫决策过程中的连续时间建模方法,探讨其在实际问题中的应用。

一、连续时间马尔可夫决策过程MDP最早是由Bellman提出的,它适用于描述状态和动作都是离散的情形。

但是,很多实际问题中,状态空间和/或动作空间是连续的,这时需要进行连续时间建模。

连续时间MDP(Continuous-time Markov Decision Process, CTMDP)是对MDP的一种扩展,它考虑状态和动作空间是连续的情形。

在CTMDP中,状态转移由随机微分方程描述,动作空间是连续的。

状态空间一般也是连续的,但有时也可以是离散的。

奖励函数在时间上是连续的,与状态和动作相关。

CTMDP的目标是找到一个策略,使得期望累积奖励最大化。

二、CTMDP的求解方法CTMDP的求解方法与MDP有些不同。

在MDP中,常用的求解方法是值迭代或策略迭代,但这些方法不适用于CTMDP,因为连续状态空间和动作空间使得价值函数和策略函数难以表示。

对于CTMDP,常用的求解方法是近似动态规划。

近似动态规划是通过近似值函数和/或策略函数来求解CTMDP的方法。

其中,近似值函数方法包括函数逼近和蒙特卡洛方法,而近似策略函数方法包括策略梯度和Q-learning等。

近似值函数方法通过对值函数进行逼近来求解CTMDP。

常用的函数逼近方法包括线性函数逼近、非线性函数逼近和神经网络逼近等。

在CTMDP中,值函数是关于状态和动作的函数,它的逼近可以通过对状态和动作空间进行离散化,然后对每个离散状态和动作进行值函数逼近。

此外,蒙特卡洛方法也可以用于求解CTMDP,它通过采样得到的轨迹来估计值函数。

一个风险值约束下的连续时间最优投资组合

一个风险值约束下的连续时间最优投资组合

第 3 卷 第 5期 1

个风险值 约束 下的连续时 问最优投 资组合
胡 华
( 宁夏大学 数学计算机学 院 , 宁夏 银川 702 50 1)

要: 考察当存在一个 风险约束 时的连续时间 的最优投资组合 问题 , 提供最 优投资组合 中控制 风
险 的一种方法 和实践 管理者对市场风险控制 的必 要条件. 一个 风险约 束是指 由 n个风 险资产 加上一个
中图分类号 : 2 13 F 3 0 2 . ;8 0 文献标识码 : A 文章编号 :00— 12 2 0 )5— 0 9— 3 10 2 6 (0 7 0 00 0
V R是一定时期给定置信水平下 的最大期望损失. 了实现预期 值 , a 为 一个投资组合必 须能够控制 V R 的水平 . Me o a 在  ̄n最初 的公 式 中 , 产 或 消费 的期 望效 用 是 在 产 生 风 险资 产 的最 优 分 配 的 时期 内 资
收 稿 日期 :0 7— 4—1 20 0 5
基金项 目: 国家 自然科 学基 金资助项 目(0 6 0 3 ; 6 6 30 ) 上海 市科 委重点基金 资助项 目( 2 J4 6 ) 0 D 103
作 者简 介 : 胡
华 (9 2 )男 , 中宁人 , 16 一 , 宁夏 宁夏大学副教授 .
最大 化 的 , 没有 考虑 V R, 最后 的 资产组 合 也不 是通 常 期 望 的 , 别 的 , 但 a 且 特 如果 使 用 一个 强 效 用 函数 , 则最 优组 合是 资 产 的常 数 倍 J这 显 然 在 某 点上 违 背 了 V R 约 束. 们 已提 出几 种 方 法研 究 均 值 一 , a 人 V R最优 化并 与 均值 一方 差法 作 比较 J然 而 , 些研 究 基 本 是 静 态 的. 近 , 态 的情 景 受 到 一 些 研 a , 这 最 动 究 者更 多 的关 注 ' , 4 他们 都集 中于效 用最 大化 的最 优组 合 政策 , J 且把 V R看做 约束 . a 本 文 把 V R看作 一个 动 态约 束 , a 为处 理 方 便 , 区 间 交 易 和 回验 的考 虑 中抽 象 出约 束 , 每 一 时 从 在 刻 , 计 V R并用 于影 响投资 决定 . 个模 型 随时 问利 用 V R约 束 并 强 调实 际 中 V R 估 a 这 a a s的重 复 计算 , 这 是 其他 模 型不具 有 的特 点 . 我们 希望模 型 能 以另一 种观 点 看待最 优 组合 和 V R约 束 的经 济含 义. a
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三讲连续时间动态最优化问题一、预备知识动态最优化问题历来是数学家们关注的热点和难点问题。

从17世纪末的伯努利,到20世纪50年代的贝尔曼和庞特里亚金,中间经过拉格朗日、欧拉等一大批数学家的努力,才使动态最优化理论日臻完善。

20世纪初,在拉姆齐(1928)的工作之后,动态数学技巧才被广泛地引入到经济学中来,目前,这些技巧已是大多数现代经济学家不可或缺的工具。

上一节,我们探讨了离散时间的动态优化问题,介绍了古典的拉格朗日乘数法和比较现代的贝尔曼方程法。

本节我们将在连续时间的动态优化问题中,也介绍两种方法,他们是古典的变分法和比较现代的汉密尔顿最大值原理。

下面分别介绍这两种方法。

二、连续时间动态最优化问题的描述例1.索罗(Solow)新古典经济增长模型的一个明显缺陷是把储蓄率看成是外生给定的。

事实表明,储蓄率不是常数。

为了将储蓄率内生化,堪斯(Cass,1965)和库普曼斯(Koopmans,1965) 利用拉姆齐(Ramsey, 1928)倡导的最优化方法,将储蓄率看作是由家庭和企业在竞争市场上追求自身利益最大化的结果,以此证明储蓄率是由模型决定的内生变量。

假设经济包含两个部门,家庭和企业,家庭通过提供劳动服务从企业取得工资,通过提供资产获得利息。

家庭收入分成消费和储蓄两部分。

家庭在预算约束条件下按照消费效用最大化的原则进行消费和投资决策。

家庭生命是无限期的。

家庭大小与成年人口数量对应,成年人口按给定(外生)不变的速度增长,为方便其见,人口的变化规律由下式确定: nt e t L =)(这里,假设初期人口数量为1,然后按等比级数递增,n 为人口增长率。

C(t)表示 t 时刻的消费, c(t)=C(t)/L(t)表示人均消费。

消费者问题是: [][]na c ra w adte e t c u t c U Max t nt t c --+=⋅⋅=⎰∞- 0)()()(ρ(1)此处,u(c)是c 的增函数并满足边际效用递减规律,u(c)满足稻田条件:∞=→)(lim'0c u c , 0)(lim '=∞→c u c 即当c 趋于零时,边际效用趋于无穷大,当c 趋于无穷大时,边际效用趋于零。

U[c(t)]表示家庭的总效用; a(t)=A(t)/L(t)表示人均净资产; r(t)表示资产收益率; w(t)表示工资率;ρ>0表示时间偏好率, 其含义是,时间越久远,效用的贴现值越少,ρ也叫做主观贴现率。

通常假设ρ>n 以保证家庭总效用在消费给定时是有界的1。

最优化问题(1)的另一种表达形式可以将由第二方程求得的消费c 代入到第一个方程获得:[][][]dt t at a t F dt e e ana ra w u t c U Max t nt t c ⎰⎰∞∞-=⋅⋅--+=00)()(),(,))( ρ (2)这就是目标函数的泛函表示最优化问题转化为:[][][]dt t at a t F dt e e ana ra w u t a V Max t nt t a ⎰⎰∞∞-=⋅⋅--+=00)()(),(,))( ρ例2. 乔根森(利润最大化)模型在乔根森的新古典投资理论中,假设企业利用资本K 和劳动L 进行生产,其生产函数具有新古典生产函数),(L K Q Q =形式。

新古典生产函数遵循三个假设,即:(1)边际生产力大于零;(2)边际生产力递减;(3)规模报酬不变。

P 表示产品价格;M 表示资本品价格;W 表示劳动力的工资;δ表示资本折旧率。

则企业的投资与资本的关1注:()t tte eρρρ+≈⎪⎭⎫⎝⎛=-111, 因此,贴现因子可以写成e 以为底的指数形式,目的是为了便于计算。

系为K K I δ+'=在任意时刻企业的净收益为:)(),(K K M WL L K PQ δ+'--如果企业贴现率r, 未来净收益的贴现值可表示为:[][]d tt K t L t K t F dte K K M WL L K PQ L K N t ⎰⎰∞∞-=-'--=0'0)(),(),(,(),(),(ρδ (3)是目标泛函F 的广义积分。

[][]d tt K t L t K t F dte K K M WL L K PQ L K V t t L t K ⎰⎰∞∞-=-'--=0'0)(),()(),(),(,(),(),(max ρδ[]KK I dte MI WL L K PQ L K N t δρ+'=--=⎰∞-0),(),(该最优化问题还可以写成:)()()())(),(),(,(),(max 0,t K t I t K dtt I t L t K t F L K N LK δ-='=⎰∞(4)一般来说,泛函积分可以表示为两种方式:一种是将泛函积分表示,如(2)和(3)的表示的最优化问题,目标函数是路径及其导数的函数。

另一种表示,如(1)和(4)所示,目标函数是控制变量和状态变量的函数,目标函数受转移动态方程的约束。

三、变分法3.1 变分问题的一般形式前面所述的最优化问题可以用目标泛函来表示:[][]dt t y t y t F y V Ty⎰'=0)(),(,max (5)且满足初始条件: Z T y A y ==)(,)0(目标函数][y V 是路径)(t y 的函数。

我们的目的是选择一条路径使积分表达式(5)达到最大。

由于变分法是利用微积分的工具发展而来,泛函极值问题是函数极值问题的发展和推广,所以,我们要求被积函数具有一阶、二阶导数。

我们知道,使函数达到最大值的点是极值点,所以,使泛函达到极值的曲线或者路径为极值曲线或极值路径。

3.2 预备知识对含参变量x 积分:⎰=ba dt x t F x I ),()(I⎰='=b a x dt x t F x I dxdI),()(' 如果a, b 也看作是参变量,则⎰=ba dt x t Fb a I ),(),(),(x b F b I=∂∂ ),(x a F aI-=∂∂ 分步积分公式:⎰⎰-=udv vu vdu复合函数求导法: 对于[])(),(),(t z t y t x F ,有dtdzz F dt dy y F t x x F dt dF ∂∂+∂∂+∂∂∂∂= 由于函数[])(),(,t y t y t F '是),,(y y t '的函数,而y y ',都是t 的函数,所以,F 和F '都是t 的复合函数。

因此,我们有dty d y F dt dy y F t F dt dF y y y y ''∂∂+∂∂+∂∂=''''3.3.欧拉方程的推导第一步,将求极值曲线的问题变换为求极值点的问题。

假设)(*t y 是已知的极值曲线,我们的目的是找到这条曲线所满足的必要条件。

任意选取连接(0,A )和(0,Z )点的扰动曲线)(t p , 则可以构造极值曲线的邻近路径: )()()(*t p t y t y ⋅+=ε)()()('*t p t y t y '⋅+='ε其中,ε是一个任意小的数,当它趋于0时,)()(*t y t y → 对于给定的)(*t y 和)(t p ,每一个ε对应于一条邻近路径y ,从而确定泛函的特定值。

于是,泛函就成了ε的函数)(εV V =,其表达式为:[]d t t p t y t p t y t F V T⎰⋅+⋅+=0'*'*)()(),()(,)(εεε由于极值曲线)(*t y 对应点ε=0, 所以,函数)(εV V =在ε=0点达到最大值,根据一元函数极值的必要条件,必有:0)()(000=⎪⎪⎭⎫ ⎝⎛''∂∂+∂∂=⎪⎪⎭⎫⎝⎛∂'∂'∂∂+∂∂∂∂=∂∂=⎰⎰⎰dt t p y Ft p y F dt y y F y y F dt F d dV TT T εεεε或者0)()(00=''∂∂+∂∂⎰⎰dt t p yF dt t p y FT T第二步:进行分步积分根据分步积分法,上式的第二个积分可以简化为:dt y Fdt d t p dty F dt d t p t p y F t dp y F dt t p y F TT TTT'∂∂-='∂∂-'∂∂='∂∂=''∂∂⎰⎰⎰⎰0000)()()()()(代入()式,可得:0)(0=⎪⎪⎭⎫ ⎝⎛'∂∂-∂∂⎰dt t p y F dt d y F T第三步:求欧拉方程上式包含附加任意函数p(t),泛函积分达到最优的条件应该不依赖于附加函数p(t),事实上,我们可以证明0='∂∂-∂∂y F dt d y F .为证明上述结论,我们证明下面的引理: 如果给定函数)(t f 和任意函数)(t g 满足:0)(0=⎪⎪⎭⎫ ⎝⎛'∂∂-∂∂⎰dt t p y F dt d y F T0)()(0⎰=Tdt t g t f , 则必有0)(=t f .证明(反证法):如果0)(≠t f ,不失一般性,我们假设存在一点0t 使0)(0>t f ,由于)(t f 是连续函数,所以必然存在一个充分小的数δ使)(t f 在区间),(00δδ+-t t 上,满足0)(>t f 。

下面我们构造函数:=)(t g 1,当),(00δδ+-∈t t t=)(t g 0,当),(00δδ+-∉t t t⎰⎰⎰⎰⎰+-+-+->=++=δδδδδδ0000000)(0)(0)()(0t t t t Tt t Tdt t f dt dt t f dt dt t g t f ,这与原假设矛盾,所以,0)(=t f 成立。

由于y Fdt d y F '∂∂-∂∂就相当于)(t f ,所以,0=???+?y F dt d y F 。

这就是泛函积分最优的一阶条件,也称欧拉方程。

第四步,欧拉方程的另一种表达方式 由于)()(''t y F t y F F dt y d y F dt dy y F t F dt dF y F dt d y y y y y t y y y y ''+'+'∂∂+∂∂+∂∂=='∂∂'''''''=所以,0='∂∂+∂∂yF dt d y F 被改写成0)()(=-''+'+''''y y y y y y t F t y F t y F F例1, 假设消费者的即时效用函数)1(1)()1(θθ--=-c c u 2。

相关文档
最新文档