动态规划基本理论推广(函数迭代与策略迭代法)
运筹学教案动态规划

运筹学教案动态规划一、教学目标1. 了解动态规划的基本概念及其在运筹学中的应用。
2. 掌握动态规划的基本原理和方法,能够解决实际问题。
3. 学会使用动态规划解决最优化问题,提高解决问题的效率。
二、教学内容1. 动态规划的基本概念动态规划的定义动态规划与分治法的区别2. 动态规划的基本原理最优解的性质状态转移方程边界条件3. 动态规划的方法递推法迭代法表格法4. 动态规划的应用背包问题最长公共子序列最短路径问题三、教学方法1. 讲授法:讲解动态规划的基本概念、原理和方法。
2. 案例分析法:分析实际问题,引导学生运用动态规划解决问题。
3. 编程实践法:让学生动手编写代码,加深对动态规划方法的理解。
四、教学准备1. 教材:《运筹学导论》或相关教材。
2. 课件:动态规划的基本概念、原理、方法及应用案例。
3. 编程环境:为学生提供编程实践的平台,如Python、C++等。
五、教学过程1. 引入:通过一个实际问题,引出动态规划的概念。
2. 讲解:讲解动态规划的基本原理和方法。
3. 案例分析:分析实际问题,展示动态规划的应用。
4. 编程实践:让学生动手解决实际问题,巩固动态规划方法。
5. 总结:对本节课的内容进行总结,强调动态规划的关键要点。
6. 作业布置:布置相关练习题,巩固所学知识。
六、教学评估1. 课堂讲解:评估学生对动态规划基本概念、原理和方法的理解程度。
2. 案例分析:评估学生运用动态规划解决实际问题的能力。
3. 编程实践:评估学生动手实现动态规划算法的能力。
4. 课后作业:评估学生对课堂所学知识的掌握情况。
七、教学拓展1. 研究动态规划与其他优化方法的联系与区别。
2. 探讨动态规划在运筹学其他领域的应用,如库存管理、生产计划等。
3. 了解动态规划在、数据挖掘等领域的应用。
八、教学反思1. 反思本节课的教学内容、方法和过程,确保符合教学目标。
2. 考虑学生的反馈,调整教学方法和节奏,提高教学效果。
3. 探讨如何将动态规划与其他运筹学方法相结合,提高解决问题的综合能力。
动态规划的基本原理和基本应用

动态规划的基本原理和基本应用动态规划(Dynamic Programming)是一种通过将一个问题分解为较小的子问题并存储子问题的解来解决复杂问题的方法。
动态规划的基本原理是通过记忆化或自底向上的迭代方式来求解问题,以减少不必要的重复计算。
它在计算机科学和数学中具有广泛的应用,尤其是在优化、组合数学和操作研究等领域。
1.确定最优子结构:将原问题分解为较小的子问题,并且子问题的最优解能够推导出原问题的最优解。
2.定义状态:确定存储子问题解的状态变量和状态方程。
3.确定边界条件:确定初始子问题的解,也称为边界状态。
4.递推计算:利用状态方程将子问题的解计算出来,并存储在状态变量中。
5.求解最优解:通过遍历状态变量找到最优解。
1.背包问题:背包问题是动态规划的经典应用之一、它有多种变体,其中最基本的是0/1背包问题,即在限定容量的背包中选择物品,使得所选物品的总价值最大。
可以使用动态规划的思想来解决背包问题,确定状态为背包容量和可选物品,递推计算每个状态下的最优解。
2. 最长递增子序列:最长递增子序列(Longest Increasing Subsequence)是一种常见的子序列问题。
给定一个序列,找到其中最长的递增子序列。
可以使用动态规划来解决这个问题,状态可以定义为以第i个元素为结尾的最长递增子序列的长度,并递推计算每个状态的解。
3.矩阵链乘法:矩阵链乘法是一种优化矩阵连乘计算的方法。
给定一系列矩阵,求解它们相乘的最小计算次数。
可以使用动态规划解决矩阵链乘法问题,状态可以定义为矩阵链的起始和结束位置,递推计算每个状态下最小计算次数。
4.最短路径问题:最短路径问题是在有向图或无向图中找到两个节点之间最短路径的问题。
可以使用动态规划解决最短路径问题,状态可以定义为起始节点到一些节点的最短距离,递推计算每个状态的最优解。
动态规划的原理及应用

动态规划的原理及应用1. 什么是动态规划动态规划(Dynamic Programming)是解决多阶段决策问题的一种优化方法。
它通过把原问题分解为相互重叠的子问题,并保存子问题的解,以避免重复计算,从而实现对问题的高效求解。
2. 动态规划的基本思想动态规划的基本思想可以归纳为以下几步:•确定问题的状态:将原问题分解为若干子问题,确定子问题的状态。
•定义状态转移方程:根据子问题的状态,确定子问题之间的关联关系,建立状态转移方程。
•确定初始条件和边界条件:确定子问题的初始状态和界限条件。
•计算最优解:采用递推或迭代的方式计算子问题的最优解。
•构造最优解:根据最优解的状态转移路径,构造原问题的最优解。
3. 动态规划的应用场景动态规划广泛应用于以下领域:3.1 图论在图论中,动态规划可以用来解决最短路径问题、最小生成树问题等。
通过保存子问题的最优解,可以避免重复计算,提高求解效率。
3.2 数值计算在数值计算中,动态规划可以用来解决线性规划、整数规划等问题。
通过将原问题分解为子问题,并利用子问题的最优解求解原问题,可以快速求解复杂的数值计算问题。
3.3 操作研究在操作研究中,动态规划可以用来解决最优调度问题、最优分配问题等。
通过将原问题拆分为若干子问题,并保存子问题的最优解,可以找到全局最优解。
3.4 自然语言处理在自然语言处理中,动态规划可以用来解决句法分析、语义理解等问题。
通过构建动态规划表,可以有效地解析复杂的自然语言结构。
3.5 人工智能在人工智能领域,动态规划可以用来解决机器学习、强化学习等问题。
通过利用动态规划的状态转移特性,可以训练出更加高效和智能的机器学习模型。
4. 动态规划的优势和限制动态规划的优势在于可以高效地解决复杂的多阶段决策问题,通过保存子问题的最优解,避免了重复计算,提高了求解效率。
同时,动态规划提供了一种清晰的问题分解和解决思路,可以帮助人们理解和解决复杂的问题。
然而,动态规划也有其应用的限制。
动态规划的基本概念与方法

动态规划的基本概念与方法动态规划(Dynamic Programming,简称DP)是解决一类最优化问题的一种方法,也是算法设计中的重要思想。
动态规划常用于具有重叠子问题和最优子结构性质的问题。
它将问题分解为子问题,并通过求解子问题的最优解来得到原问题的最优解。
动态规划的基本概念是“最优子结构”。
也就是说,一个问题的最优解可以由其子问题的最优解推导出来。
通过分解问题为若干个子问题,可以形成一个递归的求解过程。
为了避免重复计算,动态规划使用一个表格来保存已经计算过的子问题的解,以便后续直接利用。
这个表格也被称为“记忆化表”或“DP表”。
动态规划的基本方法是“状态转移”。
状态转移指的是,通过已求解的子问题的解推导出更大规模子问题的解。
常用的状态转移方程可以通过问题的递推关系定义。
通过定义好状态转移方程,可以通过迭代的方式一步步求解问题的最优解。
在动态规划中,通常需要三个步骤来解决问题。
第一步,定义子问题。
将原问题划分为若干个子问题。
这些子问题通常与原问题具有相同的结构,只是规模更小。
例如,对于计算斐波那契数列的问题,可以定义子问题为计算第n个斐波那契数。
第二步,确定状态。
状态是求解问题所需要的所有变量的集合。
子问题的解需要用到的变量就是状态。
也就是说,状态是问题(解决方案)所需要的信息。
第三步,确定状态转移方程。
状态转移方程通过已求解的子问题的解推导出更大规模子问题的解。
通常情况下,状态转移方程可以通过问题的递推关系确定。
在实际应用中,动态规划常用于求解最优化问题。
最优化问题可以归纳为两类:一类是最大化问题,另一类是最小化问题。
例如,最长递增子序列问题是一个典型的最大化问题,而背包问题是一个典型的最小化问题。
动态规划的优势在于可以解决许多复杂问题,并且具有可行的计算复杂度。
但是,动态规划也有一些限制。
首先,动态规划要求问题具有重叠子问题和最优子结构性质,不是所有问题都能够满足这两个条件。
其次,动态规划需要存储计算过的子问题的解,对于一些问题来说,存储空间可能会非常大。
动态规划问题解决策略概述

动态规划问题解决策略概述动态规划(Dynamic Programming)是一种用于解决多阶段决策问题的优化方法。
它通过拆分问题为多个阶段,并逐步求解每个阶段的最优解,从而得到全局最优解。
动态规划常被应用于许多领域,如经济学、物理学和计算机科学等。
一、动态规划原理动态规划的核心原理是最优子结构和重叠子问题。
最优子结构意味着问题的最优解可以通过子问题的最优解来构造。
对于一个给定问题,如果它具有最优子结构,那么我们可以通过将问题分解为若干子问题来解决,然后再将它们的最优解合并以得到原问题的最优解。
重叠子问题指的是在求解问题的过程中,我们会反复遇到相同的子问题。
为了避免重复计算,我们可以采用记忆化搜索或者动态规划的方式将子问题的解存储起来,以便后续的计算直接使用。
二、动态规划解决步骤1. 确定状态:首先要明确问题涉及的状态是什么,即问题的子问题是什么。
2. 定义状态转移方程:根据问题的最优子结构,我们可以定义状态转移方程来表示子问题的最优解与原问题的最优解之间的关系。
3. 初始化边界条件:在动态规划求解的过程中,通常还需要初始化一些边界条件,用于递推过程的开始。
4. 递推求解:根据状态转移方程和初始化边界条件,使用递推的方式求解每个子问题的最优解,并将其存储起来以备后续使用。
5. 返回结果:最终根据子问题的最优解,得到原问题的最优解。
三、案例分析以经典的背包问题为例,介绍动态规划的具体应用过程。
问题描述:给定一个固定容量的背包,和一些物品,每个物品都有自己的重量和价值。
要求从这些物品中选择一些放入背包,使得在满足背包容量的前提下,背包内物品的总价值最大。
解决步骤:1. 确定状态:在背包问题中,每个物品可以选取或者不选取,因此可以定义状态dp[i][j]表示在前i个物品中,背包容量为j时的最大价值。
2. 定义状态转移方程:对于第i个物品,有两种情况:(1)不选取第i个物品,则dp[i][j] = dp[i-1][j];(2)选取第i个物品,则dp[i][j] = dp[i-1][j - weight[i]] + value[i];综合两种情况,状态转移方程为:dp[i][j] = max(dp[i-1][j], dp[i-1][j - weight[i]] + value[i])。
动态规划基本原理

推边界的时候,就可以用递推的方式去实现,而有的时候用递归的方式则比较容易写出递 归关系式。 动态规划是一种记忆化搜索,将中间计算的结果保存在数组之中,避免之后的重复运 算,提高了效率,这也是动态规划与递归递推的不同之处所在。 例二 最长不下降子序列 设有一个 正整数的序列: b1, b2, …bn, 对于下标 i1<i2<…ih, 若有 bi1<bi2<…<bih,则 称存在一个长度为 h 的不下降序列例如,下列数 3,18,7,14,10,12,23,41,16,24。 若存在 i1<i2<i3< … < ie 且有 a(i1)<a(i2)< … <a(ie)则称为长度为 e 的不下降序列。如上例中 3,18,23,24 就是一个长度为 4 的不下降序列,同时也有 3,7,10,12,16,24 长度 为 6 的不下降序列。程序要求,当原数列给出之后,求出最长的不下降序列。算法分析: 按照自底向上分析的思路,由后往前进行搜索: 1、对 b(n)来说,由于它是最后一个数,所以当从 b(n)开始查找时,只存在长度为 1 的不下 降序列; 2、若从 b(n-1)开始查找,则存在下面的两种可能性: ① 若 b(n-1)<b(n)则存在长度为 2 的不下降序列 b(n-1),b(n)。 ② 若 b(n-1)>b(n)则存在长度为 1 的不下降序列 b(n-1)或 b(n)。 设 F(i) 为前 i 个数中的最大不下 降 序列,则 F(i) 为之前所有 节 点中最大的一个 +1,即 : F(1)、F(2)、F(3)……F(i-3)、F(i-2)、F(i-1)中最大的一个加上 1。注意:并不是 F(i-1)+1。 F(I) = Max{F(j)+1 | j < I 且 bj <= bi}(其中 i<n,j=i+1,i+2,……,n),边界是 F(1)=1; 例三:buy low,buy lower 例四:最短路径 如图所示是城市道路示意图,每条边上的数字为该段街道的长度。求从 A 点到 B 点的最 短路径长度(只能往上和往右走)
动态规划的基本思想

动态规划的基本思想动态规划是一种常用于解决具有重叠子问题和最优子结构特征的问题的算法思想。
它将问题分解成一系列子问题,并通过解决子问题构建出整个问题的最优解。
动态规划的基本思想是将原始问题转化成一个或多个相似的子问题,然后通过解决这些子问题获得原始问题的解。
这种思想在很多实际问题中都能够得到应用。
动态规划的基本流程一般包括以下几个步骤:1. 将原始问题分解为子问题:首先需要将原问题划分为多个子问题,并且确保这些子问题之间有重叠的部分。
2. 定义状态:确定每个子问题需要求解的状态,也即问题需要达成的目标。
3. 确定状态转移方程:根据子问题之间的关系,确定子问题之间的状态转移方程,即如何将子问题的解转移到原问题的解。
4. 解决首个子问题:解决最基本的子问题,获得初始状态下的解。
5. 填充状态表格:根据状态转移方程,依次求解其他子问题,并且填充状态表格。
6. 求解原问题:通过填充状态表格,在保证状态转移方程的基础上求解原问题的最优解。
动态规划的关键在于将原问题转化为子问题,通过递归或者迭代的方式求解子问题,最终获得原问题的最优解。
在这个过程中,重叠子问题的求解是动态规划的特点之一。
由于问题的子问题存在重叠,所以在求解的过程中我们可以保存已经求解过的子问题的解,避免重复计算,从而提高效率。
动态规划还要求问题具有最优子结构特征,即问题的最优解可以通过子问题的最优解构建出来。
通过利用已解决的子问题的最优解,可以有效地解决原问题。
动态规划算法在实际应用中有着广泛的应用。
它可以用于解决很多经典的问题,如最长公共子序列、0-1背包问题、最大子数组和等。
动态规划算法可以有效地解决这些问题,使得它们的时间复杂度得到了有效的降低。
总结来说,动态规划的基本思想是将原始问题转化为子问题,并通过解决子问题构建整个问题的最优解。
动态规划算法通过保存已经解决的子问题的解来避免重复计算,从而提高算法的效率。
动态规划算法在实际应用中具有广泛的应用,是解决具有重叠子问题和最优子结构特征的问题的常用算法思想。
动态规划中函数值序迭代法

推 论 2 对 于 推 论 l 如 果 , , , , J … ^ 在 一 1步 之 内 达 到 最 优 解 - 果 点 如
…
J ]^ ( ) , 一mi, n ̄
: ( , t ^ n]户= ,
一, , 对 点 J ・ ,- - 来说 , 则 … 在
步 之 内达 到 最 优 解 。
推论 3 对 任何 点 , ( ∞一定 在 Ⅳ~1步 收敛 于 f() i。 原 理 2 若 点 .矗, , t , … 一在 一1 内 达到其 最优解 , 步 剩余 点 i… … ….并且 有 ,i i. ^ ( ) ^ ( ) … ≤ ( ) ≤ ≤ ,
中 国 分 类 号 : 2 02 1 3 文献标识码 : A
在 多阶段 动 态规 划 中 , 函数 值 迭代法 和策 略迭 代法 是其 主要方 法 。但 是 函数值 迭代 法计 算 量大 . 复 运算 很 多 。本文 以序 、 重 指标 函数 和函 数值选 代 法 为基础 , 到 两个 原理 . 得 由这两 个 原 理得 到 每 步迭代 都 有某 … 点 的最优解 产生 以及 迭 代 的 简化 公式 , 而提 出 r函 从 数值 序 迭代 洼 利 用该 迭代 法 比函数 值迭 代法 减少 了迭代 步 数 . 因而 大大减 少 了 计算量 。
+
( )一 m|I + , () , n[ f ]≥ , t ) ・
)一 ri a n
.
.
+ (
+
,) ( ]≥ / ( ) 。
( ) 与 假 设 相 矛 , ・ - J
因 此 ^ J ≥ ^ ( ) ( ) J a但 f ) 第 个 点 的 最 优 解 , ( 是 故 ‘ ) J 盾 证 毕 。
摘 要 : 序 、 标 函数 和 函数 值 迭 代 接 为 基础 . 出 了 函 数值 序 迭 代 { 得 到 了两 个 原 理 . 指 提 击。 由这 两 个 原 理 可 以得 到 每 步 迭 代 都 有 某 一 点 的 最 优 解 产 生 及 迭 代 的 简 化 公 式 利 用 函数 值 序 迭 代 洼 比 函数 值 迭 代 接 减 少 了 迭 代 步 数 , 大 减 少 了计 算 量 。 大 关键词 : 动态 规 瑚 ; : 标 函数 ; 序 指 函数 值 序迭 代 法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.函数迭代法的步骤是: (1)选初始函数 f0 (x()一般取 (2)用迭代公式
);f0 (x) 0
及 fk (x) opt v(x,u)计 算fk1(T (x,u)), x X uU ( x)
其中fk (x) 为 当(x前),阶x 段X的n 状态和f决k (策x),,k 1, 2为, , 已知终x,u止函数,k 为迭代步数, v为指标函(x数)
可达靶点{u。1(i)} {5, 4,5,3}
第二步,由 求 ,由策略迭代法的方
程组可得: u1(i)
f1 (i)
因策略
f1(i)
di,u1 (i)
f1 (u1 (i))
f1(5) 0
直达靶点,应先计算:
u1 (1)管,理u科1 (学3与)系统工程
f1(1) d15 f1(5) 2 0 2
管理科学与系统工程
②最优决策最多走4步,多于此步数,会出现走 回头路或回路,显然这些不是最优路线。
③从任一点出发到靶点,走m(m=1,2,…)步与走
m+1步的最优距离一样,决策函数也一样,如果
继续计算走m+2步、m+3步、……,其结果仍一样,
即 fm (i) fm1(i)
,
um
(i)
u m1
(i)
d42 f1(2), d43 f1(3), d44 f1(4), d45 f1(5)]
min[2 2,5 7,1 5,0 3,3 0] 3
u2 (4) 5
管理科学与系统工程
由于只有5个点,因而从任一点出发到达靶点, 其间最多有4步(否则,有回路),这样就不需继续 下去了。将计算结果列成表:
管理科学与系统工程
f2 (4) d45 3
f2 (2) d23 f2 (3) 0.5 5 5.5
第三步:由 求解u3 (i) 。
管理科学与系统工程
所以,u2 (2) 3 同理,可求得u2 (3) 5,u2 (4) 5,于是得到第 一次策略迭代的结果为
{u2 (i)} {5,3,5,5} ②以 u2 (i) 为初始策略继续反复使用第二、三 步进行迭代。 第二步:由u2 (i)求 f2 (i)
f2 (1) d15 2 f2 (3) d35 5
从点2到点5走三步为最优,最优距离为4.5,最 优路线 2 u3 (2) 3 u2(3) 4 u1(4) 5 ;
从点3到点5走两步为最优,最优距离为4,最优 路线 3 u2 (3) 4 u1 (4) 5 ;
从点4到点5走一步为最优,最优距离为3,最 优路线4 u1 (4) 5。
管理科学与系统工程
距离,它是阶段指标之和, 并满足可分离性要 求,有
V (i, u( x)) dij V ( j, u( x))
最优值函数ƒ(i)为由i出发到达n的最短距离,即
f (i) minV (i,u(x)) V (i,u*(x)) u(x)
式中u*(x)是最优策略,满足基本方程
f
(i)
fk (x) v(x,uk (x)) fk (T (x,uk (x))), x X .
fk (x) (x), x X n.
(3)用 fk (x) 求改进策略 uk1(x) ,
uk1(x) (u opt v(x,u) fk (T (x,u))).
uU ( x)
管理科学与系统工程
例1的求解:
i f1(i) u1 (i) f2 (i) u2 (i) f3 (i) u3 (i) f4 (i) u4 (i) 125252525 2 7 5 5.5 3 4.5 3 4.5 3 355444444 435353535
管理科学与系统工程
分析上面的结果可得:
①从点1到点5走一步为最优,最优距离为2,最 优路线1 u1 (1) 5;
模型min z
2 j
j0
x
2 j
lim
k
V0
,状态变换函数
k
为j1 j xj 。( 存在明显的级变量,但级
数是无限的 )
管理科学与系统工程
求解这类问题如果仍使用以前的逐级递推方法, 将遇到极大的计算量,为此必需寻找新方法。 函数方程可以用迭代法求解,通常有函数迭代法 和策略迭代法两种迭代方法。
管理科学与系统工程
策略迭代法的基本思想是:先选定一初始策 略{uk (i) i 1, 2, , n 1}然后按某种方式求得新策 略 u1(i),u2 (i), , 直至最终求出最优策略。若对某 一k,对所有i有:uk1(i) uk (i) ,则称 u1(i),u2 (i), 收敛,此时,策略{uk (i) i 1, 2, , n 1} 就是最优 策略。
0.5
则显然有:
f1(1) d15 2 最优决策为:u(1) 5
f1(2) d25 7
u (2) 5
f1 (i)
f1(3) d35 5 f1(4) d45 3
u (3) 5 u (4) 5
f1(5) d55 0
u (5) 5
管理科学与系统工程
(2)假设从i点走两步到靶点5的最优距离为f2 (i), 根据最优化原理得:
f3 (i)
min
1 i 5
dij
f2 ( j) ,i
1, 2,3, 4
f3 (5) 0
计算结果如下: f3 (1) 2,u3 (1) 5 f3 (2) 4.5,u3 (2) 3
f3 (3) 4,u3 (3) 4 f3 (4) 3,u3 (4) 5
管理科学与系统工程
(4)假设从i点走四步到靶点5的最优距离为f4 (i), 则得:
f2 (2)
min
1i 5
d
2
j
f1( j)
min[d21
f1 (1),
d22 f1(2), d23 f1(3), d24 f1(4), d25 f1(5)]
min[6 2,0 7,0.5 5,5 3,7 0] 5.5
u2 (2) 3
管理科学与系统工程
(3)假设从i点走三步到靶点5的最优距离为f3 (i), 则得:
mu(iin) [d1,u(i) f1(u(i))] min[d11 f1(1), d12 f1(2), d13 f1(3), d14 f1(4), d15 f1(5)] min[0 2,6 11,5 5, 2 6, 2 0] 2 所以,u2 (1) 5(不在含dii 的项取u2 (1)) u(i) 2时, mu(iin) [d2,u(i) f1(u(i))] min[6 2,0 11,0.5 5,5 6,7 0] 5.5
一般来说,选定初始策略要比选定初始目标 最优值函数容易得多,且策略迭代的收敛速度稍 快,但其计算量要大些。
管理科学与系统工程
x X( 是事先给定的数)时迭代停止,最优值函 数 f (x) fk (x) ,最优策略u(x) uk (x)。
2.策略迭代法的步骤是:
(1)选初始策略u1 ( x),令k=1; (2)用uk (x)求解 fk (x) ,
(3)当
或
fk1(x) fk (x), x X ,
管理科学与系统工程
fk1(x) fk (x)
fk (x)
(4)当
uk1(x) uk (x), x X ,
或
fk1(x) fk (x) , x X
fk (x)
时迭代停止,最优值函数 f (x) fk (x) ,最优策 略u(x) uk (x) ;否则以k+1代替k重复(2),(3).
个连通图(右图中n=5),各点 标号为1,2,…,n。任意两点 i,j之间的距离(费用)记作 dij 。求任意一点i到点n(靶 点)的最短路线(距离)。
管理科学与系统工程
5
275 12
用函数迭代法求解例1
6 55
只求1,2,3,4各点到点5的最优路线,其余类似。 解:(1)假设从i点走一步到靶点5的最优距离为 2,
min
1 jn
dij
f
(
j) ,i
1, 2,
, n 1.
管理科学与系统工程
该式记为(﹡)式,它不是一个递推方程,而是一 个关于ƒ(i)的函数方程,对固定的i使(﹡)右端 [dij+ƒ(j)] 达到极小的j即为最优决策u*(i),对所有 的i求解(﹡)式得到最优策略u*(x)。
管理科学与系统工程
例1:段数不定的最短路线问题(不定期决策过程) n个点相互连接组成 一
f1(3) d35 f1(5) 5 0 5
f1(4) d43 f1(3) 1 5 6
f1(2) d24 f1(4) 5 6 11
第三步,由 f1(i)求 求出它的解u2 (i) :
u2 (i)
,由
mu(iin) [di,u(i)
f1 (u (i))]
u(i) 1时,
管理科学与系统工程
例1:段数不定的最短路线问题(不定期决策过程)
n个点相互连接组成 一 个连通图(右图中n=5),各点 标号为1,2,…,n。任意两点 i,j之间的距离(费用)记作 dij 。求任意一点i到点n(靶 点)的最短路线(距离)。
5 2753 1 24 6 55 1
2 0.5 3
管理科学与系统工程
例2:无限期决策过程
, 也就说明
{ fm (i)}一致收敛于 f (i) ,{um (i)}一致收敛于 u (i)。
故当这种一出现,计算便可停止。
管理科学与系统工程
例1的求解:(策略迭代法)
解:①第一步,先选取初始策略u1(i) 。如取:
u1(1) 5,u1(2) 4,u1(3) 5,u1(4) 3.
即
,但必需没有回路,每点
min
1i 5
d3
j
f1 (
j)
min[d31