运筹学课件第五章动态规划

合集下载

运筹学课件

f k （ sk ） = f 5 （ s5 ） = max
0≤ uk≤ sk
{ 8 uk + 5（ sk - uk ）+ fk+1（sk+1）}，k= 4，3，2，1 （，，，， { 8 u5 + 5 （ s5 - u5 ）}
max
0≤ u5≤ s5
9、逆序递推求解动态规划基本方程。、逆序递推求解动态规划基本方程。 k=5
uk* = s 3
5
动态规划 Dynamic Programming （DP））
动态规划——Dynamic Programming 动态规划
建立 DP 模型与求解 k=2 f2 （ s 2 ） =
0 ≤ u2 ≤ s2
Max
[ 9x2 + f3（s3）] = Max [ 9x2 + 2s32 ]
8.
建立动态规划基本方程：（逆序递推方程）建立动态规划基本方程：（逆序递推方程）：（逆序递推方程 fk （ s k ） = max
0 ≤ uk ≤ sk
[ gk（xk）+ fk+1（sk+1）] ，k = 3，2，1 ，，
f4 （ s 4 ） = 0
4
动态规划 Dynamic Programming （DP））
3
动态规划 Dynamic Programming （DP））
动态规划——Dynamic Programming 动态规划
建立 DP 模型与求解
1. 动态规划结构图
k阶段阶段
k+1阶段阶段
max
sk

gk（xk） 0 ≤ uk ≤ sk
sk+1 = sk - uk

运筹学课件--第五章目标规划

例如
P1 级目标实现利润至少30元； P2级目标是甲乙产品的产量假设：乙产品产量不少于4件比甲产品产量不少于6 件更重要，取其权重为2 minG= P1 d1- + P2(2d2- + d3- ) 3x1+5x2 +d1-- d1+ = 30 x2 +d2- - d2+ = 4 x1 + d3- - d3+ = 6 x1 , x2 ,dk- , dk+ ≥0(k=1,2,3)
16
OR:SM OR:SM
例3 在上题中（例2），如果工序Ⅱ在加班时间内生产出来的产品，每台A 型机减少利润20元，每台B型机减少利润25元，并且工序Ⅱ的加班时间每周最多不超过30小时，这是p4级目标，试建立这个问题的目标规划模型。解：设x1,x2分别为在正常时间和加班时间生产A型机台数，x3,x4 分别为在正常时间和加班时间生产B型机台数，目标规划数学模型为：
10
OR:SM OR:SM
建模的步骤
1、根据要研究的问题所提出的各目标与条件，确定目标值，列出目标约束与绝对约束；
2、可根据决策者的需要，将某些或全部绝对约束转化为目标约
束。这时只需要给绝对约束加上负偏差变量和减去正偏差变量即可。
3、给各目标赋予相应的优先因子 Pk（k=1.2…K）。
OR:SM OR:SM
试试看——目标规划模型的实例
例1 某厂生产A、B、C三种产品，装配工作在同一生产线上完成，三种产品时的工时消耗分别为6、8、10小时，生产线每月正常工作时间为200小时；三种产品销售后，每台可获
利分别为500、650和800元；每月销售量预计为12、10和6台。
该厂经营目标如下： 1、利润指标为每月16000元，争取超额完成； 2、充分利用现有生产能力； 3、可以适当加班，但加班时间不得超过24小时； 4、产量以预计销售量为准。试建立目标规划模型。

运筹学课件--动态规划

J 表示留在左岸的仆人人数
初始状态s1是T(3,3)
结束状态sn是 T(0,0)
可达状态有哪些?(3,J) (2,2) (1,1) (0,J) J 3 2 1 0
2013-6-9
A
1
运筹学课件
2
3
I
阶段指标——每阶段选定决策xk后所产生的效益，记
vk= vk(Sk， xk)。
指标函数——各阶段的总效益，记相应于Pkn的指标函数
2013-6-9 运筹学课件
动态规划模型的分类：以“时间”角度可分成：
离散型和连续型。
从信息确定与否可分成：
确定型和随机型。
从目标函数的个数可分成：单目标型和多目标型。
2013-6-9 运筹学课件
8.2基本概念与方程
1.基本概念
阶段（Stage）——分步求解的过程，用阶段变量k表示，k=1，，n 状态（State）——每阶段初可能的情形或位置，用状态变量Sk表示。按状态的取值是离散或连续，将动态规划问题分为
当 k 3，f Max f v
3 0
3 3
3
4
Max 3x 5s 13.6(0.9s 0.2x )
0
3 3
3
3
3
3
Max 0.28x 17.24s
0
3 3
3
3

x s , f 17.52s ,即第3年初将全部完好机器都投入高负荷。
指标函数vkn=
v

5
表示第k至5年的总产量；
1
递推公式：f Max f v
6

f 0, k 5, ,1
2013-6-9
运筹学课件

管理运筹学第5章动态规划

递推关系的建立
根据阶段划分、状态转移方程和最优解的性质，建立递推关系。
递推关系的求解
通过递推关系求解各阶段的最优解，最终得到整个问题的最优解。
03
动态规划的求解方法
逆推法
总结词
逆推法是从目标状态出发，逆向推算出达到目标状态的最优决策，逐步推算出初始状态的最优决策。
详细描述
逆推法的基本思想是将问题分解为若干个相互联系的阶段，从最后阶段开始，依次向前推算出每个阶段的最优决策，直到达到初始状态。这种方法适用于具有重叠子问题和最优子结构的问题，可以避免重复计算，提高求解效率。
详细描述
资源分配问题通常需要考虑资源的约束条件、各部门或个体的需求和优先级，以及如何平衡各方利益。动态规划通过将问题分解为一系列子问题，逐一求解最优解，最终得到整体最优解。
生产与存储问题
总结词
生产与存储问题主要研究在生产过程中如何平衡生产与库存的关系，以最小化生产成本和库存成本。
详细描述
特点
动态规划适用于具有重叠子问题和最优子结构特性的问题，通过将原问题分解为子问题，逐个求解并存储子问题的解，避免了重复计算，提高了求解效率。
动态规划的重要性
解决复杂问题
动态规划能够解决一些复杂的问题，如资源分配、生产计划、物流调度等，这些问题通常难以通过传统方法求解。
提高计算效率
通过避免重复计算，动态规划能够显著提高计算效率，尤其在处理大规模问题时，能够大大减少计算时间和资源消耗。
05
动态规划的优化策略
多阶段决策优化
01
02
03
阶段划分
将问题划分为若干个相互关联的阶段，每个阶段都有自己的决策变量和状态转移方程。
状态转移

第五章物流运筹学——动态规划

即由第阶段的状态利用这个原理，可以把多阶段决策问题求解过程表示成一个连续的递推过程，由后向前逐步计算。
的单件重量和装载收费如表5-1所示，又规由于它表示了由段到段的状态转移
因此，在物流管理中，如何进行决策，制定一个最优的设备维护更新策略，是非常重要的。
第三节动态规划模型的建立与求解
定货物2和货物3都至多装两件。问如何装但假设初始状态虽已给定，终点状态有多个，需比较到达不同终点状态的各个路径及最优指标函数值，以选取总效益最正确的终点状
3
• 【例5-1】〔生产与存储问题〕工厂在3个季度中
• 安排某种产品的生产方案。假设该季度生产此
种产x
x2
• 品〔吨〕，那么本钱为元。假设当季
生产的
• 每吨产品未销售a k 掉，那么进库，季末需付存储费，
• 产品每季的存储费为1元。现估计3个季度对该产
• 品的需求量分别为100吨，110吨和120吨，
3
j 仪器
1
2
3
10
9
14
9
12
10
6
5
8
7
• 【例5-4】〔机器负荷问题〕设某机器可以在高、
• 低两种不同的负荷下进行生产。假设年初x 有台
• 机器在高负荷下进行生产，那么产品年a产 8x
量
，
0.3
y
• 机器的年折损率
低
0.1
；假设年b 初5有y 台机器在
• 负荷下进行生产，那么产品年产量
，机器
的
• 年折损率
。假设初始时有性能正常的机器
1000
• 台，要求制定机器负荷的四年分配方案，确定每
年
8
A

管理运筹学第5章

B1
8 4
6
3
B2
2 4
42 B3 5
C1
1 4
6
D1 3
C2 3
E
4 3 D2 C3 3
v2,4= v2,4（s2 ,x2 ,x3 ,x4） = v2,4（B3 ,C2 ,D2 ,E）=9
v2,4= v2,4（s2 ,x2 ,x3 ,x4） = v2,4（B1 ,C2 ,D2 ,E）=11
v2,4= v2,4（s2 ,x2 ,x3 ,x4） = v2,4（B1 ,C3 ,D2 ,E）=13
Operational Research
(3) k=1，s1={0，1，…，8}，[1~3]
f1(s1) = max{ g1(s1,x1)+ f2(s1-x1)}
0≤x1≤s1
分别求出s1为不同值时的f1(s1)及x*1，计算结果如下表：
S1 0 1 2 3 4 5 6 7 8 x*1 0 0，1 0 0，3 4 5 4 4 ４ f1(s1) 0 5 26 40 ８0 ９0 10６ 1２0 1４0
短路，从最后一个阶段开始，由后向前逐步递推。
（1）当k=4时，S4 ={ D1 D2 } 按f4 的定义有
f4（D1）=3 f4（D2）=4 （2）当k=3时，S3 ={ C1 C2 C3 }
B1
8 4
6
f3(C1) = d3(C1 , D1)+ f4(D1) Min
2 A4
5
3
B2
2 4
d3(C1 , D2)+ f4(D2)
Operational Research
5．1．2．6 指标函数
(1)第k阶段指标函数： rk(sk,xk) 它是状态变量和决策变量

运筹学课程动态规划课件

5 A
3
1 B1 3
6
8 B2 7
6
C1 6 8
3 C2 5
3 C3 3
84 C4
2 D1
2
D2 1 2
3 D3
3
E1 3
5 5 E2 2
6 6
E3
F1 4
G 3 F2
1
2
3 4 运筹学课程动态规划
5
6
7
示例5（生产与存储问题）：
某工厂生产并销售某种产品。已知今后四个月市场需求预测及每月生产j个单位产品的费用如下：
上一个阶段的决策直接影响下一个阶段的决策
运筹学课程动态规划
8
示例6（航天飞机飞行控制问题）：
由于航天飞机的运动的环境是不断变化的，因此就要根据航天飞机飞行在不同环境中的情况，不断地决定航天飞机的飞行方向和速度（状态），使之能最省燃料和实现目的（如软着落问题）。
运筹学课程动态规划
9
所谓多阶段决策问题是指一类活动过程，它可以分为若干个相互联系的阶段，在每个阶段都需要作出决策。这个决策不仅决定这一阶段的效益，而且决定下一阶段的初
1 6
C3
D1
10
E
D2
6
运筹学课程动态规划
12
以上求从A到E的最短路径问题，可以转化为四个性质完
全相同，但规模较小的子问题，即分别从 Di 、 Ci 、Bi、
A到E的最短路径问题。
第四阶段：两个始点 D 1 和 D 2 ，终点只有一个；
本阶段始点（状态）
D1 D2
本阶段各终点（决策） E 10 6
cj30j
j0 j1,2,6
月1 2 3
4
需求 2 3 2

运筹学-第3版-课件-第5章动态规划

C1
2
1 2 2 3
D1 D2
3
2
A
B2
5
C2
6
E
4
2
B3
C3
3
D3
同样的理由，可以递推得其余阶段的铺设路线，如阶段3在C1点的决策是D1，阶段4在D1点的决策只有E点；由于到E点是整个铺设管道的终点，至此，决策过程完成，铺设一条A点到E点的管道是由四个阶段的管道组成的，如A---B3---C1---D1---E，它也称为一个策略。
B
阶段2
C
阶段3
D
阶段4
E
5
B1
4 4
6
3 6
C1
2
1 2
2
D1 D2 D3
3 4
2
A
B2
5
C2
6
E
2
3
B3
C3
3
在阶段2，从B3点出发，只有C1、C3两种可选择的点，如选C1,则C1就是阶段2在B3点的决策结果； C1点既是阶段2铺设管道的终点，又是阶段3 铺设管道的起点；
5
B1
4 4
6 3 6
使S= f ( xi ) 16 u j =
i 1 6 t
f ( x ) 16(5x
为最小，其中
i 1 i
6
j 1
1
4 x2 3x3 2 x4 x5 185)
100xi ,0 xi 15 f ( xi ) 120xi 300,15 < xi 30
第5章动态规划
运筹帷幄之中 Dynamic Programming
决胜千里之外

运筹学教案动态规划ppt课件

(uk ,u2un )
注: 指标函数的含义是多样的,如:距离、利润、成本、产品产量、资源消耗等。
最优化原理与动态规划问题基本方程
最优化原理
“作为全过程的最优策略具有这样的性质：无论过去的状态和决策如何，对于前面决策所形成的状态（即该最优策略上某一状态）而言，余下的诸决策必须构成以此状态为初始状态的最优策略。
3 A5
4
1 阶段
B
9
1
5
4
B
3
2
5
1 B
3
7
2
阶段
C1
1
5
D
1
4
8
C
4
2 D6
E 1
1
2
6
29
F
2 E
4 C
4
3
2
3
阶段
7
D
3
5
4 阶段
2
5 阶段
状态与状态变量
状态：表示每个阶段开始时所处的自然状况或客观条件，又称为不可控因素，是阶段的特征，通常一个阶段有若干个状态。
如：前例，第一阶段状态为点A，第二阶段的状态有B1，B2，B3三个状态。
但是要受到维数限制。
求解动态规划问题的过程：（1）将问题过程划分恰当阶段，选择阶段
变量k.。正确（描2过）程正的确演选变择，状又态要变满量足x无k. 后应效注性意。：既能够
（3）正确选择决策变量uk，确定允许集合。（4）正确写出状态转移方程 xk+1= Tk(xk, uk)。（5）列出按阶段可分的准则函数V1,n ，要满足几个性质。
概述
▪ 动态规划为运筹学的一个分支，是用于求解多个阶段决策过程的最优化数学方法。

大学运筹学经典课件第五章动态规划

生产计划问题的动态规划解法
根据生产阶段和生产量的不同组合，构建动态规划模型进行求解。
经典案例
多阶段生产问题、批量生产计划问题等。
图像处理与计算机视觉中的应用
图像处理中的动态规划应用
通过动态规划算法对图像进行分割、边缘检测、特征提取等操作。
计算机视觉中的动态规划应用
在目标跟踪、立体视觉、光流计算等领域，利用动态规划求解最优路径或策略。
决策的无后效性
在动态规划中，每个阶段的决策只与当前状态有关，而与过去的状态和决策无关。
边界条件与状态转移方程
边界条件
动态规划问题的边界条件通常指的是问题的初始状态和终止状态。
状态转移方程
描述问题状态之间转移关系的方程，通常根据问题的具体性质建立。通过状态转移方程，可以逐步推导出问题的最优解。
应用领域
03
适用于具有时序性和阶段性特点的问题，如资源分配、任务调
度、路径规划等。
动态规划与人工智能的融合应用
强化学习
结合动态规划和强化学习算法，通过智能体与环境交互学习最优决策策略，实现自适应的动
态规划求解。
深度学习
利用深度学习模型强大的特征提取和表达能力，对动态规划中的状态转移和决策规则进行
经典案例
图像分割中的最短路径算法、立体匹配中的动态规划算法等。
06
动态规划的扩展与前沿研究
随机动态规划
随机动态规划模型
描述随机环境下多阶段决策问题的数学模型，涉及期望总收益最大化或期望总成本
最小化。
求解方法
通过引入状态转移概率和决策规则，将随机动态规划问题转化为确定性动态规划问题求解，常用方法有值迭代
自顶向下的求解方法（记忆化搜索）

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(1) 指标函数
指标函数: 描述问题的数量函数用Vk,n表示.
Vk,n Vk,n (sk,uk ,.....,sn , un , sn1)
k 1,2,..,n
要求Vk,n 满足可分离性及递推关系 .
2020/5/30
22
10 指标和 Vk,n为阶段指标v j (s j , u j )之和
n
n
Vk,n v j (s j , u j ) vk (sk , uk ) v j (s j , u j )
▪
在实际问题中，决策变量的取值往往限制
在某一范围之内，此范围称为允许决策集合。
常用Dk (sk)表示第k阶段从状态sk出发的允许决策集合。
2020/5/30
20
4.策略
策略：决策按顺序构成的序列，用p表示。
pk,n (sk ) : 第k阶段起至第n阶段止的策略
pk,n (sk ) {uk (sk ), uk1(sk1)..., un (sn )}
23
(2) 最优值函数最优值函数fk (sk ) : 指标函数的最优值 fk (sk ) opt Vk.n (sk , uk ,...,sn , un , sn1)
uk un
opt : 最优化,取 max或 min
2020/5/30
24
四、动态规划模型的最优性原理和基本方程
1、动态规划的最优性原理
2020/5/30
12
▪ 于是
2020/5/30
13
▪ ▪ (3)在第二阶段 ▪ 在第二阶段，还有三步才能到达终点 ▪ 同理f2 (s2)=min { d2 (s2, X2) +f3 (s3)}
2020/5/30
14
2020/5/30
15
▪ (4)在第一阶段
▪ 在第一阶段f1(s1)=min {d1(s1, x1)+f2 (s2)} ▪ 目前状态s1是①，即为出发点，可选择的
③、④)中的点到 (⑤、⑥、⑦)中的一点是第二
阶段;由 (⑤、⑥ 、⑦)中的点到(⑧、⑨)中的一
点是第三阶段;由 (⑧ 、⑨)中的一点到⑩是第四
阶段。
2020/5/30
10
具体计算前，先引进几个符号:
▪ K— 阶段变量
▪
sk— 状态变量，表示第 k阶段所处的位置。
▪ 择的下Xk一—状决态策变量，表示当状态为 sk时，可选
▪ 二、多阶段决策问题
▪ 1、多阶段决策问题的描述
▪ 一个决策问题常与时间联系，将时间作为变量的决策问题称为动态决策问题。在动态决策问题中，研究对象——系统所处的状态和时点都是进行决策的重要因素。决策者要在系统发展的不同时点，根据系统的当前状态，不断地作出决策。因此，多次决策是动态决策的一个基本特点。
uk Dk
sk 1 Tk (sk , uk )
k 1,2,, n
fn1(sn1) 0
这是一个逆推方程.
2020/5/30
28
基本方程的解法
• 逆推找决策:
k n时, fn1(sn1) 0
fn (sn ) opt vn (sn , un ) fn1(sn1)
unDn
opt vn (sn , un ) un* ,
7
2020/5/30
8
▪ 生活中的常识告诉我们，最短路有一个重要的特性：如果由起点 A经过 P点和 H点而到达终点 G是一条最短路线，则由点P出发经过 H点到达终点 G的这条子路线，对于从点 P出发到达终点的所有可能选择的不同路线来说，必定也是最短路。此特性用反证法易证。
▪ 因为如果不是这样，则从点 P到 G点有另外一条距离更短的路线存在，把它和原来最短路线由 A点到达 P点的那部分连接起来，就会得到一条由 A点到 G点的新路线，它比原来那条最短路线的距离还要短些。这与假设相矛盾，是不可能的。
第五章动态规划
2020/5/30
1
▪ 一、综述
▪ 动态规划解决多阶段决策过程最优化的一种数学方法，大约产生于50年代。
▪ 1951年美国数学家贝尔曼 (R. Bellman)等人根据一类多阶段决策问题的特点，把多阶段决策问题变换为一系列互相联系的单阶段问题，然后逐个加以解决。与此同时，他提出了解决这类问题的 “最优性原理”，研究了许多实际问题，从而创建了解决最优化问题的一种新的方法—— 动态规划。他的名著《动态规划》于 1957年出版，该书是动态规划的第一本著作。
unDn
k n 1,
fn1(sn1) opt vn1(sn1, un1) fn (sn )
un 1Dn 1
un*1, 此时要用到sn Tk 1(sk 1, uk 1)
2020/5/30
29
• 逆推找决策:
k 1, f1(s1) opt v1(s1, u1) f2 (s2 )
2020/5/30
5
▪ 在多阶段决策过程中，系统的动态过程可以按照时间的进程分为若干个相互联系的阶段，而在每一个阶段中，具有一个或多个状态，在每一个阶段中都要针对每一个状态作出决策。
▪ 在各个阶段的决策确定以后，就顺序构成了一个决策序列，称为一个策略。
▪ 由于每个阶段有多种决策，因此，形成有多种策略可供选择，策略不同经济效果也不一定相同。
2020/5/30
19
▪ 3、决策
▪ 决策表示当过程处于某一阶段的某个状态时，可以作出不同的决策 (或选择)，从而确定下一阶段的状态，这种决定称为决策。
▪ 描述决策的变量，称为于向s量k时来的描决述策。变常量用。u它k (是sk)
当k 1时.p1,n (s1)为全过程策略.
p1,n (s1) P1,n (s1)
使目标达最优的策略为最优策略:
p* 1,n
(s1
)
2020/5/30
21
5.状态转移方程
确定过程由一个状态到另一个状态的变换方程.
Sk1 Tk {Sk , uk }, Tk : 变换算子 6.指标函数和最优值函数
而 pk,n uk , pk1,n
2020/5/30
26
pk*,n表示sk sn的最优策略,则最优值函数
fk (sk ) Vk,n (sk , pk*,n ) opt Vk,n (sk , pk,n )
pk ,nPk ,n
opt vk (sk , uk ) Vk 1,n (sk 1, pk 1,n )
jk
jk 1
vk (sk , uk ) Vk1,n
20 指标积 Vk,n为阶段指标v j (s j , u j )之积
n
n
Vk,n v j (s j , u j ) vk (sk , uk ) v j (s j , u j )
jk
jk 1
vk (sk , uk ) Vk1,n
2020/5/30
2020/5/30
17
▪ 2 、状态状态表示每个阶段开始时所处的自然状况或客观条件，它描述了研究问题过程的状况，又称为不可控因素。
▪ 在例 1中，状态就是某阶段的出发位置，它既是该阶段某支路的起点，又是前一阶段某支路的终点。通常一个阶段有若干个状态，第一阶段有一个状态就是点①，第二阶段有三个状态，即点集合 {②，③，④}，一般第 k阶段的状态就是第 k阶段所有始点的集合。
作为整个过程的最优策略具有这样的性质，即无论过去的状态和决策如何，对前面决策所形成的状态而言，余下的诸决策必须构成最优决策。
简言之,一个最优策略的子策略也是最优的.
例最优路线: A B2 C1 E2 F
子路线: C1 E2 F也是最优的.
2020/5/30
25
2、基本方程
设指标函数为
▪ 许多问题用动态规划的方法处理，常常比线性规划或非线性规划更有效，特别是对于离散性的问题。应当指出，动态规划是求解问题的一种方法，是考察问题的一种途径，而不是一种特殊的算法 (如线性规划是一种算法)。
2020/5/30
3
▪ 动态规划它不像线性规划那样有一个标准的数学表达式和明确的一组规则，而必须对具体的问题进行具体的分析和处理。因此，在学习动态规划时，除了要对动态规划的基本概念和方法正确理解外，还应该以丰富的想象力去建立模型，用创造性的技巧去求解。
▪ 动态规划所研究的对象是多阶段决策问题。
▪ 多阶段决策问题是指一类活动过程，它可以分为若干个相互联系的阶段，在每个阶段都需要作出决策。这个决策不仅决定这一阶段的效益，而且决定下一阶段的初始状态。
2020/5/30
4
▪ 每个阶段的决策确定以后，就得到一个决策序列，称为策略。多阶段决策问题就是求一个策略，使各阶段的效益的总和达到最优。
▪ 目前状态 s4可以是⑧或⑨，可选择的下一状态X4 是⑩ 所以f4 (8) =d4 (8, 10) =3,
▪ f4 (9)=d4 (9, 10)=4 ▪ (2)在第三阶段
▪ 在第三阶段，还需两步才能到达终点，此时 f3 ( s3)=min{d3 ( s3，X3)+f4 (s4)} 目前状态s3可以是⑤、⑥、⑦，可选择的下一状态X3有两个点⑧或⑨
uk , pk 1,n
optvk (sk , uk ) opt Vk 1,n (sk 1, pk 1,n )
uk
pk 1,n
optvk (sk , uk ) fk1(sk1)
uk
2020/5/30
27
pk*,n表示sk sn的最优策略,则最优值函数基本方程
fk (sk ) opt vk (sk , uk ) fk1(sk1)
2020/5/30
2
▪ 动态规划的方法在工程技术、企业管理、工农业生产及军事部门中都有广泛的应用，并且获得了显著的效果。

运筹学课件 第五章动态规划