第9章多阶段动态规划决策.pptx
合集下载
动态规划PPt

动态规划的基本概念及思想
•
动态规划(dynamic programming)是运筹学的一个分支,是求 解决策过程(decision process)最优化的数学方法。20世纪50年代初 美国数学家R.E.Bellman等人在研究多阶段决策过(multistep decision process)的优化问题时,提出了著名的最优化原(principle of optimality),1957年出版了他的名著Dynamic Programming,这 是该领域的第一本著作。
以上步骤称为分解。将所给问题按时间或空间特征分解成相互关联的阶段,并确定 出计算局部最优解的递推关系,这是利用动态规划法解决问题的关键和难点所在
用动态规划求解TSP问题
求解对于每个阶段通过自底向上的方法求得局部最优解 d(6, 9)=min{c67+d(7, 9), c68+d(8, 9)}=min{6+7, 5+3}=8(6→8) d(5, 9)=min{c57+d(7, 9), c58+d(8, 9)}=min{8+7, 6+3}=9(5→8) d(4, 9)=min{c47+d(7, 9), c48+d(8, 9)}=min{5+7, 6+3}=9(4→8) d(3, 9)=min{c35+d(5, 9), c36+d(6, 9)}=min{4+9, 7+8}=13(3→5) d(2, 9)=min{c24+d(4, 9), c25+d(5, 9), c26+d(6, 9)}=min{6+9, 7+9, 8+8}=15(2→4) d(1, 9)=min{c14+d(4, 9), c15+d(5, 9)}=min{9+9, 8+9}=17(1→5) d(0, 9)=min{c01+d(1, 9), c02+d(2, 9), c03+d(3, 9)}=min{4+17, 2+15, 3+13}=16(0→3) 得到最短路径为0→3→5→8→9,长度为16
•
动态规划(dynamic programming)是运筹学的一个分支,是求 解决策过程(decision process)最优化的数学方法。20世纪50年代初 美国数学家R.E.Bellman等人在研究多阶段决策过(multistep decision process)的优化问题时,提出了著名的最优化原(principle of optimality),1957年出版了他的名著Dynamic Programming,这 是该领域的第一本著作。
以上步骤称为分解。将所给问题按时间或空间特征分解成相互关联的阶段,并确定 出计算局部最优解的递推关系,这是利用动态规划法解决问题的关键和难点所在
用动态规划求解TSP问题
求解对于每个阶段通过自底向上的方法求得局部最优解 d(6, 9)=min{c67+d(7, 9), c68+d(8, 9)}=min{6+7, 5+3}=8(6→8) d(5, 9)=min{c57+d(7, 9), c58+d(8, 9)}=min{8+7, 6+3}=9(5→8) d(4, 9)=min{c47+d(7, 9), c48+d(8, 9)}=min{5+7, 6+3}=9(4→8) d(3, 9)=min{c35+d(5, 9), c36+d(6, 9)}=min{4+9, 7+8}=13(3→5) d(2, 9)=min{c24+d(4, 9), c25+d(5, 9), c26+d(6, 9)}=min{6+9, 7+9, 8+8}=15(2→4) d(1, 9)=min{c14+d(4, 9), c15+d(5, 9)}=min{9+9, 8+9}=17(1→5) d(0, 9)=min{c01+d(1, 9), c02+d(2, 9), c03+d(3, 9)}=min{4+17, 2+15, 3+13}=16(0→3) 得到最短路径为0→3→5→8→9,长度为16
多阶段决策和序贯决策教材(PPT76张)

10.2风险型多阶段动态决策 10.2.3风险型多阶段动态决策问题
10多阶段决策和序贯决策
10.2风险型多阶段动态决策 10.2.3风险型多阶段动态决策问题
10多阶段决策和序贯决策
10.2风险型多阶段动态决策 10.2.3风险型多阶段动态决策问题
10多阶段决策和序贯决策
10.2风险型多阶段动态决策 10.2.3风险型多阶段动态决策问题
1、想要体面生活,又觉得打拼辛苦;想要健康身体,又无法坚持运动。人最失败的,莫过于对自己不负责任,连答应自己的事都办不到,又何必抱怨这个世界都和你作对?人生的道理很简单,你想要什么,就去付出足够的努力。 2、时间是最公平的,活一天就拥有24小时,差别只是珍惜。你若不相信努力和时光,时光一定第一个辜负你。有梦想就立刻行动,因为现在过的每一天,都是余生中最年轻的一天。 3、无论正在经历什么,都请不要轻言放弃,因为从来没有一种坚持会被辜负。谁的人生不是荆棘前行,生活从来不会一蹴而就,也不会永远安稳,只要努力,就能做独一无二平凡可贵的自己。 4、努力本就是年轻人应有的状态,是件充实且美好的事,可一旦有了表演的成分,就会显得廉价,努力,不该是为了朋友圈多获得几个赞,不该是每次长篇赘述后的自我感动,它是一件平凡而自然而然的事,最佳的努力不过是:但行好事,莫问前程。愿努力,成就更好的你! 5、付出努力却没能实现的梦想,爱了很久却没能在一起的人,活得用力却平淡寂寞的青春,遗憾是每一次小的挫折,它磨去最初柔软的心智、让我们懂得累积时间的力量;那些孤独沉寂的时光,让我们学会守候内心的平和与坚定。那些脆弱的不完美,都会在努力和坚持下,改变模样。 6、人生中总会有一段艰难的路,需要自己独自走完,没人帮助,没人陪伴,不必畏惧,昂头走过去就是了,经历所有的挫折与磨难,你会发现,自己远比想象中要强大得多。多走弯路,才会找到捷径,经历也是人生,修炼一颗强大的内心,做更好的自己! 7、“一定要成功”这种内在的推动力是我们生命中最神奇最有趣的东西。一个人要做成大事,绝不能缺少这种力量,因为这种力量能够驱动人不停地提高自己的能力。一个人只有先在心里肯定自己,相信自己,才能成就自己! 8、人生的旅途中,最清晰的脚印,往往印在最泥泞的路上,所以,别畏惧暂时的困顿,即使无人鼓掌,也要全情投入,优雅坚持。真正改变命运的,并不是等来的机遇,而是我们的态度。 9、这世上没有所谓的天才,也没有不劳而获的回报,你所看到的每个光鲜人物,其背后都付出了令人震惊的努力。请相信,你的潜力还远远没有爆发出来,不要给自己的人生设限,你自以为的极限,只是别人的起点。写给渴望突破瓶颈、实现快速跨越的你。 10、生活中,有人给予帮助,那是幸运,没人给予帮助,那是命运。我们要学会在幸运青睐自己的时候学会感恩,在命运磨练自己的时候学会坚韧。这既是对自己的尊重,也是对自己的负责。 11、失败不可怕,可怕的是从来没有努力过,还怡然自得地安慰自己,连一点点的懊悔都被麻木所掩盖下去。不能怕,没什么比自己背叛自己更可怕。 12、跌倒了,一定要爬起来。不爬起来,别人会看不起你,你自己也会失去机会。在人前微笑,在人后落泪,可这是每个人都要学会的成长。 13、要相信,这个世界上永远能够依靠的只有你自己。所以,管别人怎么看,坚持自己的坚持,直到坚持不下去为止。 14、也许你想要的未来在别人眼里不值一提,也许你已经很努力了可还是有人不满意,也许你的理想离你的距离从来没有拉近过......但请你继续向前走,因为别人看不到你的努力,你却始终看得见自己。 15、所有的辉煌和伟大,一定伴随着挫折和跌倒;所有的风光背后,一定都是一串串揉和着泪水和汗水的脚印。 16、成功的反义词不是失败,而是从未行动。有一天你总会明白,遗憾比失败更让你难以面对。 17、没有一件事情可以一下子把你打垮,也不会有一件事情可以让你一步登天,慢慢走,慢慢看,生命是一个慢慢累积的过程。 18、努力也许不等于成功,可是那段追逐梦想的努力,会让你找到一个更好的自己,一个沉默努力充实安静的自己。 19、你相信梦想,梦想才会相信你。有一种落差是,你配不上自己的野心,也辜负了所受的苦难。 20、生活不会按你想要的方式进行,它会给你一段时间,让你孤独、迷茫又沉默忧郁。但如果靠这段时间跟自己独处,多看一本书,去做可以做的事,放下过去的人,等你度过低潮,那些独处的时光必定能照亮你的路,也是这些不堪陪你成熟。所以,现在没那么糟,看似生活对你的亏欠,其 实都是祝愿。
动态规划问题完整ppt

是动态决策问题的一种特殊形式; 其特点在于,它可以把一个n 维决策问题变换为几个一维最优化问题,从而一个一个地去解决。
产品的年产量g和投入生产的机器数量u 的关系为 找到不同时刻的最优决策以及整个过程的最优策略。
1 多阶段决策问题
1
g=g(u1)
精品课程《运筹学》
这时,机器的年完好率为a,即如果年初完好机器 的数量为u,到年终完好的机器就为au, 0<a<1。
3. 航天飞机飞行控制问题:由于航天飞机的运 动的环境是不断变化的,因此就要根据航天飞机飞 行在不同环境中的情况,不断地决定航天飞机的飞 行方向和速度(状态),使之能最省燃料和实现目 的(如软着落问题)。
不包含时间因素的静态决策问题(本质上是一次 决策问题)也可以适当地引入阶段的概念,作为多 阶段的决策问题用动态规划方法来解决。
3 C2 5
3 C3 3
84 C4
2 D1
2
D2 1 2
3 D3
3
E1 3
5 5 E2 2
6 6
E3
F1 4
G 3 F2
1
2
3
精品课பைடு நூலகம்《运筹学》
4
5
6
谢谢观看
精品课程《运筹学》
动态决策问题的特点: 系统所处的状态和时刻是进行决策的重要因
素; 即在系统发展的不同时刻(或阶段)根据系
统所处的状态,不断地做出决策; 找到不同时刻的最优决策以及整个过程的最
优策略。
精品课程《运筹学》
多阶段决策问题: 是动态决策问题的一种特殊形式; 在多阶段决策过程中,系统的动态过程可以按照 时间进程分为状态相互联系而又相互区别的各 个阶段;
每个阶段都要进行决策,目的是使整个过程的 决策达到最优效果。
产品的年产量g和投入生产的机器数量u 的关系为 找到不同时刻的最优决策以及整个过程的最优策略。
1 多阶段决策问题
1
g=g(u1)
精品课程《运筹学》
这时,机器的年完好率为a,即如果年初完好机器 的数量为u,到年终完好的机器就为au, 0<a<1。
3. 航天飞机飞行控制问题:由于航天飞机的运 动的环境是不断变化的,因此就要根据航天飞机飞 行在不同环境中的情况,不断地决定航天飞机的飞 行方向和速度(状态),使之能最省燃料和实现目 的(如软着落问题)。
不包含时间因素的静态决策问题(本质上是一次 决策问题)也可以适当地引入阶段的概念,作为多 阶段的决策问题用动态规划方法来解决。
3 C2 5
3 C3 3
84 C4
2 D1
2
D2 1 2
3 D3
3
E1 3
5 5 E2 2
6 6
E3
F1 4
G 3 F2
1
2
3
精品课பைடு நூலகம்《运筹学》
4
5
6
谢谢观看
精品课程《运筹学》
动态决策问题的特点: 系统所处的状态和时刻是进行决策的重要因
素; 即在系统发展的不同时刻(或阶段)根据系
统所处的状态,不断地做出决策; 找到不同时刻的最优决策以及整个过程的最
优策略。
精品课程《运筹学》
多阶段决策问题: 是动态决策问题的一种特殊形式; 在多阶段决策过程中,系统的动态过程可以按照 时间进程分为状态相互联系而又相互区别的各 个阶段;
每个阶段都要进行决策,目的是使整个过程的 决策达到最优效果。
多阶段决策问题与动态规划

s1=1000, x1*=0 s2=900, x2*=0 s3=810, s4=576, x4*=576 s5=397, x5*=397 x3*=810
4.4 动态规划的应用(一)
1 求解静态规划问题
某些静态规划问题可用动态规划法来求解。
例 用动态规划法求解 max z=x12.x22.x3 x1+x2+x3=c xi≥0 i=1,2,3
值函数; (6) 写出递推方程和边界条件,建立基本方程; (7) 按照基本方程递推求解。
以上步骤是动态规划法处理问题的基本步骤,其中 的前六步是建立动态规划模型的步骤。
例:机器负荷问题 某种机器可以在高低两种 不同的负荷下进行生产.在高负荷下进行生产 时,产品的年产量g和投入生产的机器数量u的 关系为 g=8u, 这时机器的年完好率为a=0.7 .在低负荷下生产时,产品的年产量h和投入 生产的机器数量v的关系为h=5v, 这时机器的 年完好率为b=0.9.假定开始生产时完好的机 器数量为s1,要求制定一个五年计划,在每年 开始时决定机器在两种不同负荷下生产的数量 ,使五年内产品的总产量最高。
解: (1)按年数划分为5个阶段,k=1,2,3,4,5
(2)取第k年初完好的机器数sk为状态变量, s(31)=取10第00k年投入高负荷的机器数xk为决策变量, 0≤xk≤sk (4)状态转移方程为 sk+1=0.7xk+0.9(sk-xk)=0.9sk-0.2xk
(5)指标函数为Vk,5=∑[8xj+5(sj-xj)]=∑(5sj+3xj)
(6)基本方程为
fk(sk)= max {5sj+3xj +fk+1(sk+1)}
k=5,4,3,2,1
运筹学及其应用9.1 多阶段决策过程最优化问题举例

6
t
使 S = ∑ ∑ f ( x i ) + 16 u j =
i =1
j =1
Байду номын сангаас
6
∑ f ( xi ) + 16(5x1 + 4 x2 + 3x3 + 2 x4 + x5 − 185)
i =1
为最小,其中
f
(xi )
=
110200xxii
,0 −
≤ xi ≤ 15 300,15 < xi
≤
30
6
例1
因此,我们的问题就变成:求y,y1,y2,…,yn-1,以使 g(y)+h(x-y)+g(y1)+h(x1-y1)+…+g(yn-1)+h(xn-1-yn-1) 达到最大,且满足条件
x1=ay+b(x-y) x2=ay1+b(x1-y1)
……… xn-1=ayn-2+b(xn-2-yn-2) yi与xi均非负,i=1,2, …,n-1
5
例1
若以y与x-y分别投入生产方式A与B,在第一 阶段生产后回收的总资源为x1=ay+b(x-y),再将x1 投入生产方式A和B,则可得到收入g(y1)+h(x1-y1), 继续回收资源x2=ay1+b(x1-y1),……
若上面的过程进行n个阶段,我们希望选择n 个变量y,y1,y2,…,yn-1,使这n个阶段的总收入最大。
第二种方法即所谓“局部最优路径”法,是 说某人从k出发,他并不顾及全线是否最短,只是选 择当前最短途径,“逢近便走”,错误地以为局部 最优会致整体最优,在这种想法指导下,所取决策
必是v1→v2→v5→ v9→ v10 ,全程长度是30;显
《动态规划》课件

《动态规划》ppt课 件
xx年xx月xx日
• 动态规划概述 • 动态规划的基本概念 • 动态规划的求解方法 • 动态规划的应用实例 • 动态规划的优化技巧 • 动态规划的总结与展望
目录
01
动态规划概述
定义与特点
定义
动态规划是一种通过将原问题分解为 相互重叠的子问题,并存储子问题的 解以避免重复计算的方法。
特点
动态规划适用于具有重叠子问题和最 优子结构的问题,通过将问题分解为 子问题,可以找到最优解。
动态规划的适用范围
最优化问题
01
动态规划适用于解决最优化问题,如最大/最小化问题、决策问
题等。
子问题重叠
02
动态规划适用于子问题重叠的情况,即子问题之间存在共享状
态或参数。
递归关系
03
动态规划适用于具有递归关系的问题,可以通过递归方式求解
机器调度问题
总结词
动态规划可以应用于机器调度问题,以确定最优的调度方案,满足生产需求并降低成本 。
详细描述
机器调度问题是一个经典的优化问题,涉及到如何分配任务到机器上,以最小化成本或 最大化效率。通过动态规划,可以将机器调度问题分解为一系列子问题,如确定每个任 务的调度顺序、分配机器等,并逐个求解子问题的最优解,最终得到整个调度方案的最
VS
详细描述
记忆化搜索法是一种优化技术,通过存储 已解决的子问题的解,避免重复计算,提 高求解效率。这种方法适用于子问题数量 较少且相互独立的情况。
04
动态规划的应用实例
最短路径问题
总结词
通过动态规划解决最短路径问题,可以找到 从起点到终点的最短路径。
详细描述
在图论中,最短路径问题是一个经典的优化 问题,旨在找到从起点到终点之间的一条路 径,使得路径上的所有边的权重之和最小。 动态规划是一种有效的解决方法,通过将问 题分解为子问题并存储子问题的解,避免了 重复计算,提高了求解效率。
xx年xx月xx日
• 动态规划概述 • 动态规划的基本概念 • 动态规划的求解方法 • 动态规划的应用实例 • 动态规划的优化技巧 • 动态规划的总结与展望
目录
01
动态规划概述
定义与特点
定义
动态规划是一种通过将原问题分解为 相互重叠的子问题,并存储子问题的 解以避免重复计算的方法。
特点
动态规划适用于具有重叠子问题和最 优子结构的问题,通过将问题分解为 子问题,可以找到最优解。
动态规划的适用范围
最优化问题
01
动态规划适用于解决最优化问题,如最大/最小化问题、决策问
题等。
子问题重叠
02
动态规划适用于子问题重叠的情况,即子问题之间存在共享状
态或参数。
递归关系
03
动态规划适用于具有递归关系的问题,可以通过递归方式求解
机器调度问题
总结词
动态规划可以应用于机器调度问题,以确定最优的调度方案,满足生产需求并降低成本 。
详细描述
机器调度问题是一个经典的优化问题,涉及到如何分配任务到机器上,以最小化成本或 最大化效率。通过动态规划,可以将机器调度问题分解为一系列子问题,如确定每个任 务的调度顺序、分配机器等,并逐个求解子问题的最优解,最终得到整个调度方案的最
VS
详细描述
记忆化搜索法是一种优化技术,通过存储 已解决的子问题的解,避免重复计算,提 高求解效率。这种方法适用于子问题数量 较少且相互独立的情况。
04
动态规划的应用实例
最短路径问题
总结词
通过动态规划解决最短路径问题,可以找到 从起点到终点的最短路径。
详细描述
在图论中,最短路径问题是一个经典的优化 问题,旨在找到从起点到终点之间的一条路 径,使得路径上的所有边的权重之和最小。 动态规划是一种有效的解决方法,通过将问 题分解为子问题并存储子问题的解,避免了 重复计算,提高了求解效率。
管理学运筹学动态规划

动态规划的最优化原理
动态规划方法基于R.Bellman等人提出的最优 化原理,它可表述为:
基本概念(续五)
指标函数:用于衡量决策或策略优劣的数量指标称为 指标函数。
阶段指标函数:它通常是指在第k阶段,从状态sk出 发,采用决策uk时的效益,记为d(sk, uk)。 过程指标函数:它通常表示在第k阶段时的状态为sk 时,采用后部子策略pk,n的效益值,记为Vk,n(sk, pk,n)。 最优指标函数记为fk(sk),表示第k阶段的状态为sk时, 采用了最优后部子策略p*k,n的指标函数值, Vk,n(sk, pk,n)与fk(sk)的关系是
表示决策的变量称为决策变量,uk(sk)就表示 第k阶段当状态为sk时的决策变量。 决策变量的取值常常限制在一定的范围内,这 一范围称为允许决策集合,常用记号Dk(sk)表 示第k阶段状态为sk时的允许状态集合。
基本概念(续三)
各阶段的决策确定后,整个过程各阶段的决策 就构成一个决策序列,称为策略,用p1,n{u1(s1), u2(s2), …, un(sn)}表示。 此外还常常需要考虑后部子策略pk,n{uk(sk), …, un(sn)}。 动态规划要求的就是使整个问题达到最优的策 略。
7 9
k=1
C1 5
2
8 D1 3
B1 3
4
4
A
6
C2
58
3
B2 7 C3 4
5
D2
6 2
1
E1 4 E2 3
F
7
8
D3 3
C4 4
f1(
A)
mindd
( (
A, A,
B1) B2 )
ff22((BB12))
第九章多阶段决策和序贯决策

第一步,画出决策树图。
-700
2
建大厂
4
销路好0.7
销路差0.3
5
销路好0.9 销路差0.1
1
-400
建小厂
8
扩建
-300
6
销路好0.7
3
不扩建
9
销路差0.3
7
210
-40
-40
销路好0.9
210
销路差0.1
-40
销路好0.9
90
销路差0.1
60
60
3年内
7年内
第二步,从右向左计算各点的期望收益值。
第二阶段决策:产量不变,还是 增加产量。
30 5
82 买专利 决
策 自行研制
65
失败 0.2
95 产量不变 6
82
3
1 成功0.8
95 7
增加产量
60
63 成功0.6
85 产量不变 4
8
2
85
量 增加产
失败0.4
9
30
11
低0.1 中0.5 高0.4 低0.1
中0.5 高0.4
低0.1 中0.5 高0.4 低0.1
方案 收益 状态
按原工 艺方案 生产
(万元)
买专利(0.8)
产量 不变
增产
自研(0.6)
产量 不变
增产
价低 0.1 -100 -200 -300 -200 -300
中 0.5 0 50 50 0 -250
价高 0.4 100 150 250 200 600
第一阶段决策问题:购买专利, 还是自行研制
200
销路不好(0.2)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
280
200
280
200
B
300
3
C
170
D
3
3
k=2
k=3
150
E
160
k=4
9.2 动态规划的基本概念和方程
贝尔曼(R.Bellman)的最优性原理:“任 何前一阶段决策结果所得的状态,应能使其 同其余阶段的决策共同构成最优决策。”
最优指标函数递推方程: f k(Sk )= min/max{Rk(Sk, dk )+ f k+1(Sk+1 )}
170
B
300
1
250
C
200
1
200
300
D 1
400
100
150
A
110
B
180
C
300
D
2
2
2
280
200
280
200
B
300
3
C
170
D
3
3
150
E
160
9.3 确定性多阶段决策
5元
1 0
1 2
“新产品定价15问题-Page22014”
6元
1 2
1 3
1 6
20
7元
1 4
8元
1 6
k=1
1 4
决策:当过程处于某一阶段的某个状态时, 可以作出的决定,用 dk (Sk )表示。
指标函数:当过程处于某一阶段某个状态的 即时所得,用 Rk (Sk ,dk )表示。
最短路线问题—基本概念
170
B
300
1
250
C
200
1
200
300
D 1
400
100
150
A
110
k=1
B
180
C
300
D
2
2
2
登山线路问题
170
B
300
1
250
C
200
1
200
300
D 1
400
100
150
A
110
B
180
C
300
D
2
2
2
280
200
280
200
B
300
3
C
170
D
3
3
150
E
160
9.2 动态规划的基本概念和方程
阶段:根据问题的时间和空间的自然特征进 行划分,用 k 表示。
状态:每个阶段开始所处的自然状况或客观 条件,用 Sk 表示。
1 5
k=2
1 6
1 5
k=3
18
14
k=4
2 5
2 4
1 8
1 4
k=5
最优策略:如果第1年定价8元,第2年定价8元,第3年定价 7元,第4年定价6元,第5年定价5元。总利润92万元。
5元
1 0
1 2
25
1 5
20
2 5
6元
1 2
1 3
45
1 6
20
2 4
7元
1 4
92
8元
1 6
k=1
1 4
76
第九章 多阶段决策
9.1 多阶段决策与动态规划 9.2 动态规划的基本概念和方程 9.3 确定性多阶段决策:定价问题 9.4 随机性多阶段决策:采购问题
最短路线问题
170
B
300
1
250CBiblioteka 2001200
300
D 1
400
100
150
A
110
B
180
C
300
D
2
2
2
280
200
280
200
B
300
3
某厂为安排生产需要在月初五日内采购一批染料, 根据市场调查,每天染料价格波动及概率如下表。 试求每月在哪一天采购为宜?
单价 (万元/千克)
概率
30 0.22
34 0.40
40 0.38
采购日期
5
4
3
2
1
期望价格
(万元/ 千克)
35.4
33.65 32.85 32.22 31.73
最优策略:如果第1、2、3天价格为30则购进,否则等待; 第4天价格为30或34则购进,否则第5天购买。
• 9、春去春又回,新桃换旧符。在那桃花盛开的地方,在这醉人芬芳的季节,愿你生活像春天一样阳光,心情像桃花一样美丽,日子像桃子一样甜蜜。20. 8.1320.8.13Thursday, August 13, 2020
• 10、人的志向通常和他们的能力成正比例。18:33:2818:33:2818:338/13/2020 6:33:28 PM
随机性多阶段决策练习
某厂为安排生产需要在近五周内采购一批原材 料,估计未来五周内原材料价格波动及概率如 下表。试求在哪一周以什么价格采购可使采购 价格的期望值最小,并求出期望值。
单价 (元/千克)
概率
500 600 700 0.3 0.3 0.4
最优策略:如果第1、2、3周价格为500元/千克则购进, 否则等待;第4周价格为500或600元/千克则购进,否则 第5天购买。
动态规划: 运筹学的一个分支,它是解决多阶段决策过程最优 化的一种数学方法。1951年美国数学家贝尔曼 (R.Bellman)等将多阶段决策问题变换为一系列 互相联系的单阶段问题,然后逐个加以解决产生。
基本思想: 从最后一段开始,用由后向前逐步递推的方法,从 终点逐段向始点方向寻找最优路经的方法.
C
170
D
3
3
150
E
160
9.1 多阶段决策与动态规划
多阶段决策:决策过程分为若干个互相联系 的阶段,在每一个阶段都需要作出决策,从 而使整个过程达到最好的效果。
状态
状态
状态
状态
决策1
决策2
……
决策n
多阶段决策过程的分类:
离散确定性,连续确定性;离散随机性,连续随机性.
9.1 多阶段决策与动态规划
• 11、夫学须志也,才须学也,非学无以广才,非志无以成学。20.8.1318:33:2818:33Aug-2013-Aug-20
• 12、越是无能的人,越喜欢挑剔别人的错儿。18:33:2818:33:2818:33Thursday, August 13, 2020
• 13、志不立,天下无可成之事。20.8.1320.8.1318:33:2818:33:28August 13, 2020
1 5
k=2
61
1 6
1 5
k=3
18
14
k=4
1 8
1 4
k=5
9.4 随机性多阶段决策
最优指标函数方程: 最优指标期望值
f k(Sk )= min{Rk(Sk, dk )+ f k+1(Sk+1 )} k = n, n-1, ……, 1
f n+1(Sn+1 )=0
9.4 随机性多阶段决策
某厂为安排生产需要在月初五日内采购一批染料, 根据市场调查,每天染料价格波动及概率如下表。 试求每月在哪一天采购为宜?
k = n, n-1, ……, 1 f n+1(Sn+1 )=0
最短路线问题的求解:“标号法”
19 2
5
A
1
20
B 1
12 14
14 6
B
10
2
4
19
12
13
B
11
3
8
C
3
1
9
76
C 2
5
12 8
C
10
3
5
D
1
5
E
2
2 D 2
最短路线:A→B2 →C1 →D1 →E
最短路线问题的性质:从最短路上的任一点到终点 的部分道路也一定是从该点到终点的最短子路。
单价:X (万元/千克)
概率
30 0.22
34 0.40
40 0.38
“原材料采购 价格问题 Page216”
采购期望价格(最优指标)函数方程: f k(xk )= min{ Dk·xk+ Dk+1·f k+1(xk+1 )} Dk k = n, n-1, ……, 1 f n+1(xn+1 )=0