第八章-序贯决策分析
决策理论序贯决策分析课件

在序贯决策分析中,需要特别关注决 策的公平性和偏见问题,以避免不公 平的结果和歧视某些群体。
序贯决策分析的展望与未来发展方向
可解释性和透明度
为了解决模型可解释性问题,未来 的研究将更加注重开发具有良好可 解释性的序贯决策分析模型。
多模态数据处理
随着多模态数据的普及,未来的序 贯决策分析将更加注重对图像、文 本、音频等多种类型数据的处理和 分析。
02 序贯决策分析基础
序贯决策的定义与特点
序贯决策的定义
时序性
序贯决策是在一系列决策过程中,决策者 根据每个阶段的环境信息和历史信息,按 照一定的顺序和规则进行决策的过程。
序贯决策中的每个决策都有时间顺序,后 续决策依赖于先前的决策结果。
动态性
最优性
序贯决策中,环境状态和决策后果会随着 时间变化而变化。
优化资源配置和生产流程
VS
详细描述
生产计划决策需要考虑生产资源的配置和 生产流程的优化。通过序贯决策分析,企 业可以根据市场需求和生产能力制定合理 的生产计划,优化资源配置,提高生产效 率,降低生产成本。
案例三:供应链管理决策分析
总结词
协调各个环节实现整体最优
详细描述
供应链管理决策需要协调各个环节,包括采 购、生产、物流等,以实现整体最优。通过 序贯决策分析,企业可以综合考虑各个环节 的需求和约束,制定合理的供应链管理策略, 提高供应链的效率和稳定性。
05 序贯决策分析的挑战与 展望
序贯决策分析的挑战
数据复杂性
随着数据规模的扩大和数据类型的多 样化,序贯决策分析面临处理复杂数 据结构的挑战。
实时性要求
在许多应用场景中,如自动驾驶和实 时推荐系统,序贯决策分析需要在短 时间内做出决策,这要求算法具有高 效的计算能力和实时性。
多阶段决策和序贯决策教材(PPT76张)

10.2风险型多阶段动态决策 10.2.3风险型多阶段动态决策问题
10多阶段决策和序贯决策
10.2风险型多阶段动态决策 10.2.3风险型多阶段动态决策问题
10多阶段决策和序贯决策
10.2风险型多阶段动态决策 10.2.3风险型多阶段动态决策问题
10多阶段决策和序贯决策
10.2风险型多阶段动态决策 10.2.3风险型多阶段动态决策问题
1、想要体面生活,又觉得打拼辛苦;想要健康身体,又无法坚持运动。人最失败的,莫过于对自己不负责任,连答应自己的事都办不到,又何必抱怨这个世界都和你作对?人生的道理很简单,你想要什么,就去付出足够的努力。 2、时间是最公平的,活一天就拥有24小时,差别只是珍惜。你若不相信努力和时光,时光一定第一个辜负你。有梦想就立刻行动,因为现在过的每一天,都是余生中最年轻的一天。 3、无论正在经历什么,都请不要轻言放弃,因为从来没有一种坚持会被辜负。谁的人生不是荆棘前行,生活从来不会一蹴而就,也不会永远安稳,只要努力,就能做独一无二平凡可贵的自己。 4、努力本就是年轻人应有的状态,是件充实且美好的事,可一旦有了表演的成分,就会显得廉价,努力,不该是为了朋友圈多获得几个赞,不该是每次长篇赘述后的自我感动,它是一件平凡而自然而然的事,最佳的努力不过是:但行好事,莫问前程。愿努力,成就更好的你! 5、付出努力却没能实现的梦想,爱了很久却没能在一起的人,活得用力却平淡寂寞的青春,遗憾是每一次小的挫折,它磨去最初柔软的心智、让我们懂得累积时间的力量;那些孤独沉寂的时光,让我们学会守候内心的平和与坚定。那些脆弱的不完美,都会在努力和坚持下,改变模样。 6、人生中总会有一段艰难的路,需要自己独自走完,没人帮助,没人陪伴,不必畏惧,昂头走过去就是了,经历所有的挫折与磨难,你会发现,自己远比想象中要强大得多。多走弯路,才会找到捷径,经历也是人生,修炼一颗强大的内心,做更好的自己! 7、“一定要成功”这种内在的推动力是我们生命中最神奇最有趣的东西。一个人要做成大事,绝不能缺少这种力量,因为这种力量能够驱动人不停地提高自己的能力。一个人只有先在心里肯定自己,相信自己,才能成就自己! 8、人生的旅途中,最清晰的脚印,往往印在最泥泞的路上,所以,别畏惧暂时的困顿,即使无人鼓掌,也要全情投入,优雅坚持。真正改变命运的,并不是等来的机遇,而是我们的态度。 9、这世上没有所谓的天才,也没有不劳而获的回报,你所看到的每个光鲜人物,其背后都付出了令人震惊的努力。请相信,你的潜力还远远没有爆发出来,不要给自己的人生设限,你自以为的极限,只是别人的起点。写给渴望突破瓶颈、实现快速跨越的你。 10、生活中,有人给予帮助,那是幸运,没人给予帮助,那是命运。我们要学会在幸运青睐自己的时候学会感恩,在命运磨练自己的时候学会坚韧。这既是对自己的尊重,也是对自己的负责。 11、失败不可怕,可怕的是从来没有努力过,还怡然自得地安慰自己,连一点点的懊悔都被麻木所掩盖下去。不能怕,没什么比自己背叛自己更可怕。 12、跌倒了,一定要爬起来。不爬起来,别人会看不起你,你自己也会失去机会。在人前微笑,在人后落泪,可这是每个人都要学会的成长。 13、要相信,这个世界上永远能够依靠的只有你自己。所以,管别人怎么看,坚持自己的坚持,直到坚持不下去为止。 14、也许你想要的未来在别人眼里不值一提,也许你已经很努力了可还是有人不满意,也许你的理想离你的距离从来没有拉近过......但请你继续向前走,因为别人看不到你的努力,你却始终看得见自己。 15、所有的辉煌和伟大,一定伴随着挫折和跌倒;所有的风光背后,一定都是一串串揉和着泪水和汗水的脚印。 16、成功的反义词不是失败,而是从未行动。有一天你总会明白,遗憾比失败更让你难以面对。 17、没有一件事情可以一下子把你打垮,也不会有一件事情可以让你一步登天,慢慢走,慢慢看,生命是一个慢慢累积的过程。 18、努力也许不等于成功,可是那段追逐梦想的努力,会让你找到一个更好的自己,一个沉默努力充实安静的自己。 19、你相信梦想,梦想才会相信你。有一种落差是,你配不上自己的野心,也辜负了所受的苦难。 20、生活不会按你想要的方式进行,它会给你一段时间,让你孤独、迷茫又沉默忧郁。但如果靠这段时间跟自己独处,多看一本书,去做可以做的事,放下过去的人,等你度过低潮,那些独处的时光必定能照亮你的路,也是这些不堪陪你成熟。所以,现在没那么糟,看似生活对你的亏欠,其 实都是祝愿。
决策理论与方法多属性决策多目标及序贯决策-文档资料

• 什么是多目标决策问题?(例如购买衣服时,款式、价格、 颜色、质量等可能都是决策目标)。多目标决策问题的特点 :
– 决策问题的目标多于一个; – 多个目标间不可公度(non-commensurable),即各目标没有统一的衡
量标准,难以比较;
– 各目标之间存在矛盾。
• 一般将决策变量离散、决策方案有限的多目标决策问题称为 多属性(Multi-attribute)决策问题;而将决策变量连续、有无 限决策方案的多目标决策问题称为多目标(Multi-objective)决 策问题。两者又可以统称为多准则(Multi-criterion)决策问题 。
2021/4/16
总目标 一级指标 二级指标 三级指标
2
多属性决策分析—相关术语
• 目标(Objective):决策人的愿望或决策人所 希望达到的、努力的方向(如物美价廉)。在多 目标决策中,目标是求极值的对象,是需要 优化的函数式。
• 目的(Goal):在特定时间、空间状态下,决 策人的期望,是目标的具体数值表现。目标 和目的常混用。
– 属性集是最小完备集:既要能够描述决策问题的 所有(重要)方面,又不能有冗余;
– 属性的测量值是可运算的; – 属性集内的各属性相互独立、可分解。
• 但在实际决策中,上述要求很难达到,这也 正是我们开展决策理论与方法研究的动力源 。
2021/4/16
6
多属性决策分析—目标与属性
• 例:某流域水资源项目建设目标(指标体系)及
– 映射区间定义:[M0,M*] – 定义映射z:fi(a)→zi(a),zi(a)=M0+(M*-M0)(fi(a)-fmin)/(fmax-fmin) – 一般取M0=0,M*=1。对应标准0-1转换。
决策理论与方法多属性决策多目标及序贯决策

决策理论与方法多属性决策多目标及序贯决策多属性决策是指在决策过程中考虑多个属性或指标,通过对这些属性进行量化和比较,找出最优选择的决策方法。
在实际决策中,我们常常需要考虑多个属性因素,而这些因素往往是相互矛盾甚至相互制约的。
多属性决策的关键是建立合理的评价指标体系,将不同属性进行量化,再通过合适的决策模型或方法进行计算和比较。
常用的多属性决策模型包括加权法、层次分析法和灰色关联法等。
多目标决策是指在决策过程中存在多个决策目标,且这些目标往往是相互冲突或无法同时达到的。
多目标决策的目标是找到一个最佳的折衷方案,使得各个决策目标能够得到尽可能满足。
多目标决策的关键是建立合理的决策模型,将各个决策目标进行量化和比较,再通过适当的优化方法或规划方法寻找最优解。
常用的多目标决策方法包括线性规划、整数规划、动态规划和遗传算法等。
序贯决策是指在决策过程中需要根据不完全的信息和不确定的环境进行连续的决策,即通过一系列的决策步骤逐渐完善和调整决策方案。
序贯决策的关键是建立适当的决策模型,将决策过程分解为多个连续的阶段,每个阶段根据已有的信息和条件做出决策,并根据反馈信息不断调整和优化决策方案。
常用的序贯决策方法包括马尔可夫决策过程、博弈论和贝叶斯决策等。
在实际应用中,多属性决策、多目标决策和序贯决策往往会相互结合使用。
例如,在制定企业的发展战略时,需要考虑多个因素,如市场需求、竞争环境和资源能力等,这涉及到多属性决策的内容。
同时,为了实现企业的长远目标,需要考虑多个决策目标,如利润最大化、成本最小化和风险最小化等,这也涉及到多目标决策的内容。
而在制定战略的实施方案时,可能需要根据不断变化的市场和竞争环境进行序贯的决策,这涉及到序贯决策的内容。
综上所述,多属性决策、多目标决策和序贯决策是决策理论与方法中常用的三个重要方法。
它们分别从不同的角度和需求出发,帮助人们在复杂和不确定的决策环境中做出最佳决策。
这些方法在实际应用中相互结合,能够提供更全面和准确的决策支持。
序贯决策博弈

小
1/2
大
1/2
N
小
1/2
B
B
B
B 不开发
不开发
不开发
不开发 开发
开发
开发
开发
(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)
房地产开发博弈
B知道自 然的选择; 但不知道A 的选择(或A、 B同时决策)
A
开发
N
大
1/2
小
1/2
不开发
大
1/2
N
小
1/2
政府负责确定关税税率(t1,t2); 企业制造产品供给本国(h1,h2)及出口(e1,e2);
市场1:
Q1=h1+e2
考虑两个完全相同的国家(i=1,2),
政府负责确定关税税率(t1,t2); 企业制造产品供给本国(h1,h2)及出口(e1,e2);
两个市场:
Qi=hi+ej
hi*须满足: maxhi[a-(hi+ej*)-c],
hi≧0
且ei*必须满足:maxei[a-(ei+hj*)-c]-tjei
ei≧0
解得
hi*=(a-ej*-c)/2 ei*=(a-hj*-c-tj)/2
hi
1 3
(a
c
ti )
ei
1 3
(a
c
2t
j
)
同理,若政府给定关税税率t1和t2,则第二 个企业j将选择产量(hj*, ej*),即
hi
1 3
(a
决策分析中文ppt课件

10
-50 -25 0 25 50 -50
max 30
12
最大最大(max-max)准则 最大最大准则也称乐观准则,它找出每种 行动的最好结果,再从最好结果中找一个 更好的做为选择:
u(Ai*) = maxi maxj aij
按这一准则报童选择的行动方案是从出版 商订购10份报纸。
13
(决策) (事件) 需求数量
20
0.5 D2
放弃
不利
0
150
EMV = -10
0.4 需求大 EMV = 70 B 0.4 需求小
0.2 无需求
200 50
0.72 需求大 -150
E1
0.24 需求小 200
推出
0.04 无需求 50
-150
放弃 推出
E2
0
0
0.08 需求大 200 0.56 需求小 50 0.36 无需求
33
200 推出 200
需求大
取消 0
B
0.4
50 推出 50
0.4 需求小
0.2
取消 0
EVWPI= 100 无需求 0 推出 -150
取消 0
EVWPI = 200×0.4 + 50×0.4 + 0×0.2 = 100 EVPI = 100 - 70 = 30
34
EVPI是获取任何信息可以付出的最大代价。 如果信息成本超过EVPI,它可以立刻被拒绝。
m2i0n
17
最大期望值准则 计算每个决策的期望值:
u(Ai*) = maxi ∑j pi aij
选期望值最大的方案, 本例中各个 事件发 生的概率相同,期望值计算很简单,只需 将每一行的值相加再除 6 即可得到决策的 期望值,订购 6 或 7 份报纸是明智的选择。
序贯决策

13
1.多阶段决策 多阶段决策
1.3 应用举例
P ( H1 ) = ∑ P ( H1 θ j ) P(θ j )
j =1 3
= 0.4 × 0.4 + 0.3 × 0.2 + 0.32 × 0.4 = 0.34
P (θ1 H1 ) = P ( H1 θ1 ) P (θ1 ) P( H1 ) = 0.4 × 0.4 = 0.471 0.34
0.2 × 0.3 = = 0.177 0.34 = 0.4 × 0.3 = 0.352 0.34
P (θ2 H1 ) =
P ( H1 θ2 ) P (θ2 ) P( H1 ) P ( H1 θ3 ) P(θ3 ) P( H1 )
P (θ3 H1 ) =
14
1.多阶段决策 多阶段决策
1.3 应用举例 试销结果下的后验概率
16
2. 序列决策
有些决策问题, 有些决策问题,在进行决策后又产生一些新情况 需要进行新的决策,接着又有一些新的情况, ,需要进行新的决策,接着又有一些新的情况,有 需要进行新的决策。这样决策、新情况、决策…, 需要进行新的决策。这样决策、新情况、决策 , 就构成一个系列,成为系贯决策。 就构成一个系列,成为系贯决策。 多阶段决策的阶段数是确定的, 多阶段决策的阶段数是确定的,序贯决策的阶段 数是不确定的, 数是不确定的,它依赖于执行决策过程中所出现的 状况。 状况。 决策方法: 决策方法:决策树
20
3. 马尔可夫决策
3.1 马尔可夫决策问题 预测在本质上就是利用预测对象的历史数据去推 知预测对象的未来。 知预测对象的未来。 在经济管理现象中存在一种“无后效性” 在经济管理现象中存在一种“无后效性”,即“ 系统在每一时刻的状态仅仅取决于前一时刻的状态 而与其过去的历史无关。 ,而与其过去的历史无关。” 例如:池塘里有三张荷叶,编号为 , , , 例如:池塘里有三张荷叶,编号为1,2,3,假 设有一只青蛙随机地在荷叶上跳来跳去, 设有一只青蛙随机地在荷叶上跳来跳去,在初始时 它在2号荷叶上 在时刻,它有可能跳到1号或 号荷叶上。 刻,它在 号荷叶上。在时刻,它有可能跳到 号或 号荷叶上, 者3号荷叶上,也有可能原地不动。 号荷叶上 也有可能原地不动。
多阶段决策和序贯决策教材

多阶段决策和序贯决策教材引言多阶段决策和序贯决策是决策理论中重要的概念和方法。
在很多实际应用中,决策问题往往不仅仅是一次性的选择,而是需要在不同阶段进行多次决策,每次决策都受之前决策的影响。
本教材将介绍多阶段决策和序贯决策的基本概念和方法,并提供案例来帮助读者理解和应用这些概念和方法。
多阶段决策多阶段决策是指决策问题中包含多个决策节点的情况。
在每个决策节点,决策者需要面临不同的选择,并根据选择的结果进行下一阶段的决策。
多阶段决策常见于实际生活中的许多问题,比如投资决策、项目管理等。
多阶段决策可以通过决策树来表示。
决策树是一种树状结构,其中每个节点表示一个决策点,每个边表示一个选择。
通过自顶向下的递归过程,从根节点到叶子节点,决策树可以表示整个多阶段决策的过程。
在每个决策节点,决策者根据一定的决策准则选择一个最优的方案。
常用的决策准则包括最大化效益、最小化风险等。
序贯决策序贯决策是多阶段决策的一种特殊形式,它是指在每个决策节点上,决策者只能看到当前状态的信息,并且只做当前状态下最优的决策,无法事先知道所有后续状态的信息。
序贯决策常见于动态环境下的问题,比如控制系统、机器人等。
序贯决策可以通过动态规划来求解。
动态规划是一种递推的算法,通过将问题划分为一系列子问题,并利用子问题的最优解来推导出整个问题的最优解。
在序贯决策中,我们可以定义一个价值函数来表示当前状态的价值,然后利用动态规划算法不断更新和求解价值函数,最终得到最优的决策序列。
案例分析为了帮助读者理解和应用多阶段决策和序贯决策的概念和方法,下面将给出一个案例分析。
假设你是一家餐厅的经理,现在面临一个供应商选择的问题。
你可以选择三个不同的供应商,每个供应商的价格和质量都不同。
此外,每个供应商的产品质量在未来可能会有变化。
你需要决策在当前时间选取哪个供应商,并在之后的时间里根据每个供应商的质量变化重新评估和选择供应商。
这个问题可以通过多阶段决策和序贯决策的方法来解决。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【例8.2】
为了更好地选择检验方案,可先从任意一 箱中随机地抽取一件产品作为样品。 第一次抽样后,可继续进行第二次、第三 次等若干次抽样,每次抽样成本均为4.2元, 样本容量均为1。 试进行序列决策: (1)是否需要抽样?(若需要,抽样几次?) (2)在抽样或不抽样的前提下,采用何种方 案进行检验?
E a 3 / H 3 1 0.353 1 0.353 1 0.294 1 (万元)
故当试销结果为 H3时,也应选择中批生产a2, 截去方案a1、a3 ,结点6的值为1.53万元 。
例8.1
试销收益期望值:
E E a 2 / H 1 p H 1 E a 2 / H 2 p H 2 E a 2 / H 3 p H 3 3.406 0.44 2.62 0.39 1.53 0.17 2.78054 (万元)----结点3
§8.1
多阶段决策
例8.1 某企业考虑是否花费1万元购买某新产 品专利。若购买了专利,可进行大批生产 (a1)、中批生产(a2) 或小批生产(a3),可能 出现的市场销售情况也分为畅销(θ1)、一般 (θ2)和滞销(θ3 )三种。其收益(利润, 万元)矩阵如下表:
状态θ a1 a2 a3 P(θ) 0.6 0.3 0.1 θ1 4 3 1 θ2 2 3 1 θ3 -3 -2 1
P ( X 1 0 | 2 ) P ( 2 ) 0.60 0.6 P ( 2 | X 1 0) 0.6228 P ( X 1 0) 0.578
P ( X 1 0 | 3 ) P ( 3 ) 0.10 0.2 P ( 3 | X 1 0) 0.0346 P ( X 1 0) 0.578
例8.1
为了更正确地掌握市场情况,正式投产公 司打算先生产少量产品试销,试销费需要 5000元。试销结果分为产品受欢迎(H1), 一般(H2)和不受欢迎(H3)三种。 由于试销面不宽,试销结果的准确性有限。 其准确度(似然分布矩阵)见下表:
θ θ1 θ2 θ3 P(θ) 0.6 0.3 0.1 P(H1︱θ) 0.6 0.2 0.2 P(H2︱θ) 0.3 0.6 0.3 P(H3︱θ) 0.1 0.2 0.5
§8.1 多阶段决策
8.1.1 多阶段决策问题
决策者关心的是整个决策过程的总体效应, 而不单是各阶段的决策结果。 总之,若一个决策问题需要经过相互衔接、 相互关联的若干阶段决策才能完成,则自然 称之为多阶段决策。
§8.1 多阶段决策
8.1.2 多阶段决策方法及其应用实例 多阶段决策分析的步骤 适当地划分阶段; 确定各阶段的状态变量,寻找各阶段之间 的联系; 从后到前用逆序归纳法进行决策分析,每 一阶段决策可采用各种单阶段决策方法。 主要方法是决策树方法和动态规划方法。
θ1 a1 a2 9 4 a3 10 5 6 8
θ2
θ3
3
H2 H3
(略)
7
第一阶段
第二阶段
第三阶段
例8.1
解:这是一个三阶段决策问题,采用逆序归 纳法进行决策分析,先要计算在一定的试销 结果下的各后验概率。由全概率公式:
p H i
计算得:
p( H / ) p( ) i 1,2,3
0.046 -3万元
2
1.7万
6
2.7万
(略)
1 不试销
7
1.1万元
第一阶段
第二阶段
第三阶段
§8.1 多阶段决策
有一类多阶段决策问题,在进行决策后又 产生一些新情况,需要进行新的决策,接 着又有一些新的情况,又需要进行新的决 策。这样决策、情况、决策„,就构成一 个序列,这就是序列决策。 特点:决策次数事前并不明确,决策阶段 划分次数依赖于决策过程中出现的特殊状 况。 仍可用决策树法解这类问题,关键是:确 定一个决策序列终止的原则。
第八章 序贯决策分析
广西大学数学与信息科学学院 运筹管理系
§8.1 多阶段决策
8.1.1 多阶段决策问题 决策过程比较复杂; 需要将过程分为若干个相互联系的阶段, 分别对每阶段都做出决策; 各阶段的决策结果前后相互衔接,彼此相 互关联,前阶段决策结果影响后阶段决策目 标,后阶段决策状态又依赖于前阶段状态设 置; 各个阶段决策形成一个完整的决策过程 (序列);
P ( X 1 1) P ( X 1 1 | j ) P ( j )
j 1 3
0.01 0.2 0.40 0.6 0.90 0.2 0.422
【例8.2】
P ( X 1 1 | 1 ) P (1 ) 0.01 0.2 P (1 | X 1 1) 0.0047 P ( X 1 1) 0.422
故当不试销时,应选择大批生产a1,截去方案 a2、a3 ,结点7的值为2.7万元。
例8.1
试销收益期望值扣除试销费用5000元后小于
不试销的收益值,截去试销方案,结点2的值 为2.7万元。 购买专利总期望收益=2.7-1=1.7万元,大于 不买技术的收益1.1万元,截去不买专利方案, 结点1的值为1.7万元 。
P ( X 1 1 | 2 ) P ( 2 ) 0.40 0.6 P ( 2 | X 1 1) 0.5687 P ( X 1 1) 0.422
P ( X 1 1 | 3 ) P ( 3 ) 0.90 0.2 P ( 3 | X 1 1) 0.4265 P ( X 1 1) 0.422
a( X1 1) a1
0.3426 97.5 0.6228 0 33.40 a1 0.0346 0 0.3426 0.578 4.325 0 a2 0.5687 4.325 0 0.4265 125 0.0047 97.5 2.69 0.5687 0.4582 0 a1 0.4265 0 0.4582 0.0047 0.422 0 a2 6.89 0.5687 53.31 0 0.4265 125 最满意方案是,应抽取一件产品作样品检验。 0.2 97.5 0.6 a1 19.5 0 0.2 19.5 若为正品,则无 0 0.2 须检验整箱产品; 0 a 2 期望损失值(包含抽样费用) 0.6 若为次品,则整 25 0 箱检验。 0.2 125 S1 S2 A1 A2 A3 A4
i j j j 1
3
p H 1 0.44
p H 2 0.39 p H 3 0.17
例8.1
再由贝叶斯公式:
p j / Hi
p( H i / j ) p( j ) p( H i )
计算得: 1 2 3
H1 0.818 0.462 0.353 p j / H i 0.136 0.462 0.353 H2 0.046 0.076 0.294 H3
0.3426 0.0047 97.5 0 0 0 0 125 0.6228 0.5687 0.0346 0.4265 X 1 1 一次抽样后最满 X1 0
a1 33.40 0.4582 意方案分别为: a2 4.325 53.31 a( X 1 0) a2
E a2 / H 2 3 0.462 3 0.462 ( 2) 0.076
E a3 / H 2 10 0.462 1 0.462 1 0.462 1 (万元)
2.62 (万元)
故当试销结果为 H2时,应选择中批生产a2,截 去方案a1、a3 ,结点5的值为2.62万元 。
例8.1
如不买此项专利,把这笔费用用在其他方 面,在同样的时期可获利1.1万元。那么, 该公司应该如何决策? (1)是否买专利? (2)如果买专利,是否采取试销办法? (3)如果不试销,应大批生产,中批生产还 是小批生产?如果试销,又应该如何根据 试销结果决定其行动?
例8.1
H1
试销 2 1 不试销
第一次抽样的后验概率矩阵为
X1 0
X1 1
1 0.3426 0.0047 P ( | X 1 ) 2 0.6228 0.5687 3 0.0346 0.4265
【例8.2】
后验行动方案的期望损失值矩阵为
R(a | X 1 ) R P( | X 1 )
E a3 / H 1 1 0.818 1 0.136 1 0.046
----结点10 1(万元) 故当试销结果为 H1时,应选择大批生产a1,截 去方案a2、a3,结点4的值为3.406万元。
例8.1
当试销结果为 H2时:
E a1 / H 2 4 0.462 2 0.462 ( 3) 0.076 2.544 (万元)
相应的损失矩阵为
先进行第一次抽样的后验概率计算
P ( X 1 0) p( x1 0 | j ) p( j )
j 1 3
0.99 0.2 0.60 0.6 0.10 0.2 0.578
【例8.2】
p( X 1 0 | 1 ) P (1 ) 0.99 0.2 P (1 | X 1 0) 0.3426 P ( X 1 0) 0.578
【例8.2】
解: θ1,θ2,θ3分别表示产品次品率为 0.01 , 0.4,0.9三种状态。对于抽样检验一件产品, X=1和X=0分别表示样品为次品和合格品两个结 果。结果值均用期望损失值表示。 序列决策树图不能够一次绘制成功,而是随着 决策过程序列的延伸和终止依次进行。为了简 化图形,行动方案al和a2、可能出现的状态及 其对应的损失值均在图中略去,仅在方案枝末 端标注上期望损失值。
例8.1
当试销结果为 H1时:
E a1 / H 1 4 0.818 2 0.136 ( 3) 0.046