管理运筹学课件第13章对策论

合集下载

运筹学课件--对策论共105页

运筹学课件--对策论
21、没有人陪你走一辈子，所以你要适应孤独，没有人会帮你一辈子，所以你要奋斗一生。 22、当眼泪流尽的时候，留下的应该是坚强。 23、要改变命运，首先改变自己。
24、勇气很有理由被当作人类德性之首，因为这种德性保证了所有其余的德性。--温斯顿．丘吉尔。 25、梯子的梯阶从来不是用来搁脚的，它只是让人们的脚放上一段时间，以便让别一只脚能够再往上登。
谢谢！Βιβλιοθήκη 61、奢侈是舒适的，否则就不是奢侈。——CocoCha nel 62、少而好学，如日出之阳；壮而好学，如日中之光；志而好学，如炳烛之光。 ——刘向 63、三军可夺帅也，匹夫不可夺志也。 ——孔丘 64、人生就是学校。在那里，与其说好的教师是幸福，不如说好的教师是不幸。 ——海贝尔 65、接受挑战，就可以享受胜利的喜悦。——杰纳勒尔·乔治·S·巴顿

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法，主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统，不考虑时间变化和过程发展，只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境，如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述对策模型对策论的基本概念对策分析方法对策论的应用实例对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论，也称为博弈论，是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡，通过数学模型和逻辑推理来描述和分析竞争行为，尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择，例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下，企业间可能通过对策论的方法找到合作的可能性，例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面，对策论可以帮助理解个体和团队的行为反应，优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中，参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划，它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中，参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中，如果一个参与者的某个策略能够使其获得比其他参与者更好的结果，则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

管理运筹学-PPT精品

(50*60+100*250) - (50*50+100*250) = 500
， 500 / 10 = 50 元
说明在一定范围内每增加（减少）1个台时的设备能力就可增加（减少）50元利润，称为该约束条件的对偶价格。
• 假设原料 A 增加10 千克时，即 b2变化为410，这时可行域扩大，但最优解仍为 x2 = 250 和 x1 + x2 = 300 的交点 x1 = 50，x2 = 250 。此变化对总利润无影响，该约束条件的对偶价格为 0 。
§1问题的提出
例1. 某工厂在计划期内要安排甲、乙两种产品的生产，已知生产单位产品所需的设备台时及A、B两种原材料的消耗以及资源的限制，如下表：
设备原料A 原料B 单位产品获利
甲 1 2 0 50元
乙 1 1 1 100元
资源限制 300台时 400千克 250千克
17
第三章线性规划问题的计算机求解(2)
• 结果考察：（演示例1） 1、当目标函数的系数 ci 单一变化时，只要不超过其上、下限，最优解不变； 2、当约束条件中右边系数 bj 变化时，当其不超过上、下限，对偶价格不变（最优
解仍是原来几个线性方程的解）； 3、当有多个系数变化时，需要进一步讨论。 • 百分之一百法则：对于所有变化的目标函数决策系数（约束条件右边常数值），
线性规划的最优解如果存在，则必定有一个顶点（极点）是最优解；有的线性规划问题存在无穷多个最优解的情况；有的线性规划问题存在无有限最优解的情况，也称无解；有的线性规划问题存在无可行解的情况。
作业：P24---1，2，3，4，5
14ቤተ መጻሕፍቲ ባይዱ
§3图解法的灵敏度分析

运筹学_对策论

第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混合扩充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充： *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混合扩充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超算例
• 线性规划方法
基本思想算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} ， A 是 m n 的矩阵，如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注：局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

管理运筹学课件第13章-对策论

管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论，又称博弈论，是研究决策过程中理性决策者之间冲突与合作的数学理论。
特点
对策论注重分析决策者之间的相互作用和影响，以及决策结果的均衡性和稳定性。
供应链管理
在供应链管理中，对策论可用于协调供应商、制造商、销售商之间的利益关系，优化供应链整体效益。
金融市场投资决策
对策论可用于分析金融市场中的投资决策问题，如股票交易、期货交易等，帮助投资者制定最优的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择，帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中，对策论可用于分析不同武器系统的性能优
劣和作战效能，为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力，为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择，提出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者的策略，直到达到某个均衡条件为止。
数值解法
利用数值计算的方法求解连续对策的均衡解，如有限差分法、有限元法等。
解析法
在某些特殊情况下，可以通过解析的方法求解连续对策的均衡解，如线性二次型微分对策等。

运筹学中的对策论与博弈论

人工智能技术为对策论与博弈论提供新的研究工具和思路
机器学习算法在对策论与博弈论中的应用，提高决策效率和准确性
深度学习技术可以模拟复杂的博弈场景，为对策论与博弈论提供更真实的数据支持
人工智能与对策论与博弈论的结合将推动相关领域的发展和创新
对策论与博弈论在商业竞争中的应用研究
不完全信息静态博弈
定义：博弈参与者在完全信息条件下进行的一次性决策，每个参与者只能选择一种策略，并且所有参与者同时做出选择。
示例：寡头垄断市场中的价格竞争、囚徒困境等。
添加标题
添加标题
添加标题
添加标题
特点：参与者之间无法进行有效的沟通或协商，只能依靠自己的判断和决策。
应用：在经济学、政治学、社会学等领域有广泛应用。
03
对策论的主要内容
合作博弈与非合作博弈
合作博弈：参与者通过合作达成共赢，核心概念包括联盟和核心
非合作博弈：参与者追求个体理性，核心概念包括纳什均衡和优势策略
区别：合作博弈强调合作与共赢，非合作博弈注重竞争与冲突
应用场景：合作博弈常用于国际关系、经济合作等领域，非合作博弈适用于市场竞争、决策分析等场景
对策论与博弈论在商业竞争中具有重要地位，是制定竞争策略和决策的重要工具。
随着大数据和人工智能技术的发展，对策论与博弈论在商业竞争中的应用将更加广泛和深入。
对策论与博弈论可以帮助企业预测竞争对手的行动，制定更加有效的竞争策略。
在商业竞争中，运用对策论与博弈论需要综合考虑各种因素，包括市场环境、竞争对手、自身实力等。
面临的挑战与问题：如何将对策论与博弈论更好地应用于实际场景，解决复杂的问题，仍需进一步的研究和探索。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

局中人称为“i旳对手”，记为-i。
对策中利益一致旳参加者只能看成一种局中人，例：桥牌中旳东、西两方。对策论中对局中人旳一种主要假设：每个局中人都是“理智旳”，即每一种局中人都不存在侥幸心理，不存在利用其他局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中，一种对策有下列几种基本要素：一．局中人二．策略(strategies)：
-1
1
布
1
0
-1
剪刀
-1
1
0
第三节矩阵对策旳纯策略
例：设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解：对局中人I而言，最大赢得是9，若想得到这个赢得，
他要选择纯策略，3因为局中人II也是理智旳竞争者，他已考虑到局中人I打算出旳3心理，则准备以 3对付之，使局中人I不但得不到9，反而失掉10. 局中人I当然也会猜到局中人II旳心理，故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人：参加对策旳局中人有两个；
有限：局中人旳策略集都为有限集；
零和：在任一局势下，两个局中人旳赢得之和总等于0，即，
一种局中人旳所得值恰好是另一种局中人旳所失值，双方旳利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学—对策论(一)

3﹒赢得函数
局势: 在一局对策中，各局中人所选定的策略形成的策略组称为一个局势。即若设si是第i个局中人的一个策略，则n个局中人的策略组s={s1， s2，…， sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔乘积表示，即S=S1× S2×… × Sn
赢得函数：当局势出现后，对策的结果也就确定了。也就是说，对任一局势s∈S，局中人i可以得到一个赢得Hi(s)。
对
二人
动策无
态
限
对策
微分对策等
多人
重点
零和
学习
的对
非零和策。
零和
非零和零和
非零和
零和
非零和
§2矩阵对策的基本定理一﹑矩阵对策的数学模型
1﹒二人有限零和对策：是指有两个参加对策的局中人，每个局中人都只有有限个策略可供选择，在任一局势下，两个局中人的赢得之和总等于零。
2﹒矩阵对策：就是二人有限零和对策。 3﹒矩阵对策模型
总之，局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ，β 2。
5﹒矩阵对策的解定义1 设G={S1 ， S2；A}为矩阵对策，其中
S1={α1,α2, …,αm}，S2={ β 1, β 2, …, β n} ， A=（aij）m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立，记VG= ai*j* 。则称VG为对策G的值，称上述等式成立的纯局势（ α i* , β j* ）为G在纯策略下的解（或平衡局势）， α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和，所以局中人Ⅱ的赢得矩阵

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

13.3.3 线性规划法
y1 L
x1 a11 L
A M
M
O
xm am1 L
yn
min
甲至少期望赢得
n
a1n a1 j y j
aM mn
j 1
M
n
amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
V
j 1
乙采取策略组合y1,…,yn时,是从利己主义出发的,会使自己的期望损失最小(也即甲的赢得最小)
猜硬币游戏属于矩阵对策，儿童甲的策略有出正面向上(α1)
和出反面向上(α2)，儿童乙的策略有猜正面向上(β1)和猜反
面向上(β2)。
min
A
1
1
1 1 1 1 max 1
max 1{1
min1
min j
max i
aij
min j
max i
aij
2020/5/14
课件
13
13.3.1 混合策略的概念
(2) 当x>0.5时，E1 E2 ，理性的儿童乙会选择猜正面; (3) 当x=0.5时，E1 E2 0 ，儿童乙不论采取何种策略，平均赢得都是零。
x
x
x
1
1
1
0.5
0.5
0.5
0
0.5
1y
乙的策略
2020/5/14
0
0.5
1y
同理甲的策略
课件
0
0.5
1y
最优混合策略
14
13.3.1 混合策略的概念
局中人采用不同策略对策时，各方总是有得或有失，统称赢得(payoff)或
得益。
1
2
3
4
5
6
(上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
(1上中下) (2上下中) (3中上下) (4中下上) (5下上中) (6下中上)
3，-3 1，-1 1，-1 -1，1 1，-1 1，-1
2 3 11
A 7
5
2
S1 1,2 S2 1, 2 , 3
解设甲的混合策略为x,(1x),x∈[0,1], 则乙分别使用 β1,β2,β3时,甲赢得值:
1 : v1 2x 7(1 x) 7 5x
2 : v2 3x 5(1 x) 5 2x
: v 2020/5/14 33
2020/5/14
课件
5
13.1.1 对策模型的基本要素
1．局中人
局中人(players)是指参与竞争的各方，每方必须有独立的决策能力和承担风险的能力。(如:田忌、齐王）
2．策略集
在对策问题中，局中人为了应对其他局中人的行动而采取的方案和手段称为该局中人的一个策略(strategy)。
3．赢得及赢得函数
min
2 3 4 4 4
A 6 4 2
4 3 3
2 3 2
5 2 4
5 2
max
2
4
max 61 4432 44 432
最优纯策略(3 ,4 )
2020/5/14
min2
课件
12
13.3.1 混合策略的概念
【例13.5】猜硬币游戏：甲、乙两个儿童玩猜硬币游戏，甲手中拿着一枚硬币，把硬币盖在桌子上，让儿童乙猜是正面向上还是反面向上。如若猜对甲给乙1元钱，猜错乙给甲1元钱。
11x
2(1
x)
9x
2
步骤:
(1)绘制x数轴,标出x取值范围[0,1]
(2)x取0和1,确定三条直线端点,绘制三条甲赢得值直线
(3)由于乙是理智的,甲的赢得值只能是最小的(粗线所示)
(4)甲只能在最小中取最大,对应的策略为 X * ( 3 , 8 ) ,最优对策值为V*=49/11
11 11
β3
3
522源自α230x*
2 1x
故β1的概率为0.设β2,β3的概率为 y,(1-y).由效率矩阵:
0
y* 1 y
由于甲是理智的,故乙取最大损
2 3 11
A 7 5
2
失(粗线)
乙会在最大损失中找出最小,即乙最优混合策略为:
可知,当甲使用α1,α2,时,乙的损失
2值020为/5/14:
课件
Y * (0, 9 , 2 ) 11 11 18
设局中人甲使用策略i的概率为xi
m
则m维概率向量x (x1,..., xm )T , xi 1, xi 0称为甲的一个混合策略 i 1
则m维称S1*
x
(x1,..., xm )T
|
m i 1
xi
1, xi
0 称为甲的混合策略集
同理可定义局中人乙的混合策略与混合策略集.
当甲采取混合策略x,乙采取混合策略y,则称(x,y)为一个混合局势.
2020/5/14
课件
9
13.2.1超优原则
1．对 r ,s 若恒有arj asj 则称 r 超优于 s 2．对 h , k 若恒有aih aik 则称 h 超优于 k
【例13.2】
第3行优超
6
1
A5
1
4 2 5 3
5 0 1.5 3
4 3 4 0
6.5
7
9
8
于第2行，第1行优超于第5行
甲会使用某种策略组合x1,…,xm,使得在最小赢得的概率组合尽可能地大.
因此有: aij y j ≤V
j
y j 1
j
i 1, 2,L , m
令:yj
yj V
,则:
n j 1
yj
1 V
,于是有 :
n
max
y
j
j 1
y j ≥ 0
j 1, 2,L , n
乙的目标是期望损失最小:minV或max 1
课件
10
【例13.3】某地区有甲、乙两家企业生产同种产品，采取相同的价格
出售，为了提高市场份额，均采取做广告的方式扩大自己的销售量。
甲和乙均有三种广告策略。甲企业所占的市场份额增加的百分数如下
面矩阵A所示。 1 2 3 min
A 1 2
3 5
1 6
4 1 1 6 max 1
3 4 2 3 3
第13章对策论
教学目标与要求
【教学目标】 1. 理解下列基本概念：矩阵对策，矩阵对策三要素，最优纯策略与最优混合策略，鞍点和对策值 2. 算法要求： (1) 会用“超优原则”和“最大最小”原则求矩阵对策的最优纯策略 (2) 会用“线性规划”方法求矩阵对策的最优混合策略 (3) 了解纯策略和混合策略的纳什均衡求取。【知识结构】
max 514 21 434
min1
2020/5/14
课件
11
13.2.2 最大最小原则
1 L
A 1
M
a11
M
L O
m am1 L
n min
a1n M
max
ars
amn
如果ars ahk ,则该值所对应的策略为最优纯策略
max 1 44 2 4 43
min ahk
【例13.4】
M
n
min amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
m
m
j 1
乙各方案最大损失max ai1xi L max ain xi
i 1
i 1
mn
乙最多期望损失 min max a x y YS2* XS1* i1 j1 ij i j
由于甲乙都是理智的，故
设甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反面(β2)的概率1-y。则乙两个策略的期望值分别为:
E1 1 x (1)(1 x) 2x 1 E2 (1) x 1 (1 x) 1 2x
令E1 E2 , 可得x 0.5
(1) 当x<0.5时，E1 E2，理性的儿童乙会选择猜反面;
1，-1 3，-3 -1，1 1，-1 1，-1 1，-1
1，-1 1，-1 3，-3 1，-1 1，-1 -1，1
1，-1 1，-1 1，-1 3，-3 -1，1 1，-1
-1，1 1，-1 1，-1 1，-1 3，-3 1，-1
1，-1 -1，1 1，-1 1，-1 1，-1 3，-3
2020/5/14
最优混合策略为max min E(X,Y ) min max E(X,Y )时X,Y的解
X S1 YS2
YS2 X S1
2020/5/14
课件
15
13.3.1 混合策略的概念
矩阵对策G S1 , S2 , A
甲的策略集S1 1 , ...,m 乙的策略集S2 1 , ..., n 赢得矩阵A aij mn
1 1 6
A1 3 5
4 1
0 4 2 1 3
第1列优超于第5列，第4列优超于第2列
1
1 6 A2 3 5
3
5 1.5
4 1 3
4
4 4
第1行优于 2、3行
0
A3
1
2 3 4 5
4 5 4 6.5
5 1.5 4
9
3 3 0 8
1
2
3
6 4 5
2020/5/14
最优纯策略（α1,β2）
11
7 β1
5 β2
β3
3
2
2
课0 件
x*
1 x 17