管理运筹学课件第13章对策论

合集下载

运筹学课件--对策论共105页

运筹学课件--对策论共105页
运筹学课件--对策论
21、没有人陪你走一辈子,所以你要 适应孤 独,没 有人会 帮你一 辈子, 所以你 要奋斗 一生。 22、当眼泪流尽的时候,留下的应该 是坚强 。 23、要改变命运,首先改变自己。
24、勇气很有理由被当作人类德性之 首,因 为这种 德性保 证了所 有其余 的德性 。--温 斯顿. 丘吉尔 。 25、梯子的梯阶从来不是用来搁脚的 ,它只 是让人 们的脚 放上一 段时间 ,以便 让别一 只脚能 够再往 上登。
谢谢!Βιβλιοθήκη 61、奢侈是舒适的,否则就不是奢侈 。——CocoCha nel 62、少而好学,如日出之阳;壮而好学 ,如日 中之光 ;志而 好学, 如炳烛 之光。 ——刘 向 63、三军可夺帅也,匹夫不可夺志也。 ——孔 丘 64、人生就是学校。在那里,与其说好 的教师 是幸福 ,不如 说好的 教师是 不幸。 ——海 贝尔 65、接受挑战,就可以享受胜利的喜悦 。——杰纳勒 尔·乔治·S·巴顿

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

管理运筹学-PPT精品

管理运筹学-PPT精品

(50*60+100*250) - (50*50+100*250) = 500
, 500 / 10 = 50 元
说明在一定范围内每增加(减少)1个台时的设备能力就可增加(减少)50元利 润,称为该约束条件的对偶价格。
• 假设原料 A 增加10 千克时,即 b2变化为410,这时可行域扩大,但最优解仍为 x2 = 250 和 x1 + x2 = 300 的交点 x1 = 50,x2 = 250 。 此变化对总利润无影响,该约束条件的对偶价格为 0 。
§1问题的提出
例1. 某工厂在计划期内要安排甲、乙两种产品的生产,已知生产单位产品所需的设备台时 及A、B两种原材料的消耗以及资源的限制,如下表:
设 备 原 料A 原 料B 单 位 产 品 获 利
甲 1 2 0 50元
乙 1 1 1 100元
资 源 限 制 300台 时 400千 克 250千 克
17
第三章 线性规划问题的计算机求解(2)
• 结果考察:(演示例1) 1、当目标函数的系数 ci 单一变化时,只要不超过其上、下限,最优解不变; 2、当约束条件中右边系数 bj 变化时,当其不超过上、下限,对偶价格不变(最优
解仍是原来几个线性方程的解); 3、当有多个系数变化时,需要进一步讨论。 • 百分之一百法则:对于所有变化的目标函数决策系数(约束条件右边常数值),
线性规划的最优解如果存在,则必定有一个顶点(极点)是最优解; 有的线性规划问题存在无穷多个最优解的情况; 有的线性规划问题存在无有限最优解的情况,也称无解; 有的线性规划问题存在无可行解的情况。
作业:P24---1,2,3,4,5
14ቤተ መጻሕፍቲ ባይዱ
§3图解法的灵敏度分析

运筹学_对策论

运筹学_对策论
第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混 合 扩 充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充: *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混 合 扩 充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超 算例
• 线性规划方法
基本思想 算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} , A 是 m n 的矩阵,如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注:局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

管理运筹学课件第13章-对策论

管理运筹学课件第13章-对策论
管理运筹学课件第13章对策论
• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。

运筹学中的对策论与博弈论

运筹学中的对策论与博弈论

人工智能技术为 对策论与博弈论 提供新的研究工 具和思路
机器学习算法在 对策论与博弈论 中的应用,提高 决策效率和准确 性
深度学习技术可 以模拟复杂的博 弈场景,为对策 论与博弈论提供 更真实的数据支 持
人工智能与对策 论与博弈论的结 合将推动相关领 域的发展和创新
对策论与博弈论在商业竞争中的应用研究
不完全信息静态博弈
定义:博弈参与者在完全信息条 件下进行的一次性决策,每个参 与者只能选择一种策略,并且所 有参与者同时做出选择。
示例:寡头垄断市场中的价格竞 争、囚徒困境等。
添加标题
添加标题
添加标题
添加标题
特点:参与者之间无法进行有效 的沟通或协商,只能依靠自己的 判断和决策。
应用:在经济学、政治学、社会 学等领域有广泛应用。
03
对策论的主要内容
合作博弈与非合作博弈
合作博弈:参与者通过合作达成共赢,核心概念包括联盟和核心
非合作博弈:参与者追求个体理性,核心概念包括纳什均衡和优势策略
区别:合作博弈强调合作与共赢,非合作博弈注重竞争与冲突
应用场景:合作博弈常用于国际关系、经济合作等领域,非合作博弈适用于市场竞争、决策分 析等场景
对策论与博弈论 在商业竞争中具 有重要地位,是 制定竞争策略和 决策的重要工具。
随着大数据和人 工智能技术的发 展,对策论与博 弈论在商业竞争 中的应用将更加 广泛和深入。
对策论与博弈论 可以帮助企业预 测竞争对手的行 动,制定更加有 效的竞争策略。
在商业竞争中, 运用对策论与博 弈论需要综合考 虑各种因素,包 括市场环境、竞 争对手、自身实 力等。
面临的挑战与问题:如何将对策论与博弈论更好地应用于实际场景,解决 复杂的问题,仍需进一步的研究和探索。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1

1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学—对策论(一)

运筹学—对策论(一)

3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。

二人
动 策无


对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

13.3.3 线性规划法
y1 L
x1 a11 L
A M
M
O
xm am1 L
yn
min
甲至少期望赢得
n
a1n a1 j y j
aM mn
j 1
M
n
amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
V
j 1
乙采取策略组合y1,…,yn时,是从利己主义出发的,会使自己的期望损失最 小(也即甲的赢得最小)
猜硬币游戏属于矩阵对策,儿童甲的策略有出正面向上(α1)
和出反面向上(α2),儿童乙的策略有猜正面向上(β1)和猜反
面向上(β2)。
min
A
1
1
1 1 1 1 max 1
max 1{1
min1
min j
max i
aij
min j
max i
aij
2020/5/14
课件
13
13.3.1 混合策略的概念
(2) 当x>0.5时,E1 E2 ,理性的儿童乙会选择猜正面; (3) 当x=0.5时,E1 E2 0 ,儿童乙不论采取何种策略,平均赢得都是零。
x
x
x
1
1
1
0.5
0.5
0.5
0
0.5
1y
乙的策略
2020/5/14
0
0.5
1y
同理甲的策略
课件
0
0.5
1y
最优混合策略
14
13.3.1 混合策略的概念
局中人采用不同策略对策时,各方总是有得或有失,统称赢得(payoff)或
得益。
1
2
3
4
5
6
(上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
(1上中下) (2上下中) (3中上下) (4中下上) (5下上中) (6下中上)
3,-3 1,-1 1,-1 -1,1 1,-1 1,-1
2 3 11
A 7
5
2
S1 1,2 S2 1, 2 , 3
解 设甲的混合策略为x,(1x),x∈[0,1], 则 乙 分 别 使 用 β1,β2,β3时,甲赢得值:
1 : v1 2x 7(1 x) 7 5x
2 : v2 3x 5(1 x) 5 2x
: v 2020/5/14 33
2020/5/14
课件
5
13.1.1 对策模型的基本要素
1.局中人
局中人(players)是指参与竞争的各方,每方必须有独立的决策能力和承 担风险的能力。(如:田忌、齐王)
2.策略集
在对策问题中,局中人为了应对其他局中人的行动而采取的方案和手段 称为该局中人的一个策略(strategy)。
3.赢得及赢得函数
min
2 3 4 4 4
A 6 4 2
4 3 3
2 3 2
5 2 4
5 2
max
2
4
max 61 4432 44 432
最优纯策略(3 ,4 )
2020/5/14
min2
课件
12
13.3.1 混合策略的概念
【例13.5】 猜硬币游戏:甲、乙两个儿童玩猜硬币游戏, 甲手中拿着一枚硬币,把硬币盖在桌子上,让儿童乙猜是 正面向上还是反面向上。如若猜对甲给乙1元钱,猜错乙给 甲1元钱。
11x
2(1
x)
9x
2
步骤:
(1)绘制x数轴,标出x取值范围[0,1]
(2)x取0和1,确定三条直线端点,绘制三 条甲赢得值直线
(3)由于乙是理智的,甲的赢得值只能是 最小的(粗线所示)
(4)甲只能在最小中取最大,对应的策略 为 X * ( 3 , 8 ) ,最优对策值为V*=49/11
11 11
β3
3
522源自α230x*
2 1x
故β1的概率为0.设β2,β3的概率为 y,(1-y).由效率矩阵:
0
y* 1 y
由于甲是理智的,故乙取最大损
2 3 11
A 7 5
2
失(粗线)
乙会在最大损失中找出最小,即 乙最优混合策略为:
可知,当甲使用α1,α2,时,乙的损失
2值020为/5/14:
课件
Y * (0, 9 , 2 ) 11 11 18
设局中人甲使用策略i的概率为xi
m
则m维概率向量x (x1,..., xm )T , xi 1, xi 0称为甲的一个混合策略 i 1
则m维称S1*
x
(x1,..., xm )T
|
m i 1
xi
1, xi
0 称为甲的混合策略集
同理可定义局中人乙的混合策略与混合策略集.
当甲采取混合策略x,乙采取混合策略y,则称(x,y)为一个混合局势.
2020/5/14
课件
9
13.2.1超优原则
1.对 r ,s 若恒有arj asj 则称 r 超优于 s 2.对 h , k 若恒有aih aik 则称 h 超优于 k
【例13.2】
第3行优超
6
1
A5
1
4 2 5 3
5 0 1.5 3
4 3 4 0
6.5
7
9
8
于第2行, 第1行优超 于第5行
甲会使用某种策略组合x1,…,xm,使得在最小赢得的概率组合尽可能地大.
因此有: aij y j ≤V
j
y j 1
j
i 1, 2,L , m
令:yj
yj V
,则:
n j 1
yj
1 V
,于是有 :
n
max
y
j
j 1
y j ≥ 0
j 1, 2,L , n
乙的目标是期望损失最小:minV或max 1
课件
10
【例13.3】 某地区有甲、乙两家企业生产同种产品,采取相同的价格
出售,为了提高市场份额,均采取做广告的方式扩大自己的销售量。
甲和乙均有三种广告策略。甲企业所占的市场份额增加的百分数如下
面矩阵A所示。 1 2 3 min
A 1 2
3 5
1 6
4 1 1 6 max 1
3 4 2 3 3
第13章 对策论
教学目标与要求
【教学目标】 1. 理解下列基本概念: 矩阵对策,矩阵对策三要素,最优纯策略与最优混合策略,鞍点和对策值 2. 算法要求: (1) 会用“超优原则”和“最大最小”原则求矩阵对策的最优纯策略 (2) 会用“线性规划”方法求矩阵对策的最优混合策略 (3) 了解纯策略和混合策略的纳什均衡求取。 【知识结构】
max 514 21 434
min1
2020/5/14
课件
11
13.2.2 最大最小原则
1 L
A 1
M
a11
M
L O
m am1 L
n min
a1n M
max
ars
amn
如果ars ahk ,则该值所对 应的策略为最优纯策略
max 1 44 2 4 43
min ahk
【例13.4】
M
n
min amj y j
max
min
X S1* YS2*
m i 1
n
aij xi y j
j 1
m
m
j 1
乙各方案最大损失max ai1xi L max ain xi
i 1
i 1
mn
乙最多期望损失 min max a x y YS2* XS1* i1 j1 ij i j
由于甲乙都是理智的,故
设甲出正面(α1)的概率x,出反面(α2)的概率1-x;乙猜正面(β1)的概率y,猜反 面(β2)的概率1-y。则乙两个策略的期望值分别为:
E1 1 x (1)(1 x) 2x 1 E2 (1) x 1 (1 x) 1 2x
令E1 E2 , 可得x 0.5
(1) 当x<0.5时,E1 E2,理性的儿童乙会选择猜反面;
1,-1 3,-3 -1,1 1,-1 1,-1 1,-1
1,-1 1,-1 3,-3 1,-1 1,-1 -1,1
1,-1 1,-1 1,-1 3,-3 -1,1 1,-1
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
2020/5/14
最优混合策略为max min E(X,Y ) min max E(X,Y )时X,Y的解
X S1 YS2
YS2 X S1
2020/5/14
课件
15
13.3.1 混合策略的概念
矩阵对策G S1 , S2 , A
甲的策略集S1 1 , ...,m 乙的策略集S2 1 , ..., n 赢得矩阵A aij mn
1 1 6
A1 3 5
4 1
0 4 2 1 3
第1列优超于 第5列,第4列 优超于第2列
1
1 6 A2 3 5
3
5 1.5
4 1 3
4
4 4
第1行优于 2、3行
0
A3
1
2 3 4 5
4 5 4 6.5
5 1.5 4
9
3 3 0 8
1
2
3
6 4 5
2020/5/14
最优纯策略(α1,β2)
11
7 β1
5 β2
β3
3
2
2
课0 件
x*
1 x 17
相关文档
最新文档