第七章 对策论

合集下载

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

第七章 对策论习题课精品文档67页

第七章  对策论习题课精品文档67页

s1 s2
1 2 3 4
1
2
7
1
3
2
16 1 136 02
3 m-in8aij
8
2
4
-3
3 -3
55
m miaxm aijja a ix ji m n j m iia n ia j a 2 x 22
G 的解为(2,2), VG=2 , 2 与2分别是 局中人I和II的最优纯策略。
例3 求解矩阵对策 G ={S1, S2; A},其中
例4 某单位采购员在秋天要决定冬季取 暖用煤的贮量局中问人题I。:采已购知员在正常的冬季气温条 件下要消耗1三5个吨策煤略,:在在较秋天暖时与买较煤冷的气温条件 下要消耗10吨10和吨2、0吨15。吨假、定20冬分季别记时的煤价随天 气寒冷程为度:而有1,所2变,化3,, 在较暖、正常、较冷 的气候条件下局中每人吨I煤I:价大分自然别为10元,15元和20 元,又设秋季三种时策煤略价:为冬每季出吨现10元.在没有关于 当年冬季准确较的暖气、象正预常报、的条较件冷下,秋季贮煤 多少吨能分使别单记位为的:支1出,最2少,?3,
齐王 上 中 下 田忌 下 上 中
最终净胜一局,赢得1000金。
表14-1 齐王赛马中齐王的赢得表
田忌
1
的策略 上
齐王

的策略

1上 中 下
3
2上 下 中
1
3中 上 下
1
4中 下 上
-1
5下 中 上
1
6下 上 中
1
2
3
4
5
6









博弈论与策略性行为

博弈论与策略性行为
寡头垄断市场上的卖方将价格定在足以 获得经济利润,但又不致于引起新企业进入 的水平上。
与掠夺性定价的异同
企业采用限制性定价,直接目的是阻止新 企业进入市场,但实质上这是一种牺牲部分短 期利润以追求长期利润最大化。因此同掠夺性 定价一样,都是企业长期定价的策略性行为。 所不同的是采用限制性定价的企业短期内仍有 “利润”,而采用掠夺性定价的企业在短期内 处于亏损状态。
动态限制性定价
是指一家在位企业在长期内确定价格和产 量来减少或消除导致新企业进入它所在市场的 诱因的方法。
市场主导企业经常是先定立一个高价,然 后随新企业进入逐渐降低价格。现实经济中, 我们可以看到,新产品刚刚导入时价格定得很 高,然后逐渐回落到竞争性价格水平。
影响限制性定价的主要因素
市场进入壁垒高,新企业难以进入, 阻止的价格也就高。壁垒低,新企业容易 进入,要阻止新企业进入,必须按平均的 甚至更低的利润水平定价。
第七章 博弈论与策略性行为
博弈论又称为对策论或游戏论,是研究决 策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题。
近20年来,博弈论在经济学中得到了广泛 的应用,它对寡头理论、信息经济学等方面的 发展做出了重要贡献。
1994年度的诺贝尔经济学奖授予三位从事对策论 研究的经济学家:纳什、泽尔腾、海萨尼。
(2)对于现实经济而言,掠夺性定价并不是 经常发生,大企业更愿意通过兼并来消灭竞 争者,因为兼并能使企业免受低价造成的利 润损失,又有利于增强企业的实力和竞争力。
什么情况下掠夺性定价行为难以成功?
两家企业的成本函数相同 完全可竞争市场
二、限制性定价行为
限制性定价又称阻止进入定价,指一家 在位企业将其价格和产量定在新企业进入市 场后所剩的需求不足以使它生存的水平。

对策论

对策论

例 1:
甲、乙两名儿童玩猜拳游戏。游戏中 双方可分别出拳头(代表石头)、 手掌(代表布),两个手指(代表 剪刀)。规则是剪刀赢布,布赢石 头,石头赢剪刀,赢者得一分。若 双方所出相同,算和局,均不得分。 试列出游戏中儿童甲的赢得矩阵。
儿童甲的赢得矩阵:
乙 甲 石头 布 剪刀 石头 0 1 -1 布 -1 0 1 剪刀 1 -1 0
在矩阵对策模型中,赢得矩阵每一行代表 了局中人甲的一个策略,每一列代表了局 中人乙的一个策略; 行的数目表示了甲的策略集的策略数目, 列的数目表示了乙的策略集的策略数目; 赢得矩阵的第i行第j列的数值表示了甲出 第i个策略,乙出第j个策略时,所得的损 益值(所得的损益值应为该数的相反数.)
例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组 成,双方都可排成三种不同的阵容,每一种阵容可以看作一
★各局中人使用一定的对策形成一个 局势时,一个局势就决定了各局中人 的对策的结果也称为对策的损益值。 ★一般而然,当以上三个基本因素确 定后一个对策模型也就确定了。 ★在众多对策模型中,占有重要地位 的是二人有限零和对策。
二人有限零和对策(two-person zero score game) 对策中存在有2个局中人; 每个局中人的策略集的策略数是有限 的; 每一局势的对策都有确定的损益值, 且对同一局势的两个局中人的损益值 之和为零。 例:齐王赛马
(上中下)(上下中)(中上下)(中下上)(下上中)(下中上)
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3

对策论管理运筹学李军

对策论管理运筹学李军
甲:有m个策略,表示为S1=( 1, 2, 3,……, m) 乙:有n个策略,表示为S2=( 1, 2, 3,……, n) 当甲选定策略i 、乙选定策略j 时,就形成了一个 局势( i , j )。可见这样的局势总共有m n个,对任 意局势( i , j )甲的赢得值为aij,即甲的赢得矩阵为
Min
-4 2 -6 -6
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ,乙应采取2策略;结果甲赢得3,乙付
出3。
2019/8/22

2. 矩阵对策解的问题
定义1:设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,…,m}, S2 = {1 ,2 , …, n}
A = {aij}mn ;若
Max min aij = Min max aij = ai*j*
i
j
j
i
则称ai*j*为对策G的值,局势( i* ,j* )为G的 解,i*和j*分别称为局中人的最优策略。
2019/8/22

2. 矩阵对策解的问题
由于ai*j*既是其所在行的最小值,又是其所在 列的最大值,于是有:
Min
7 5 6 5 5 A= 2 -3 9 -4 -4 Max = 5
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
1 -1 3 1 1 1 A=
-1 1 1 3 1 1
2019/8/22
1 1 -1 1 3 1
1 1 1 -1 1 3

1. 矩阵对策的示例1
例1 :甲的赢得矩阵

对策论

对策论

如果博弈有唯一的纳什均衡点,那么这个博弈是 可预测的。 斗鸡博弈则有两个纳什均衡:一方进而另一方退。 那么到底是公鸡1退还是公鸡2退,我们无法预测。 即我们不知道谁进谁退,谁输谁赢。
你死我活的竞争—零和博弈
石头剪刀布游戏 B 剪刀 1, -1
石头 A 石头 0, 0
布 -1, 1
剪刀

-1, 1
1, -1
0, 0
-1, 1
1, -1
0, 0
在这个博弈中一方所得即为另一方所失,没有纳什均衡
零和博弈与非零和博弈
零和博弈:一方的收益必然意味着另一方 的损失,博弈各方的收益和损失相加总和 永远为“零”。
石头剪刀布、体育竞赛、猜硬币游戏
非零和博弈:博弈中各方的收益或损失的 总和不是零值,它区别于零和博弈,属于 合作博弈,博弈双方存在 “双赢”的可能 。
3.
收益

支付或报酬。一个特定的策略组合下参与者 得到的确定的效用或期望效用。
收益矩阵
单次博弈的收益矩阵
参与者乙 行动A 行动B
参与者甲
行动A
行动B
(a, b)
(e, f)
(c, d)
(g, h)
企业竞合问题—囚徒困境
1. 2.
局中人:嫌疑犯A和B 策略:担白、抵赖
3.
各策略的收益

合作博弈
囚徙博弈中的合作策略(抵赖,抵赖)对双方均 有更大收益。 合作博弈亦称为正和博弈,是指博弈双方的利益 都有所增加,或者至少是一方的利益增加,而另 一方的利益不受损害,因而整个社会的利益有所 增加。 合作博弈研究人们达成合作时如何分配合作得到 的收益,即收益分配问题。
供应链中的合作问题
如何达成此合作?

对策论方法

对策论方法
2013年8月7日星期三 绍兴文理学院 35
1 1 2 -100 -150
2 -175 -150
3 -300 -250 -200
行最小
3 -200 -200 列最大 -100 -150
•定理:p≤q
2013年8月7日星期三 绍兴文理学院 30
p=q时的最优策略
•案例中局中人I(美军)应当选择(北 线)策略1,这样能保证赢得2。局中人 Ⅱ(日军)应当选择(北线)策略1使 盟军赢得不超过2。实际上,在(1,1) 局势下,有 max min aij = min max aij
S2 益损值 S1
田忌赛马
α1(上中下) α2(上下中) α3(中上下) α4(中下上) α5(下上中) α6(下中上)
β1 β2 β3 β4 β5 β6 (上中下) (上下中) (中上下) (中下上) (下上中) (下中上) 3 1 1 1 -1 1 1 3 1 1 1 -1 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
绍兴文理学院 26
2013年8月7日星期三
有限零和二人对策
•在这几个例中的每一个对局,双方的赢得 的代数之和为零,这样的对策称为“有限 零和二人对策”。
•设两个局中人为I,Ⅱ;
•局中人Ⅰ有m个策略:1 ,2 ,…,m ;用S1 表示这些策略的集合:S1={1 ,2 ,…,m } •局中人Ⅱ有n个策略:β1,β2,…,βn;用 S2表示这些策略的集 合:S2={β1,β2,…,βn}
2013年8月7日星期三 绍兴文理学院 14
纳什(John Nash)
2005.10.10.瑞典皇家科学院宣布,将今年诺贝尔经 济学奖授予罗伯特.奥曼(以、美)和托马斯.谢林(美) , 以表彰他们在博弈论领域所作出的贡献。 诺贝尔评奖委员会说,这两位经济学家"通过对博 弈论的分析,加强了我们对冲突和合作的理解"。 奥曼(75岁),出生于 德国法兰克福,现任耶路 撒冷希伯来大学教授和美 国纽约州立大学斯坦尼分 校教授。 谢林(84岁),曾任美 国哈佛大学肯尼迪学院、 马里兰大学公共政策学院 和经济系教授。 15 2013年8月7日星期三

运筹学-对策论

运筹学-对策论

3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表 7.1
赢B
石头
剪子

A
石头
0
1
-1
剪子
-1
0
1

1
-1
0
3.对策论的产生
1944 年,纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后,由于军事
需要,抽象成数学模型。
50 年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的
“核”的概念。同时,非合作对策也开始创立。纳什于 1950 和 1951 年发表了两篇关于非合作
Ⅰ,Ⅱ的最优纯策略, ai* j* 称为 G 的值,记为VG 。
( ) ( ) (2)
鞍点:若局势 αi* , β j*
对应的 ai* j*
=
max i
min j
aij
=
min j
max i
aij
,则称
αi* , β
j*

鞍点。
分析上例中 a23 ,它就满足 ai3 ≤ a23 ≤ a2 j
( ) ( ) 定理 1: G 在纯策略中有解 αi* , β j* ⇔ αi* , β j* 是鞍点
7.1 基本概念
7.1.1 对策现象与对策论
1.对策和对策论 在日常生活中及各种领域内,经常可以看到一些充满着竞争、对抗、冲突的现象。对策 论是研究上述现象的数学理论和方法。它是一种理论模型,其中包括参加者所掌握的全部信 息及可能采取的行动等。 对策论把各式各样的冲突现象抽象成一种数学模型,然后给出分析这些问题的方法和 解。应该说明的是,所谓解是指对策中的所有参与者都按最佳策略行动而得到的结果。对策 论的研究中一般都假设:在对策中所有参与者都是“完全理智”的,在采取的策略上没有任 何失误。 2.对策现象 (1)下棋:围棋源于我国殷代。 (2)齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于 田忌。孙膑给田忌出主意,用下----上,上----中,中----下,结果田忌胜出。 (3)猜手:小孩 A 与 B 猜手,若规定赢得 1 分,平得 0 分,输得 -1 分,则 A 的赢得可 用下表来表示
⎛ 0 −2
2⎞
−2 •
例 7.2
⎜ ⎜⎜⎝
5 2
4 3
−−43 ⎟⎟⎟⎠
−3 −4
54 2
min
j
max i
aij
=
2,
max i
min j
aij
=
−2 ,鞍点不存在,即在纯策略意义下无解
⎛6 5 6 5 ⎞ 5
⎜•
•⎟ •
⎜ 1 4 2 −1⎟ −1
例 7.3
⎜ ⎜
8
5

7
5

⎟ ⎟
5

⎜⎝ 0 2 6 2 ⎟⎠ 0
第七章 对策论
(Game Theory)
本章重点:基本概念、矩阵对策的混合扩充 本章难点:矩阵对策的混合扩充
Game Theory 也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题的学科。
1994 年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经 成为当代经济学的基石。博弈论博大精深,它不仅在经济学领域得到广泛应用,在军事、政 治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响,工程学中如 控制论工程也少不了它。
一个混合局势。
(4)对一个混合局势 (X, Y) ,用 E(X, Y) = XTAY 表示局中人Ⅰ的收益期望值。 (5)用G* = (S1*,S*2 ,E) 表示G= (S1,S2 ,A) 的混合扩充。
(6) 混合扩充的解与值
若G* 的值VG* = E( X *,Y *) 满足 E( X ,Y *) ≤ E( X *,Y *) ≤ E( X *,Y ) * 式 G* 的解 ( X *,Y *) 也称 G 在混合策略意义下的解。
7.2.1 矩阵对策的最优纯策略
1.矩阵对策 设二人有限零和对策问题中的局中人为Ⅰ,Ⅱ,
策略集为 S 1
=
{α1 , α 2
,αm}, S2 = {β1,β 2
, βn},
α1 则支付可以用矩阵 A =
αm
β1, ⎜⎛ a11, ⎜ ⎜⎝ am1,
, βn , a1n ⎟⎞ 表示,
⎟ , amn ⎟⎠
min j
aij
=
2
,即对策解是(α3, β1)VG
=
2。
根据性质 3,则 X* = (0, 0,1, 0),Y * = (1, 0, 0, 0),VG* = 2
性质 4: G1 = (S1, S2 , A1), G2 = (S1, S2 , A2 ), A1 = (aij ), A2 = (aij + d ) ,则:
分析*式:
E(X ,Y*) ≤ E(X *,Y*) ≤ E(X *,Y)
E( X *,Y * ) = X *T AY *
分析左式:
= (x1*
⎛ a11
xm*
)
⎜ ⎜

a1n
⎞⎛ ⎟⎜
y1*
⎞ ⎟
⎟⎜ ⎟
⎜⎝ am1
amn ⎟⎠ ⎜⎝ yn* ⎟⎠
E( X ,Y *) = X T AY * = (x1
也可以写成:

xm
)
⎜ ⎜
A1
⎞⎛ ⎟⎜ ⎟⎜
y1*
⎞ ⎟ ⎟
=
( x1
⎜⎝ Am ⎟⎠ ⎜⎝ yn* ⎟⎠
⎛ ⎜
A1Y
*
⎞ ⎟
xm ) ⎜

⎜⎝ AmY * ⎟⎠
y1*
x1
⎛ ⎜
a11
⎜ xm ⎜⎝ am1
yn*

a1n
⎞ ⎟
⎟ amn ⎟⎠
x1 A1Y *
Y * 已固定Ⅰ将在 X 中选
xm AM Y *
证明: ⇐

min j
ai*
j
=
min j
max i
aij
=
max i
min j
aij
=
max i
aij*
min j
ai*
j
=
ai*
j*
,
max i
aij*
=
ai* j*
故 aij* ≤ a , a i* j* i* j* ≤ ai* j i = 1, , m j = 1, , n
( ) ∴ aij* ≤ ai* j* ≤ ai* j ,即 αi* , β j* 是 G 的解
使得受益最大
x1* A1Y * ≤
xm* AmY *
x1* A1Y *
进一步:
中必有每个 AiY * ≤ VG*
xm* AmY *
( 因为若有某个 Ai0Y* > VG* ,则Ⅰ出αi0 ,即取 X = 0
1
0) ,
i0
此时Vi0 > VG* 矛盾。而且若有某 i0 ,使 Ai0Y* <VG* ,则必有 X i0=0 。
对策的文章,图克于 1950 年定义了“囚徒困境”问题。 60 年代,泽尔腾(1965)引入动态分析,提出“精练纳什均衡”概念。海萨尼(1967-1968)
则把不完全信息引入对策论的研究。
7.1.2 对策问题的组成
1. 局中人(参加者):一局对策的参加者。如齐王赛马例中局中人为齐王和田忌。 2. 策略:局中人在一局对策中对付对手的一个完整的方案。 策略集:局中人在一局对策中所有策略的全体。记为 S(分为有限和无限) 问:田忌和齐王的 S=? 答:(S={(上中下),(上下中),(中上下),(中下上),(下上中),(下中上)}) 3. 局势:在一局对策中,每个局中人都选定一策略后的各策略总和。
(1) VG = VG' (2) y*' = y* 若 X *' = (x1* xk*−1,xk*+1 xm* ) ,则 X * = (x1* xk*−1,0,xk*+1 xm* )
例 7.5 用优超原理求解下列对策问题
⎛ 1 0 3 4⎞
A
=
⎜ ⎜
-1
⎜2
4 2
0 2
1
⎟ ⎟
3⎟
⎜ ⎝
0
4
1
1
⎟ ⎠
其中 aij 为Ⅰ的得(也是Ⅱ的失),Ⅱ的得即为 − aij 。
( ) 故又称二人有限零和对策为矩阵对策,记为 G = S1, S2, A
2.理智局中人的选择
在矩阵对策中,局中人将如何选取自己的策略呢?
α1 举例说明,若 A = α2
α3
β1, β2 , β3 ⎜⎛ −1 3 − 2⎟⎞ ⎜4 3 2⎟ ⎜⎝ 6 1 − 8 ⎟⎠

∵ aij* ≤ ai* j* ≤ ai* j i = 1, , m j = 1, , n

max i
aij*

ai* j*

min j
ai*
j
min j
max i
aij

max i
aij*

ai* j*

min j
ai*
j

max i
min j
aij
但对于任意
A
,有
max i
min j
aij

min j
max i
aij
( ) ∴只有 ai* j*
=
min j
max i
aij
=
max min
i
j
aij
,即
αi* , β
j*
是鞍点
相关文档
最新文档