第七章 对策论
《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。
第七章 对策论习题课精品文档67页

s1 s2
1 2 3 4
1
2
7
1
3
2
16 1 136 02
3 m-in8aij
8
2
4
-3
3 -3
55
m miaxm aijja a ix ji m n j m iia n ia j a 2 x 22
G 的解为(2,2), VG=2 , 2 与2分别是 局中人I和II的最优纯策略。
例3 求解矩阵对策 G ={S1, S2; A},其中
例4 某单位采购员在秋天要决定冬季取 暖用煤的贮量局中问人题I。:采已购知员在正常的冬季气温条 件下要消耗1三5个吨策煤略,:在在较秋天暖时与买较煤冷的气温条件 下要消耗10吨10和吨2、0吨15。吨假、定20冬分季别记时的煤价随天 气寒冷程为度:而有1,所2变,化3,, 在较暖、正常、较冷 的气候条件下局中每人吨I煤I:价大分自然别为10元,15元和20 元,又设秋季三种时策煤略价:为冬每季出吨现10元.在没有关于 当年冬季准确较的暖气、象正预常报、的条较件冷下,秋季贮煤 多少吨能分使别单记位为的:支1出,最2少,?3,
齐王 上 中 下 田忌 下 上 中
最终净胜一局,赢得1000金。
表14-1 齐王赛马中齐王的赢得表
田忌
1
的策略 上
齐王
中
的策略
下
1上 中 下
3
2上 下 中
1
3中 上 下
1
4中 下 上
-1
5下 中 上
1
6下 上 中
1
2
3
4
5
6
上
中
中
下
下
下
上
下
中
上
博弈论与策略性行为

与掠夺性定价的异同
企业采用限制性定价,直接目的是阻止新 企业进入市场,但实质上这是一种牺牲部分短 期利润以追求长期利润最大化。因此同掠夺性 定价一样,都是企业长期定价的策略性行为。 所不同的是采用限制性定价的企业短期内仍有 “利润”,而采用掠夺性定价的企业在短期内 处于亏损状态。
动态限制性定价
是指一家在位企业在长期内确定价格和产 量来减少或消除导致新企业进入它所在市场的 诱因的方法。
市场主导企业经常是先定立一个高价,然 后随新企业进入逐渐降低价格。现实经济中, 我们可以看到,新产品刚刚导入时价格定得很 高,然后逐渐回落到竞争性价格水平。
影响限制性定价的主要因素
市场进入壁垒高,新企业难以进入, 阻止的价格也就高。壁垒低,新企业容易 进入,要阻止新企业进入,必须按平均的 甚至更低的利润水平定价。
第七章 博弈论与策略性行为
博弈论又称为对策论或游戏论,是研究决 策主体的行为发生直接相互作用时的决策以及 这种决策的均衡问题。
近20年来,博弈论在经济学中得到了广泛 的应用,它对寡头理论、信息经济学等方面的 发展做出了重要贡献。
1994年度的诺贝尔经济学奖授予三位从事对策论 研究的经济学家:纳什、泽尔腾、海萨尼。
(2)对于现实经济而言,掠夺性定价并不是 经常发生,大企业更愿意通过兼并来消灭竞 争者,因为兼并能使企业免受低价造成的利 润损失,又有利于增强企业的实力和竞争力。
什么情况下掠夺性定价行为难以成功?
两家企业的成本函数相同 完全可竞争市场
二、限制性定价行为
限制性定价又称阻止进入定价,指一家 在位企业将其价格和产量定在新企业进入市 场后所剩的需求不足以使它生存的水平。
对策论

例 1:
甲、乙两名儿童玩猜拳游戏。游戏中 双方可分别出拳头(代表石头)、 手掌(代表布),两个手指(代表 剪刀)。规则是剪刀赢布,布赢石 头,石头赢剪刀,赢者得一分。若 双方所出相同,算和局,均不得分。 试列出游戏中儿童甲的赢得矩阵。
儿童甲的赢得矩阵:
乙 甲 石头 布 剪刀 石头 0 1 -1 布 -1 0 1 剪刀 1 -1 0
在矩阵对策模型中,赢得矩阵每一行代表 了局中人甲的一个策略,每一列代表了局 中人乙的一个策略; 行的数目表示了甲的策略集的策略数目, 列的数目表示了乙的策略集的策略数目; 赢得矩阵的第i行第j列的数值表示了甲出 第i个策略,乙出第j个策略时,所得的损 益值(所得的损益值应为该数的相反数.)
例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组 成,双方都可排成三种不同的阵容,每一种阵容可以看作一
★各局中人使用一定的对策形成一个 局势时,一个局势就决定了各局中人 的对策的结果也称为对策的损益值。 ★一般而然,当以上三个基本因素确 定后一个对策模型也就确定了。 ★在众多对策模型中,占有重要地位 的是二人有限零和对策。
二人有限零和对策(two-person zero score game) 对策中存在有2个局中人; 每个局中人的策略集的策略数是有限 的; 每一局势的对策都有确定的损益值, 且对同一局势的两个局中人的损益值 之和为零。 例:齐王赛马
(上中下)(上下中)(中上下)(中下上)(下上中)(下中上)
其中:齐王的策略集: S1={ 1, 2, 3, 4, 5, 6 }, 田忌的策略集:S2={ 1, 2, 3, 4, 5, 6 }。 下面矩阵称齐王的赢得矩阵: 3 1 1 1 -1 1 1 3 1 1 1 -1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
对策论管理运筹学李军

Min
-4 2 -6 -6
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ,乙应采取2策略;结果甲赢得3,乙付
出3。
2019/8/22
2. 矩阵对策解的问题
定义1:设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,…,m}, S2 = {1 ,2 , …, n}
A = {aij}mn ;若
Max min aij = Min max aij = ai*j*
i
j
j
i
则称ai*j*为对策G的值,局势( i* ,j* )为G的 解,i*和j*分别称为局中人的最优策略。
2019/8/22
2. 矩阵对策解的问题
由于ai*j*既是其所在行的最小值,又是其所在 列的最大值,于是有:
Min
7 5 6 5 5 A= 2 -3 9 -4 -4 Max = 5
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
1 -1 3 1 1 1 A=
-1 1 1 3 1 1
2019/8/22
1 1 -1 1 3 1
1 1 1 -1 1 3
1. 矩阵对策的示例1
例1 :甲的赢得矩阵
对策论

如果博弈有唯一的纳什均衡点,那么这个博弈是 可预测的。 斗鸡博弈则有两个纳什均衡:一方进而另一方退。 那么到底是公鸡1退还是公鸡2退,我们无法预测。 即我们不知道谁进谁退,谁输谁赢。
你死我活的竞争—零和博弈
石头剪刀布游戏 B 剪刀 1, -1
石头 A 石头 0, 0
布 -1, 1
剪刀
布
-1, 1
1, -1
0, 0
-1, 1
1, -1
0, 0
在这个博弈中一方所得即为另一方所失,没有纳什均衡
零和博弈与非零和博弈
零和博弈:一方的收益必然意味着另一方 的损失,博弈各方的收益和损失相加总和 永远为“零”。
石头剪刀布、体育竞赛、猜硬币游戏
非零和博弈:博弈中各方的收益或损失的 总和不是零值,它区别于零和博弈,属于 合作博弈,博弈双方存在 “双赢”的可能 。
3.
收益
支付或报酬。一个特定的策略组合下参与者 得到的确定的效用或期望效用。
收益矩阵
单次博弈的收益矩阵
参与者乙 行动A 行动B
参与者甲
行动A
行动B
(a, b)
(e, f)
(c, d)
(g, h)
企业竞合问题—囚徒困境
1. 2.
局中人:嫌疑犯A和B 策略:担白、抵赖
3.
各策略的收益
合作博弈
囚徙博弈中的合作策略(抵赖,抵赖)对双方均 有更大收益。 合作博弈亦称为正和博弈,是指博弈双方的利益 都有所增加,或者至少是一方的利益增加,而另 一方的利益不受损害,因而整个社会的利益有所 增加。 合作博弈研究人们达成合作时如何分配合作得到 的收益,即收益分配问题。
供应链中的合作问题
如何达成此合作?
对策论方法

1 1 2 -100 -150
2 -175 -150
3 -300 -250 -200
行最小
3 -200 -200 列最大 -100 -150
•定理:p≤q
2013年8月7日星期三 绍兴文理学院 30
p=q时的最优策略
•案例中局中人I(美军)应当选择(北 线)策略1,这样能保证赢得2。局中人 Ⅱ(日军)应当选择(北线)策略1使 盟军赢得不超过2。实际上,在(1,1) 局势下,有 max min aij = min max aij
S2 益损值 S1
田忌赛马
α1(上中下) α2(上下中) α3(中上下) α4(中下上) α5(下上中) α6(下中上)
β1 β2 β3 β4 β5 β6 (上中下) (上下中) (中上下) (中下上) (下上中) (下中上) 3 1 1 1 -1 1 1 3 1 1 1 -1 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 1 -1 3 1 1 1 -1 1 1 3
绍兴文理学院 26
2013年8月7日星期三
有限零和二人对策
•在这几个例中的每一个对局,双方的赢得 的代数之和为零,这样的对策称为“有限 零和二人对策”。
•设两个局中人为I,Ⅱ;
•局中人Ⅰ有m个策略:1 ,2 ,…,m ;用S1 表示这些策略的集合:S1={1 ,2 ,…,m } •局中人Ⅱ有n个策略:β1,β2,…,βn;用 S2表示这些策略的集 合:S2={β1,β2,…,βn}
2013年8月7日星期三 绍兴文理学院 14
纳什(John Nash)
2005.10.10.瑞典皇家科学院宣布,将今年诺贝尔经 济学奖授予罗伯特.奥曼(以、美)和托马斯.谢林(美) , 以表彰他们在博弈论领域所作出的贡献。 诺贝尔评奖委员会说,这两位经济学家"通过对博 弈论的分析,加强了我们对冲突和合作的理解"。 奥曼(75岁),出生于 德国法兰克福,现任耶路 撒冷希伯来大学教授和美 国纽约州立大学斯坦尼分 校教授。 谢林(84岁),曾任美 国哈佛大学肯尼迪学院、 马里兰大学公共政策学院 和经济系教授。 15 2013年8月7日星期三
运筹学-对策论

3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 对策论§1 引言社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来解决这样的问题开始于17世纪的科学家,如C.,Huygens 和W.,Leibnitz 等。
现代对策论起源于1944年J.,V on Neumann 和O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。
对策论亦称竞赛论或博弈论。
是研究具有斗争或竞争性质现象的数学理论和方法。
一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。
对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。
所以日益引起广泛的注意。
在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。
具有竞争或对抗性质的行为称为对策行为。
在这类行为中。
参加斗争或竞争的各方各自具有不同的目标和利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。
§2 对策问题对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。
先考察一个实际例子。
例1 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑7年。
将嫌疑犯A 、B 被判刑的几种可能情况列表如下:嫌疑犯B供认 不供认 嫌疑犯A 供认 (3,3) (0,7) 不供认 (7,0) (1.5,1.5)表中每对数字表示嫌疑犯B A 、被判刑的年数。
如果两名疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。
从这一简单实例中可以看出对策现象中包含有的几个基本要素。
2.1 对策的基本要素 (i )局中人在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。
通常用I 表示局中人的集合.如果有n 个局中人,则},,2,1{n I =。
一般要求一个对策中至少要有两个局中人。
在例1中,局中人是B A 、两名疑犯。
(ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。
参加对策的每一局中人i ,I i ∈,都有自己的策略集i S 。
一般,每一局中人的策略集中至少应包括两个策略。
(iii )赢得函数(支付函数)在一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若i s 是第i 个局中人的一个策略,则n 个局中人的策略组),,,(21n s s s s =就是一个局势。
全体局势的集合S 可用各局中人策略集的笛卡尔积表示,即n S S S S ⨯⨯⨯= 21当局势出现后,对策的结果也就确定了。
也就是说,对任一局势,S s ∈,局中人i 可以得到一个赢得)(s H i 。
显然,)(s H i 是局势s 的函数,称之为第i 个局中人的赢得函数。
这样,就得到一个向量赢得函数))(,),(()(1s H s H s H n =。
本节我们只讨论有两名局中人的对策问题,其结果可以推广到一般的对策模型中去。
2.2 零和对策(矩阵对策)零和对策是一类特殊的对策问题。
在这类对策中,只有两名局中人,每个局中人都只有有限个策略可供选择。
在任一纯局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。
设局中人Ⅰ、Ⅱ的策略集分别为},,{11m S αα =,},,{12n S ββ = 当局中人Ⅰ选定策略i α和局中人Ⅱ选定策略j β后,就形成了一个局势),(j i βα,可见这样的局势共有mn 个。
对任一局势),(j i βα,记局中人Ⅰ的赢得值为ij a ,并称⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=mn m m n n a a a a a a a a a A 212222111211为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。
由于假定对策为零和的,故局中人Ⅱ的赢得矩阵就是A -。
当局中人Ⅰ、Ⅱ和策略集1S 、2S 及局中人Ⅰ的赢得矩阵A 确定后,一个零和对策就给定了,零和对策又可称为矩阵对策并可简记成};,{21A S S G =。
例 2 设有一矩阵对策};,{21A S S G =,其中},,{3211ααα=S ,},,,{43212ββββ=S ,⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡----=16100610182142230612A从A 中可以看出,若局中人Ⅰ希望获得最大赢利30,需采取策略1α,但此时若局中人Ⅱ采取策略4β,局中人Ⅰ非但得不到30,反而会失去22。
为了稳妥,双方都应考虑到对方有使自己损失最大的动机,在最坏的可能中争取最好的结果,局中人Ⅰ采取策略321ααα、、时,最坏的赢得结果分别为22}22,30,6,12min{-=--2}10,18,2,14min{= 10}16,10,0,6min{-=--其中最好的可能为2}10,2,22max{=--。
如果局中人Ⅰ采取策略2α,无论局中人Ⅱ采取什么策略,局中人Ⅰ的赢得均不会少于2。
局中人Ⅱ采取各方案的最大损失为14}6,14,12max{=-,2}0,2,6max{=-,30}10,18,30max{=-,和16}16,10,22max{=-。
当局中人Ⅱ采取策略2β时,其损失不会超过2。
注意到在赢得矩阵中,2既是所在行中的最小元素又是所在列中的最大元素。
此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减少损失,称这样的局势为对策的一个稳定点或稳定解。
定义1 设),(y x f 为一个定义在A x ∈及B y ∈上的实值函数,如果存在A x ∈*,B y ∈*,使得对一切A x ∈和B y ∈,有)*,(*)*,(*),(y x f y x f y x f ≤≤则称*)*,(y x 为函数f 的一个鞍点。
定义 2 设};,{21A S S G =为矩阵对策,其中},,,{211m S ααα =,},,,{212n S βββ =,n m ij a A ⨯=)(。
若等式**m a x m i n m i n m a x j i ij ijij jia a a == (1)成立,记**j i G a V =,则称G V 为对策G 的值,称使(1)式成立的纯局势),(**j i βα为对策G 的鞍点或稳定解,赢得矩阵中与),(**j i βα相对应的元素**j i a 称为赢得矩阵的鞍点,*i α与*j β分别称为局中人Ⅰ与Ⅱ的最优纯策略。
给定一个对策G ,如何判断它是否具有鞍点呢?为了回答这一问题,先引入下面的极大极小原理。
定理 1 设},,{21A S S G =,记ij jia min max =μ,ij ija max min -=ν,则必有0≤+νμ。
证明 )(m i n m a xij ija -=ν,易见μ为Ⅰ的最小赢得,ν为Ⅱ的最小赢得,由于G 是零和对策,故0≤+νμ必成立。
定理2 零和对策G 具有稳定解的充要条件为0=+νμ。
证明:(充分性)由μ和ν的定义可知,存在一行(例如p 行)μ为p 行中的最小元素且存在一列(例如q 列)ν-为q 列中的最大元素。
故有μ≥pq a 且ν-≤pq a又因0=+νμ,所以νμ-=,从而得出μ=pq a ,pq a 为赢得矩阵的鞍点,),(q p βα为G 的稳定解。
(必要性)若G 具有稳定解),(q p βα,则pq a 为赢得矩阵的鞍点。
故有pq pj jij jia a a =≥=min min max μpq iq iij ija a a =≤=-max max min ν从而可得0≥+νμ,但根据定理1,0≤+νμ必成立,故必有0=+νμ。
上述定理给出了对策问题有稳定解(简称为解)的充要条件。
当对策问题有解时,其解可以不唯一,当解不唯一时,解之间的关系具有下面两条性质:性质 1 无差别性。
即若),(11j i βα与),(22j i βα是对策G 的两个解,则必有2211j i j i a a =性质2 可交换性。
即若),(11j i βα和),(22j i βα是对策G 的两个解,则),(21j i βα和),(12j i βα也是解。
§3 零和对策的混合策略具有稳定解的零和问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍点,任一局中人都不可能通过自己单方面的努力来改进结果。
然而,在实际遇到的零和对策中更典型的是0≠+νμ的情况。
由于赢得矩阵中不存在鞍点,此时在只使用纯策略的范围内,对策问题无解。
下面我们引进零和对策的混合策略。
设局中人Ⅰ用概率i x 选用策略i α,局中人Ⅱ用概率j y 选用策略j β,∑∑====m i nj ji yx 111,记T m x x X ),,(1 =,T n y y Y ),,(1 =,则局中人Ⅰ的期望赢得为AY X Y X E T=),(。
记*1S :策略 m αα,,1 *2S :策略 n ββ,,1 概率 m x x ,,1 概率 n y y ,,1 分别称*1S 与*2S 为局中人Ⅰ和Ⅱ的混合策略。
定义4 若存在m 维概率向量X 和n 维概率向量Y ,使得对一切m 维概率向量X 和n 维概率向量Y 有AY X Y A X Y A X T YT XT min max ==则称),(Y X 为混合策略对策问题的鞍点。
定理3 任意混合策略对策问题必存在鞍点,即必存在概率向量X 和Y ,使得:AY X AY X Y A X T XYT YXT max min min max ==。
使用纯策略的对策问题(具有稳定解的对策问题)可以看成使用混合策略的对策问题的特殊情况,相当于以概率1选取其中某一策略,以概率0选取其余策略。
例3 B A 、为作战双方,A 方拟派两架轰炸机Ⅰ和Ⅱ去轰炸B 方的指挥部,轰炸机Ⅰ在前面飞行,Ⅱ随后。
两架轰炸机中只有一架带有炸弹,而另一架仅为护航。
轰炸机飞至B 方上空,受到B 方战斗机的阻击。
若战斗机阻击后面的轰炸机Ⅱ,它仅受Ⅱ的射击,被击中的概率为0.3(Ⅰ来不及返回攻击它)。
若战斗机阻击Ⅰ,它将同时受到两架轰炸机的射击,被击中的概率为0.7。
一旦战斗机未被击落,它将以0.6的概率击毁其选中的轰炸机。
请为B A 、双方各选择一个最优策略,即:对于A 方应选择哪一架轰炸机装载炸弹?对于B 方战斗机应阻击哪一架轰炸机?解 双方可选择的策略集分别是},{21αα=A S ,1α:轰炸机Ⅰ装炸弹,Ⅱ护航2α:轰炸机Ⅱ装炸弹,Ⅰ护航},{21ββ=B S ,1β:阻击轰炸机Ⅰ2β:阻击轰炸机Ⅱ赢得矩阵22)(⨯=ij a R ,ij a 为A 方采取策略i α而B 方采取策略j β时,轰炸机轰炸B 方指挥部的概率,由题意可计算出:82.0)6.01(3.07.011=-+=a 112=a ,121=a58.0)6.01(7.03.022=-+=a即⎥⎦⎤⎢⎣⎡=58.01182.0R易求得82.0min max ==ij jia μ,1max min -=-=ij ija ν。