运筹学资料：11对策论

合集下载

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法，主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统，不考虑时间变化和过程发展，只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境，如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述对策模型对策论的基本概念对策分析方法对策论的应用实例对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论，也称为博弈论，是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡，通过数学模型和逻辑推理来描述和分析竞争行为，尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择，例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下，企业间可能通过对策论的方法找到合作的可能性，例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面，对策论可以帮助理解个体和团队的行为反应，优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中，参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划，它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中，参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中，如果一个参与者的某个策略能够使其获得比其他参与者更好的结果，则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

运筹学_对策论

第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混合扩充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充： *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混合扩充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超算例
• 线性规划方法
基本思想算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} ， A 是 m n 的矩阵，如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注：局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

运筹学对策论

第六章对
策
论
第一节对策论的基本概念
第二节矩阵对策第三节矩阵对策的解法
第一节对策论的基本概念
一、简例
二、对策问题的数学模型三、对策问题的分类四、均衡的意义
一、简例
例1 战国时期，齐王与大夫田忌每年要赛马，双方约定：每方出上、中、下三个等级的马各1匹，每匹马都参赛一次，共赛3次。每次赛后，负者要付给胜者千金。当时的情况是，在各个等级的马中，齐王的马都稍强于田忌的马。每次赛马，田忌经常要输三千金。有一次，田忌的谋士孙膑出了个主意：让田忌用下等马对齐王的上等马，用中等马对齐王的下等马，用上等马对齐王的中等马。这样，比赛结果田忌一负两胜，反而赢得了一千金。由此可见，掌握准确的信息，制定正确的行动方案是制胜的关键。在现实生活中，例如乒乓球团体赛，选手的排序不同，往往导致比赛的结果不同。在各种冲突的现象中，参与者如何决策是关系重大的问题。
一、简例
例2 Von Neumann根据福尔摩斯探案中的情节，略加修改，把对策论的精神融会其中，使大侦探与巨盗的斗争，更加引人入胜。大侦探福尔摩斯严重妨碍了当时邪恶势力的头子莫里亚蒂。此人诡计多端，心黑手狠，多次扬言要对福尔摩斯下毒手。风声传到福尔摩斯耳朵里，他感到，当时自己势孤力单，“三十六计，走为上计”，决定暂时离开英国，福尔摩斯匆忙上了从伦敦到多佛尔的火车。从车窗里，他突然发现莫里亚蒂也在站台上，并且觉察到对手已发现他坐在火车里，火车正要开动，下车躲避已不可能。福尔摩斯在火车里，紧张地盘算着对策。从伦敦到多佛尔，火车只停靠一个中间站坎特伯雷，他是否要在那里下车，中途脱逃呢？另一方面，莫里亚蒂分析问题的本领毫不逊色于福尔摩斯，他当然会考虑到福尔摩斯中途是否会下车。两人各自应该采取怎样的对策才更有利于自己？这些问题都是对策论所要研究的。

运筹学教材习题答案详解

3
B1：2.0
3
需要量（套）
200
150
问怎样下料使得（1）用料最少；（2）余料最少．
【解】第一步：求下料方案，见下表。
方案
一
二
三
四
五
六
七
八
九
十
十一
十二
十三
十四
需要量
B1:2.7m
2
1
1
1
0
0
0
0
0
0
0
0
0
0
300
B2:2m
0
1
0
0
3
2
2
1
1
1
0
0
0
0
450
A1:1.7m
0
0
1
0
0
1
0
2
1
0
3
2
1
0
(2)
【解】最优解X＝（3/4，7/2）；最优值Z=－45/4
(3)
【解】最优解X＝（4，1）；最优值Z=－10
(4)
【解】最优解X＝（3/2，1/4）；最优值Z=7/4
(5) 【解】最优解X＝（3，0）；最优值Z=3
(6)
【解】无界解。
(7)
【解】无可行解。
(8)
【解】最优解X＝（2，4）；最优值Z=13
【解】设x1、x2、x3分别为产品A、B、C的产量，则数学模型为
1.3建筑公司需要用6m长的塑钢材料制作A、B两种型号的窗架．两种窗架所需材料规格及数量如表1－23所示：
表1－23窗架所需材料规格及数量
型号A
型号B
每套窗架需要材料
长度（m）

运筹学--对策论 PPT

当盟军获悉此情报后，盟军统帅麦克阿梭命令太平洋战区空军司令肯尼将军组织空中打击。
日本统帅山本五十六大将心里很明白：在日本舰队穿过俾斯麦海的三天航行中，不可能躲开盟军的空中打击，他要策划的是尽可能减少损失。
日美双方的指挥官及参谋人员都进行了冷静的思考与全面的谋划。
自然条件对于双方都是已知的。基本情况如下：从蜡包尔出发开往莱城的海上航线有南北两条。通过时间均为3天。
案例中，肯尼将军与山本五十六大将的赢得（支付）函数都可以用矩阵A、B表示。
（盟军）北线南线
（日军）北线南线
（日军）
北线
南线
22 =A1源自3（盟军）北线
南线
-2
-2 =B
-1
-3
在本例中的每一个对局，双方的赢得的代数之和为零，这样的对策称为“有限零和二人对策”
设两个局中人为I，II，局中人I有 m 个策略：1、 2… m ；用S1表示这些策略的集合：
max min aij
i
j
同样，局中人II可以保证局中人I的赢得不超过
min max aij
j
i
案例中局中人I（盟军）应当选择（北线）策略1，这样能保证赢得2。局中人II（日军）应当选择（北线）策略1 使盟军赢得不超过2。实际上，在（ 1， 1）局势下，有
max min aij= min max aij
局势3：盟军的侦察机重点搜索南线，而日本舰队走北线。由于发现晚、盟军的轰炸机群在南线，以及北线气候恶劣，故有效轰炸只有一天。
局势4：盟军的侦察机重点搜索南线，日本舰队也恰好走南线。此时日本舰队迅速被发现，盟军的轰炸机群所需航程很短，加上天气晴好，有效轰炸时间三天。

高级运筹学（博弈论书稿）-周晶

第章博弈论(对策论)第一节引言1.1博弈行为和博弈论在日常生活中，经常会看到一些相互之间具有斗争或竞争性质的行为。

譬如，两个人下棋，任何一个人在走某一步之前，都需要考虑对方是怎么走的，以及对方在他走了一步之后会怎么走，以至无穷。

高手与俗手的区别往往就在于高手能够考虑10步甚至20步以后的变化，最终的输赢不仅取决于你的决策，而且取决于你对手的决策，这就是博弈。

博弈与决策的根本区别在于是否考虑对方的行为，具有竞争或对抗性质的行为称为博弈行为。

在这类行为中，参加斗争或竞争的各方各自具有不同的目标和利益。

为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最有利或最合理的方案。

比如战争活动中的双方，都力图选取对自己最有利的策略，千方百计去战胜对方；还比如在政治方面，国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性质；在经济活动中，各国之间、各公司企业之间的经济谈判，企业之间为争夺市场而进行的竞争等，举不胜举。

博弈论(game theory)，就是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法，即研究博弈行为中竞争各方是否存在着最合理行动方案，以及如何找到最合理行动方案的数学理论和方法。

也就是说，当一个主体，好比说一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。

博弈论应是一种分析问题的方法，它被设计用来帮助我们理解所观察到的决策主体相互作用时的现象，其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选择等各个领域。

博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存，各方在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案，同时也依赖于其他参与方所实施的行为方案，是各参与方行为方案组合的函数。

所以，博弈论在我国也被称为“对策论”。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

局中人称为“i旳对手”，记为-i。
对策中利益一致旳参加者只能看成一种局中人，例：桥牌中旳东、西两方。对策论中对局中人旳一种主要假设：每个局中人都是“理智旳”，即每一种局中人都不存在侥幸心理，不存在利用其他局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中，一种对策有下列几种基本要素：一．局中人二．策略(strategies)：
-1
1
布
1
0
-1
剪刀
-1
1
0
第三节矩阵对策旳纯策略
例：设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解：对局中人I而言，最大赢得是9，若想得到这个赢得，
他要选择纯策略，3因为局中人II也是理智旳竞争者，他已考虑到局中人I打算出旳3心理，则准备以 3对付之，使局中人I不但得不到9，反而失掉10. 局中人I当然也会猜到局中人II旳心理，故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人：参加对策旳局中人有两个；
有限：局中人旳策略集都为有限集；
零和：在任一局势下，两个局中人旳赢得之和总等于0，即，
一种局中人旳所得值恰好是另一种局中人旳所失值，双方旳利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学--对策论

max min E(X,Y)= min max E(X,Y)
X S1* Y S2*
Y S2* X S1*
则称这个公共值为对策G在混合意义下的值，记为V*G，而达到V*G 的混合局势（X*，Y*）称为对策G在混合策略意义下的解，而X*和Y*分别称为局中人I，II的最优混合策略。
定理14-2：矩阵对策 G = S1，S2；A
0 2 3 0
赢得矩阵为 A 2 0 3 0
0
3
0 4
0
3
4
0
14.2 矩阵对策的混合策略
定义:对给定的矩阵对策
G = Ⅰ，Ⅱ；S1,S2;A
其中 S1= 1, 2…m
S2= 1 , 2… n
A=(aij)mn
把纯策略集合对应的概率向量
X=(x1, x2 … xm) 其中 xi 0 xi=1 和 Y=(y1 , y2 … yn ) 其中 yj 0 yj=1
分别称为局中人I和局中人II的混合策略。
如果局中人I选取的策略为
X=(x1, x2 … xm) 局中人II选取的策略为
Y=(y1 , y2 … yn )，则期望值 E（X，Y）= xi aij yj=XAYT 称为局中人I期望赢得，而局势（X，Y）称为“混合局势”，局中人I，II的混合策略集合记为S1*， S2*。
S1= 1、 2…… m
同样，局中人II有n个策略：1、 2。。。 n ；用S2表示这些策略的集合： S2= 1、 2… n 局中人I的赢得矩阵是：
a11 a12 …… a1n a21 a22 …… a2n A= …… …… …… a m1 a m2 … a mn
局中人II的赢得矩阵是 -A 把一个对策记为G： G= S1，S2；A

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

方的益损值为-aij（零和性质）。
第二节矩阵对策的最优纯策略
•
3
A
2
2
0 3 4
2 0 1
0 1 4
min -3 0
-4
max max min aij= 0 0 ij
max 2 3 0 4
min 0
min max aij= 0
ji
max min aij = min max aij = v
ij

aij
求解混合策略。
第三节矩阵对策的混合策略
思路：对甲给出一个选取不同策略的概率分布，以使甲在各种情况下的平均赢得最多。
对乙给出一个选取不同策略的概率分布，以使乙在各种情况下的平均损失最少。 -----即混合策略
第三节矩阵对策的混合策略
• 线性规划法 •
A
5 8
9 6
• 1)设甲使用策略1的概率为X1′ • 设甲使用策略2的概率为X2′
第三节矩阵对策的混合策略
-- 优超原则：当局中人甲方的策略t被其它策略所优
超时，可在其赢得矩阵A中划去第t行（同理，当局中人乙方的策略t被其它策略所优超时，可在矩阵 A中划去第t列）。
如此得到阶数较小的赢得矩阵A’，其对应的矩阵对策 G’= { S1,S2,A’}与 G ={ S1,S2,A }等价，即解相同。
X*’= (0，0，1/3 ，2/3 ，0)T 乙： Y* = (1/10，1/10，0，0，0)T V=5
于是甲的最优混合策略为：
以1/3的概率选1；以2/3的概率选2 最优值V=7.
第三节矩阵对策的混合策略
• 同样可求乙的最优混合策略： • 设乙使用策略1的概率为Y1′ Y1′+Y2′=1
设乙使用策略2的概率为Y2′ Y1′,Y2′0
• 设在最坏的情况下，甲赢得的平均值为V. 这也是乙损失的平均值，越小越好
• X1′+X2′=1 • X1′,X2′0
设在最坏的情况下，甲赢得的平均值为V. （未知）
第三节矩阵对策的混合策略
2)无论乙取何策略，甲的平均赢得应不少于V:
• 对乙取1：5X1’+ 8X2’V • 对乙取2：9X1’+ 6X2’V • 注意 V>0,因为A各元素为正。
3) 作变换： X1 =X1’/V ; X2= X2’/V • 上述关系式=变为：
第三节矩阵对策的混合策略
• 优超原则：假设矩阵对策 G ={ S1,S2,A } 甲方赢得矩阵 A=[aij]mn
-- 若存在两行，s 行的各元素均优于 t 行的元素，即asjatj j=1,2…n 称甲方策略s优超于t
--若存在两列，s 列的各元素均优于 t 列的元素，即ais ait i=1,2…m称乙方策略s优超于t
第一节对策论的基本概念
二二人有限零和对策：（又称矩阵对策） ➢ 局中人为2； ➢ 每局中人的策略集中策略数目有限； ➢ 每一局势的对策均有确定的损益值，并且对同
一局势的两个局中人的益损值之和为零。 ➢ 矩阵对策记法
G = {S1, S2, A}
甲的策略集
乙的策略集
甲的赢得矩阵
“齐王赛马”齐王在各局势中的益损值表（单位：千金）
作变换： Y1= Y1’/V • 建立线性模型：
max Y1+Y2 s.t. 5Y1+9Y21
8Y1+6Y21 Y1, Y20
; Y2= Y2’/V
Y1= 1/14 Y2= 1/14 1/V= Y1+Y2=1/7 所以：V=7
• 返回原问题： Y1’= Y1V= 1/2 Y2’= Y2V= 1/2
ji
称（ 2 ，3 ）为对策G={s1,s2,A} 的鞍点。值V为G的值。
第三节矩阵对策的混合策略
一个赢得矩阵如下: min
5 9 5 max A 8 6 6 6
max 8 9 min 8
max min aij= 6
ij
min max aij= 8
ji
max i
min j
aij
min j
max i
乙的最优混合策略为：以1/2的概率选1；以1/2的概率选2 最优值V=7.
• 当赢得矩阵中有非正元素时，V0的条件不一定成立，可以作下列变换：选一正数k，令矩阵中每一元素加上k得到新的正矩阵 A’，其对应的矩阵对策 G’= { S1,S2,A’}与 G ={ S1,S2,A } 解相同，但VG = VG’ - k
A
2
3
0 1
2，3；乙有四个策
2 4 1 4
略1，2，3，4，在甲方赢得矩阵中：
根据获利情况建立甲 A=[aij]m*n
方的赢得矩阵。 i行代表甲方策略 i=1,2…m j列代表乙方策略 j=1,2…n
• 问：甲公司应采取什aij代表甲方取策略i,乙方取策略j,
么策略比较适合？这一局势下甲方的益损值，此时乙
第十一章对策论第一节对策论的基本概念 • 一三个基本要素； • 1.局中人：参与对抗的各方； • 2.策略集： • 策略：局中人选择对付其它局中人的行动方案称为策略。
策略集：某局中人的所有可能策略全体称为策略集。
3.局势对策的益损值：
局中人各自使用一个对策就形成一个局势
一个局势决定了各局中人的对策结果称为该局势对策的益损值）
第三节矩阵对策的混合策略
• 例设甲方的益损值赢得矩阵。
32030 50259 A= 7 3 9 5 9 4 6 8 7 5.5 60883
被第1列优超
73959 A= 4 6 8 7 5.5
60883
被第3、4行优超被第3行优超
A
7 4
3 6
被第2列优超
第三节矩阵对策的混合策略
• 用线性规划方法得到：（注意：余下的策略为3，4，1，2）甲： X* = (0，0，1/15，2/15，0)T V=5
X1+ X2=1/V 5X1+ 8X21 9X1+ 6X21 X1, X20
(V愈大愈好）待定
第三节矩阵对策的混合策略
• 建立线性模型：
min X1+X2 s.t. 5X1+8X21
9X1+6X21 X1, X20
X1= 1/21 X2= 2/21 1/V= X1+X2=1/7 所以：V=7
返回原问题： X1’= X1V= 1/3 X2’= X2V= 2/3
齐王的策略集: S1={1,2,3,4,5,6}
上，中，下上，下，中
中，上，下
中，下。上
下，上，中
下，中，上
田忌的策略集：S1={1,2,3,4,5,6}
上，中，下上，下，中中，上，下
中，下。上下，上，中下，中，上
第二节矩阵对策的最优纯策略
• 例：有交易双方甲和
3 0 2 0
乙，甲有三个策略1，