运筹学—对策论(一)
运筹学12-2对策论

3.矩阵对策的混合策略(续)
-- 优超原则:当局中人甲方的策略t被其它 策略所优超时,可在其赢得矩阵A中划去第t 行(同理,当局中人乙方的策略t被其它策 略所优超时,可在矩阵A中划去第t列)。 如此得到阶数较小的赢得矩阵A’,其对
应的矩阵对策
G’= { S1,S2,A’}与 G ={ S1,S2,A } 等价,即解相同。
17
再讨论“齐王赛马”
• “齐王赛马”的赢得矩阵A有 max min aij=-1 min max aij=3
i j j i
故需求混合策略,由于A中有非正元素, 可选k=2,令矩阵中每一元素加上k得到新的 正矩阵A’:
5 3 3 1 3 3 3 5 1 3 3 3 3 3 5 3 3 1 3 3 3 5 1 3 1 3 3 3 5 3 3 1 3 3 3 5
19
再讨论“齐王赛马”(续)
• 求乙方(田忌)最优策略的线性规划模型:
min Y1+Y2 +Y3 +Y4 +Y5 +Y6 s.t. 5Y1+3Y2 +3Y3 +3Y4 + Y5 +3Y6 1 3Y1+5Y2 +3Y3 +3Y4 +3Y5 + Y6 1 3Y1+ Y2 +5Y3 +3Y4 +3Y5 +3Y6 1 Y1+3Y2 +3Y3 +5Y4 +3Y5 +3Y6 1 3Y1+3Y2 +3Y3 + Y4 +5Y5 +3Y6 1 3Y1+3Y2 + Y3 +3Y4 +3Y5 +5Y6 1 Y1,Y2,Y3,Y4,Y5,Y6 0 可得两组解:(1/9,0,0,1/9,1/9,0)T, (1/18,1/18,1/18,1/18,1/18,1/18)T ,V’=3 于是,Y’=(1/3,0,0,1/3,1/3,0)T, Y’=(1/6,1/6,1/6,1/6,1/6,1/6)T V = V’-2 = 1 即田忌的最优混合策略值是输1千金
《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。
《运筹学》教材编写组《运筹学》笔记和课后习题(含考研真题)详解(对策论基础)

圣才电子书 十万种考研考证电子书、题库视频学习平台
(2)2× 或 ×2 对策的图解法
注意:该方法用在赢得矩阵为 2× 或 ×2 阶的对策上特别方便,也可用在 3× 或
×3 对策上。但对 和 均大于 3 的矩阵对策就丌适用了。
设缩减后的赢得矩阵为二阶无鞍点对策问题,局中人Ⅰ的混合策略为
的最优纯策略。 定理 1 矩阵对策 使得对一切
在纯策略意义下有解的充分必要条件是:存在纯局势
,均有
。
定义 2 设
为一个定义在
及
上的实值函数,如果存在
,使得对一切
和
,有
,则称
为
函数 的一个鞍点。 矩阵对策解的性质:
性质 1 无差别性。即若 性质 2 可交换性。即若
也是解。 定义 3 设有矩阵对策
记
是对策 G 的两个解,则
定理 11 设矩阵对策
的值为 ,则
6.矩阵对策的解法 (1)2×2 对策的公式法 所谓 2×2 对策是指局中人Ⅰ的赢得矩阵为 2×2 阶的,即
如果 A 有鞍点,则很快可求出各局中人的最优纯策略;如果 A 没有鞍点,为求最优混 合策略可求下列等式组:
上面等式组(Ⅰ)和(Ⅱ)一定有严格非负解
和
,其中
6 / 33
是对策 G 的两个解,则
和
,其中
,
,
则 和 分别称为局中人Ⅰ和Ⅱ的混的混合策略(或策略);对
,称
为一个混合局势(或局
势),局中人Ⅰ的赢得函数记成
这样得到的一个新的对策记成
,称 为对策 G 的混合扩充。
定义 4 设
是矩阵对策
的混合扩充,如果
3 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
对策论(Theory of Games)

定义
并不是所有的对策都存在鞍点,如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如:
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5,对策的解有两个,分 别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则:坏中求好的原则。 3、解的存在:一定有解 4、混合策略求解:利用期望转化成 线性规划问题求解。
三、矩阵对策模型
(一)矩阵对策的概念 (二)矩阵对策的最优纯策略 (三)矩阵对策的混合策略 (四)矩阵对策的解法
(一)矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义 局中人只有两个,对策中各方只能从有限 的策略集中确定性的选择一种,且对策双 方的支付之和为零的对策称为两人零和纯 策略对策。
表2
齐 王 上中 下 田忌 上中下 3 上下 中上 中 下 1 1 中下 上 -1 下中 上 1 下上 中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分,负者得 -1分,平手时各得0分。双方选定的各种 出法及相应的结果可由下表列出。双方 应取何种策略?
管理运筹学课件第13章-对策论

• 对策论基本概念 • 矩阵对策 • 连续对策 • 合作对策 • 非合作对策 • 对策论在实际问题中应用
01
对策论基本概念
对策论定义与特点
定义
对策论,又称博弈论,是研究决策过 程中理性决策者之间冲突与合作的数 学理论。
特点
对策论注重分析决策者之间的相互作 用和影响,以及决策结果的均衡性和 稳定性。
供应链管理
在供应链管理中,对策论可用于 协调供应商、制造商、销售商之 间的利益关系,优化供应链整体 效益。
金融市场投资决策
对策论可用于分析金融市场中的 投资决策问题,如股票交易、期 货交易等,帮助投资者制定最优 的投资策略。
军事领域应用案例
作战计划制定
01
对策论可用于分析敌我双方的作战能力和策略选择,帮助军事
指挥官制定最优的作战计划。
武器系统研发
02
在武器系统研发中,对策论可用于分析不同武器系统的性能优
劣和作战效能,为武器系统研发提供决策支持。
军事演习评估
03
对策论可用于评估军事演习的效果和参演部队的作战能力,为
军事训练提供改进建议。
社会领域应用案例
社会治安综合治理
对策论可用于分析社会治安问题中的各方利益关系和行为选择,提 出综合治理的策略和措施。
微分对策的求解方法
包括最大值原理、动态规划等方法。
连续对策求解方法
01
02
03
迭代法
通过不断迭代更新参与者 的策略,直到达到某个均 衡条件为止。
数值解法
利用数值计算的方法求解 连续对策的均衡解,如有 限差分法、有限元法等。
解析法
在某些特殊情况下,可以 通过解析的方法求解连续 对策的均衡解,如线性二 次型微分对策等。
运筹学博弈论简介

合作博弈
非合作博弈
二)按局中人数分 类:
二人博弈 多人博弈
三)按策略数分 类:
•有限策略博弈 •无限策略博弈
二人非合作博 弈是我们讨论的重 点。
非合作博弈的进一步分类
非合作博弈
非零和的四种博弈
零和博弈
也可以有纯策略和混合
– 纯策略博弈 策略博弈之分。
策略—前进或后退
支付函数
斗鸡B
前进 后退
前进 -3/-3 2/0
斗鸡A
后退 0/2 0/0
五、博弈论的典型例子
市场进入阻挠—二人非合作非零和纯策略博弈
局中人—在位者和进入者 策略—在位着:容忍或斗争;进入者:进入或不进入 支付函数—垄断利润300,寡头利润各50;进入成本10
进入 进入者
不进入
在位者 容忍 斗争
– 混合策略博弈
非零和博弈
动态时行动和策略
– 完全信息博弈 不同,要素有五个;而
静态博弈
静态时行动与策略不加
动态博弈
区别,要素有三个。
– 不完全信息博弈
静态博弈
动态博弈
四、博弈论发展史的要件
1944年,von Neumann and Oskar Morgenstern 发表专著 The Theory of Games and Economic Behavior创立了博弈论
2000 -40万 -40万 -40万
五、博弈论的典型例子
齐王赛马—二人非合作零和博弈
局中人—齐王和田忌 策略—上中下三种等级的马的组合 ,比三
次,有六组策略:(上,中,下)、 (中,上, 下)、 (上,下,中)、 (中,下,上)、 (下, 上,中)、 (下,中,上)
精心整理的运筹学重点10.对策论

v1 = max min(3 − 2 x, 2 + 2 x) , v1 = max min(3 − 2 x, 2 + 2 x) 就是折线 ABC,它是局 0≤ x ≤1 0≤ x ≤1
中人 I 的最小赢得线,B 就是折线 ABC 的最高点,所以 B 点所对应的值就是混合策略意 义下的最大最小值。
i j j i
3.无鞍点的两人有限零和对策求解 X = ( x1 , x2 ,..., xm )T 为局中人 I 的混合策略,
Y = ( y1 , y 2 ,..., yn )
T
∑ x = 1 为局中人 II 的混合策略, ∑ y = 1 , ( X , Y ) 称为混合局势。
i i
最优混合策略求解方法 y1 y2
第十章 对策论 1.对策论类型 1)根据局中人个数:二人对策、多人对策 2)根据局中人间是否允许合作:合作对策、非合作对策 3)根据局中人的策略集中的策略个数:有限对策、无限对策 4)根据各局中人的赢得函数的代数和是否为零:零和对策、非零和对策 5)根据策略的选择是否与时间推移有关:静态对策、动态对策 6)根据对策中各局中人所拥有的有关决策信息:完全信息对策、不完全信息对策 7)根据对策模型的数学特征:矩阵对策、连续对策、微分对策、随机对策 矩阵对策:又称为二人有限零和对策。 2.有鞍点的两人有限零和对策求解 G = {S1, S2 , A} 求解: maxmin{aij } = V1,minmax{aij } = V2
x1 a11 x2 a21
矩阵对策求解方法
有
a12 a22
有无鞍点?
无 是
获得
2*n 或 m*2 矩阵
否
图解
高级运筹学(博弈论书稿)-周晶

第章博弈论(对策论)第一节引言1.1博弈行为和博弈论在日常生活中,经常会看到一些相互之间具有斗争或竞争性质的行为。
譬如,两个人下棋,任何一个人在走某一步之前,都需要考虑对方是怎么走的,以及对方在他走了一步之后会怎么走,以至无穷。
高手与俗手的区别往往就在于高手能够考虑10步甚至20步以后的变化,最终的输赢不仅取决于你的决策,而且取决于你对手的决策,这就是博弈。
博弈与决策的根本区别在于是否考虑对方的行为,具有竞争或对抗性质的行为称为博弈行为。
在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益。
为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。
比如战争活动中的双方,都力图选取对自己最有利的策略,千方百计去战胜对方;还比如在政治方面,国际间的谈判、各种政治力量间的较量、各国际集团之间的角逐等都无一不具有对抗性质;在经济活动中,各国之间、各公司企业之间的经济谈判,企业之间为争夺市场而进行的竞争等,举不胜举。
博弈论(game theory),就是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的理论与方法,即研究博弈行为中竞争各方是否存在着最合理行动方案,以及如何找到最合理行动方案的数学理论和方法。
也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。
博弈论应是一种分析问题的方法,它被设计用来帮助我们理解所观察到的决策主体相互作用时的现象,其应用范围涉及经济学、政治学、犯罪学、军事、外交、国际关系、公共选择等各个领域。
博弈论思想的主要特征是各参与人所实施的行为方案(策略)相互依存,各方在冲突或合作后所实现的损益得失结果不仅取决于自己所采取的行为方案,同时也依赖于其他参与方所实施的行为方案,是各参与方行为方案组合的函数。
所以,博弈论在我国也被称为“对策论”。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当局中人,策略,赢得函数三个因素确定后,一 个对策模型也就给定了。
三﹑对策的分类 联合对策
结 静 盟 合作对策
态对
二人
对 策有
策
限
不
多人
对
结
策
盟
从各自可能出现的最不利的情形中选择一种最为有利的 情形作为决策的依据。
②选择原则:局中人Ⅰ按最大最小原则,局中人Ⅱ按最
小最大原则。即局中人Ⅰ从所有最小的赢得中选择最
大的赢得的策略,局中人Ⅱ从所有最大的损失中选择 最小的损失的策略。
例1 设有一矩阵G={S1 , S2;A},其中S1={α1,α2, α2, α4}和S2={ β 1, β 2, β 3} 局中人Ⅰ的赢得矩阵为
总之,局中人Ⅰ﹑Ⅱ的最优察纯策略分别为α2 ,β 2。
5﹒矩阵对策的解 定义1 设G={S1 , S2;A}为矩阵对策,其中
S1={α1,α2, …,αm},S2={ β 1, β 2, …, β n} , A=(aij)m×n
若等式
max
i
min
j
aij=minj
max
i
aij
=ai*j*
成立,记VG= ai*j* 。则称VG为对策G的值,称上 述等式成立的纯局势( α i* , β j* )为G在纯策略下的 解(或平衡局势), α i*与β j*分别称为局中人Ⅰ﹑Ⅱ 的最优纯策略。
⑷经济—各国之间,各公司企业之间的各种经济 谈判,企业之间为争夺市场而进行的竞争。
2﹒对策论
对策论是研究对策行为中斗争各方是否存在着最 合理的行动方案,以及如何找到这个合理的行动方案 的数学理论和方法。对策论也称为竞赛论或博奕论。
经典的对策论研究的例子:“齐王賽马”
战国时期,齐王有一天提出要与田忌进行賽马。 双方约定:从各自的上中下三个等级马中各选一匹参 赛,每匹均只能参赛一次,每次比赛双方各出一匹马, 负者要付给胜者千金。已知:在同等级的马中,田忌 的马不如齐王的马,而如果田忌的马比齐王的马高一 等级,则田忌的马可取胜。 双方如何取胜?
﹣6 1 ﹣8
A=
32 4 9 ﹣2 ﹣10
求出局中人Ⅰ﹑Ⅱ的最优策略。
﹣3 0 6
例1 设有一矩阵G={S1 , S2;A},其中S1={α1,α2, α2, α4}和S2={ β 1, β 2, β 3} 局中人Ⅰ的赢得矩阵为
﹣6 1 ﹣8
A=
32 4 9 ﹣2 ﹣10
求出局中人Ⅰ﹑Ⅱ的最优策略。
3﹒矩阵对策模型
设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略 集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记 局中人Ⅰ对任一局势( αi, β j )的赢得值为aij,并称
a11 a12 …a1n A= . . … .
am1 am2 …amn
为局中人Ⅰ的赢得矩阵。
﹣3 0 6
解:根据选择的原则,分析局中人的选择的策略
⑴局中人Ⅰ的策略:纯策略α1,α2, α2, α4可能带来的最 小赢得分别﹣8,2,﹣10,﹣3 所以,最小赢
得中最大的值为2。因此局中人Ⅰ的策略应为α2 ⑵局中人Ⅱ的策略:纯策略β 1, β 2, β 3可能带来的最大
损失分别9,2,6 。 所以,最大损失中最小的值为2。 因此局中人Ⅱ的策略应为β 2 。
设Ⅰ﹑Ⅱ分别表示两个局中人,且它们的纯策略
集分别为S1={α1,α2, …,αm}和S2={ β 1, β 2, …, β n}。记局
中人Ⅰ对任一纯局势( a11 a12 …a1n
αi,
β
j
)的赢得值为aij,并称
A= . . … . 为局中人Ⅰ的赢得矩阵。
am1 am2 …amn
局中人Ⅱ的赢得矩阵为﹣A。
对
二人
动 策无
态
限
ቤተ መጻሕፍቲ ባይዱ
对 策
微分对策等
多人
重点
零和
学习
的对
非零和 策。
零和
非零和 零和
非零和
零和
非零和
§2矩阵对策的基本定理 一﹑矩阵对策的数学模型
1﹒二人有限零和对策: 是指有两个参加对策的局中人, 每个局中人都只有有限个策略可供选择,在任一局势 下,两个局中人的赢得之和总等于零。
2﹒矩阵对策:就是二人有限零和对策。 3﹒矩阵对策模型
②在对策中总是假定每一个局中人都是“理智 的”决策者或竞争者。即对任一局中人来讲,不存 在利用其它局中人决策的失误来扩大自身利益的可
2﹒策略集
策略
一局对策中,可供局中人选择的一个实际可行 的完整的行动方案,称为一个对策。
策略集
设i为局中人,i的所有策略构成的集合Si称为i的 策略集。
如:在“齐王赛马”中,如果用(上,中,下) 表示以上马﹑中马﹑下马依次参赛这样一个次序,这 就是一个完整的行动方案,即为一个策略。
3﹒赢得函数
局势: 在一局对策中,各局中人所选定的策略形 成的策略组称为一个局势。即若设si是第i个局中人的 一个策略,则n个局中人的策略组s={s1, s2,…, sn} 就是一个局势。
全体局势的集合S可用各局中人策略集的笛卡尔 乘积表示,即S=S1× S2×… × Sn
赢得函数:当局势出现后,对策的结果也就确定 了。也就是说,对任一局势s∈S,局中人i可以得到 一个赢得Hi(s)。
定理的直观解释:如果ai*j*既是矩阵A=(aij)m×n中 第i*行的最小值,又是第j*列的最大值,则ai*j*是对策 的值,且(α i* , β j* )是在纯策略意义下的解。
定理的对策意义:一个平衡局势(α i* , β j* )具有 这样的性质,当局中人Ⅰ 选择了纯策略α i* 后,局中 人Ⅱ为了其所失 最小,只能选择β j* ,否则就可能失 去更多;反之,当局中人Ⅱ 选择了纯策略β j* 后,局 中人Ⅰ为了得到 最大的赢得,只能选择α i* ,否则就 会赢得更少 。双方在局势(α i* , β j* )下达到一个平衡 状态。
根据定义1可知,例1中( α 2 , β2 )是在纯策略 下的解。对策值VG=a22=2 ,i*=2,j*=2 。
定理1 矩阵对策G={S1 , S2;A}在纯策略意义下有解 的充要条件是:存在纯局势( α i* , β j* )使得对一切 i=1,2, …,m, j=1,2, …,n, 均有aij*≤ ai*j* ≤ ai*j 。
根据条件可看出,两人各采取什么的样出马顺序 对胜负是至关重要的。
二﹑对策行为的三个基本要素
1﹒局中人 在一个对策行为中,有权决定自己行动方案的
对策参加者,称为局中人。通常用I表示局中人的集 合。如果n个局中人,则I={1,2,…,n}。
说明:
①对策中关于局中人的概念是具有广义性的。 局中人除了可理解为个人外,还可以理解为一集体, 如球队﹑交战国﹑企业等,以及研究自然界中某个 现象时,可把这个现象看成一个局中人。
运筹学—对策论(一)
§1对策论的基本概念 一﹑对策行为和对策论
1﹒对策行为: 具有竞争或对抗性质的行为称为对 策行为。 对策行为的实例:
⑴下棋﹑打牌﹑体育比赛等。
⑵战争—在战争活动中的双方,都力图选取对自 己最为有利的策略,千方百计去战胜对手。
⑶政治—国际的谈判,各种政治力量之间的斗争, 各国际集团之间的斗争等都具有斗争的性质。
由于假定对策为零和,所以局中人Ⅱ的赢得矩阵
为﹣A。
当局中人Ⅰ﹑Ⅱ和策略集S1 ﹑ S2及局中人Ⅰ的赢 得矩阵A确定后,一个矩阵对策就确定了。
通常,将矩阵对策记成G={Ⅰ,Ⅱ;S1 , S2;A} 或G={S1 , S2;A} 。
4﹒局中人如何选取对自己最有利的纯策略? ①局中人的“理智行 双方都不想冒险,都不存在侥 为幸”心:理,而是考虑到对方必然会设法使自己的所得最小,
定理1的一个等价命题:
定义2 设f(x,y)为一个定义在x∈A ,y∈B上的实值 函数,如果存在x* ∈A,y* ∈B,使得对一切x∈A ,y∈B, 有f(x,y*) ≤f(x*,y*) ≤ f(x*,y) , 则称(x*,y*) 为函数f(x,y) 的一个鞍点。
定理1的等价命题:矩阵对策G在纯策略意义下有 解,且VG=ai*j*的充要条件是: ai*j*是矩阵A的一个鞍 点(也称为对策的鞍点)。
显然, Hi(s)是局势s的函数,称之为第i局中人的 赢得函数。
如:在“齐王赛马”中,局中人集合I={1,2}, 齐王和田忌的策略集可分别用S1={α1, α2, α3 , α4 , α5 , α6}和S2={β1 ,β 2, β 3 , β 4 , β 5 , β 6}表示。 这样,齐王的一个策略αi和田忌的一个策略β j就决定 了一个局势sij 。 如果α1 =(上,中,下), β 1 =(上, 中,下),则在局势s11下齐王的赢得值H1(s11)=3,田 忌的赢得值H2(s11)=﹣3。