运筹学12-2对策论

合集下载

《管理运筹学-对策论》

《管理运筹学-对策论》

博弈与均衡
04
对策分析方法
CHAPTER
VS
静态分析法是一种不考虑时间因素的分析方法,主要适用于解决一次性决策问题。
详细描述
静态分析法将问题视为一个静态系统,不考虑时间变化和过程发展,只关注决策变量的当前状态和最优解。这种方法适用于确定性和静态的环境,如线性规划、整数规划等。
总结词
静态分析法
总结词
《管理运筹学-对策论》
目录
对策论概述 对策模型 对策论的基本概念 对策分析方法 对策论的应用实例 对策论的未来发展
CONTENTS
01
对策论概述
CHAPTER
对策论,也称为博弈论,是研究决策主体在相互竞争、相互依存的环境中如何进行策略选择和行动的学科。
对策论强调理性、优化和均衡,通过数学模型和逻辑推理来描述和分析竞争行为,尤其关注在不确定性和信息不对称情况下的决策问题。
对策论的定义与特点
特点
定义
竞争策略分析
对策论可以用于分析企业或组织在市场竞争中的策略选择,例如定价策略、产品差异化、市场份额争夺等。
合作协议
在某些情况下,企业间可能通过对策论的方法找到合作的可能性,例如供应链协调、合作研发等。
人力资源决策
在招聘、晋升、激励设计等方面,对策论可以帮助理解个体和团队的行为反应,优化人力资源决策。
03
对策论的基本概念
CHAPTER
策略与行动
策略
在对策中,参与者为达到目标所采取的行动方案。策略是完整的、具体的行动计划,它规定了参与者在所有可能情况下应采取的行动。
行动
在对策中,参与者实际采取的行动。行动是实现策略的具体行为或决策。
在对策中,如果一个参与者的某个策略能够使其获得比其他参与者更好的结果,则称该策略为优势策略。优势策略是相对于其他参与者的策略而言的。

运筹学_对策论

运筹学_对策论
第17页
混合策略
• 混合扩充
矩阵对策扩充 N人有限对策
• 混合平衡解
矩阵对策 N人有限对策
• 均衡解的存在性
第18页
混 合 扩 充—矩阵对策
策略集
m
S * 1
{X
( x1 , x2 ,..., xm )
xi 1, xi 0, i 1,2,..., m}
i 1
nS* 2{Y( y1 ,y2 ,...,
yn )
y j 1, y j 0, j 1,2,..., n}
j 1
支付函数
mn
E( X ,Y )
aij xi y j
i1 j1
混合扩充: *
{
S1*
,
S
* 2
,
E
(
x
,
y),
x
S1* ,
y
S
* 2
}
第19页
混 合 扩 充—N人有限对策
N 人有限对策 I {1,2,..., N }, Si , i I , H i (s), i I
• 定理1 N人有限对策的混合扩充存在平衡局势. • 定理2 矩阵对策的混合扩充存在平衡局势.
第23页
矩阵对策的解法
• 问题的简化
优超 算例
• 线性规划方法
基本思想 算例
第24页
优超
给定矩阵对策 {S1 , S2 , A} , A 是 m n 的矩阵,如果
akj alj , j 1,2,..., n
则称局中人 1 的策略 k 优超于策略 l。如果
aik ail , i 1,2,..., m
则称局中人 2 的策略 k 优超于策略 l。
注:局中人 1 的策略 k 优超于策略 l 则说明对局中人 1

运筹学--第十二章 对策论

运筹学--第十二章 对策论

12.1 A、B两人各有1元、5角和1角的硬币各一枚。

在双方互不知道的情况下各出一枚硬币,并规定当和为奇数时,A赢得B所出硬币;当和为偶数时,B赢得A所出硬币。

试据此列出二人零和对策的模型,并说明该项游戏对双方是否公平合理。

12.2A、B两人在互不知道的情况下,各自在纸上写﹛-1,0,1﹜三个数字中的任意一个。

设A所写数字为s,B所写数字为t,答案公布后B付给A的钱为〔s(t-s)+t(t+s)〕元。

试列出此问题对A的支付矩阵,并说明该游戏对双方是否公平合理。

12.3 已知A、B两人对策时对A的赢得矩阵如下,求双方各自的最优策略及对策值。

(1)2 1 4 (2)―3 -2 6 2 0 3 2 0 2 -1 -2 0 5 -2 -412.4 在下列矩阵(a ij)3×3中确定p和q的取值范围,使得该矩阵在元素a22处存在鞍点。

(1) 1 q 6 (2) 2 4 5p 5 10 10 7 q6 2 3 4 p 612.5 A和B进行一种游戏。

A先在横坐标x轴的〔0,1〕区间内任选一个数,但不让B知道,然后B在纵坐标y的〔0,1〕区间内任选一个数。

双方选定后,B对A的支付为p(x,y)=0.5y2-2x2-2xy+3.5x+1.25y求A、B各自的最优策略及对策值。

12.6 证明下列矩阵对策具有纯策略解(其中字母为任意实数)(1) a b (2) a e a e a e a ec d b f b f f b f ba d c g g c c g g cc b12.7 下列矩阵为A、B对策时A的赢得矩阵,先尽可能按优超原则简化,再用图解法求A,B各自的最优策略及对策值。

(1)-3 3 0 2 (2) 2 4 0 -2-4 -1 2 -2 4 8 2 61 1 -2 0 -2 0 4 20 -1 3 -1 -4 -2 -2 012.8 用线性规划方法求解下列对策问题:(1) 3 -1 -3 (2)―1 2 1-3 3 -1 1 -2 2-4 -3 3 3 4 -330630712.9每行与每列均包含有整数1,…,m 的m ×m 矩阵称为拉丁方。

运筹学-对策论

运筹学-对策论

3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5 A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略α2
8 策略β1
• 思路:对甲(乙)给出一个选取不同策 略的概率分布,以使甲(乙)在各种情 况下的平均赢得(损失)最多(最少)。 -----即混合策略
重要定理
定理 任一矩阵对策G {S1,S2;A}, 任一矩阵对策G={S1,S2;A},一定存在混 合策略意义下的解。 合策略意义下的解。 • 定理 设有两个矩阵对策 • G1= G2= G1={S1,S2;A1} G2={S1,S2;A2} • 其中A1=(aij),A2=(aij+L),L为任一常数。 A1= 其中A1 (aij),A2=(aij+L), 为任一常数。 则 • (1)G1 G2同解 G1与 同解; (1)G1与G2同解; • (2)VG2 VG2= (2)VG2=VG1+L
7.4 矩阵对策的解法
• (1) 2×2矩阵对策的线性方程组法 2× • 所谓2 所谓2×2矩阵对策是指局中人Ⅰ的赢得矩阵为2×2阶的,即 矩阵对策是指局中人Ⅰ的赢得矩阵为2 是指局中人 阶的, A = a11 a12 • a21 a22 • 如果此对策有纯策略意义下的解,则很容易求解; 如果此对策有纯策略意义下的解,则很容易求解;如果没有 纯策略意义下的解, 纯策略意义下的解,则为求出各局中人的最优混合策略可求解下 列方程组: 列方程组: • a11x1+a21x2= a11y1+a12y2= a11x1+a21x2=v a11y1+a12y2=v • a12x1+a22x2= a21y1+a22y2= a12x1+a22x2=v a21y1+a22y2=v • y1+y2= x1+x2= y1+y2=1 x1+x2=1 • 当没有纯策略意义下的解时,方程组一定有严格非负解 x*= 当没有纯策略意义下的解时, x1* x2* y*=(y1*,y2*), (x1*,x2*)和y*=(y1*,y2*), 即为各局中人的最优混合策 略。

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件

运筹学教学-对策论公开课获奖课件百校联赛一等奖课件
局中人称为“i旳对手”,记为-i。
对策中利益一致旳参加者只能看成一种局中人,例:桥牌中 旳东、西两方。 对策论中对局中人旳一种主要假设:每个局中人都是“理智 旳”,即每一种局中人都不存在侥幸心理,不存在利用其他 局中人决策旳失误来扩大本身利益旳行为。
基本概念
在策略型博奕中,一种对策有下列几种基本要素: 一.局中人 二.策略(strategies):
-1
1

1
0
-1
剪刀
-1
1
0
第三节 矩阵对策旳纯策略
例:设有一矩阵对策 G {S1, S2; A} 其中
6 1 8
A
3
2
4
9 1 10
3 0
6
解:对局中人I而言,最大赢得是9,若想得到这个赢得,
他要选择纯策略 ,3因为局中人II也是理智旳竞争 者,他已考虑到局中人I打算出 旳3心理,则准备 以 3对付之,使局中人I不但得不到9,反而失掉10. 局中人I当然也会猜到局中人II旳心理,故而出 4
I {1,2,..., n}
Si ;i 1,2,..., n
局势----状态
n
S Si i 1
支付函数
支付有关局势旳函数----决策根据和原则 H i (s);i 1,2,..., n, s S
模型 I {1,2,..., N }, Si , i I , H i (s), i I
二人:参加对策旳局中人有两个;
有限:局中人旳策略集都为有限集;
零和:在任一局势下,两个局中人旳赢得之和总等于0,即,
一种局中人旳所得值恰好是另一种局中人旳所失值,双方旳 利益是完全对抗旳。
设局中人I和II旳策略集分别为
S1 {1,2 ,...,m } S2 {1, 2 ,..., n}

运筹学对策论

运筹学对策论

min
59 5 A=
86 6
max 6
i
策略2
max 8 9
min 8
j
策略1
管理运筹学
17
§3 矩阵对策的混合策略
当甲取策略2 ,乙取策略1时,甲实际赢得8比预期的多2,
乙当然不满意。考虑到甲可能取策略2这一点,乙采取策略2。若 甲也分析到乙可能采取策略2这一点,取策略1,则赢得更多为 9 … 。此时,对两个局中人甲、乙来说,没有一个双方均可接受
1和2分别称为局中人甲队、乙队的最优策略。由于双方必然选择这 一种策略,所以,这种策略又称为最优纯策略。
这种最优纯策略只有当赢得矩阵A=(aij)中等式
max i
min j
aij
min j
max i
aij
成立时,双方才有最优纯策略,并把(1,2)称为对策G在纯策略下的解,
又称(1,2)为对策G的鞍点。把其值V称之为对策G={S1,S2,A}的值。
3(20吨) -200
-200
-200
在此表上计算,有
1
2
3
1(10吨) -100
-175
-300
2(15吨) -150
-150
-250
3(20吨) -200
-200
-200
max
-100
-150
-200*

max i
min j
aij
min j
max i
aij
a32
200
故(3,3)为对策G的解,VG=-200。
V=10x1y1-5x1y2-5x2y1+0x2y2=10x1y1-5x1y2-5x2y1
x1+x2=1,y1+y2=1

运筹学12对策论

运筹学12对策论

下上中
-1,1 1,-1 1,-1 1,-1 3,-3 1,-1
下中上
1,-1 -1,1 1,-1 1,-1 1,-1 3,-3
《运筹学课程建设组》
14
由表12-2我们可以看到,如果按照严格的博弈问题的假设来重新 安排这一游戏的话,齐威王只要把从策略集中选择策略的顺序不断改
动(随机产生选择),不让田忌掌握策略规律,齐威王的胜率(统计 事件)显然要高于田忌。
《运筹学课程建设组》
回本章目录
2
一、猜币博弈
古老的流传广泛的猜硬币游戏想来对于我们每一个人来说都不陌 生,而正是这样的一个简单游戏构成了一个最基本的博弈问题。
这个游戏非常简单,两人通过猜硬币的正反面赌输赢,其中一人 抛起一枚硬币,用手盖住后,由另一方猜是正面朝上还是反面朝上, 若猜对,则猜者赢,盖硬币者输;否则,猜者输,而盖硬币者赢。
第十二章 博弈论
§1 引论 §2 博弈论的概念及历史沿革 §3 矩阵对策的最优纯策略 §4 矩阵对策的混合策略 §5 我们从博弈论中学习什么
《运筹学课程建设组》
1
§1 引论
为了对什么是博弈论以及博弈包括哪些类型等问题有一些更清晰 的理解和认识,本节先介绍几个典型的简单博弈问题实例,并对它们 作初步的分析。其实博弈本身就如这些实例一样,并不像人们通常理 解的那样深奥、复杂,当然,要想完全弄懂它,也的确需要下一番功 夫。
《运筹学课程建设组》
3
如果我们记赢的一方收益为1角(记为收益1),输的一方损失1 角(记为收益-1),则我们可用表12-1中收益矩阵表示这个猜硬币 博弈问题。
表12-1 猜币博弈
猜硬币方 盖硬币方
正面 反面
《运筹学课程建设组》
正面

运筹学教材习题答案详解

运筹学教材习题答案详解
X(2)=( 0 ,450 ,0 ,0,0 ,0,0 ,0 ,0 ,0 ,0 ,200 ,0 ,0 );Z=0,用料650根
显然用料最少的方案最优。
1.4A、B两种产品,都需要经过前后两道工序加工,每一个单位产品A需要前道工序1小时和后道工序2小时,每一个单位产品B需要前道工序2小时和后道工序3小时.可供利用的前道工序有11小时,后道工序有17小时.
3
B1:2.0
3
需要量(套)
200
150
问怎样下料使得(1)用料最少;(2)余料最少.
【解】第一步:求下料方案,见下表。
方案










十一
十二
十三
十四
需要量
B1:2.7m
2
1
1
1
0
0
0
0
0
0
0
0
0
0
300
B2:2m
0
1
0
0
3
2
2
1
1
1
0
0
0
0
450
A1:1.7m
0
0
1
0
0
1
0
2
1
0
3
2
1
0
《运筹学》
第1章线性规划
第2章线性规划的对偶理论
第3章整数规划
第4章目标规划
第5章运输与指派问题
第6章网络模型
第7章网络计划
第8章动态规划
第9章排队论
第10章存储论
第11章决策论
第12章对策论
习题一
1.1讨论下列问题:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.矩阵对策的混合策略(续)
-- 优超原则:当局中人甲方的策略t被其它 策略所优超时,可在其赢得矩阵A中划去第t 行(同理,当局中人乙方的策略t被其它策 略所优超时,可在矩阵A中划去第t列)。 如此得到阶数较小的赢得矩阵A’,其对
应的矩阵对策
G’= { S1,S2,A’}与 G ={ S1,S2,A } 等价,即解相同。
17
再讨论“齐王赛马”
• “齐王赛马”的赢得矩阵A有 max min aij=-1 min max aij=3
i j j i
故需求混合策略,由于A中有非正元素, 可选k=2,令矩阵中每一元素加上k得到新的 正矩阵A’:
5 3 3 1 3 3 3 5 1 3 3 3 3 3 5 3 3 1 3 3 3 5 1 3 1 3 3 3 5 3 3 1 3 3 3 5
19
再讨论“齐王赛马”(续)
• 求乙方(田忌)最优策略的线性规划模型:
min Y1+Y2 +Y3 +Y4 +Y5 +Y6 s.t. 5Y1+3Y2 +3Y3 +3Y4 + Y5 +3Y6 1 3Y1+5Y2 +3Y3 +3Y4 +3Y5 + Y6 1 3Y1+ Y2 +5Y3 +3Y4 +3Y5 +3Y6 1 Y1+3Y2 +3Y3 +5Y4 +3Y5 +3Y6 1 3Y1+3Y2 +3Y3 + Y4 +5Y5 +3Y6 1 3Y1+3Y2 + Y3 +3Y4 +3Y5 +5Y6 1 Y1,Y2,Y3,Y4,Y5,Y6 0 可得两组解:(1/9,0,0,1/9,1/9,0)T, (1/18,1/18,1/18,1/18,1/18,1/18)T ,V’=3 于是,Y’=(1/3,0,0,1/3,1/3,0)T, Y’=(1/6,1/6,1/6,1/6,1/6,1/6)T V = V’-2 = 1 即田忌的最优混合策略值是输1千金
20
3.矩阵对策的混合策略(续)
• 优超原则: 假设矩阵对策 G ={ S1,S2,A } 甲方赢得矩阵 A=[aij]mn
-- 若存在两行,s 行的各元素均优于 t 行的 元素,即 asjatj j=1,2…n 称甲方策略s优超于t -- 若存在两列,s 列的各元素均优于 t 列的 元素,即 ais ait i=1,2,…,m 称乙方策略 s优超于t 21
–利用有超原则化简赢得矩阵时,有可能将原对 策问题的解也划去一些(多解情况); –线性规划求解时有可能是多解问题。 25 决策分析
12
• 求解方法:线性规划法 • (其他方法:图解法,迭代法,线性方程 法等略) • 例: 5 9 设在最坏的情况下, • A= 甲赢得的平均值为V. • 8 6 (未知)
• STEP 1
• 1)设甲使用策略1的概率为X1′ X1′+X2′=1 设甲使用策略2的概率为X2′ X1′,X2′0
13
2)无论乙取何策略,甲的平均赢得应不少 于V: • 对乙取1:5X1’+ 8X2’V • 对乙取2:9X1’+ 6X2’V • 注意 V>0,因为A各元素为正。 STEP 2 作变换: X1= X1’/V ; X2= X2’/V • 得到上述关系式变为: X1+ X2=1/V (V愈大愈好)待定 5X1+ 8X21 9X1+ 6X21 X1, X20
8 策略1
11
• 矛盾:甲取2 ,乙取时1,甲实际赢得 8比预期多2(乙就少2)这对乙讲是不满 意的,考虑这一点,乙采取策略2,若甲 分析到这一点,取策略1,则赢得更多 为9… • 此时,甲,乙芳没有一个双方均可接受 的平衡局势。 • 一个思路:对甲(乙)给出一个选取不 同策略的概率分布,以使甲(乙)在各 种情况下的平均赢得(损失)最多(最 少)。-----即混合策略
• 甲采取策略2 不管乙采取如何策略,都至 少得益。 • 乙采取策略3 不管甲采取如何策略, 都至少可以得益。(最多损失0) 分别称甲,乙公司的最优策略,由唯一性又 称最优纯策略。 存在前提:
max min aij = min max aij = v
i j j i
又称( 2 ,3 )为对策G={s1,s2,A} 的鞍点。值V为G的值。
§12.2矩阵对策
“齐王赛马”齐王在各局势中的 益损值表(单位:千金)
2
• 齐王的策略集: S1={1, 2, 3, 4, 5, 6} • 田忌的策略集: S2={1, 2, 3, 4, 5, 6} 齐王的赢得矩阵:
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 1 -1 1 -1 1 1 1 1 3 1 -1 3 1 1 1 -1 1 1 1 3
• “齐王赛马”即是一个矩阵策略.
5
二、矩阵对策的最优纯策略
• 在甲方赢得矩阵: A=[aij]m*n • i行代表甲方策略i i=1,2…m
• j行代表乙方策略j j=1,2…n
• aij代表甲方取策略i,乙方取策略j,这一 局势下甲方的益损值,此时乙方的益损值 为-aij(零和性质)。 • 在讨论各方采用的策略是必须注意一个前 提就是对方是理智的。这就是要从最有把 握取得的益损值情况考虑。
7
甲: 取大则取2 采取1至少得益–3(损失 3) max min aij= 0 2 0 i j 3 -4(损失 4) • -3 0 -2 0 1 • A= 2 3 0 1 2 • -2 -4 -1 3 3 乙: 1 2 3 4 采取1甲最多得益2(乙得益-2) 2 3(乙得益-3) 取小则取3 3 0(乙得益 0) min max aij= 0 i j 4 3(乙得益-3) 8
22
3.矩阵。
3 5 7 4 6 7 4 6 2 0 3 6 0 3 6 0 0 2 9 8 8 9 8 8 3 0 5 9 5 9 7 5.5 8 3 5 9 7 5.5 8 3
被第3、4行所优超 被第3行所优超
A=
得到
被第1列所优超
被第2列所优超
6
二、矩阵对策的最优纯策略
• 例:有交易双方公司甲和乙,甲有三个 策略1,2,3;乙有四个策略1,2, 3,4,根据获利情况建立甲方的益损 值 赢得矩阵。 • -3 0 -2 0 1 • A= 2 3 0 1 2 • -2 -4 -1 3 3 1 2 3 4 • 问:甲公司应采取什么策略比较适合?
14
• 建立线性模型: min X1+X2 s.t. 5X1+8X21 9X1+6X21 X1, X20
X1= 1/21 X2= 2/21 1/V= X1+X2=1/7 所以:V=7 返回原问题: X1’= X1V= 1/3 X2’= X2V= 2/3 于是甲的最优混合策略为: 以1/3的概率选1;以2/3的概率选2 最优值V=7.
9
三、矩阵对策的混合策略
• 设矩阵对策 G ={S1,S2,A} • 当 max min aij min max aij时,
i j j i
不存在最优纯策略 求解混合策略。
10
3.矩阵对策的混合策略
例:设一个赢得矩阵如下:
5
A = 8 max 8 6 9 6 min
j
9
min 5 max
i
6 策略2
A1=
23
3.矩阵对策的混合策略(续)
• 续例
A2=
得到
3 9 6 5.5 0 3
3 9
7 4 6
7
被第1行所优超 被第1列所优超
得到
A3=
4
6
5.5 7 3
4 6
24
最终得到 A4=
3.矩阵对策的混合策略(续)
• 对A4计算,用线性规划方法得到: (注意:余下的策略为3,4,1,2) 甲: X* = (0,0,1/15,2/15,0)T V=5 X*’= (0,0,1/3 ,2/3 ,0)T 乙: Y* = (1/10,1/10,0,0,0)T V=5 Y*’= (1/2 ,1/2 ,0,0,0)T • 注:
3
A=
一、二人零和对策的模型
二人有限零和对策(又称矩阵对策): 局中人为2; 每局中人的策略集只含有限个策略; 每一局势的对策均有确定的损益值, 并且对同一局势的两个局中人的益损 值之和为零。
4
一、二人零和对策的模型
• 记矩阵对策为:
• •

G = {S1,
S 2,
A}

甲的策略集 甲的赢得矩阵 乙的策略集
18
A’ =
再讨论“齐王赛马”(续)
• 求甲方(齐王)最优策略的线性规划模型:
min X1+X2 +X3 +X4 +X5 +X6 s.t. 5X1+3X2 +3X3 + X4 +3X5 +3X6 1 3X1+5X2 + X3 +3X4 +3X5 +3X6 1 3X1+3X2 +5X3 +3X4 +3X5 + X6 1 3X1+3X2 +3X3 +5X4 + X5 +3X6 1 X1+3X2 +3X3 +3X4 +5X5 +3X6 1 3X1+ X2 +3X3 +3X4 +3X5 +5X6 1 X1,X2,X3,X4,X5,X6 0 可得两组解:(0,1/9,1/9,0,0,1/9)T, (1/18,1/18,1/18,1/18,1/18,1/18)T ,V’=3 于是,X’=(0,1/3,1/3,0,0,1/3)T, X’=(1/6,1/6,1/6,1/6,1/6,1/6)T V = V’-2 = 1 即齐王的最优混合策略值是赢1千金
相关文档
最新文档