运筹学教程》胡云权第五版运筹学6对策论矩阵对策
矩阵对策

max aij 对局中人 II,求 min j i
若 max min aij min max aij a i
i j j i
*
j*
策略 i , j 为I,II 的最优策略
这一对策 的值为 V a i
j
几个术语
局势 对策的解
最优纯策略
对策的值 鞍点 e. g. 2 (续)求解取暖购煤问题
两人零和对策
对抗对策(antagonistic game)
矩阵对策(matrix game)
二.实际问题中的矩阵对策模型
e. g. 1 扩大销售模型
公司I,公司II 的同一产品竞争市场份额,各有三种办 法扩大销售额(由于市场需求一定,一家扩大,意味 另一家缩减),三种方法比如:①改进包装;②广告; ③降价.公司I 的三种策略表示为 1 , 2 , 3 ,公司II 的三种策略为 1 , 2 , 3 ,在不同策略下销售量增长百 分比不同.下表中表示公司I 的增长率,而公司II 的即 为相反数
e. g. 6 (续)求最优策略与值
作业
P206,
Ex 6. 3:1,2
1=急转 2 =不转
1
给急转弯者以1 分,不转弯者以5 分 局中人II 局中人I 局 =急转 1 中 人 2=不转 II
3 5
1 =急转 2=不转
1 0
0
II 的支付矩阵
此对策中,若两者都想得5 分,则发生惨祸, 全部玩完.实际上两人最好的做法是同时停车 或转弯,各得3 分. Remark 此例已不是 2 人有限零和对策问题(因为在 每个对局中,双方支付的代数和不为零), 称为双矩阵对策.
e. g. 2 取暖购煤问题 某公司在秋末需决定冬季取暖用煤问题.根据气温 情况,用煤量和煤价均不同,可用下表表示: 正常气温 较冷气温 较暖气温 需求量15 吨 需求量20 吨 需求量10 吨 200元/吨 250元/吨 150元/吨
矩阵对策的最优纯策略

,m α,
,
,n β;则分别为
},m α和},n β。
当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略后,就形成了一个纯局)j ,这样的纯局势共有m n ⨯个。
对任一纯局势赢得值为ij a ,称
12122
212n n m m mn a a a a a ⎤⎥⎥⎥⎥⎦
为局中人Ⅰ的赢得矩阵。
局中人Ⅱ的赢得矩阵就是当局中人Ⅰ,Ⅱ的策略集12,S S 及局中人Ⅰ的赢得矩阵对策也就给定了,记为{}12,,G S S A =。
在齐王赛马的例子中,齐王的赢得矩阵
},
,m α,
},n β,max )
成立,记其值为)成立的纯局势()
,i j αβ**
在纯策略意义下的解(或鞍点)
},m α,},n S β,
1,2,
,,m x ∑1,2,
,,n y ∑分别称为局中人Ⅰ和Ⅱ的混合策略集分别称为局中人Ⅰ和Ⅱ的混合策略(或策略),对
),m x 可设想成当两个局中人多次重复进行对策
12,,
,m ααα的频率。
若只进行一次时对策,混合
对策可设想成局中人Ⅰ对各纯策略的偏爱程度。
求解混合策略的问题有图解法,迭代法、线性方程组法和线性规划法,在。
运筹学教程胡云权第五版孔静静运筹学博弈论专题知识讲座

➢ 课程性质:措施技能类 专业必须课 ➢ 课时数:1-14周,3,42课时 ➢ 课程框架
约束条件、目的最大/小化、最优方案
图
线运 性送 规问 划题
整
动
数
态
规
规
划
划
与 网 络 分
决对 策策 论论
析
➢ 考核方案:作业(40%)+考试(60%)
《运筹学》教材内容
➢ 线性规划 第一章 1-5节 ➢ 运送问题 第三章 1-3节 ➢ 整数规划 第五章 1-5节 ➢ 动态规划 第七章 1-4节 ➢ 图与网络分析 第八章 1-3节 ➢ 对策论 第十二章 1-3节 ➢ 决策论 第十三章 1-3节
严格劣势策略
Strictly dominated strategy
课堂游戏——“同学困境”
α
我
β
同伴
α B-, B-
β A, C
C, A
B+,B+
现实囚徒困境
• 宿舍卫生 • 价格战争 • 过分捕捞 • 碳排放 • 军备竞赛
思索
破解措施
• 沟通
坦白
抵赖
• 协议、协议
坦白 -8, -8
0, -10
《运筹学》课程答疑
时间:周一 8:00——10:00 12:00——18:00
地点:建工楼512 邮箱: 电话
《运筹学》
对策论
• 孔静静 • 2023年3月2日
课堂游戏——“同学困境”
请各位在不被邻桌看到旳情况下,选择α或者β 随机两人一组,鉴定成绩 成绩给定旳原则
• 若你选择α ,同伴选择β ,则你得A,同伴得C; • 若都选择α,则都得B-; • 若你选择β,同伴选择α,则你得C,同伴得A; • 若都选择β,则都得B+。
《运筹学(胡运权)》第五版课后习题答案

可知购进原材料15个单位为宜。
4.1
a)设yi= 1第i组条件起作用
0第i组条件不起作用
x1+x2≤2-(1-y1)M M—充分大正数
2x1+3x2≥5+(1-y2)M
y1+y2=1
y1,y2=0或1
b)设yi= 1第i组条件起作用
0第i组条件不起作用
x=0y1
x=3y2
X2 1.000000 2.000000 INFINITY
X3 4.000000 1.000000 1.500000
X1,X2,X3 0.000000 0.000000 INFINITY
RIGHTHAND SIDE RANGES
ROW CURRENT ALLOWABLE ALLOWABLE
RHS INCREASE DECREASE
0.03(a2+b2+c1)-0.06(a3+b3)-0.11(a4+c1)-0.05a5
=0.95a1+0.97a2+0.94a3+1.5b3+2.1c1-0.05b1-0.11a4-0.05a5
s.t.
5a1+10b1≤6000
7a2+b2+12c1≤10000
6a3+8a3≤4000
4a4+11c1≤7000
5.3c
因为使mind1-,故在x1+x2=40的右侧,若使mind4+,则在x1+x2=50的左侧,即阴影区域,因为在阴影部分无法使2d2-+d3-最小,故比较E(20,30),F(24,26),E点:d2-=4,d3-=0 min2d2-+d3-=8,F点:d2-=0,d3-=4, min2d2-+d3-=4,故选F点
运筹学课件 第六章对策论基础

– 局中人(参与人) —二人或多人 – 行动与策略—有限或无限 – 信息—完全或不完全 – 支付函数—可正可负
一、基本概念与名词
• 局中人 • 策略与策略集 • 局势 • 赢得函数 • 零和对策 • 矩阵对策:二人有限零和对策
二、对策分类
矩阵混合对策问题的解
X (0,0,1 / 3,2 / 3,0) Y (1 / 2,1 / 2,0,0,0) V 5
T
T
相关定理
记T(G)为矩阵对策G的解集
定理1 设有两个矩阵对策 G1={S1,S2,A1}, G2={S1,S2,A2}, 其中A1=(aij), A2=(aij+L), L为一任意常数,则
– 支付函数—赢了得一千金,输了付一千金。
齐王赛马赢得函数
田 忌 (上中下) 1 (上下中) 2
齐 (中上下) 3 王 (中下上) 4 (下中上) 5 (下上中) 6
1 2 3 4 5 6
3 1 1 -1 1 1 1 3 -1 1 1 1 1 1 3 1 -1 1 1 1 1 3 1 -1 1 -1 1 1 3 1 -1 1 1 1 1 3
• 划去普遍较大的列,例如第3、4、5三列, 结果如上。
进一步化简
• 上述结果的第一行比第三行普遍更优,因 此再划去第三行,得 1 2
3 7 3 A 4 4 6
• 若混合策略均不为零,由上述定理知混合 对策问题数学模型的不等式应为等式。因 此有
第二步 用方程组求解
分析上述例子
• 因为 max min{aij } 2, min max{aij } 3 j j i i • 所以 max min{aij } min max{aij }
胡运权运筹学第五版答案

胡运权运筹学第五版答案【篇一:运筹学基础及应用第四版胡运权主编课后练习答案】xt>习题一 p46 1.1 (a)412该问题有无穷多最优解,即满足4x1z?3。
6x26且0?x2?的所有?x1,x2?,此时目标函数值(b)用图解法找不到满足所有约束条件的公共范围,所以该问题无可行解。
1.2(a) 约束方程组的系数矩阵12a833106?403000200??0?1t最优解x??0,10,0,7,0,0?。
(b) 约束方程组的系数矩阵1a222314??2??最优解1.3(a)(1) 图解法11??2x??,0,,0?5?5?t。
最优解即为?3x14x295x12x28的解x31,2,最大值z352(2)单纯形法首先在各约束条件上添加松弛变量,将问题转化为标准形式 max z?10x1?5x2?0x3?0x4?3x1?4x2?x3?9s.t. ?5x12x2x48则p3,p4组成一个基。
令x1?x2?0得基可行解x??0,0,9,8?,由此列出初始单纯形表12。
??min?898,53?520,??min?2183,??142?2?新的单纯形表为1,20,表明已找到问题最优解x1?1, x2?32,x3?0 , x4?0。
最大值z*352(b) (1) 图解法6x1?2x2x1?x2?最优解即为?6x12x224x1?x2?5的解x73,22?,最大值z172(2) 单纯形法首先在各约束条件上添加松弛变量,将问题转化为标准形式 max z?2x1?x2?0x3?0x4?0x55x2?x3?15??s.t. ?6x1?2x2?x4?24xxx5125则p3,p4,p5组成一个基。
令x1?x2?0得基可行解x??0,0,15,24,5?,由此列出初始单纯形表12。
??min??,245?,??461?155,24,20,??min?3?32?2新的单纯形表为【篇二:运筹学基础及应用第四版胡运权主编课后练习答案】xt>习题一 p46 1.1 (a)41的所有?x1,x2?,此时目标函数值2该问题有无穷多最优解,即满足4x1?6x2?6且0?x2?z?3。
《运筹学教程》胡云权第五版运筹学-6对策论-矩阵对策

矩阵对策的基本原理
矩阵对策的基本原理是将决策问题抽象为一个决策矩阵,其中行表示决策方 案,列表示决策因素。通过对矩阵进行分析和计算,找到最优的决策方案。
矩阵对策的应用领域
矩阵对策可以应用于各种决策问题,包括但不限于供应链管理、投资组合优化、资源分配、人力资源管理等领 域。
矩阵对策的解决方法
矩阵对策可以通过数学方法和算法来求解,例如线性规划、整数规划、动态规划等。不同的决策问题可能需要 不同的解决方法。
案例分析:矩阵对策在实际问题中的应用
本节将通过案例分析展示矩阵对策在实际问题中的应用。我们将介绍一个具体的决策问题,并演示如何使用矩 阵对学习,你已经了解了矩阵对策的基本原理、应用领域和解决方法。希望本节内容对你在运筹学领域 的学习和应用有所帮助。
《运筹学教程》胡云权第 五版运筹学-6对策论-矩 阵对策
本节将介绍运筹学中的矩阵对策,包括其概述、基本原理、应用领域、解决 方法以及在实际问题中的应用。
运筹学简介
运筹学是一门研究在资源有限的情况下如何做出最佳决策的学科。它应用数学方法和模型来协助管理者进行决 策和优化。
矩阵对策概述
矩阵对策是一种运筹学方法,通过构建决策矩阵来帮助管理者进行决策。它 可以同时考虑多个决策因素和多种决策方案,从而找到最佳决策。
《运筹学》胡运权清华版-12-02矩阵对策基本定理

运筹学中,矩阵对策是重要的决策分析工具。通过这个矩阵对策基本定理, 我们能够更好地理解并应用它在实际问题中。
Байду номын сангаас
矩阵对策的背景和定义
矩阵对策是一种决策分析方法,通过建立决策者与对手之间的策略矩阵,来 寻求最佳决策方案。它在解决有限决策问题中具有广泛的应用。
矩阵对策在实际问题中有广泛的应用,如在市场竞争、资源分配、风险管理 等领域。通过矩阵对策的应用,我们能够做出更明智和有效的决策。
矩阵对策在经济领域的案例分 析
矩阵对策在经济领域有着丰富的案例分析。通过深入研究这些案例,我们可 以更好地理解和应用矩阵对策的方法和技巧。
矩阵对策的优势和局限性
矩阵对策具有许多优势,如能够考虑多个因素和决策变量,以及能够量化和 比较各种策略。然而,它也存在一些局限性,如对信息和参数的需求较高。
矩阵对策的基本定理
矩阵对策的基本定理可以帮助我们确定最佳对策和策略组合。通过对矩阵对 策进行精确分析,我们能够得到优化的决策结果。
矩阵对策的解决方法
矩阵对策有多种解决方法,如通过优化算法和约束条件来求解最优解。同时, 可以利用计算机模拟和博弈理论等工具来辅助分析和决策。
矩阵对策在实际问题中的应用
结论和总结
矩阵对策是一种强大的决策分析工具,能够帮助我们做出更明智和优化的决 策。通过学习和应用矩阵对策,我们能够提高决策的准确性和效果,从而更 好地解决现实生活和工作中的问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
赢得函数( H(s) ):对于任一局势,局中人的赢得值。支付函数
严格占优策略/严格劣势策略
2
上策均衡/纳什均衡
可编辑ppt
典型案例和重要结论
囚徒困境 智猪博弈
结论1:不要选择严格劣势策略。 结论2:个人理性选择导致非最优。 结论3:学会换位思考。 求解方法:删除严格劣势策略
课程目标
理解并掌握矩阵对策的纯策略 理解并掌握矩阵对策的混合策略 掌握矩阵对策的求解方法
6
可编辑ppt
矩阵对策的策略
纯策略:确定的选择某策略 混合策略:以某一概率分布选择各策略。
7
矩阵对策的纯策略
可编辑ppt
1、矩阵对策的一般表达
设用Ⅰ、Ⅱ分别表示两局中人,Ⅰ有 m 个纯策略
1,2 ,,m ,Ⅱ有 n 个纯策略 1, 2 ,, n ,则
均有
a ij
*
ai* j*
ai* j
2 7 2 1 1
例: G {S1, S2; A},其中 A 2 2 3 4 2
3 5 4 4 3
2 2 1 6 1
3746
由
max i
min j
aij
min j
max i
aij
a31
ห้องสมุดไป่ตู้
3 则VG
3 ,G
的解
为3, 1分别是局中人Ⅰ、Ⅱ的最优纯策略。
事实:对策 G 的值VG ai* j* 是 A a 中 i* j* 所在的行的最小 12
矩阵对策的纯策略
2、矩阵对策解的引例
例: 设 G {S1, S2; A} ,
其中 S1 {1,2,3,4} ,
6
A
3
1 2
8 -8
4
2
S2 {1, 2, 3},
9 1 10 -10
3 0
6
-3
926
可编辑ppt
理智行为:从各自最不利情形中选择最有利 I:最大最小原则 II:最小最大原则
β2)(α3,
β4) 14
可编辑ppt
矩阵对策的纯策略
5、矩阵对策纯策略的性质
性质1:无差别性
若(αi1 ,βj1)和(αi2,βj2)是对策G的两个解,则
ai1j1 = ai2j2
性质2:可交换性
若(αi1 ,βj1)和(αi2,βj2)是对策G的两个解,则(αi1 ,βj2) 和(αi2,βj1)也是对策G的两个解。
元素,又是所在列的最大元素,即
a ij
*
ai* j*
ai* j 。
可编辑ppt
矩阵对策的纯策略
4、矩阵对策的鞍点与解
对于一个对策G={S1, S2, A}, 若
有
max i
min j
aij
min j
max i
aij
ai* j*
则称局势(αi*, βj*)为对策G的
鞍点,V = a i*j*为对策G的值。
Ⅰ的策略集为: S1 {1,2 , i , ,m},
Ⅱ的策略集为: S2 {1, 2 , j , , n} 。
当Ⅰ、Ⅱ分别选择纯策略i , j 时,形成了一个纯局势
(i , j ) S S1 S2 ,则对任一 (i , j ) S ,记Ⅰ的赢得
值为 ai j ,即Ⅱ赢得值为 ai j (i 1,2,, m; j 1,2,, n) .
3
可编辑ppt
矩阵对策的基本理论
4
可编辑ppt
对策/博弈分类
局中人个数:二个,多个 策略集中的个数:有限,无限 支付/赢得代数和:零和,非零和 局中人是否合作:非合作,合作 局中人行动时间:静态,动态 局中人对他者信息了解程度:完全信息,非完全信息 对策次数:单次,重复
5
可编辑ppt
平衡局势:双方均可接受,且对双方都是最稳妥的结果。 10 (α2 ,β2),局中人I和II的最优纯策略。
矩阵对策的纯策略
3、矩阵对策的最优纯策略
可编辑ppt
定义 1:设 G {S1, S2; A}为矩阵对策,其中
S1 {1,2 ,,m} , S2 {1, 2 ,, n}, A {aij }mn ,
如
果
max i
min j
aij
min j
max i
aij
ai* j*
成立,记 VG
ai* j*
,则
称VG ai* j* 为矩阵对策 G 的值.
相应的纯局势 (i* , j* ) 为 G 在纯策略下的解,i* 与 j*
分别称为局中人Ⅰ与Ⅱ的最优纯策略。
从上例看出,矩阵A中平衡局势(α2 ,β2)对应的元素
矩阵对策的值唯一。即当一个局中人选择了最 15
优纯策略后,他的赢得值不依赖于对方的纯策略。
a22既是其所在行的最小元素,也是其所在列的最大元素,
11
即有 ai2≤a22 ≤ a2j i=1,2,3,4 j=1,2,3
矩阵对策的纯策略
可编辑ppt
3、矩阵对策的最优纯策略
定理 1: 矩阵对策 G {S1, S2; A}在纯策略意义下有解的充要条
件是:存在纯局势 (i* , j* ) 使得对一切 i 1,2,, m; j 1,2,,n
可编辑ppt
第六章 对策论
1
基本概念
对策论又称博弈论,研究冲突对抗条件下最优决策问题
的理论。
可编辑ppt
策略形势:不完全竞争条件下的对抗行为,各方收益由
自身行为和其他方行为共同决定。
基本要素
局中人(I ):有权决定自己行动方案的对策参加者,理性人 策略集(S ):供局中人选择的实际可行完整行动方案的集合,
a11 a12 a1n
记
A
a21
a22
a2
n
am1
am2
amn
Ⅰ的赢得矩阵
或Ⅱ的支付矩阵
8
Ⅱ的赢得矩阵为-A 。
矩阵对策的纯策略
1、矩阵对策的一般表达
可编辑ppt
如果局中人Ⅰ、Ⅱ的策略集为 S1, S2 ,局中人Ⅰ的赢得矩阵
为 A,则矩阵对策的模型为
G {, ; S1, S2; A} 或 G {S1, S2; A}
例:田忌赛马
局中人:田忌(I)、齐王(II)
S1 ={(上、中、下),(上、下、中),(中、上、下), (中、下、上),(下、中、上),(下、上、中)}= S2
3 1 1 1 1 1
1
3
1
1
1
1
1 1 3 1 1 1
A 1 1
1
3
1
1
9
1 1 1 1 3 1
1 1 1 1 1 3
注:在矩阵中,一个数在所在行中是最大值,在所 在列中是最小值,则被称为鞍点。
13
矩阵对策的纯策略
4、矩阵对策的鞍点与解 多鞍点与无鞍点对策 例: 设有一矩阵对策如下,求它的解。
可编辑ppt
6 5 6 5
A 1 4 2 1 8 5 7 5
0 2
6
2
局势(α1, β2),(α1, β4),(α3, 均构成鞍点,此对策有多个解。