矩阵对策精讲

合集下载

第1章 矩阵对策

第1章  矩阵对策
策被称为矩阵对策).对策按如下方式进行,局中人 1 选择行 i ∈ M ,局中人 2 选择列 j ∈ N ,
此时局中人 1 和 2 是同时并且独立地进行选择.因此局中人 1 获得支付 aij ,局中人 2 获得支
( ) 付 −aij .如果支付是一个负数, 那么可以认为是局中人的实际损失.
记具有支付矩阵 A 的对策 Γ 为 ΓA ,并且根据矩阵的维数,称之为 (m × n) 对策.如果
果它被隐藏在那里)的概率为 0 < βi ≤ 1 ,i = 1, 2, , n .如果找到目标,局中人 1 获得收益 为α .在其中隐藏和搜索物体的坑的编号是局中人的策略,局中人 1 的支付等于期望收益与
寻找目标时所付出的努力之差.隐藏和搜索目标的问题可以转化为矩阵对策,其支付矩阵为
⎡αβ1 −τ1 −τ1 −τ1
选择进行攻击的目标(局中人 1)和防卫目标(局中人 2)的问题可以转化为矩阵对策,
其支付矩阵为
⎡β1τ1 τ1
A
=
⎢ ⎢
τ2
β2τ 2

⎢ ⎣
τn
τn
τ1 ⎤
τ2
⎥ ⎥

β

n
⎥ ⎦
例 1.1.5 (离散型搜索对策)有 n 个坑,局中人 2 在 n 个坑中之一隐藏物体,局中人
1 希望找到它.在寻找第 i 个坑时局中人 1 付出的努力为τi > 0 ,在第 i 个坑中找到目标(如
m −1 > n ,则 a10 = n +1+1 = n + 2 , a11 = n −1+1 = n , a1 j = n − j +1−1−1 = n − j −1,
2 ≤ j ≤ n .一般情况下(对任意的 m 和 n )元素 aij , i = 0, m , j = 0, n 以及支付矩阵可以

第十三讲 对策矩阵解法

第十三讲 对策矩阵解法

4
矩阵对策解法
• 矩阵对策模型给定后,各局中人面临的问 题:如何选取对自己最为有利的纯对策略, 以谋取最大的赢得?
5
矩阵对策的纯策略
例1:设有一矩阵对策G={S1, S2; A},其中
6 3 A 9 3 1 2 1 0 8 4 10 6
求最优纯策略?
取大则取2 max min aij= 2
i j
取小则取2 min max aij= 2
j
i
7
矩阵对策的纯策略
定义1 设G={S1, S2; A}为一矩阵对策,其中 S1={α1, …,αm},S2={β1, …,βn}, A=(aij)m×n。若
max min aij min max aij
7 1 8 3 2 4 A 16 1 3 3 0 5
9
答案
1
2
3
min ai j
j
α1 α2 α3
max ai j
i
-7 3 16 -3 16
1 2 -1 0 2*
-8 4 -3 5 5
-8 2* -3 -3
7 1 8 3 2 4 A 16 1 3 3 0 5
16
矩阵对策实例
这一储量问题可以看成是一个对策问题,把采购员当作局中人Ⅰ,他 有三个策略:在秋天时买10吨、15吨与20吨,分别记为 1 , 2 ,3 把大自然看作局中人Ⅱ(可以当作理智的局中人来处理),大自然(冬季 气温)有三种策略:出现较暖的、正常的与较冷的冬季,分别记为 1 , 2 ,3 把该单位冬季取暖用煤实际费用(即秋季购煤时的用费与冬季不够时 再补购的费用总和)作为局中人Ⅰ的赢得,得矩阵如下:

双矩阵对策

双矩阵对策
则称( X *,Y * )为双矩阵对策G的平衡局势。
平衡局势(X *,Y *)对应的二局中人的期望收益 ( X *T AY *, X *T BY * )就是G的值,记为(U *,V *)。
定理1:任何双矩阵对策至少存在一个平衡局势。
定理2:(X *,Y *)为双矩阵对策G的一个平衡局势的
充要条件是存在数p*和q*使[ X * Y * p* q* ]T 是下述问题的一个解:
公理(5 线性变换不变性):设P'是从P经线性变换 U ' aU b,V ' cV d (a, c 0)
(U0,V0 )称为安全点,表示收益的“下限”。
(2) Nash谈判集 满足U U0且V V0的Pareto点(U ,V )的全体。
VA
(U0 ,V0)
0
B
U
显然,最优点应从Nash谈判集中产生,称为Nash谈判解。
4.Nash谈判解的计算 ⑴Nash谈判公理
为了从Nash谈判集中寻找使双方可达成协议的解(U *,V *), 记所有可能成为(U *,V *)的可行解的集合为P(可即Nash谈判集) Nash给出了(U *,V *)的6个公理:
B1 0 B2 0
0yyyy01111yy110011,,,,11,0,BBB0B1212xx11xx11xy1B1BBB12BB12BB112112
y1
1
B2
B1
0
1
x1
y1
1
B2
B1
0
1
x1
y1
8
B1 0 B2 0
1
y1 1, 0 x1 1
0
1
x1
y1
9
B1 0 B2 0

引论第二矩阵对策第三矩阵对策的求解

引论第二矩阵对策第三矩阵对策的求解

5.矩阵对策解的性质
*
性质5:设一矩阵对策G={S1,S2,A} ,若在S1(或、和S2)中出现被优超的策略,那么去掉被优超的策略所形成的新的矩阵对策与原矩阵对策同解。
A =
4 0 2 3 -2 -2 1 4 -4 3 7 3 8 4 5 4 6 5 6 6 5 2 7 4 3
02
田忌:上、 中、 下
2.对策行为的基本要素
*
3.对策行为的基本假设
*
对策行为总是假定每一个局中人都是“理智的”决策者,不存在利用其他局中人的决策失误来扩大自身利益的可能性或相反。
4.对策行为的分类
*
对策
动态对策
静态对策
结盟对策
不结盟对策
联合对策
合作对策
无限对策
有限对策
二人
多人
零 和
A =
-4 2 -6 -6 4 3 5 3 8 -1 -10 -10 -3 0 6 -3
Min
Max 3
局中人甲应选择2 ,此时不管局中人乙采取什么策略,甲的赢得均不小于3。
3
6
5
4
3.矩阵对策的混合策略
*
2
4.矩阵对策的基本定理
*
定理1:设矩阵对策G={S1,S2,A}在策略意义下有解的充分必要条件是存在着局势( i* ,j* )使得对于一切i与j都有aij* ai*j* ai*j成立。 定理2:对策矩阵G={S1,S2,A}在混合策略意义下有解的充分必要条件是存在着 x * S1* , y * S2*使(x *,y *) 为E (x,y) 的一个鞍点,即对于一切x S1* , y S2* 有 E (x,y *) E (x *,y *) E (x *,y)

第10章 第3节 矩阵对策的解法

第10章 第3节 矩阵对策的解法



(10 49 )


(10 52 )
11
例18 利用线性规划方法求解赢得矩阵为A的矩 阵对策。
7 2 9 A 2 9 0 9 0 11
12
3
Hale Waihona Puke a11a 22 a12 a 21 VG (a11 a 22 ) (a12 a 21 )
例12 求解矩阵对策G={S1,S2;A},其中
1 3 A 4 2
2. 2 n 或 m 2 对策的图解法 例13 考虑矩阵对策G={S1,S2;A},其中
2 3 11 A 7 5 2
由定理5已知,任一矩阵对策G={S1,S2;A}的求 解均等价于一对互为对偶的线性规划问题,而定理4 * 表明,对策G的解 x *和 y 等价于下面两个不等式 组的解。
8
aij xi v, i (I) xi 1 i xi 0, aij y j v, j (II) yj 1 j y j 0,
(10 40)
就是对策的值VG 。
定理11 设矩阵对策G={S1,S2;A}的值为VG , 则
VG max min E ( x, j ) min* max E (i, y ) *
xS1 1 j n yS 2 1i m
(10 41)
10
min z xi' i ' (P) a x j 1,, n ij i 1, i x ' 0, i 1,, m i max w y 'j j ( D) aij y 'j 1, i 1,, m j y ' 0, j 1,, n j

《运筹学》胡运权清华版-12-02矩阵对策基本定理

《运筹学》胡运权清华版-12-02矩阵对策基本定理
《运筹学》胡运权清华版 -12-02矩阵对策基本定理
运筹学中,矩阵对策是重要的决策分析工具。通过这个矩阵对策基本定理, 我们能够更好地理解并应用它在实际问题中。
Байду номын сангаас
矩阵对策的背景和定义
矩阵对策是一种决策分析方法,通过建立决策者与对手之间的策略矩阵,来 寻求最佳决策方案。它在解决有限决策问题中具有广泛的应用。
矩阵对策在实际问题中有广泛的应用,如在市场竞争、资源分配、风险管理 等领域。通过矩阵对策的应用,我们能够做出更明智和有效的决策。
矩阵对策在经济领域的案例分 析
矩阵对策在经济领域有着丰富的案例分析。通过深入研究这些案例,我们可 以更好地理解和应用矩阵对策的方法和技巧。
矩阵对策的优势和局限性
矩阵对策具有许多优势,如能够考虑多个因素和决策变量,以及能够量化和 比较各种策略。然而,它也存在一些局限性,如对信息和参数的需求较高。
矩阵对策的基本定理
矩阵对策的基本定理可以帮助我们确定最佳对策和策略组合。通过对矩阵对 策进行精确分析,我们能够得到优化的决策结果。
矩阵对策的解决方法
矩阵对策有多种解决方法,如通过优化算法和约束条件来求解最优解。同时, 可以利用计算机模拟和博弈理论等工具来辅助分析和决策。
矩阵对策在实际问题中的应用
结论和总结
矩阵对策是一种强大的决策分析工具,能够帮助我们做出更明智和优化的决 策。通过学习和应用矩阵对策,我们能够提高决策的准确性和效果,从而更 好地解决现实生活和工作中的问题。

矩阵对策定理


a
j
ij
y j * v*
a
i
ij i
x *
(4)
或 E(i,y*) v* E ( x*, j ) 又由 E ( x*, y*) E (i, y*)xi * v * xi * v * E ( x*, y*) E ( x*, j ) y j * v * y j * v *
E (i, y*) E ( x*, y*) E ( x*, j ) 其中,E (i, y) a y E( x, j ) aij xi ij j
j i
Hale Waihona Puke (3)证明:设(x*,y*)是G的解,则由引理2可知
E ( x, y*) E ( x*, y*) E ( x*, y)
E ( x, y*) E (i, y*)xi E ( x*, y*) xi E ( x*, y*)
定理2 对任一矩阵对策G={S1,S2; A},一定存在混合策略意义下的解。 证明:由引理3,只要证明存在x*S1*,y*S2*,使得(3)式成立。为此, 考虑如下线性规划问题:
min v max w aij y j v i 1,2,...,m aij xi w j 1,2,...,n i j ( P) 和( D ) xi 1 y j 1 i j xi 0, i 1,2,...,m y j 0, j 1,2,...,n
j i j
ai* j* m ax aij* m in m ax aij
i j i
则由
i
m ax m in aij m in m ax aij ai* j*
i j j i j

第2节 矩阵对策的平衡局势

第2节 矩阵对策的平衡局势
矩阵对策及其平衡局势
矩阵对策 平衡局势
矩阵对策的混合扩充 矩阵对策的简化 线性规划求解方法
矩阵对策
两人有限零和对策(也称矩阵对策) 有两个局中人,每个局中人的策略集合都是有限的,两个局 中人的支付函数H1,H2具有性质H1+H2=0。 局中人:两人 策略集:S1={α1,α2,…,αm},S2={β1,β2,…,βn} 局势集:S1×S2={(αi,βj) | i=1,2,…,m,j=1,2,…,n} 支付函数:H1(αi,βj)=aij 和 H2(αi,βj)=-aij

线性规划求解方法
给 定 矩 阵 对 策 Γ={S1,S2,A} , 由 定 理 10.2.2 , 局 势 (x*,y*)是Γ的平衡局势的充分必要条件是下列不等式 组成立: n m n m ∑aijyj*≤∑ ∑aijxi*yj*≤∑aijxi* j=1 i=1 j=1 i=1 i=1,2,…,m j=1,2,…,n 定理10.2.4 矩阵对策Γ={S1,S2,A},如果存在实数V 及局势(x*,y*),使下列不等式组成立: n m ∑aijyj*≤V, i=1,2,…,m; ∑aijxi*≤V, j=1,2,…,n j=1 i=1 *,y*)是平衡局势,V是值 则(x E(x,y*)≤E(x*,y*)≤E(x*,y) x∈S1*, y∈S2*
n

线性规划求解方法 续三
定理10.2.5 线性规划(10.2.10),(10.2.11)有最优解 X=(x1,x2,…,xm),Y=(y1,y2,,yn),并且∑xi=∑yj=1/V, X*=V(x1,x2,…,xm),Y*=V(y1,y2,,yn)是矩阵对策Γ={S1, S2,A}的平衡局势,V是值。

对策论矩阵求解

故令A中每个元素减1再乘以½ ,得到
• 目前讨论 A 为支付矩阵旳对策 旳解。为此先 解方程组
•和
• 上述不等式组无解,根据计算下面两个不 等式组
二、线性规划措施
• 例2.6.3 用线性规划措施求解例
• 解:先将A旳每个元素加3,得到每个元素都是整 数旳支付矩阵
6 1 4
A1
局中人Ⅰ在这三局中合计赢得至少。后来各局均照此方 式对策下去,直到迭代旳成果到达一定旳满意程度为止。
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm旳次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n旳次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵旳矩阵对策 ,为此求
解两个互为对偶旳线性规划问题
1
1
三、迭代法
迭代法是求矩阵对策旳一种近似措施。
基本思想:
假设两个局中人反复进行对策屡次,在每 一局中各局中人都从自己旳策略集中选用 一种使对方取得最不利成果旳策略,即第t 局对策纯策略旳选择欲使对手在前t-1局中 合计所得(或合计所失)至少(或最多)
• 注:假如上述两个方程组旳分别存在非负解
x*,y*,则求得了 旳一种解(x*,y*)和对策值;

假如x*,y*中有负旳分量,则将方程组
(2.6.1),(2.6.2)中旳某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中旳支付矩阵
• 对策 没有鞍点。为了使A中元素尽量多旳变为0,

10矩阵对策

max V 7 x1 + 3 x 2 ≥ V 4 x1 + 6 x 2 ≥ V x1 + x 2 = 1 x i ≥ 0, i = 1,2
其意义是: 其意义是 : 甲在每个乙的策略下的期望赢得 都不少于V 都不少于V
17
1.基本概念 1.基本概念
同样, 为乙的最优损失, 为用策略i 同样 , 设 U 为乙的最优损失 , yi 为用策略 i 的概 则有: 率,则有:
3. 混合策略 b1 b2 例4 a1 7 4 A= a2 3 6
max 7 6 min min 4 3 找不到鞍点, 找不到鞍点, 因此在纯策略 意义下无解 max
解决办法: 解决办法:双方只能以某一 概率选取自己的策略, 概率选取自己的策略,所以 叫混合策略
13
1.基本概念 1.基本概念
12
− 1 − 1 − 1 1 − 1
1
−1 −3 −1 −1 −1 1
1
1 −1 −3 −1 −1 −1
1
−1 1 −1 −3 −1 −1
1
−1 −1 1 −1 −3 −1
1
− 1 − 1 − 1 1 − 1 − 3
1 无纯策略
1.基本概念 1.基本概念
max V
s.t.
∑a
i =1 m
i =1
m
ij
x i ≥ V , j = 1,2,..., n
=1
16
∑x
i
xi ≥ 0, i = 1,2,..., m
1.基本概念 1.基本概念
例如,上例中, 为甲的最优赢得, 例如,上例中,设V为甲的最优赢得,xi为用策 的概率,则有: 略i的概率,则有:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

前提假设:“理性”是所有局中人的共同知识 (Common Knowledge)
例:求下面博弈的重复剔除的占优均衡解
Ⅱ B1 A1 A2 1, 0 0, 3 B2 1, 2 0, 1 B3 0, 1 2, 0 B1 Ⅱ B2
前提: 对策双方均理智 结论: 最不利中选最有利
s1 3 A s 2 6 s3 - 5
1 0 -1
2 - 3 4
问:双方局中人采用何策略最佳。
解:可用下述表格表示上述寻找最优纯策略过程:
d1 s1 s2 s3 3 6 -5 6 d2 1 0 -1 1 d3 2 -3 4 4
2.混合策略集合
称集合
* m S x ( x1 , x 2 , , x m ) x i 1, x i 0 i 1
为甲的混合策略集合; n * D y ( y1 , y2 , , yn ) y j 1, y j 0 j 1 为乙的混合策略集合; 3.混合局势 当局中人甲选择混合策略x;局中人乙选择混 合策略y,称(x,y)为一个混合局势。
归一化
1 x x' , w

1 y y' z

例: “剪刀、石头、布” 游戏,
1 1 0 A 1 0 1 1 1 0
A+2
m in z x1 x2 x3 2 x1 x2 3 x3 1 1 1 1 T 3 x1 2 x2 x3 1 求解 X ( , , ) st x1 3 x2 2 x3 1 6 6 6 xi 0( i 1, 2, 3) 归一化 1 1 1 T X ( , , ) 3 3 3 1 1 1 T 同理, Y ( , , ) 3 3 3
* maxminaij minmaxaij aij i j j i
V a 称为对策G 之值。 例 上例中 G S , D, A
* ij
则称局势 ( si , d j ) 为对策G的一个鞍点,
*
*
3 A 6 - 5
1 0 -1
2 - 3 4
局势 ( s1 , d 2 )构成一个鞍点, 局中人甲的最优策略为s1 ,
称为i的劣策略(Dominated strategy)。
' i
'' i
例: B1 Ⅰ A1 A2 1, 0 0, 3

B2 1, 2 0, 1 B3 0, 1 2, 0
劣策略
可按如下思路寻找均衡解: 首先找出某个局中人的劣策略(如果存在),剔除该劣 策略,得到新的博弈;再剔除该新博弈中的某个中人的 劣策略。重复进行,直至只剩下唯一的策略组合为止, 这个剩下的策略称为重复剔除的占优均衡(Iterated dominance equilibrium)。
称为局中人甲的一个混合策略,即局中人甲选择 策略si的概率为xi 。 同理可定义乙的混合策略。
例: “剪刀、石头、布” 游戏,若B的混合策略 B (0.4,0.3,0.3)
石头(0.4) 剪子(0.3) 石头(0.5) 布(0.3)
A 剪子(0.2)

(0.3)
0 -1 1
1 0 -1
-1 1 0
二人有限零和对策
§2 纯策略对策
一、纯策略与混合策略
纯策略是指确定的选择某策略;而混合策略 则指以某一概率分布选择各策略。 二、纯策略对策的解 1. 引例
D d1 , d 2 , d 3 ,其赢得矩阵为: d1 d 2 d 3

设一对策 G S , D, A,其中 S s1 , s2 , s3 ,
(Ⅰ)
m in
w x1 ' x2 ' xm '
m aij xi ' 1, j 1,2, , n s.t i 1 xi ' 0, i 1,2, , m
(Ⅱ) max
z y1 ' y2 ' yn '
n aij y j ' 1, i 1,2, , m s.t. j 1 y j ' 0, j 1,2, , n
2 3 1 1 2 3 3 1 2
第三部分
二人有限非零和对策
一、非零和对策的一般表达 1、局中人集合:i = 1, 2 ,…,n 2、每个局中人的策略集:Si (i = 1,…,n) 3、每个局中人的赢得函数:ui (s1, …, s i , … sn)
对策的一般表达:G={S1, … Sn ; u1, … un }
*' *
*'
* ( x1
* * xk , x 1 k 1 * * xk , 0 , x 1 k 1
* xm ) * xm )
* 则X * ( x1
例: 用优超原理求解下列对策
1 -1 A 2 0 1 -1 2 0 0 4 2 4 3 0 2 1 0 4 2 4 3 0 2 1 4 1 3 1 1 3 -1 4 2 0
二、纳什均衡
均衡(Equilibrium)是所有局中人的最优策 略的组合,一般记为:
s ( s ,, s ,, s )
s 是第i个局中人在均衡情况下的最优战略,即 其中,
i

1
i
n
ui ( s , si ) ui ( s , si ) s s
' i ' i
i
1
1 3 1
1
1 1 3
4、优超原理
定义: 若A中第i, k 行有aij akj , j 1 记 i 记 j n 称 i 优超于 k 。 m 称 j 优超于l
3
k

若A中第j, l列有aij ail , i 1
l
例: A
1 0 2 2 3 1
β1 β2 β3 β4 β5 β6 (上中下) (上下中) (中上下) (中下上) (下上中) (下中上)
α1 (上中下) α2 (上下中) α1 (中上下) α1 (中下上) α1 (下上中) α1 (下中上)
3 1
1 3
1 1
1 1
-1 1
1 -1
1
-1 1 1
-1
1 1 1
3
1 1 -1
1
3 -1 1
4
(2)
A
'
根据性质3,则X * (0,0,1,0), Y * (1,0,0,0), VG* 2
§3 混合策略对策
一、混合策略对策的基本概念
无鞍点对策的求解方法是采用混合策略,混合策略就 是局中人考虑以某种概率分布来选择他的各个策略。
1.混合策略
T x ( x , x , , x ) , xi 1, xi 0, m维概率向量 1 2 m i 1 m
1
2
2 1 3
2 3 3
3 1 3 2
性质1:若G ( S1 , S2 , A)中, i ① VG VG '
' k,构造新的G ' ( S1' , S2 , A' )
' 其中S1'是S1去掉 k,S2 =S2,A'是A中去掉k 行,则:
② y y 若X
i i j
(2)局中人乙对每个策略dj的评价值为
dj
* j
评价
g (d j ) max a ij
i
故局中人乙选择策略模型为:
d ming(d j ) minmaxaij Vmin
j j i
3. 纯策略对策模型的解
(1) 鞍点与解 对于一个对策 G S , D, A ,如果有
4.收益期望函数
对于一个混合局势(x,y),用
E ( x , y ) xi ( aij y j ) aij xi y j x T Ay
i 1 j 1 i 1 j 1
m
n
m
n
表示局中人甲在混合局势(x,y)时的收益期望值。 5.混合策略对策模型 对于一个纯策略对策 G ( S , D, A) ,我们用
0×0.4 + 1 ×0.3 + (-1)×0.3=0 则A选“石头”的期望赢得为: (-1)×0.4 + 0 ×0.3 + 1 ×0.3= - 0.1 则A选“剪子”的期望赢得为: 1×0.4 + (-1) ×0.3 + 0×0.3=0.1 则A选“石头”的期望赢得为: 若又已知A的混合策略(0.5,0.2,0.3),则A的期望赢得为: 0×0.5 + (-0.1) ×0.2 + 0.1×0.3= 0.01 (同理,B的期望赢得为-0.01)
局中人乙的最优策略为d2,
对策值V=1
(2) 多鞍点与无鞍点对策
例 设有一矩阵对策如下,求它的解。
6 1 A 8 0 5 4 5 2 6 2 7 6 5 - 1 5 2
局势 ( s1 , d 2 ) ( s1 , d 4 ) ( s3 , d 2 ) ( s3 , d 4 ) 均构成鞍点, 此对策有多个解。
i
( si ( s1 , , si 1 , si 1 , , sn ) 表示除 i 之外
所有局中人的策略组成的向量。)
均衡的层次:
占优策略均衡 重复剔除的占优均衡 (纯策略)纳什均衡 混合策略纳什均衡
弱 强
条 件
1. 占优策略均衡
坦白
II 不坦白
考虑“囚犯困境”问题: 坦白 (9, 9) (0, 10) I 不坦白 ( 10, 0) ( 1, 1) 不论同伙选择什么策略,每个囚徒的最优策略是“坦白”。
相关文档
最新文档