第一引论第二矩阵对策第三矩阵对策的求解-资料
对策问题的提出对策论模型矩阵对策的解法◎知识归纳

(1)局中人 在一个对策行为中,有权决定自己行动方案的对策参加者被称为局中人。局中 人除了理解为个人外还可以理解为集体,如球队、交战国、企业公司等,也可以把大 自然理解为局中人(因为人类经常处于和大自然斗争的状态中);另外,还假定局中 人都是聪明的,有理智的和利己的。同时,为使所研究的问题更加清晰,把那些利益 完全一致的参加者们看做一个局中人,因为他们利害一致,必使他们齐心合力,相互 配合行动如一个人。例如,桥牌游戏中,东西双方利益一致,南北两方得失相当,所 以虽有四人参加,只能算有两个局中人。 一个对策中一般要求至少有两个局中人。每个局中人用i表示,局中人的集合用 字母I表示,则I={1,2,…,n}。我们称只有两个局中人的对策现象为“两人对 策”,如象棋、桥牌等,显然上述齐王赛马中局中人也是两人,即I={1,2}。而 多于两个局中人的对策称为“多人对策”。另外根据局中人之间是否允许进行合作, 还可有“结盟对策”和“不结盟对策”,或称为“合作博弈”和“非合作博弈”。
(2)物流仓储优化策略 【例8.2】一仓储供应中心为其下游的一家生产企业供应某种原料。生产企业根 据产品订单情况对原料的需求进行分析,分别有淡季、旺季和正常三种情况,在正 常情况下需要原料15吨,在淡季和旺季情况下分别需要原料10吨和20吨;而原料的 价格与原料市场的需求有关,在淡季、正常、旺季三种情况下,每吨原料的价格分 别为100元、150元和200元,已知此时每吨原料的价格为100元。问在生产企业对原 料的需求没有确定预知的条件下,此时应采购多少吨原料才能使仓储供应中心的总 成本最少(不计存储费用)? 这个问题可看成一个博弈问题。即仓储供应中心针对可能出现的三种不同的原
8.1.2 对策论在现代物流管理中的运用
在现代物流管理实践中,决策者们为了谋求自身的不断发展,保持自身的竞争 优势,必须不断地审时度势、不停地进行选择和作出决定,以保证最大限度地降低 物流成本、提高物流效率及服务水平。他们的选择和决定会影响到竞争对手的决策 结果,同样竞争对手的选择和决定也直接影响着他们的决策结果。也就是说,决策 者在决策时必须要考虑到对手的策略,因此,博弈论的思想已完全融入到现代物流 管理的每一个环节中。博弈论在现代物流管理中的运用主要有物流项目投资、物流 市场竞争对策、物流服务价格策略、物流中心选址、物流运输规划、物流仓储优化 等内容。以下仅就本书涉及到的有关博弈论中矩阵对策的例子作简要介绍。
矩阵对策问题及其解法

矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。
有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。
⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。
局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。
矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。
矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。
局中⼈ II 的赢得矩阵就是 −A T。
最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。
显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。
混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。
我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。
纯策略是混合策略的特例。
若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。
同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。
运筹学 第15章 对策论

23
• 局中人1为了使此值达到最大,就调整x1和 x2的值;而局中人2为了使此值达到最小, 也要调整y1和y2的值。 • 此时,上述问题变为条件极值问题,可用拉 格朗日乘数法求解,令λ 、μ为待定系数, 将式 • W=10x1y1-5x1y2-5x2y1+ λ (x1+x2-1)+ μ(y1+y2-1) • 对x1、x2、y1、y2求偏导数,并让它们等于 0。
下面矩阵称齐王的赢得矩阵:
3 1 1 -1 1 1 1 1 1 3 1 1 -1 3 1 1 1 3 1 1 -1 1 -1 1 -1 1 1 1 3 1 1 -1 1 1 1 3
A=
管
理
运
筹
学
6
§1 对策论的基本概念
二人有限零和对策(又称矩阵对策): 局中人为2;每个局中人的策略集的策略数目都 是有限的;每一局势的对策均有确定的损益值,并 且对同一局势的两个局中人的益损值之和为零。
消耗10吨和20吨。假定冬天的煤价随天气寒冷程度而有所变化,在
较暖和、正常、较冷的气候条件下每吨煤价分别为10元、15元、20 元。又设冬季时煤炭价格为每吨10元。在没有关于当年冬季准确的 气象预报的条件下,秋天储煤多少吨能使得单位的支出最少? 解:局中人I为采购员,局中人II为大自然,采购员有三个策 略,买10吨、15吨、20吨。分别记为1,2,3。大自然也有三个 策略:暖、正常、冷,分别记为1,2,3。
8 2 A 9 0 5 3 5 2 8 5 2 1 6 5 3 3
求纳什均衡
1 2 3 4 min
【解】 直接在赢得表上计算,有
max min ai* j min max aij* ai* j*
矩阵对策的最优纯策略

,m α,
,
,n β;则分别为
},m α和},n β。
当局中人Ⅰ选定纯策略i α和局中人Ⅱ选定纯策略后,就形成了一个纯局)j ,这样的纯局势共有m n ⨯个。
对任一纯局势赢得值为ij a ,称
12122
212n n m m mn a a a a a ⎤⎥⎥⎥⎥⎦
为局中人Ⅰ的赢得矩阵。
局中人Ⅱ的赢得矩阵就是当局中人Ⅰ,Ⅱ的策略集12,S S 及局中人Ⅰ的赢得矩阵对策也就给定了,记为{}12,,G S S A =。
在齐王赛马的例子中,齐王的赢得矩阵
},
,m α,
},n β,max )
成立,记其值为)成立的纯局势()
,i j αβ**
在纯策略意义下的解(或鞍点)
},m α,},n S β,
1,2,
,,m x ∑1,2,
,,n y ∑分别称为局中人Ⅰ和Ⅱ的混合策略集分别称为局中人Ⅰ和Ⅱ的混合策略(或策略),对
),m x 可设想成当两个局中人多次重复进行对策
12,,
,m ααα的频率。
若只进行一次时对策,混合
对策可设想成局中人Ⅰ对各纯策略的偏爱程度。
求解混合策略的问题有图解法,迭代法、线性方程组法和线性规划法,在。
对策论矩阵求解

• 目前讨论 A 为支付矩阵旳对策 旳解。为此先 解方程组
•和
• 上述不等式组无解,根据计算下面两个不 等式组
二、线性规划措施
• 例2.6.3 用线性规划措施求解例
• 解:先将A旳每个元素加3,得到每个元素都是整 数旳支付矩阵
6 1 4
A1
局中人Ⅰ在这三局中合计赢得至少。后来各局均照此方 式对策下去,直到迭代旳成果到达一定旳满意程度为止。
近似解: 若设在N局对策中局中人Ⅰ出α1,α2, …,αm旳次数 为k1,k2, …,km ,局中人Ⅱ出β 1, β 2, …, β n旳次数 为l 1, l 2, …, l n ,xN=(k1 /N ,k2 /N, …,km /N), yN=(l1/N ,l2/N, …,lm /N), 则(xN, yN )就是所求近似解。
2
7
5
5 5 6
• 转而讨论以A1为支付矩阵旳矩阵对策 ,为此求
解两个互为对偶旳线性规划问题
1
1
三、迭代法
迭代法是求矩阵对策旳一种近似措施。
基本思想:
假设两个局中人反复进行对策屡次,在每 一局中各局中人都从自己旳策略集中选用 一种使对方取得最不利成果旳策略,即第t 局对策纯策略旳选择欲使对手在前t-1局中 合计所得(或合计所失)至少(或最多)
• 注:假如上述两个方程组旳分别存在非负解
x*,y*,则求得了 旳一种解(x*,y*)和对策值;
•
假如x*,y*中有负旳分量,则将方程组
(2.6.1),(2.6.2)中旳某些等式改为不等式试算。
例2.6.1 求解矩阵对策----田忌赛马问题。 解:已知田忌赛马问题中旳支付矩阵
• 对策 没有鞍点。为了使A中元素尽量多旳变为0,
矩阵对策纯策略意义下的解

此而来。通常把矩阵对策记为
G={Ⅰ,Ⅱ;S1,S2;A} 或
G={S1,S2;A}
例:G={S1,S2,A} S1={α1,α2,α3,α4} S2={β1,β2, β3}
-6 1 -8 A= 3 2 4
9 -1 -10 -3 0 6
对于G={S1,S2;A}, 若有等式
max min aij=min max aij=ai*j*
aij*≤ai*j*≤ai*j
例如
65 15 A= 8 5 02
65 2 -1 55 62
7.3 矩阵对策混合策略意义下的解
先看一个简单的例子: A= 3 6 54
一般地,设矩阵对策G={S1,S2;A},其中 S1={α1,α2,…,αm},S2={β1,β2,…,βn}, A=(aij)m×n
为各局中人的最优混合策略。例
(2)线性规划法
当对策的值大于0时,可利用
线性规划法求解矩阵对策。构造
两个线性规划问题
min z=∑xi i
∑i aijxi≥1 (j=1,2,…,n)
xi≥0
(i=1,2,…,m)
max w=∑j yj
∑j aijyj≤1 (i=1,2,…,m)
பைடு நூலகம்
yj≥0
(j=1,2,…,n)
7.2 矩阵对策纯策略意义下的解
矩阵对策就是二人有限零和对策。设两个局中人为Ⅰ、
Ⅱ,它们各自的策略集为
S1={α1,α2,…,αm} S2={β1,β2,…,βn} 当局中人Ⅰ选定纯策略αi,局中人Ⅱ选定纯策略βj后,就 形成了一个纯局势(αi,βj),这样的纯局势共有m·n个。
对任一纯局势(αi,βj),记局中人Ⅰ的赢得值为aij,则得 矩阵 A=(aij),称为矩阵人Ⅰ的赢得矩阵。由于是零和对 策,则矩阵人Ⅱ的赢得矩阵为-A。矩阵对策的名称正是由
对策论

在日常生活中,经常可以看到一些具有相互斗 争或竞争性质的行为,
如下棋、打牌、体育比赛等 还有企业间的竞争、军队或国家间的战争、政治斗 争等,都具有对抗的性质。
这种具有竞争或对抗性质的行为称为对策行为。
在这类行为中,各方具有不同的目标和利益。为实 现自己的目标和利益,各方必须考虑对手可能采取 的行动方案,并力图选择对自己最为有利或最为合 理的行动方案。
在田忌赛马中
局中人集合I={1,2}
齐王和田忌的策略集合可分别用S1={α1,…,α6}, S2={β1,…,β6}
齐王的任一策略αi和田忌的任一策略βj就构成了一个 局势sij
如果α1 =(上,中,下), β1 =(上,中,下), 则在局势s11下,齐王的赢得为H1(s11)=3,田忌的赢 得为H2(s11)=-3
6 1 8 3 2 4 A 9 1 10 3 0 6
局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理,转而出α4来对 付,使局中人Ⅱ得不到10,反而失掉6; …… 如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方 必然会设法使自己所得最少这一点,就应该从各自可能出现 的最不利情形中选择一个最有利的情形作为决策一句。 这就是所谓的“理智行为”,也是对策双方实际上可以接收 并采取的一种稳妥的方法。
对策问题举例:市场购买力争夺问题
据预测,某乡镇下一年的饮食品购买力将有4000万元。乡镇企 业和中心城市企业饮食品的生产情况是:乡镇企业有特色饮食品 和一般饮食品两类,中心城市企业有高档饮食品和低档饮食品两 类产品。他们购买这一部分购买力的结局表如下。
乡镇企业所得(万元)
乡镇企业 的策略 出售特色饮食品
即局中人Ⅰ、Ⅱ的策略集分别为
运筹学—对策论(四)

补充定理:
定理9 设(x*,y*)是矩阵对策G的解, υ =VG,则
=υ ⑴若xi*>0, 则 ∑ aijyj* j =υ ⑵若yj*>0, 则 ∑ aijxi* i ⑶若 ∑ aijyj* < υ 则xi*=0 j 则yj*=0 ⑷若 ∑ aijxi* >υ i
§3矩阵对策的解法
A
1 Ⅱ
Ⅰ
V=2x+7(1-x)
7 5 2
0
· β2 · β3 · B
1
β1
B
B2
Ⅰ
方程组:
折线B1 B B2 B3上的点的 · 11 纵坐标就是对应x的最 小赢得值。按最大最 小原则应选择x=OA, · 3 AB即为对策值。为求 B3 · 2 出x和对策值VG,可 1 Ⅱ 求 x=3/11, VG=49/11。所以
过数轴上O和1的两点作两条垂线Ⅰ–Ⅰ ,Ⅱ –Ⅱ,在垂线 上把局中人Ⅰ采取纯策略α1和α2时,局中人Ⅱ分别采取 纯策略β 1, β 2, β 3 时的赢得值标出。如图 Ⅰ Ⅱ 折线B1 B B2 B3上的点的 V=2x+7(1-x) · 11 纵坐标就是对应x的最 β1 小赢得值。按最大最 7 · β 小原则应选择x=OA, 5 ·2 β3 · 3 AB即为对策值。为求 B B2 2 · B1 B3 · 2 出x和对策值VG,可 0 Ⅰ
A
1 Ⅱ
Ⅰ
V=2y+7(1-y) B
B2 Ⅱ
B1 α 1
1 Ⅱ
折线B1 B B2 上的点的纵 · 11 坐标就是对应y的最大 损失值。按最小最大原 则应选择y=OA,AB即 · 3 为对策值。为求出y和 ·2 对策值VG,可求
方程组:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
零和
盟
多人
对
策
无
非零和
限
对 同有限对策
策
第二节:矩阵对策
1.矩阵对策的数学模型 2.矩阵对策解的问题 3.矩阵对策的混合策略 4.矩阵对策的基本定理 5.矩阵对策解的性质
2019/10/7
1.矩阵对策的数学模型
(1)矩阵对策的内涵:二人有限零和对策,即对策双方 的利益是激烈对抗的。
(2)矩阵对策的数学模型:
2019/10/7
3. 矩阵对策的混合策略
例:对策矩阵G={S1,S2,A},其中: A= 3 6
54
显然G在策略意义下的解不存在,于是设x=(x1,x2) 为局中人甲的混合策略, y=(y1,y2)为局中人乙的混 合策略,则
S1* = {xi 0,i=1,2; x1+ x2 = 1} S2* = {yj 0,j=1,2; y1+ y2 = 1} 局中人甲的赢得期望值是:E (x,y) =xT A y
Min
7 5 6 5 5 A= 2 -3 9 -4 -4 Max = 5
6 5 7 5 5 0 1 -1 2 -1
Max 7 5 9 5
Min = 5
i = 1, 3 ,j = 2, 4,ai*j* = 5,四个局势均为矩 阵对策的解。
2019/10/7
3. 矩阵对策的混合策略
对矩阵对策G={S1,S2,A}来说,局中人甲 有把握的最小赢得是:
v1 = max min aij
ij
局中人乙有把握的最大损失是: v2= min max aij
ji
当v1 = v2时,对矩阵对策有策略意义下的解;
然而并非总是如此,经常是 v1 < v2 ( 总有v1
v2 ),此时没有策略意义下的解。 2019/10/7
Min
-4 2 -6 -6
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
Max
8 36
Min 3
局中人甲应选择2 ,乙应采取2策略;结果甲赢得3,乙付
出3。
2019/10/7
2. 矩阵对策解的问题
定义1:设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,…,m}, S2 = {1 ,2 , …, n}
抽到红牌1/2
掷硬币
让乙猜
抽到黑牌1/2 让乙猜
正面 1/2
反面 1/2
p
-q
2019/10/7
猜红 -r
猜黑
猜红
s
t
猜黑 -u
1. 矩阵对策的示例2
抽到红牌1/2
掷硬币
让乙猜
抽到黑牌1/2 让乙猜
正面 1/2
p
反面 1/2
-q
猜红 -r
猜黑
猜红
s
t
猜黑 -u
若甲决定掷硬币这个策略,则乙的猜红或猜黑已无意
2019/10/7
5.矩阵对策解的性质
性质2:矩阵对策G1={S1,S2,A1}、 G2={S1, S2,A2},解集分别为T( G1 )和 T( G2 ),若其 中有A1=(aij)、 A2=(aij+L ),L为任一常数, 则:(1) V G2= V G1+L;
Am×n={aij}。因为对策是零和的,所以乙的赢得矩阵为 -Am×n。
2019/10/7
1. 矩阵对策的数学模型
建立二人零和对策的模型就是要根据对实际问 题的叙述,确定甲、乙两个局中人的策略集合以 及相应的赢得矩阵。不难看出在“齐王赛马”的 例子中,齐王的赢得矩阵为:
3 1 1 1 1 -1
1 3 3 3 -1 1
max min E (x,y) = min max E (x,y)
x S1* y S2*
y S2* x S1*
记其值为VG,则VG为对策G *的值,使上式成立的混合 局势(x *,y *)为G 在混合策略意义下的解, x *,y * 分别称为局中人甲和乙的最优混合策略。
注:策略意义下的解不存在时,自动转向混合策略意义下 的解。
A= 4 3 5
3
8 -1 -10 -10
-3 0 6 -3
Max 3
局中人甲应选择2 ,此时不管局中人乙采取什么策略,甲的
赢得均不小于3。
2019/10/7
2. 矩阵对策解的问题
设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,3,4}, S2 = {1 ,2 , 3}
aij* ai*j* ai*j 定理1:设矩阵对策G={S1,S2,A}在策略意义下
有解的充分必要条件是存在着局势( i* ,j* )
使得对于一切i与j都有aij* ai*j* ai*j成立。
2019/10/7
2. 矩阵对策解的问题
例:设矩阵对策G={S1,S2,A},赢得矩阵为:
定理4:设 x * S1* , y * S2*则(x *,y *) 是矩阵对策G的解的充分必要条件是存在数v使得x * 和y *
分别是不等式组
aijxi v (j=1,2,…,n)
i
aijyj v (i=1,2,…,m)
j
xi = 1
xi 0 (i=1,2,…,m)
的解,且v=VG。
2019/10/7
3. 矩阵对策的混合策略
例:E (x,y) =xT A y =3x1y1+6x1y2+5x2y1+4x2y2 = -4(x1-1/4)(y1-1/2)+9/2
取x *=(1/4,3/4),y *=(1/2,1/2),则
E (x,y *)= E (x *,y *) = E (x *,y) = 9/2
齐王:上、 中、 下 田忌:上、 中、 下
2019/10/7
1.引例:齐王赛马
齐王:上、 中、 下 田忌:上、 中、 下
2019/10/7
2.对策行为的基本要素
1. 局中人(Player):在一个对策行为中,有权 决定自己行动方案的参加者称为局中人。 2. 策略(Strategy):一局对策中,可供局中人 选择的完整的行动方案称为策略。 3. 赢得函数(Score):一局对策中,局中人使 用每一策略都会有所得失,这种得失是全体局中 人所采取的一组策略的函数,称为赢得函数。 4. 局势:一局对策中,各局中人选定的策略所形 成的策略组称为一个局势。
2019/10/7
3. 矩阵对策的混合策略
对 x S1*, y S2* 称(x, y)为一个混合局势,局
中人的赢得函数记成:
E (x, y) =xT A y 这样便得到一个新的对策
G* = {S1*, S2*, E} G*称为G的混合扩充。
2019/10/7
3. 矩阵对策的混合策略
G * = {S1*, S2*, E} 是G={S1,S2,A}的混合扩 充,如果
猜红
猜黑
p
-q
-r
s
t
-u
乙
甲
猜红
猜黑
掷硬币 1/4(p-q+2t) 1/4(p-q-2u)
让乙猜
1/2(-r+t) 1/2(s-u)
2019/10/7
2. 矩阵对策解的问题
设矩阵对策G={S1,S2,A},其中:
S1 ={1,2,3,4}, S2 = {1 ,2 ,3} ,
Min
-4 2 -6 -6
即有
E (x,y *) E (x *,y *) E (x *,y)
故x *和y *分别为局中人甲和乙的最优(混合)策略。
2019/10/7
4.矩阵对策的基本定理
定理1:设矩阵对策G={S1,S2,A}在策略意 义下有解的充分必要条件是存在着局势( i* ,j* ) 使得对于一切i与j都有aij* ai*j* ai*j成立。
A = {aij}mn ;若
Max min aij = Min max aij = ai*j*
i
j
j
i
则称ai*j*为对策G的值,局势( i* ,j* )为G的 解,i*和j*分别称为局中人的最优策略。
2019/10/7
2. 矩阵对策解的问题
由于ai*j*既是其所在行的最小值,又是其所在 列的最大值,于是有:
甲:有m个策略,表示为S1=( 1, 2, 3,……, m) 乙:有n个策略,表示为S2=( 1, 2, 3,……, n) 当甲选定策略i 、乙选定策略j 时,就形成了一个 局势( i , j )。可见这样的局势总共有m n个,对任 意局势( i , j )甲的赢得值为aij,即甲的赢得矩阵为
4.矩阵对策的基本定理
定理3:设 x * S1* , y * S2*则(x *,y *)
是矩阵对策G的解的充分必要条件是对任意的i(1,2,…,m)和 j(1,2, …,n)有
E (x,y *) E (x *,y *) E (x *,y)
2019/10/7
4.矩阵对策的基本定理
1 -1 3 1 1 1 A=
-1 1 1 3 1 1
2019/10/7
1 1 -1 1 3 1
1 1 1 -1 1 3
1. 矩阵对策的示例1
例1 :甲的赢得矩阵
乙
甲
石头 剪子
布
石头
0
1
-1
剪子
-1
0
1
布
1
-1
0
2019/10/7
1. 矩阵对策的示例2
例2 :从一张红牌和一张黑牌中随机抽取一张,在对乙保密的情况 下拿给甲看。若甲看到的是红牌,他可以选择掷硬币或让乙猜;若 甲选择掷硬币,出现正面甲赢 p 元,出现反面甲输 q 元;若让乙猜, 当乙猜中是红牌时甲输 r 元,否则甲赢 s 元。若甲看到的是黑牌, 他只能让乙猜,当乙猜中是黑牌时甲输 u 元,否则甲赢 t 元。试确 定甲、乙各自的策略并建立赢得矩阵。