矩阵对策论

合集下载

矩阵对策

矩阵对策
i j
max aij 对局中人 II,求 min j i
若 max min aij min max aij a i
i j j i

*
j*
策略 i , j 为I,II 的最优策略
这一对策 的值为 V a i

j
几个术语
局势 对策的解
最优纯策略
对策的值 鞍点 e. g. 2 (续)求解取暖购煤问题
两人零和对策
对抗对策(antagonistic game)
矩阵对策(matrix game)
二.实际问题中的矩阵对策模型
e. g. 1 扩大销售模型
公司I,公司II 的同一产品竞争市场份额,各有三种办 法扩大销售额(由于市场需求一定,一家扩大,意味 另一家缩减),三种方法比如:①改进包装;②广告; ③降价.公司I 的三种策略表示为 1 , 2 , 3 ,公司II 的三种策略为 1 , 2 , 3 ,在不同策略下销售量增长百 分比不同.下表中表示公司I 的增长率,而公司II 的即 为相反数
e. g. 6 (续)求最优策略与值
作业
P206,
Ex 6. 3:1,2
1=急转 2 =不转
1
给急转弯者以1 分,不转弯者以5 分 局中人II 局中人I 局 =急转 1 中 人 2=不转 II
3 5
1 =急转 2=不转
1 0
0
II 的支付矩阵
此对策中,若两者都想得5 分,则发生惨祸, 全部玩完.实际上两人最好的做法是同时停车 或转弯,各得3 分. Remark 此例已不是 2 人有限零和对策问题(因为在 每个对局中,双方支付的代数和不为零), 称为双矩阵对策.
e. g. 2 取暖购煤问题 某公司在秋末需决定冬季取暖用煤问题.根据气温 情况,用煤量和煤价均不同,可用下表表示: 正常气温 较冷气温 较暖气温 需求量15 吨 需求量20 吨 需求量10 吨 200元/吨 250元/吨 150元/吨

运筹学12-2对策论

运筹学12-2对策论

3.矩阵对策的混合策略(续)
-- 优超原则:当局中人甲方的策略t被其它 策略所优超时,可在其赢得矩阵A中划去第t 行(同理,当局中人乙方的策略t被其它策 略所优超时,可在矩阵A中划去第t列)。 如此得到阶数较小的赢得矩阵A’,其对
应的矩阵对策
G’= { S1,S2,A’}与 G ={ S1,S2,A } 等价,即解相同。
17
再讨论“齐王赛马”
• “齐王赛马”的赢得矩阵A有 max min aij=-1 min max aij=3
i j j i
故需求混合策略,由于A中有非正元素, 可选k=2,令矩阵中每一元素加上k得到新的 正矩阵A’:
5 3 3 1 3 3 3 5 1 3 3 3 3 3 5 3 3 1 3 3 3 5 1 3 1 3 3 3 5 3 3 1 3 3 3 5
19
再讨论“齐王赛马”(续)
• 求乙方(田忌)最优策略的线性规划模型:
min Y1+Y2 +Y3 +Y4 +Y5 +Y6 s.t. 5Y1+3Y2 +3Y3 +3Y4 + Y5 +3Y6 1 3Y1+5Y2 +3Y3 +3Y4 +3Y5 + Y6 1 3Y1+ Y2 +5Y3 +3Y4 +3Y5 +3Y6 1 Y1+3Y2 +3Y3 +5Y4 +3Y5 +3Y6 1 3Y1+3Y2 +3Y3 + Y4 +5Y5 +3Y6 1 3Y1+3Y2 + Y3 +3Y4 +3Y5 +5Y6 1 Y1,Y2,Y3,Y4,Y5,Y6 0 可得两组解:(1/9,0,0,1/9,1/9,0)T, (1/18,1/18,1/18,1/18,1/18,1/18)T ,V’=3 于是,Y’=(1/3,0,0,1/3,1/3,0)T, Y’=(1/6,1/6,1/6,1/6,1/6,1/6)T V = V’-2 = 1 即田忌的最优混合策略值是输1千金

第1章 矩阵对策

第1章  矩阵对策
策被称为矩阵对策).对策按如下方式进行,局中人 1 选择行 i ∈ M ,局中人 2 选择列 j ∈ N ,
此时局中人 1 和 2 是同时并且独立地进行选择.因此局中人 1 获得支付 aij ,局中人 2 获得支
( ) 付 −aij .如果支付是一个负数, 那么可以认为是局中人的实际损失.
记具有支付矩阵 A 的对策 Γ 为 ΓA ,并且根据矩阵的维数,称之为 (m × n) 对策.如果
果它被隐藏在那里)的概率为 0 < βi ≤ 1 ,i = 1, 2, , n .如果找到目标,局中人 1 获得收益 为α .在其中隐藏和搜索物体的坑的编号是局中人的策略,局中人 1 的支付等于期望收益与
寻找目标时所付出的努力之差.隐藏和搜索目标的问题可以转化为矩阵对策,其支付矩阵为
⎡αβ1 −τ1 −τ1 −τ1
选择进行攻击的目标(局中人 1)和防卫目标(局中人 2)的问题可以转化为矩阵对策,
其支付矩阵为
⎡β1τ1 τ1
A
=
⎢ ⎢
τ2
β2τ 2

⎢ ⎣
τn
τn
τ1 ⎤
τ2
⎥ ⎥

β

n
⎥ ⎦
例 1.1.5 (离散型搜索对策)有 n 个坑,局中人 2 在 n 个坑中之一隐藏物体,局中人
1 希望找到它.在寻找第 i 个坑时局中人 1 付出的努力为τi > 0 ,在第 i 个坑中找到目标(如
m −1 > n ,则 a10 = n +1+1 = n + 2 , a11 = n −1+1 = n , a1 j = n − j +1−1−1 = n − j −1,
2 ≤ j ≤ n .一般情况下(对任意的 m 和 n )元素 aij , i = 0, m , j = 0, n 以及支付矩阵可以

第八讲 矩阵对策概要

第八讲 矩阵对策概要

矩阵G的一般解法
1)取每行的最小值:
min gij i 1, 2, , m
j
i
maxmin gij i 1, 2, , m 2)从上述值中选最大值: j
j
3)取每列的最大值: max gij j 1,
i
2, , n
max gij j 1, 2, , n 4)从3)项中选最大值:min j
E X ,Y E X ,Y
那么: X




x和y EX ,Y

都成立时
局中人P1的最优策略; 局中人P2的最优策略; 对策的值; 对策的解;
Y
E X ,Y

X
,Y


最优策略的解法

假设策略的值是V,最优策略及策略的解可 通过下式求得。
m
E X , j g ij xi V
Y , , 5) 13 13 13 25 V 13
E 1, Y 3 y1 y2 y3 V E 2, Y y1 y2 5 y3 V E 3, Y y1 4 y2 y3 V y1 y2 y3 1
i
min gij min max gij gi* j* 时, 5)若 max j j i i
ai* →P1的最优纯策略; b * →P2的最优纯策略; j
a , b 对策的解; V
i* j*

g i* j* 对策 a * , b * 的值。 i j


例3
某耕地根据种植划以及自然条件,规划 与收益存在如下表所示的关系。 试求出最佳规划方案。

矩阵对策问题及其解法

矩阵对策问题及其解法

矩阵对策问题及其解法背景对策论研究具有竞争性质的现象。

有权决定⾃⾝⾏为的对策参加者称为局中⼈,所有局中⼈构成集合I,在⼀局对策中可供剧中⼈选择的⼀个实际可⾏的完整的⾏动⽅案成为策略,对于任意剧中⼈i∈I,都有⾃⼰的策略集S i。

⼀局对策中由各剧中⼈选定的策略构成的策略组称为局势s=(s1,...,s n),⽽全体局势集合S=S1×...×S n。

局势决定了对策的结果,对局势s∈S,局中⼈i可以得到收益H i(s),也称为局中⼈i的赢得函数。

矩阵对策即⼆⼈有限零和对策,是⼀类较为简单的对策模型。

矩阵对策基础我们假设,局中⼈ I 有纯策略α1,...,αm,局中⼈ II 有纯策略β1,...,βn,⼆者各选择⼀个纯策略则构成m×n个纯局势 (αi,βj),将 (αi,βj)下 I 的赢得值记为a i,j,设矩阵A=[a i,j],称为 I 的赢得矩阵或 II 的⽀付矩阵。

局中⼈ II 的赢得矩阵就是 −A T。

最优纯策略若纯局势 (a i∗,b j∗) 满⾜max i minj a i,j=minjmaxi a i,j=a i∗,j∗则称为矩阵对策 {S1,S2;A} 的最优纯策略。

显然,最有纯策略在赢得矩阵中对应的元素⼀定满⾜,其是所在⾏的最⼩元素,也是所在列的最⼤元素,即矩阵的鞍点。

混合策略当纯策略不存在时,我们希望给出⼀个选取不同策略的概率分布。

我们记 I,II 的概率分布向量分别为x,y,所有概率分布向量构成的集合为S1,S2,则局中⼈ I 的赢得函数为E(x,y)=x T Ay。

纯策略是混合策略的特例。

若混合局势 (x∗,y∗) 满⾜max x miny E(x,y)=minymaxx E(x,y)=E(x∗,y∗)则称为矩阵对策 {S1,S2;A} 的最优混合策略。

同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数E(x,y) 的鞍点。

对策论例题

对策论例题

策略 1 1 A 2 3 3 0 2
39; 3
把此对策问题表示成一个线性规划模型,并用单纯 形法求解此对策。 解 由 max min aij 0, min max aij 2, 知v>0 j j i i ' ' ' 先求B的最优策略,设B的策略为 ( y1 , y2 , y3 ), 对策值
* 1 * 2 * 3
例3 已知矩阵对策 , 局中人为A与B,A的赢的矩阵为
0 3 1 1 1 2 2 1 1 1 3 0
求对策的最优混合策略与对策的值。 解 由max min aij 2, min max aij 0, 知-2<V<0. 将上面的赢得矩阵中各元素都加上3, 得新的赢得
3 2 0 4
y y y 为v,并令 y1 , y2 , y3 , v v v
则B规划的线性规划模型为表5。1 初始表
max W y1 y2 y3,
3 y1 2 y2 s.t. 2 y y 1 2 y1 , y2 , 2 y3 4 y3 y3 0 1 1 1
的最优解为 2 或 4 , 最优解 V

5.
注: 此例说明,对策的解可以不惟一,但值是唯一的.
2。无鞍点的混合策划问题 (1)线性规划法求解
例 2 某小城市有两家超级市场相互竞争,超级市场
A有三个广告策略,超级高级B也有三个广告策略, 已经算出当双方采取不同的广告策略时,A方所占市 场 份额增加的百分数如下:
0
0
1
0
-1/3
1/3
YB
b
y1
y2
y3
s1
s2
s3

《运筹学教程》胡云权第五版运筹学-6对策论-矩阵对策

《运筹学教程》胡云权第五版运筹学-6对策论-矩阵对策

矩阵对策的基本原理
矩阵对策的基本原理是将决策问题抽象为一个决策矩阵,其中行表示决策方 案,列表示决策因素。通过对矩阵进行分析和计算,找到最优的决策方案。
矩阵对策的应用领域
矩阵对策可以应用于各种决策问题,包括但不限于供应链管理、投资组合优化、资源分配、人力资源管理等领 域。
矩阵对策的解决方法
矩阵对策可以通过数学方法和算法来求解,例如线性规划、整数规划、动态规划等。不同的决策问题可能需要 不同的解决方法。
案例分析:矩阵对策在实际问题中的应用
本节将通过案例分析展示矩阵对策在实际问题中的应用。我们将介绍一个具体的决策问题,并演示如何使用矩 阵对学习,你已经了解了矩阵对策的基本原理、应用领域和解决方法。希望本节内容对你在运筹学领域 的学习和应用有所帮助。
《运筹学教程》胡云权第 五版运筹学-6对策论-矩 阵对策
本节将介绍运筹学中的矩阵对策,包括其概述、基本原理、应用领域、解决 方法以及在实际问题中的应用。
运筹学简介
运筹学是一门研究在资源有限的情况下如何做出最佳决策的学科。它应用数学方法和模型来协助管理者进行决 策和优化。
矩阵对策概述
矩阵对策是一种运筹学方法,通过构建决策矩阵来帮助管理者进行决策。它 可以同时考虑多个决策因素和多种决策方案,从而找到最佳决策。

对策论(Theory of Games)

对策论(Theory of Games)

定义
并不是所有的对策都存在鞍点,如 A为齐王的赢得矩阵 3 1 1 1 1 -1 1 3 1 1 -1 1 A= 1 -1 3 1 1 1 -1 1 1 3 1 1 1 1 -1 1 3 1 1 1 1 -1 1 3 max(min aij)= -1 min (max aij)=3 i j j i
例如:
• 给定矩阵对策
6 5 6 A 1 4 2 8 5 7
对策的最优值为5,对策的解有两个,分 别为局势 , 和 , 。
1 2 3 2
(三)矩阵对策的混合策略
1、矩阵对策的混合策略的定义
2、原则:坏中求好的原则。 3、解的存在:一定有解 4、混合策略求解:利用期望转化成 线性规划问题求解。
三、矩阵对策模型
(一)矩阵对策的概念 (二)矩阵对策的最优纯策略 (三)矩阵对策的混合策略 (四)矩阵对策的解法
(一)矩阵对策的概念 1、矩阵对策的定义 2、建立矩阵对策模型
1、矩阵对策的定义 局中人只有两个,对策中各方只能从有限 的策略集中确定性的选择一种,且对策双 方的支付之和为零的对策称为两人零和纯 策略对策。
表2
齐 王 上中 下 田忌 上中下 3 上下 中上 中 下 1 1 中下 上 -1 下中 上 1 下上 中 1
上下中 1 中上下 1
中下上 1 下中上 1
3 1
1 -1
-1 3
1 1
1 1
3 1
1 -1
1 3
1 1
-1 1
下上中 -1
1
1
1
1
3
引例3
有两个儿童A和B在一起玩“石头-剪子布”游戏。我们规定胜者得1分,负者得 -1分,平手时各得0分。双方选定的各种 出法及相应的结果可由下表列出。双方 应取何种策略?
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

局中人II的赢得矩阵是 局中人II的赢得矩阵是 -A 把一个对策记为G 把一个对策记为G: G= S1,S2;A
北线 β1 南线β2 (盟军)北线 α1 盟军) 南线α2 2 1 2 3 =A
在矩阵中,盟军的最大赢得是3 在矩阵中,盟军的最大赢得是3, 而要得到3 必须选择策略α 而要得到3,必须选择策略α 2,而 日军的目的是使盟军的赢得尽量的 必须选择策略β 小,必须选择策略β1 ,使盟军的赢 得只有1 得只有1。 在局中人I 在局中人I设法使自己的赢得 尽可能大的同时,局中人II也设法 尽可能大的同时,局中人II也设法 使局中人I的赢得尽可能小。 使局中人I的赢得尽可能小。
有解的充分必要条件是在A 有解的充分必要条件是在A中存在元 素 ai*j*是其所在行中最小的同时又 是其所在列中最大的。这时ai*j*即 是其所在列中最大的。 是对策值,因此ai*j*也称为“鞍 也称为“ 对策值, ),为对策 点”,而( α*i*, β*j *),为对策 的解。 的解。
Z
鞍点
Y
X
经测算,双方均可得到如下估计: 经测算,双方均可得到如下估计: 局势1 盟军的侦察机重点搜索北线, 局势1: 盟军的侦察机重点搜索北线, 日本舰队也恰好走北线。 日本舰队也恰好走北线。由于气候恶 能见度差, 劣,能见度差,盟军只能实施两天的 轰炸。 轰炸。 局势2 盟军的侦察机重点搜索北线, 局势2:盟军的侦察机重点搜索北线, 日本舰队走南线。由于发现晚, 日本舰队走南线。由于发现晚,尽管 盟军的轰炸机群在南线, 盟军的轰炸机群在南线,但有效轰炸 也只有两天。 也只有两天。
马鞍面z=f(x,y) 马鞍面z=f(x,y)
Z
Y
在X=0的平面上 X=0的平面上
z=f(0,y)
鞍点是 鞍点是z=f(0,y)
的极大值点
Z
z=f(x,0)
X
在Y=0的平面上 Y=0的平面上
鞍点是 鞍点是z=f(x,0)
的极小值点
例14-3:对给定的矩阵对策 G = S1,S2;A 14S1= α1,α2 ,α3 6 A= 1 8 显然 S2= β1 , β2 , β3 5 4 5 6 2 7 ai2 ≤ a32 ≤ a3j
β1 α1 α2 α3 由 -1000 -1500 -2000
β2 -1750 -1500 -2000
β3 -3000 -2500 -2000
max min aij= min max aij = a33 = -2000
I j j i
该最优策略为( ),即秋季购煤 即秋季购煤20 该最优策略为(α3, β3),即秋季购煤20 吨。
(日军) 日军) 北线 (盟军)北线 盟军) 南线 2 1 (日军) 日军) 北线 (盟军)北线 盟军) 南线 -2 -1 南线 -2 -3 =B 南线 2 3 =A
在本例中的每一个对局,双方的 在本例中的每一个对局, 赢得的代数之和为零, 赢得的代数之和为零,这样的对 策称为“有限零和二人对策” 策称为“有限零和二人对策” 设两个局中人为I II,局中人I 设两个局中人为I,II,局中人I有 m 个策略:α1、 α2… α m ;用S1表 个策略: 示这些策略的集合: 示这些策略的集合: S1= α1、 α2……α m ……α
赢得矩阵(支付): ):当每个局中人 赢得矩阵(支付):当每个局中人 在确定了所采取的策略后, 在确定了所采取的策略后,他们就 会获得相应的收益或损失, 会获得相应的收益或损失,此收益 或损失的值称为赢得(支付)。 )。赢 或损失的值称为赢得(支付)。赢 得与策略之间的对应关系称为赢得 支付)函数。 (支付)函数。 案例中, 案例中,肯尼将军与山本五十六大 将的赢得(支付) 将的赢得(支付)函数都可以用矩 表示。 阵A、B表示。
当盟军获悉此情报后,盟军统帅 当盟军获悉此情报后, 麦克阿梭命令太平洋战区空军司令肯 尼将军组织空中打击。 尼将军组织空中打击。 日本统帅山本五十六大将心里很 明白: 明白: 在日本舰队穿过俾斯麦海的三 天航行中, 天航行中,不可能躲开盟军的空中打 他要策划的是尽可能减少损失。 击,他要策划的是尽可能减少损失。 日美双方的指挥官及参谋人员都 进行了冷静的思考与全面的谋划。
j i
案例中局中人I 盟军) 案例中局中人I(盟军)应当选 择(北线)策略α1,这样能保证赢 北线)策略α 这样能保证赢 局中人II(日军) 得2。局中人II(日军)应当选择 北线)策略β 盟军赢得不超过2 (北线)策略β1使盟军赢得不超过2。 实际上, 局势下, 实际上,在( α1, β1)局势下,有 max min aij= min max aij
这场海空遭遇与对抗一定会发生, 这场海空遭遇与对抗一定会发生, 双方的统帅如何决策呢? 双方的统帅如何决策呢?历史的实际 情况是:局势1成为现实。 情况是:局势1成为现实。肯尼将军命 令盟军的侦察机重点搜索北线; 令盟军的侦察机重点搜索北线;而山 本五十六大将命令日本舰队取道北线 航行。由于气候恶劣,能见度差, 航行。由于气候恶劣,能见度差,盟 军飞机在一天后发现了日本舰队, 军飞机在一天后发现了日本舰队,基 地在南线的盟军轰炸机群远程航行, 地在南线的盟军轰炸机群远程航行, 实施了两天的有效轰炸, 实施了两天的有效轰炸,重创了日本 舰队,但未能全歼。 舰队,但未能全歼。
ai2 ≤ a12 ≤ a1j
对 I=1,2,3 j=1,2,3 都成立: a12 = a32 =5 都成立: 由定理5 由定理5-1,对策值=5,对策的解:( α1 , β2 ) 对策值=5,对策的解:( 和 ( α3 , β 2 )
例14-4:某单位采购员在秋天时要决定 14冬天取暖用煤的采购量。 冬天取暖用煤的采购量。已知在正常气 温条件下需要用煤15吨 温条件下需要用煤15吨,在较暖和较冷 气温条件下需要用煤10吨和 吨 吨和20 气温条件下需要用煤10吨和20吨。假定 冬季的煤价随着天气寒冷的程度而变化, 冬季的煤价随着天气寒冷的程度而变化, 在较暖、正常、 在较暖、正常、较冷气温条件下每吨煤 价为100元 150元 200元 价为100元、150元、200元。又秋季每吨 煤价为100元 煤价为100元。在没有关于当年冬季气温 情况下,秋季应购多少吨煤, 情况下,秋季应购多少吨煤,能使总支 出最少? 出最少?
对策的三要素: 对策的三要素: 局中人: 局中人:有权决定自己行为方案的对 局参加者称为局中人。案例中, 局参加者称为局中人。案例中,美日 双方的决策者为局中人。 双方的决策者为局中人。当对局中局 中人只有两人时,称为二人对策。 中人只有两人时,称为二人对策。 策略: 策略:对局中一个实际可行的方案称 为一个策略。案例中, 为一个策略。案例中,美日双方各有 二个策略。
第十四章 对策论
对策论概论
对策论(The Game Theory)也称竞赛 Theory)也称竞赛 对策论( 论或博弈论,是研究具有竞争、对抗、 论或博弈论,是研究具有竞争、对抗、利益 分配等方面的数量化方法, 分配等方面的数量化方法,并提供寻求最优 策略的途径。 策略的途径。 1944年以来,对策论在投资分析、价格制定、 1944年以来,对策论在投资分析、价格制定、 年以来 费用分摊、财政转移支付、投标与拍卖、 费用分摊、财政转移支付、投标与拍卖、对 抗与追踪、国际冲突、双边贸易谈判、 抗与追踪、国际冲突、双边贸易谈判、劳资 关系以及动物行为进化等领域得到广泛应用。 关系以及动物行为进化等领域得到广泛应用。
同样,局中人II有 个策略: 同样,局中人II有n个策略:β1、 β2。。。 表示这些策略的集合: β n ;用S2表示这些策略的集合: S2= β1、 β2… β n 局中人I的赢得矩阵是: 局中人I的赢得矩阵是: a11 a21 a12 …… a1n a22 …… a2n
A= …… …… …… a m1 a m2 … a mn
1414-1矩阵对策的基本概念
案例: 案例:俾斯麦海的海空对抗 1943年 1943年2月,第二次世界大战中的 日本,在太平洋战区已经处于劣势。 日本,在太平洋战区已经处于劣势。 为扭转局势, 为扭转局势,日本统帅山本五十六大 将统率下的一支舰队策划了一次军事 行动:由集结地——南太平洋的新不 行动:由集结地——南太平洋的新不 列颠群岛的蜡包尔出发, 列颠群岛的蜡包尔出发,穿过俾斯麦 开往新几内亚的莱城, 海,开往新几内亚的莱城,支援困守 在那里的日军。 在那里的日军。
解: 局中人I 采购员)有三个策略: 局中人I(采购员)有三个策略: 策略α 10吨 策略α 15吨 策略α 20吨 策略α1: 10吨,策略α2: 15吨,策略α3 :20吨。 局中人II(环境): 局中人II(环境): 策略β 策略β1 较暖 ,策略β2 正常,策略β3较冷 策略β 正常,策略β 现把该单位冬天取暖用煤全部费 用(秋季购煤费用与冬天不够时再补购 煤费用)作为采购员的赢得矩阵。 煤费用)作为采购员的赢得矩阵。
所以局中人I应首先考虑用α 所以局中人I应首先考虑用α 所能赢 得的最小, 得的最小,然后在这些最小赢得中 选择最大。局中人I 选择最大。局中人I可以保证赢得 max min aij
i j
同样,局中人II可以保证局中人 可以保证局中人I 同样,局中人II可以保证局中人I的 赢得不超过 min max aij
i j j i
上式蕴涵的思想是朴素自然的, 上式蕴涵的思想是朴素自然的,可 以概括为: 从最坏处着想, 以概括为:“从最坏处着想,去争 取最好的结果” 取最好的结果”
定义14定义14-1:对给定的矩阵对策 G =
i j
S1,S2;A
j i
若等式
max min aij= min max aij 成立,则称这个公共值为对策G的值, 成立,则称这个公共值为对策G的值, 记为V 而达到的局势( 记为VG,而达到的局势( αi, β j ) 称为对策G在纯策略意义下的解, 称为对策G在纯策略意义下的解,记 为( αI*, β j *)而αI*和β j *分别称 为局中人I和局中人II的最优纯策略 的最优纯策略。 为局中人I和局中人II的最优纯策略。
相关文档
最新文档