第七章 竞争型决策分析——博弈论 (《决策理论与方法》PPT课件)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二节 完全信息静态博弈
一、博弈的标准式表述
定义7.1 在一个n人博弈的标准式表述中,参与者的策略空间分别为 S1, Sn,收益函数分别为 u1 , , un
则G {S1, Sn ;u1, ,un}表示此博弈。
二、纳什均衡
定义7.2
在博弈 G {S1,
Sn ;u1, ,un} 中,如果策略组合(s1 ,
(六)结果和均衡
结果指博弈中博弈方的行动所产生的每一可能情形。而均衡是指所有博弈方的最优策略的组合,记为
s*

(s1* , s2*
,
s
* n
)
其中,s
i*为第i个博弈方在均衡情况下的最优策略。
四、博弈的分类
(一)单人博弈、两人博弈和多人博弈
按博弈中参与人数目的多少,将博弈分为单人博弈、两人博弈和多人博弈。单人博弈即只存在一个博 弈方的博弈。两人博弈就是存在两个各自独立决策,但策略和利益具有相互依存与制约关系的博弈方的决
三、博弈的要素
参与者、策略和支付是博弈必不可少的三个基本要素。
(一)博弈的参与者 又称博弈方或局中人,是指博弈中独立决策、独立承担结果的决策主体。一般地,记博弈方为 i,
N {1,2, , n} 即共有n个博弈方。
(二)博弈方可选择的全部行为或策略的集合
即每个博弈方在进行决策时(同时或先后,一次或多次)可以选择的方法、做法等。策略有纯策略和混合

0
j 1,2 n i 1,2 m
(2)


n
ij y j

j1

yj
1


y
j

0
i 1,2 m j 1,2 n
为了求解上述不等式组,可将它们变为线性规划而求出博弈G的最优混合策略。不妨设 0(否则

' ij
ij
d ,则
一定可大于零)。令 xi'
策略之分。记博弈方i的策略为 ,si 为S博i 弈方i可选择的策略组成的策略集合,又称策略空间,则 si 。 Si
n个局中人各选择一个策略形成的向量 s (s1 , , s,n )称为策略组合。
第一节 竞争型决策分析与博弈论
(三)博弈方的支付
每个博弈方从各种策略组合中获得的收益或效用,它是策略组合s的函数,所以也被称为支付函数。 记博弈方i的支付函数为ui (s)。 (四)博弈方的信息
将不会优于最优混合局势下的所得。
第二节 完全信息静态Байду номын сангаас弈
(四)最优混合策略的求解方法
博弈G {S , S ;A} 有混合意义下的解的充要条件是:存在x* Sm,y* Sn 及数 满足下列两
个不等式组:


m
ij xi

(1) i1 xi 1


xi
i1 j 1
m
又记
Sm {x | x (x1 xm ), xi 0,i 1,2, , m, xi 1}
ni 1
Sn {y | ( y y1 yn ), y j 0, j 1,2, , n, y j 1}
分别为局中人 和 的混合策略集合。
第七章 竞争型决策分析 ——博弈论
第一节 竞争型决策分析与博弈论
一、竞争型决策分析与博弈论
在现实生活中我们经常会遇到一些具有竞争性质的决策问题,在这些竞争中是存在竞争对手的,每个 决策主体的行为后果都要受到对手的影响,并且这些决策者之间的利益是相互冲突的,这类特殊的决策 问题就是竞争型决策。
博弈论是研究理性的决策者之间的冲突与合作的理论,具体讲就是研究当决策主体的行为在发生直接 的相互作用时,人们如何进行决策以及这种决策的均衡问题。此外,博弈论研究的决策问题是包括开始、 过程和结果的整个决策过程,也是广义上的竞争型决策分析。
信息是博弈方有关博弈的知识。博弈方应尽可能多地收集有关博弈的信息,从而在采取策略进行决策 时掌握主动。
(五)博弈的次序
很多时候各博弈方的决策又必须有先后之分,并且,在一些博弈中每个博弈方还要作不止一次的决策选 择,这就免不了有一个次序问题。因此,规定一个博弈就必须规定其中的次序,不同的次序必然是不同的 博弈,即使其他方面都相同。
j 1
定义7.4 如果 max min E(xy) min max E(xy) E(x , y )
xSm ySn
ySn xSm
则称 x,y为局中人和 的最优混合策略,称(x,y )为 G的最优混合局势,称 为博弈方的期望所得。
最优混合局势 x , y 构成了混合意义上的纳什均衡,任何一方,单独背离这个局势,则它的期望所得
图7-4)。
垄断者
容忍
反击
进 进入 入 者 不进入
1,1 0,2
-1,-1 0,2
图7-4市场进入阻挠博弈
例7-4 产量决策的古诺模型。古诺模型是博弈论中最经典的例子。古诺首先提出了这一模型。由于他采 用了分析企业各自的最优反应函数从而形成均衡的思路,与纳什均衡非常相似,因此纳什均衡也称古诺一纳 什均衡。它描述的是所谓厂商进行数量竞争的形势,以下是最常见的一种较为简化的版本。
)为G的一个“纳什均衡”。
纳什均衡有强弱之分,以上是弱纳什均衡,也是最常用的纳什均衡概念,强纳什均衡是指每个博弈方对
于对手的策略有唯一的最佳反应,即
s
i
为严格纳什均衡,当且仅当对所有i,所有其他
sij

S i,均有:
ui
(s1 ,
,
s i1
,
si
,
s i1
,
, sn )

ui
(s1 ,

ij
y
' j
1

y
' j
0
i 1,2 m j 1,2 n
第二节 完全信息静态博弈
四、应用举例
例7-3 市场进入阻扰博弈。一种市场上存在一个垄断企业,另一个企业希望进入这一市场,垄断者
为了保持自己的地位需要对进入者进行阻挠。这种博弈中,进入者有两种策略可以选择:“进入”与
“不进入” ;垄断者也有两种策略:“容忍”与“反击”。他们的支付函数用以下双变量矩阵表示(见
x (x1 xm )
m
xi 1且xi 0
i 1
y ( y1 yn )
n
y j 1且y j 0
j 1
mn
分别为局中人 和 的一个混合策略。称E(xy) ij xi y j 为局中人 的期望获得, E(xy)为 的期
望获得,而(x,y)为博弈的混合局势。
该博弈问题的最终结果必然是两博弈方都选择坦白,收益均为-5。当然这里有个前提,即两人均没 有条件串供,否则无论是对这两个囚徒总体来讲,还是对他们个人来讲,最佳的结果都不是同时坦白得 到-5,而是都不坦白所得到的-1。
第一节 竞争型决策分析与博弈论
(二)“齐威王与田忌赛马”
春秋战国时期齐威王经常约手下大将田忌与他赛马。赛马的规则是这样的:每次双方各出三匹马, 一对一比赛三场,每一场的败者要输一千金给胜者。齐威王的三匹马和田忌的三匹马按实力都可分为上、 中、下三等。由于齐威王的上、中、下三匹马都分别比田忌的上、中,下三匹马略胜一筹,因此田忌每 次都是连输三场,要输掉三千金。实际上,田忌的上马虽不如齐威王的上马,却比齐威王的中马和下马 都要好,同样,田忌的中马则比齐威王的下马要好一些,田忌每次都连输三场是有些冤枉的。后来田忌 的谋士孙膑知道这一情况后,给田忌出了个主意,即让田忌不要用自己的上马去对抗齐威王的上马,而 是用下马去对抗齐威王的上马,上马则去对抗齐威王的中马,中马去对抗齐威王的下马。这样,虽然第 一场田忌必败无疑,但后两场田忌却都能取胜,二胜一负,田忌反而能赢齐威王一千金。

xi ,则不等式组(1)等价于下面的线形规划:

m
min S xi' i 1

(3)
m i 1

ij
xi'
1

xi' 0
j 1,2 n i 1,2 m
同理,令 ,问题(2)就变为线形规划(4):
n
max S '
y
' j
j 1

(4)
n j 1
策问题。多人博弈是指有三个或三个以上博弈方参加的博弈。
第一节 竞争型决策分析与博弈论
(二)有限博弈和无限博弈
根据各博弈方可选策略数量的多少,将博弈分为有限博弈和无限博弈。有限博弈是指各个博弈方的 可选策略都是有限的博弈。无限博弈是指至少有某些博弈方的策略是无限多个的博弈。
(三)零和博弈、常和博弈和变和博弈
按参加博弈的各个博弈方从博弈中所获得的利益的总和,可将博弈划分为零和博弈、常和博弈和变 和博弈。零和博弈是所有博弈方的得益总和始终为0的博弈。常和博弈是所有博弈方的得益总和始终为某 一非零常数的博弈 。零和博弈和常和博弈以外的所有博弈都称为“变和博弈”。
(四)静态博弈和动态博弈
按参与人行动的先后顺序,博弈可以分为静态博弈和动态博弈。静态博弈是指所有博弈方同时或可看作 同时选择策略的博弈。动态博弈指的是参与人的行动有先后顺序,而且后行动者能够观察到先行动者所选择 的行动的博弈。
二、博弈现象
(一)“囚徒困境”
“囚徒困境”博弈是博弈理论中的典型实例。“囚徒困境”讲的是警方拘捕两个同案犯罪嫌疑人(囚 徒)后,为防其相互间串供,而将两人分别拘押、隔离审问时,两疑犯所面临的认罪策略选择的问题。
摆在两疑犯面前的选择有两种:坦白或不坦白。按照我们通常的政策,坦白从宽,抗拒从严。所以, 若两人均坦白,则可从轻处理,分别判刑5年;若两人中有一人坦白而另一人拒不坦白,则坦白者可免于 处罚,而拒不坦白者,将从重惩处被判10年;当然,若两人均不交代,而警方手中又无足够的证据可以 指控犯罪嫌疑人,那他们只可能被按妨碍公务罪被判1年。
(五)完全信息博弈和不完全信息博弈
根据参与人所掌握的信息可以把博弈分为完全信息博弈和不完全信息博弈。完全信息博弈是指每个参 与人对其他参与人的策略空间及支付函数有准确认识的博弈。不完全信息博弈是指至少部分博弈方不完全 了解其他博弈方支付情况的博弈。
(六)混合划分
把参与人行动顺序和掌握的信息结合起来划分,可以得到四种类型的博弈,即:完全信息静态博弈, 完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与它们相对应的四种均衡是:纳什均衡, 子博弈完美纳什均衡,贝叶斯纳什均衡,及完美贝叶斯纳什均衡。
弈记作G {S , S ;A}。
(二)最优纯策略与纳什均衡
定义7.3 对于博弈G {S , S ;A},如果
max i
min{ j
ij
}

min j
max{ i
ij
}

i
j
v
的博弈则值称。i, j 分别为局中人 和 的最优纯策略,称局势(i, j)为博弈G的鞍点,v称博弈
,
s i1
,
sij
,
s i1
,
, sn )
三、两人有限零和博弈
(一)两人有限零和博弈模型
两人有限零和博弈是指只有两个局中人,每个局中人都有有限个可选择的策略,而且在任一局势中两个 局中人得失之和总是等于零。
第二节 完全信息静态博弈
如果我们用 和 表示两人有限零和博弈的两个局中人,并设他们的策略集分别为
(三)最优混合策略与纳什均衡
局中人只能以一定的概率在其策略集中随机选择每个策略,这种在纯策略空间上的概率分布为混合
策略。
设博弈G {S , S ;A} ,S 1 2 m ,S 1 2 n ,令xi , yi 分别为局中人 和 在各自
的策略集S和S 中选择策略 i 和 j 的概率,则称
不难验证鞍点(i, j)是博弈 G {S , S ;A}的纳什均衡,鞍点又称纯策略纳什均衡。

i
两人有限零和博弈存在的鞍点的充要条件是支付矩阵中存在一个元素
1,2, , m ,j 1,2, , n,总有:
ai
j
,使对于一
aij ai j ai j
第二节 完全信息静态博弈
,
s
n
)
中任一博弈方i的策略
s i都是对其余博
弈方的策略组合的最佳对策,也即:
ui (s1, , si1, si, si1, , sn) ui (s1, , si1, sij , si1, , sn)
对任意
sij

Si
都成立,则称(s1 ,
,
s
n
S 1 2 m ,S 1 2 n 。局中人 的支付矩阵可记作:
11 1n


A






m1 mn
根据局中人 的支付矩阵A,结合博弈的一般式表述 G {S1, Sn ;u1, ,un} ,我们可将这种博
相关文档
最新文档