第三章 完全信息静态博弈(博弈论-河海大学,王慧敏)

合集下载

2 完全信息静态博弈--博弈论

2 完全信息静态博弈--博弈论

上中下
上下中
3,-3 1,-1
1,-1 3,-3

中上下

中下上
1,-1 -1,1
1,-1 1,-1
-1,1 1,-1
1,-1 1,-1
3,-3 1,-1
1,-1 -1,1
1,-1 3,-3
-1,1 1,-1
1,-1 1,-1
3,-3 1,-1
1,-1 1,-1
1,-1 3,-3

下上中 下中上
2.1 基本分析思路和方法
智猪博弈
小猪 按 按 大猪 5,1 9,-1
等待
4,4 0,0
等待
劣战略(下策,dominated strategy)
– 不管其它博弈方的策略如何变化,自己的某一策略 带来的得益总是比其他某些策略带来的得益小,则 该策略称为其它策略的劣战略。
2.1.4 重复剔除的上策均衡
严格下策反复消去法
B
11,12 10,11
C
14,13 12,12
Player 1
10,15
10,13
13,14
Scenario Analysis
Then 1 should choose ―a‖.
– Player 1’s best response to ―B‖ is ―a‖.
Player 2
Strategy a b c
Strategy a b c
A
12,11 11,10 10,15
B
11,12 10,11 10,13
C
14,13 12,12 13,14
Player 1
The Outcome
Player 2
Strategy a b c

博弈论与经济-第3章 完全信息静态博弈的

博弈论与经济-第3章 完全信息静态博弈的

2 n( 2) 个企业的古诺模型 除企业个数 n 2 外,其它条件与前述 n 2 的古诺模型相同。 q Q q q q Pa bQ 市场逆需求函数 ,其中 , q Q Q 。且设 C1 C2 ,企业 Cn C n个企业具有相同的边际成本 i的利润 函数为
a C1 bq2 q1 2b q a C 2 bq1 2 2b
首先设 q 充分大,分几种情况讨论。
i
(1) C1 C 2 , a 2C1 C 2,或 C1 C 2 , a 2C 2 C1 ,或 C1 C 2 。在这三 C2 a C 2 a C1 个条件下, a bC1 a 与 同时成立。企业1的最优 2b b 2b 反应函数为
* qT 314.21
0 qS 995 qS 995
* 272.32, 纳什均衡为 qS 均衡价格为 P* 413.47 * , 均衡利润为 S 22695
* T 3536 .17
3.古诺模型与囚徒困境 囚徒困境问题的纳什均衡揭示了博弈模型中个人理性与集 体理性的矛盾,古诺模型均衡实际也反映了市场竞争中企 业所面临的“困境”。假设两个企业具有相同的边际成 本 c1 c 2 c ,这时古诺模型的 均衡产量为 均衡价格为
1 2 2 U q 0 a1q1 a 2 q 2 (b1 q1 2dq1q 2 b2 q 2 ) 2
a1 0, a 2 0, b1 0, b2 0, d 0 , q 1与 q 2 分别为两个企业的 式中, q0 为该经济中其他竞争性企业产量的总和。 产量,
纳什均衡为(不合作,不合作)。
4 企业兼并是否有利可图 如果产业中有多个企业,兼并总是有利可图的吗? 命题3.1 只有当几乎所有的企业都加入兼并时,兼并才是 有利可图的。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈

囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈

3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈

在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈

我们需要对“占优战略”和“劣战略”的概念进行重新定义。


都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:

博弈论_完全信息静态博弈

博弈论_完全信息静态博弈
– 策略式表述 (Strategic form), and – Extensive form
——
本章主要介绍博弈的策略式表述
博弈的策略式表述
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
参与人集合
– N人博弈的参与人集合,往往也记为N。参与人 则记为i, i∈ N – 参与人i的策略集,记为Si ,其中的一个特定策 略,可记为si.有si ∈ Si.
——
v(a)=0, v(b)=100, v ©=101
In a word, any other function w for which w(a) < w(b) < w(c)
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
——
博弈的策略式表述
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
– Si中的元素 si 表示参与人i的一个具体策略
– 一旦确定了所有参与人的策略,便形成了一个 博弈局势,表示为s=(s1, s2, … sN),s∈S。
——
博弈的策略式表述
博 弈 论 • 参与人i的支付函数 讲 – 参与人 i的支付函数,是从博弈局势集 义 S=S1×S2 …× SN 到实数集R的一个映射,记为 ui(s1, s2, … s N),表示参与人i对局势s = (s1, s2, … sn) 完 的偏好。 全 信 • 一个博弈可以表示为 息 G = {S1, … ,SN; u1, … ,uN, i ∈N} 静 态 • 这就是博弈的策略式表述 博 弈
偏好关系 (preference relation)
– 假定
• 决策者可以比较对任意一对行动的偏好(优于、等 价、劣于)。称满足上述条件的行动集的偏好关系 为完全的(complete) • 对于决策者来说,若行动a优于行动b,则可记为

博弈论与信息经济学课件3—完全信息静态博弈2

博弈论与信息经济学课件3—完全信息静态博弈2

2

聚点和相关均衡
抛硬币解决
博弈方2 博 弈 U 方 D 1 L 5, 1 4, 4 R 0, 0 1, 5 存在三个纳什均衡,其中: 两个是纯策略均衡: (U,L); (D,R) 一个是混合策略均衡: [(1/2,1/2),(1/2,1/2)]
相关均衡例子
由于避免(U,R)的出现符合双方的利益,可以使用抛硬币的解 决方法: 正面—1U,2L;反面—1D,2R.
国家2 战争 国 家 战争 1 和平 -5, -5 -10, 8 和平 8, -10 10, 10
两个纯策略纳什均衡: (战争,战争), (和平,和平) 在帕累托效率意义上,(和平,和平) 明显较好,构成一个帕累托上策 均衡。
战争与和平
如果两国的决策者都是理性的,那么两个国家之间就不应 该会发生战争。
3

共谋和防共谋均衡 这里提到的防共谋均衡中讨论的博弈方之间的串 通和联合行为均出于自愿自觉,是没有强制力的, 与协议式的合作行为不同。 因此,防共谋均衡是非合作博弈的均衡概念,而 不是合作博弈的概念。

博弈论与信息经济学
完全信息静态博弈2
——纳什均衡的选择和分析方法扩展
纳什均衡的选择和分析方法扩展

1
帕累托和风险上策均衡 ——帕累托上策均衡 ——风险上策均衡 聚点和相关均衡 ——聚点均衡 ——相关均衡 共谋和防共谋均衡

2

3
1

帕累托和风险上策均衡
帕累托上策均衡:依据帕累托效率意义上的优劣关系, 某一个纳什均衡给所有博弈方带来的利益都大于其他所 有纳什均衡会带来的利益,博弈方选择的倾向性是一致 的。

3
共谋和防共谋均衡
博弈方2 博 弈 方 1 博弈方2

博弈论第5次课——完全信息静态博弈

博弈论第5次课——完全信息静态博弈
wwwdocincom混合策略纳什均衡ikikikikikik对于所有的的概率的一个混合策略称为则概率分个纯策略博弈个参与人的策略式表述其中代表混合策略组合的混合策略空间代表它可被定义为策略组合混合之外所有其他参与人的的期望效用函数表示参与人wwwdocincom社会福利博弈的支付矩阵流浪汉找工作游荡政府救济3213不救济1100wwwdocincom假定政府的混合策略为1即政府以的概率选救济1的概率选不救济流浪汉的混合策略为r1r即流浪汉以r的概率选找工作以1r的概率选游荡
0.2 ,政府将选择救济;只有当 0.2 时,政府才会选择混合策略 ( 0, 1) 或任何纯策 • 略。 要找出政府的均衡混合策略,需求流浪汉的最优 化问题。流浪汉的效用函数为: v L ( G , L ) (2 1(1 ) (1 )( 3 0(1 )) • ( 1) 3(1 ) • (2 1) 3 v L 最优化一阶条件为: (2 1) 0 因此, * 0.5 该结论可解释为:若θ<0.5,流浪汉的最优选择是找 工作;若θ>0.5,其最优选择是游荡;只有当θ=0.5时, 他才选择混合策略 ( 0, 1) 或任何纯策略。 •
混合纳什均衡
女 足球 男 足球 芭蕾 2,1 0,0 芭蕾 0,0 1,2
如在“性别战”博弈中,有两个纯策略纳什 均衡:(足球,足球),(芭蕾,芭蕾)。事实 上,可以验证,还有一个混合策略纳什均衡,即 男的以2/3的概率选择足球赛,以1/3的概率选择 芭蕾舞;女的以1/3的概率选择足球赛,以2/3的 概率选择芭蕾舞。
混合策略纳什均衡
在n个参与人的策略式表述 博弈G {S1 ,, Sn ; u1 ,, un } 中, 假定参与人 i有K个纯策略 : Si {si1 ,, siK }, 则概率分 布 i ( i1 ,, iK )称为i的一个混合策略 . ik ( sik )是 i选sik的概率, 对于所有的 k 1,, K ,0 ik 1,

博弈论-完全信息静态博弈

博弈论-完全信息静态博弈

u2 u2 ( P1, P2 ) P2q2 - c2q2 ( P2 - c2 )q2 (P2 - c2 )(a2 - b2 P2 + d2 P1 )
1 P (a1 + b1c1 + d1 P* ) 2 2b1
* 1
1 P (a2 + b2 c2 + d 2 P* ) 1 2b2


在许多博弈中,博弈方的策略是有限且非连 续时,其得益函数不是连续可导函数,无法 求得反应函数,从而不能通过解方程组的方 法求得纳什均衡。 即使得益函数可以求导,也可能各博弈方的 得益函数比较复杂,因此各自的反应函数也 比较复杂,并不总能保证各博弈方的反应函 数有交点,特别不能保证有唯一的交点。
2.4 混合策略和混合策略纳什均衡
c1 c2 2
u1 q1P(Q) - c1q1 q1[8 - (q1 + q2 )] - 2q1
6q1 - q1q2 - q12
u2 q2 P(Q) - c2q2 q2[8 - (q1 + q2 )] - 2q2
6q2 - q1q2 - q22
两寡头间的囚徒困境博弈
策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6
寻找混合策略纳什均衡概率分布的思路: 令各个博弈方随机选择纯策略的概率分布,满足 使对方或其他博弈方采用不同策略的期望得益相 同。
求此博弈中的混合策略纳什均衡
博弈方2 左
博弈 方1

0, 2 3, 0
上 下
2, 1 1, 2
* * * q1 q2 q3 24
* * * u1 u2 u3 576
Q* 72

2010课件2—完全信息静态博弈

2010课件2—完全信息静态博弈

§3 纳什均衡
囚徒困境
囚徒 2 坦 白 囚 徒 1 坦 白 不坦白 不坦白
-5, -5
0, -8
-8, 0
-1, -1
§3 纳什均衡
猜硬币博弈
1、局中人:猜硬币方,盖硬币方 2、策 略:猜硬币方:猜正面,猜反面 盖硬币方:盖正面,盖反面 3、支付函数:见下页
§3 纳什均衡
猜硬币博弈
猜硬币方 正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1 反 面 1, -1 -1, 1
每个策略组合中各个博弈方能否通过单独改变自己的策略而增加 得益。如能,则从所分析的策略组合对应的得益数组引一箭头, 到改变策略后的组合对应的得益数组。最后综合为每个策略组合 的分析情况,形成对博弈结果的判断。 利用策略组合的稳定性为思路,对博弈模型的结果进行分析和预 测。 箭头法与划线法效果相同

——如果重复剔除严格劣策略剔除掉除策略组合s以外的所有策略,
则这一策略组合s为该博弈的唯一的纳什均衡。 ——如果策略组合s是一个纳什均衡,那么它就不会被重复剔除严 格劣策略所剔除。

纳什均衡是一个比重复剔除严格劣策略适用性更强的解概念。
§3 纳什均衡
3.4 纳什均衡解法

——双人有限博弈:划线法和箭头法 ——连续性策略博弈纳什均衡与反应函数
§3 纳什均衡
猜硬币博弈
猜硬币方 正 面 盖 硬 币 方 正 面 反 面 -1, 1 1, -1 反 面 1, -1 -1, 1
§3 纳什均衡
公共地悲剧
牧民乙 1只 牧 民 甲 1只 2只 100, 100 120, 60 2只 60, 120 80, 80
§4 连续策略纳什均衡解法
首先求出每个局中人对其他局中人策略组合的反应函 数——即在其他局中人策略组合给定时极大化自己的支付, 得到的最佳反应策略表现为其他局中人策略组合的函数; 然后将这些反应函数联立求解即得到博弈的纳什均衡解。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一节引入的房地产开发博弈中,如果市场需求大,(开发、开 发)是占优战略均衡。
占优战略均衡只要求每个参与人是理性的,而并不要求每个 参与人知道其他参与人是理性的(也就是说,不要求“理性” 是共同知识)。
s i 是 i 的占优战略,那么,战略组合 s ( s , , s ) 1 n 称为占优战略均衡(dominant-strategy equilibrium)。
3.2.1 占优战略均衡
劣 战 略 的 定 义 一般地,s
i 的(严格)占优战略,如果 s i是 i 严格最优选择,即: 对应所有的s i ,
i 称为参与人
ui (s , s i ) ui ( s , s i )s i , s s
* i ' i ' i
* i
' 对应地,所有的 i
3.2.2 重复剔除的占优均衡
' '' s s 定义2: i 弱劣于战略 i( s i' is weakly dominated ui ( si' , s i ) ui ( si'' , s i ) , by s i''),如果对于所有的 s i , '' ' s s s 且对于某些 i,严格不等式成立。 i 称为相对于 i 的 弱占优战略。
3.2.3 纳什均衡
纳 什 均 衡 * * 的 ui { si* , s } u { s , s i i i i }, si S i , i 定 * s 义 或者用另一种表述方式, i 是下述最大化问题的解:
有n个参与人的战略式表述博弈 G { S1 , S n;u1 , un } , * * * 战略组合 s { s1 ,, si ,, sn } 是一个纳什均衡,如果对 * 于每一个 i ,s i 是给定其他参与人选择 * * * * * s { s , , s , s , , s i 1 i 1 i 1 n } 的情况下第 i 个参与人的最 优战略,即:
我们给出战略式表述:
1、博弈的参与人集合:i , (1,2, , n) ;
2、每个参与人的战略空间: Si , i 1,2, , n ;
ui ( s1 , , si , , sn ), i 1,2, , n 。 3、每个参与人的支付函数:
库诺特寡头竞争模型
求解纳什均衡的方法有很多种,这里介绍两种:
对每个企业的利润函数求一阶导数并令其等于零:
1 P(q1 q2 ) q1 P ' (q1 q2 ) C1' (q1 ) 0 q1 2 ' P(q1 q2 ) q2 P ' (q1 q2 ) C2 ( q2 ) 0 q2
主讲人: 王慧敏 河海大学商学院
第三章 完全信息静态博弈
3.1 策略型博弈 3.2 纳什均衡
3.3 纳什均衡应用举例
3.4 混合战略纳什均衡
3.5 纳什均衡的存在性和多重性讨论
河海大学商学院
授课教师:王慧敏
3.1 战略式博弈
在博弈论里,一个博弈可以用两种不同的方式来表达:
•战略型表达:适合于静态博弈(strategic form representation) •扩展型表达:适合于动态博弈(extensive form representation)
Ci (qi ) 代表成 我们用qi 0, 代表第 个企业的产量,
i Q( P) P P(q1 q2 ) 代表逆需求函数( 本函数, P是价格; 是原需求函数)。第 i 个企业的利润函数为: i (q1 , q2 ) qi p(q1 q2 ) Ci (qi ), i 1,2 ( q1 , q2 )是纳什均衡产量意味着: q1 arg max 1 (q1 , q2 ) q1 P(q1 q2 ) C1 (q1 ) q2 arg max 2 (q1 , q2 ) q 2 P ( q 1 q2 ) C 2 ( q2 )
纳什均衡与占优战略均衡及重 复剔除占优均衡之间的关系
1、每一个占优战略均衡、重复剔除的占优均衡一定
是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡。
2、纳什均衡一定是在重复剔除严格劣战略过程中没
有被剔除掉的战略组合,但没有被剔除的战略组合不 一定是纳什均衡,除非它是唯一的。(这句话并不适 用于弱劣战略剔除的情况)
分析:
显然,这个博弈没有占优战略均衡。
在找出上述智猪博弈的均衡解时,可以用“重复剔除严格 劣战略”(iterated elimination of strictly dominated strategies).
3.2.2 重复剔除的占优均衡
定义1:令 s i'和 s i''是参与人 i 可选择的两个战略
重复剔除的占优均衡:战略组合 s ( s1 , , sn )
称为重复剔除的占优均衡,如果它是重复剔除劣战略后 剩下的唯一的战略组合。如果这种唯一的战略组合是存 在的,我们说改博弈是重复剔除占优可解的 (dominance sovable)。
3.2.2 重复剔除的占优均衡
注意:
(即 si' S i , si'' S i )。如果对于任意的其他参与人 ' s s i 的战略组合 i ,参与人 从选择 i 得到的支付严格小 '' 于从选择 s i 得到的支付
ui ( si' , s i ) ui ( si'' , s i )s i
' '' ' s s 我们说战略 i 严格劣于战略 i( s i is strictly ' '' s dominated by s i )。通常, i 称为相对于 s i'' 地劣战略; s i'' s i' 对应地, 称为相对于 的占优战略。占优战略均衡中 ' s s 的占优战略 是相对于多有 si i 的占优战略。 i
寻找纳什均衡
参与人B
L C R
参 与 人
U M D
0,4 4,0 3,5
4,0 0,4 3,5
5,3 5,3 6,6
A
纳什均衡的一致预测性质
一致预测性质 :
如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的 博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一 致的策略,即没有哪个博弈方有偏离这个结果的愿望,这个预测结 果最终会成为博弈的结果
参 与 U 人 D L
பைடு நூலகம்
参与人B M
R
1, 0 0, 3
参与人B L M
1, 2 0, 1
0, 1 2, 0
参 与U 人 D
A A
参与人B 参 与U 人 L M
1, 0 0, 3
1, 2 0, 1
1, 0
1, 2
A
3.2.2 重复剔除的占优均衡
注意:
如果每次剔除的是严格劣战略,均衡结果与剔除 的顺序无关。然而如果剔除的是弱劣战略,均衡结 果可能与剔除顺序有关。 与上节讨论的占优战略均衡不同,重复剔除的占 优均衡不仅要求每个参与人是理性的,而且要求 “理性”是参与人的共同知识,即所有参与人知道 所有参与人是理性的,所有参与人知道所有参与人 知道所有参与人是理性的,如此等等。
在用重复剔除方法寻找均衡时,一个战略时 占优战略或劣战略只是相对于另一个特定的 战略而言,而不是相对于战略组合中的其他 所有战略。
上述定义中我们使用了“唯一”这个词, 如果重复剔除后剩下的战略组合不唯一,我 们说该博弈不是重复剔除占优可解的。
3.2.2 重复剔除的占优均衡
为了加深对重复剔除过程的理解,让我们考虑一个例子:
strategies)。其中, s i ( s1 ,, si 1 , si 1 ,, s n ) ,是 i 之外所有参与人战略的组合。
s s
* i 被称为“劣战略”(dominated
3.2.2 重复剔除的占优均衡

大 猪 按
等待 按
智猪博弈 小猪
等待
3, 1
2, 4
7,-1
0, 0
3.2.1 占优战略均衡
占 优 战 略 均 衡 的 定 义

坦白
囚徒2
不坦白
囚 徒 坦白 1
不坦白
-5,-5
0,-8
-8,0
囚徒困境
-1,-1
3.2.1 占优战略均衡
i 定义:在博弈的战略式表述中,如果对于所有的 ,
占 优 战 略 注意: 均 在一个博弈里,如果所有参与人都有占优战略存在,那么, 衡 占优战略均衡是可以预测到的唯一的均衡,因为没有一个理性 的 的参与人会选择劣战略。 定 在囚徒困境博弈里,(坦白、坦白)是占优战略均衡;在上 义
3.1 战略式博弈举例
例: (a)高需求情况
开发商B 开 发 商
开发 开发 不开发
4000,4000 0,8000
8000,0 0,0
不开发
A
(b)低需求情况
开发商B
开 发 商
开发 开发 不开发
-3000,-3000 0,1000
不开发
1000,0 0,0
A
3.2 纳什均衡
3.2.1 占优战略均衡 3.2.2 重复剔除的占优均衡 3.2.3 纳什均衡定义
s arg max ui ( s , , s , si , s
* i si S i * 1 * i 1
* i 1
, s )
* n
3.2.3 纳什均衡
纳 什 均 衡 的 定 义
注意:
纳什均衡有强弱之分,上述定义给出的是弱纳什均 衡的概念。一个纳什均衡是强的(strict or strong),如果给定其他参与人的战略,每一个参 与人的最优选择是唯一的。 如果一个纳什均衡是强的,没有任何参与人在均衡 战略与某些其他战略之间是无差异的;对比之下, 在弱纳什均衡的情况下,有些参与人可能在均衡战 略与非均衡战略之间是无差异的。
相关文档
最新文档