第6章:扩展式博弈及其均衡)
博弈论概述

一般地,称 si*为局中人i的(严格)占优策略, 若对应所有的
si , s i*是i的严格最优策略 , 即:
ui (si*, si ) ui (si' , si ) si , si' si*
对应地,所有的 si' si* 被称为“劣策略”。注意:这
甲的策略
1
2
3
乙的策略
1
7
8
9
2
6
2
3
3
5
4
0
1.乙先行动。若乙选1,则甲选3;乙选2,则甲选1;乙选3, 则甲选1。乙在行动时会估计到甲的行动,它估计三种选择 中的最高代价为策略1(损失900万),其次为策略2(损失 600万),最低为策略3(损失为500万)。因此,乙必选代 价最低的策略3。——最大最小原理。结论:乙选择3,甲选 1作为回应,乙损失500万,甲获益500万。
在博弈论里,一个博弈可以有两种表述方式:一种是策 略式(strategic form representation)表述,另一种是 扩展式( extensive form representation )表述。前者 适合于讨论静态博弈,后者适合于讨论动态博弈。在策略式 表述中,所有参与人同时选择各自的策略,所有参与人选择 的策略一起决定每个参与人的支付。
2007 - Leonid Hurwicz, Eric S. Maskin, Roger B. Myerson 2005 - Robert J. Aumann, Thomas C. Schelling 2001 - George A. Akerlof, A. Michael Spence, Joseph E.
博弈均衡和机制设计_概述解释及说明

博弈均衡和机制设计概述解释及说明1. 引言1.1 概述博弈均衡和机制设计是博弈论和经济学中的两个重要概念,它们在分析和解决各种经济、社会和政治问题中起着关键作用。
博弈均衡是指在多方参与者之间进行策略选择时达到一种相对稳定状态的理论概念,而机制设计则是为了实现特定目标而设计出合适的规则和激励机制。
本文将对博弈均衡和机制设计进行总结、解释和说明。
1.2 文章结构本文将分为六个部分进行讨论。
首先,在引言部分对博弈均衡和机制设计进行介绍,并说明它们的关系。
接着,我们将详细探讨不同类型的博弈均衡及其特点,包括完全信息博弈和不完全信息博弈,以及纳什均衡与其他类型的博弈均衡之间的比较。
然后,我们将深入研究机制设计的原理与方法,包括契约理论在机制设计中的应用、声明式机制设计与计算式机制设计的对比分析,以及公共品和外部性问题中的机制设计策略。
接下来,我们将探讨博弈论在经济领域中的应用实例以及社会公共资源配置中的机制设计案例,并讨论机制设计在社会政策决策中的意义和作用。
最后,我们将给出结论部分对全文进行总结。
1.3 目的本文的目的是介绍和解释博弈均衡和机制设计的概念,并探讨它们之间的关系。
通过对不同类型博弈均衡及其特点、机制设计的原理与方法以及应用案例进行分析,我们希望读者能够更好地理解博弈论和机制设计,并认识到它们在经济、社会和政治问题中起到的重要作用。
同时,本文还旨在提供一些思考和启发,为相关领域研究者提供理论依据和实践指导。
2. 博弈均衡和机制设计2.1 博弈均衡的概念博弈均衡是博弈论中一个重要的概念,指的是在一个博弈过程中,各参与者通过采取最佳策略而达到的一种稳定状态。
在博弈均衡中,不存在任何一个参与者可以通过改变自己的策略来获取更好的结果,即没有人单方面改变策略可以获得更高效益。
博弈均衡可以分为纯策略均衡和混合策略均衡两种形式。
2.2 机制设计的概念机制设计是经济学中研究如何设计合适机制以实现某种特定目标或解决某个问题的理论框架。
扩展式博弈与标准式博弈

• 却不知道:诸葛亮知道自己知道“实则虚之”的 用兵之道
2-2 扩展式博弈
• 扩展式博弈(extensive form game): • 描述工具是博弈树
Game tree: ultimatum bargaining game(分 配100元钱)
给B90( 9-1分) 给B10( 1-9分)
10
90
90
10
10
0
90
0
0
90
0
10
0
0
0
0
2-4 联盟博弈
– 吴、蜀之间存在利益冲突,并多次兵戎相见, 但两国为什么在赤壁之战中能结为联盟?
• 联盟:相互协调行动的一组博弈参与人 • 联盟价值:一个联盟的产出(收益)
2-4 几种著名的博弈例子
囚徒困境
1,-1
下中上 1,-1
-1,1
1,-1
强 齐 王中
弱
博弈描述的复杂性
——再谈田忌赛马
强
中
田中
田忌 弱
Hale Waihona Puke 忌弱强中强
齐王
弱
田忌 弱 强
田 忌
田 忌
中 弱
强 中
齐王 强 弱
齐王 强
弱
田忌 弱
田忌 强
弱
田忌
强 中
田忌 强
中
弱
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开 囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
(1)若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方 保持沉默,此人将即时获释,沉默者将判监10年。 (2)若二人都保持沉默(相关术语称互相“合作”),则二人同样判监 1年。 (3)若二人都互相检举(相关术语称互相“背叛”),则二人同样判监 8年。
纳什均衡的扩展与精炼博弈理论及其应用.ppt

贝叶斯纳什均衡与一般纳什均衡的不同点
• (1)贝叶斯纳什均衡用贝叶斯公式得到的,以概率分布作
为依据,考虑自己的期望收益。贝叶斯静态博弈中的期望收
益是对其它局中人不同类型下的期望收益,而不是自己类型
下的期望收益。 • (2)贝叶斯纳什均衡研究的是局中人的策略选择,并且这 种策略选择依赖于自身的类型,当类型不同时,它们选择的 策略就不一样。
海萨尼转换
(1)引入一个虚拟的局中人——“自然”(nature) 或者说是“上帝”(God),他不用考虑自己的得失,他 的唯一作用就是赋予博弈中各局中人的类型向量 Ti t (t1 ,, t n ) ti 其中 属于可行类型空间 ( Ti 为局中人的特征的完备描述); • (2)自然只把局中人 i 的真实的类型 t i 告诉局中人i 本人,却不让其他局中人知道。但“自然”将把在 t (t1 ,, t n ) 概率分布 p(t1 , , t 上的 告诉每一个局中人; n)
t i T i
则称混合策略组合
个混合 x t , x t ,, x t ,, x t是一
* 1 1 * 2 2 * i 1 * n n
策略贝叶斯纳什均衡。 这里的 E 是指对混合策略 中人 i 的收益u i 期望。
x t , x t ,, x t ,, x t下局
§3.1.3 贝叶斯静态博弈的典型模型
§3.1.1 不完全信息博弈与海萨尼转换
不完全信息的含义与形式
海萨尼转换 例 3.1.1 不完全信息的行业博弈
不完全信息的含义
不完全信息博弈中的不完全信息具有特定含义,它
专指一种博弈局势中局中人对其他局中人与该种博弈局
势有关的事前信息了解不充分,而不是博弈中产生的与
上海财经大学《高级微观经济学I》扩展式博弈

0
13
A 扩展式博弈
• 例:约会博弈
d1.1
– H 1={d1.1 ,d1.2} – H 2={d2 .1, d2.2} – 信息集
Reading 2
Concert
d1.2
• I 11={d1.1 }; I 12={ d1.2}
2B
S
• I 2={d2 .1, d2.2}
d2.1
d2.2
B
S
B
S
3
High See
d1.1
raise
d2.1
Pass
Meet
Low
d1.2
raise
-1 See
1
d2.2
Pass
Meet
1
2
-1
-2
1
-2
-1
2
A 扩展式博弈
• 连续行动集:货币政策
– 第一阶段:中央银行宣布政策目标 π0 – 第二阶段:居民/企业形成通货膨胀预期πe – 第三阶段:中央银行决定实际政策 π
0
– a(I1.1)∈ A(I1.1) , a(I1.2)∈ A(I1.2)
– 2的信息集I2 ={d2}
– 策略: s2 =a(I2)
d1.1
C
d2
S
C
d1.2
1
S
C
3
4
3
2
5
18
A 扩展式博弈
• 策略(一般定义)
– 是参与者信息集Ii到行动集A(Ii)的函数
– s1 =a(I1)
d1
• a(I1)∈ A(I1)
• 例:三阶段蜈蚣博弈
1.1
S
C
2
2
第六章、合作博弈 《经济博弈论基础》PPT课件

• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
7.3扩展式博弈

7.3扩展式博弈扩展式博弈定义7.13扩展式博弈一个扩展式博弈Γ由下列要素组成由下列要素组成::1、 有限的有限的参与人集合参与人集合N ;2、 行动集A ,它包括所有可能的行动它包括所有可能的行动,,不必是有限的不必是有限的3、 结或者或者历史的集合历史的集合X .(1) 初始结X ∈0x ,或空的历史或空的历史。
博弈从初始结开始开始。
(2) 对于一些有限多的行动A a i ∈,每个}{\0x x X ∈采取的形式为),...,,(21k a a a x =,这里a 1,a 2…表示第一步表示第一步、、第二步第二步。
的行动的行动。
(3) 如果对于一些K>1,K>1, }{\),...,,(021x X a a a k ∈,那么那么,,}{\),...,,(0121x X a a a k ∈−一个结或一段历史只是对在博弈中迄今已被采取的行动的一个完全的描述的行动的一个完全的描述。
}),({)(X a x A a x A ∈∈≡表示在历史}{\0x X x ∈之后轮到参与人行动时的该参与人可选择的行动集后轮到参与人行动时的该参与人可选择的行动集。
4、 一个行动集A x A ⊆)(0以及在A(x 0)上的一个概率分布π被用于描述博弈中自然的行被用于描述博弈中自然的行动动。
自然总是首先行动的首先行动的,,并且只行动一次并且只行动一次,,以概率π随机的在A(x 0)中选择一个行动。
因此,}{\),...,,(021x X a a a k ∈意味着对于i=1且只有i=1i=1,,)(0x A a i ∈。
5、 终点结集合A a X a x X x E ∈∉∈≡对于一切,),({},。
每个终点结描述了由开始至结束的博弈的一个特殊的完全演变特殊的完全演变。
6、 一个函数N x E X →}){(\:0U ι,表明在属于X 的每一个决策结上那个将轮到的采取行动的每一个决策结上那个将轮到的采取行动的参与参与人。
4.扩展式博弈与反向归纳策略

扩展式博弈的形式
完全信息的情况
①
L
②
R
②
l
2 0
r
2 1
l1Biblioteka 0r 3 1
不完全信息的情况
①
L
R
l
2 0
r
2 1
②
l
1 0
r
3 1
扩展式博弈的规则
在一个偏僻的山里,有一个村庄,村里有100对夫妇。 在这个村里已经形成了约定成俗的规定,如果女人发现自己的丈夫对自 己不忠的话,就会毫不犹豫的将他杀死,而且当天执行。当然,她必须 有确切的证据来证明他丈夫的不忠。由于这个因素,某个女人发现某个 男人不忠,她不会告诉那个不忠男人的妻子。但是,她会告诉其他人的 妻子,并且女人们会相互的传递这一信息,因此最后,一个男人不忠, 除了其妻子不知道外,其他女人都知道。 事实上是,村子里的这100对夫妇的男人都不忠,但由于女人不会将她们 知道的事实告诉不忠男人的妻子,每个女人不知道自己的男人不忠,因 此,该村子一直很稳定,而没有发生妻子杀丈夫的行为。 村子里有1个辈分很高的老太太,她德高望重,诚实可敬,对村子里的情 况了如指掌。一天,这位老人对这这100个女人说了一句很平常的话: “你们的男人当中至少有一个是不忠的。”于是,村里发生了这样一个 事情,前99天,村里风平浪静,但到了第100天,村里发生了一场大屠杀, 所有的女人都杀死了她们的丈夫! 为什么会这样?
结论
作为博弈方你不应该仅仅是个被动的参与人,满足于接受别人制定的博 弈规则,而应该设法改变博弈使其对自己尽量有利
可置信的承诺能够促进长期利润,但承诺方也确实因此而对自己的行动 施加了严格的限制。这种通过限制自己行动来获取竞争优势的做法被称 为策略性行为
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2) x 的后续结 T (x) (the set of successors):
T(x) = { y ∈ X | x ≺ y}
若 (x) = φ, x为 点 ; T 则 终 结 若 (x) = φ, x为 始 。 P 则 初 结
3) x 的直接前列结 P(x) x 不为初始结) ( (immediate predecessor)
性质1)、2)意味着 ≺为一半序 (partial order)或偏序。应注意的是 ≺ 不一定具有连通性(connectedness) 或完备性(completeness),即:
∀ 1, x2 ∈ X , 必 x 有 x ≺ x2 1 或 x2 ≺ x 1
关于节的基本概念
1) x 的前列集 P(x) (the set of predecessors):
1结
决策结(decision nodes):参与人采取行 动的时点; 终点结(terminal nodes):博弈行动路径 的终点。
用 X表示所有决策结的集合。 ∈ X 为某一特定 x 的决策结。
用 ≺ 表示定义在 X上的顺序关系 (precedence relation)或者二元关 系(binary relation):
扩展式的构成要素:
1) 参与人集合 Γ ={1,2,...,n} ; 2) 参与人的行动顺序(the order of moves):谁在什么时候行动 i(x) ; 3) 参与人的行动空间(action set):在 每次行动时,参与人有些什么选择
A(x)
;
扩展式的构成要素:
4) 参与人的信息集(information set): 每次行动时,参与人知道些什么 H(x) ; 5) 参与人的支付函数:在行动结束时,每 次参与人得到些什么(支付是所有行动 的函数); 6) 外生事件(即自然的选择)的概率分布。
休息一会!!!
第二部分 完全信息动态博弈
第六章 博弈的扩展式表示
例1 Nim游戏
三枚硬币如图排列。A、B 两人轮流取硬币,每一轮 每个选手必须至少拿走一 枚硬币,不允许在两行中 挑选硬币。取走最后一枚 硬币的选手为获胜者。 假设A先行动,问A该如何选择才能获胜?
例1 Nim游戏
A B A B B获胜 A A B B获胜 A获胜 A获胜 A获胜
甲 乙
4) 博弈满足“完美记忆”(perfect recall)的要求。 “完美记忆” : 没有参与人会忘记自己以前知道的 事情,所有参与人都知道自己以前的选 择。
1 U D 2 R L R 1
N
1 U 2 L R L D U
1 D
R 1
第六章 扩展式表述博弈的Nash均衡
以新产品开发为例。
定义1:设 S = (s , s ,..., s , S*为扩 ) 展式的一个Nash均衡,当且仅当 ∀i ∈Γ
* * 1 * 2 * n
s ∈argmaxUi (si , s−i )
* i * si∈Si
或者∀si ∈Si, i (si , s ) ≥ Ui (si , s )。 U
* −i * −i
5 i(⋅) : X →{1 ) ,2,..., n, N}
即 i(x) 定义为从决策结集合到参与人集合 的函数。可解释为在决策结 x参与人 i 行动,决定了“谁在什么时候行动”的 i(0) 问题。如前图中, = A 。 函数 i(x) 给出了博弈中参与人行动顺 序的完全描述(扩展式的第二个要素)。
博弈树
人有限战略博弈的扩展式描述可以 用博弈树来表示,如新产品开发博弈。 N
大 开发 小
A
不开发 大
N
小
B
开发 不开发 开发
B
不开发
B
开发 不开发 开发
B
不开发
博弈树几乎包含了有限博弈的所有 信息,其最基本的构成: 1)结(node); 2)枝(branch); 3)信息集(information set)。
N
大
开发 小
A
不开发 大
N
小
B
B
B
B
B知道N的选择但不知道A的选择。 此时,B的信息集由两个组成。
N
大
开发 小
A
不开发 大
N
小
B
B
B
B
B对A,N的选择都不知道。B 只存在一个信息集。
信息集的结构说明:
博弈的结构是共同知识,即所有 人都可看到博弈树。
如果博弈树的所有信息集都是单结 的,则称该博弈为完美信息博弈(game of perfect information)。 它意味着没有两个人同时行动,并 且所有后行动者确切知道前行动者的选 择,所有参与人观测到自然选择。
A N B B B N B
B知道A、N的选择,但A不知道N的选择。
A B
大
N
小
A B
B
B
假定:自然的信息集为单结的
A B
大
N
小
A B
B
B
B A
大
N
小
B A
A
有了信息集的概念,扩展式也可用来表 示静态博弈。 乙 坦白 坦白 -8,-8 甲 抵赖 -10,0 抵赖
0,-10 -1,-1
甲 乙 乙 乙
∀x1, x2 ∈ X ,
≺
x1 ≺ x2 ⇔ x1在 2之 x 前
1)传递性(transitivity):
≺满足:
∀x1, x2 , x3 ∈ X , 若 1 ≺ x2,x2 ≺ x3,则 x x1 ≺ x3
2)反对称性(asymmetricity):
∀x1, x2 ∈ X , 若 1 ≺ x2, x 则 x2 ≺ x1 不 立 成 。
开发
-0.3,-0.3 -0.3,-0.3 0.1,0 0,0.1 0,0 0,0.1
0.1,0 0,0
A
不开发
注意:均衡与均衡结果是不同的!!!
SA = A(h(O))
= {开发,不开发 ; }
SB = A(h(x1)) × A(h(x2 )) ={{开发,开发},开发,不开发}, { {不开发,开发},不开发,不开发} { }
信息集是决策结集合 X 的子集。 当一个参与人在作出决策时,他知道的 和不知道的“之前”所发生的所有事情。
N
大
开发 小
A
不开发 大
N
小
B
B
B
B
B知道A、N的决策,存在7个决策结。 7个信息集,A一个,N两个,B四个 。
N
大
开发 小
A
不开发 大
N
小
B
B
B
B
B只知道A的选择,而不知道N的选择。 此时,B的信息集由四个变成了两个。
所有参与人的一个纯战略组合
s = (s1, s2 ,..., sn )
决定了博弈树上的一个路径,例如(开发, {不开发,开发})决定了博弈路径: A (0.1,0) 开发 B 不开发
战略组合(不开发,{开发,开发})决定了 博弈路径: A (0,0.1) 不开发 B 开发
不同的纯战略组合可能决定同一个路 径,例如,战略组合(开发,{不开发, 开发})和(开发,{不开发,不开发}) 决定了: A (0.1,0) 开发 B 不开发
N
大 小 开发
O A B
X1
A
不开发
A B B B
B
X2 不开发 不开发 开发
B
开发
A、B知道N的选择, B知道A的选择
完美信息博弈
SA ={开发,不开发}(A只有一个信息集, 两个可选择行动)。 SB ={{开发,开发},{开发,不开发}, {不开发,开发},{不开发,不开发}}
B
开发,开发 开发,不开发 不开发,开发 不开发,不开发
∗
定义3:如果一个扩展式博弈有有限 个参与人,且有有限信息集,每个信息 集上参与人有有限个行动选择,则这个 博弈为有限博弈。
定理1(Zermelo,1913;Kuhn,1953)一 个有限完美信息博弈有一个纯战略Nash均 衡。 定理1的证明可利用动态规划中的“逆 向归纳法”(backward induction)来证明 的。
设 (x) ∈P(x), x′ ∈P(x) p ∀ 且 ′ ≠ p(x), x′ ≺ p(x), 称 x 若 则 p(x)为 的 接 列 x 直 前 结 ( 然 (x)唯 ) 显 p 一 。
4) 的直接后续结 t(x) x 不为终点结) ( x (immediate successor)
设 (x) ∈T(x), ∃x′ ∈T(x),使 t 若 x′ ≺ t(x) 则 t(x)为 的 接 续 称 x 直 后 结 ( 一 唯 ) 不 定 一 。
静态博弈——参与人同时行动。 用战略(标准)式描述。 动态博弈——参与人的行动顺序有先后。 用扩展式描述。
Si
战略式的构成元素:
参与人集合
Γ;
i
参与人的战略集合 S ; 参与人的支付 Ui
。
G =< Γ; Si ,..., Sn ;U1,...,Un > 或 G =< Si ,..., Sn ;U1,...,Un >
2枝 枝是一个决策结到它的直接后续结的连线, 每一个枝代表在该决策结行动的参与人的 行动选择。
这意味着:从给定结点出发,当且仅 当参与人选择不同的行动时,才会达到不 同的直接后续结。 枝不仅完整的描述了每一决策结参与 人的行动空间(第三要素),而且给出了 从一个决策结到下个决策结的路径。
3 信息集
扩展式:
扩展式主要是对参与人的战略集 Si 进 行“扩展”,即要给出每个战略的动态描 述:在某一时刻,谁行动,怎么行动即行 动方案由哪些组成,依据什么行动(即信息 是什么)。