合作博弈的要素

博弈论

张冠湘

2014 4

华南理工大学经贸学院物流工程系Email:gxzhang@https://www.360docs.net/doc/7f3102756.html,

第十二章合作博弈的要素

同一博弈问题的理性解往往有多个,有两种最为同博弈问题的理性解往往有多个有两种最为重要,一种是不考虑其他人,只需最大化个人收益的非合作解另一种是以整体收益最优为目标益的非合作解,另一种是以整体收益最优为目标,参与者相互协调的合作解。

非合作博弈:参与者无法协调相互之间的战略选择,非合作博弈得到的解为非合作博弈解;

合作博弈:参与者可以协调相互之间的战略选择,合作博弈得到的解为合作博弈解

如果参与者的战略可以相互协调,什么样的战略如果参与者的战略可以相互协调什么样的战略选择才会带来整体最大收益呢?

第十二章合作博弈的要素12.1 自行车交易

12.2 可信的承诺

12.3 房地产开发

12.4 合作博弈的几个概念和要点

124

12.5 顺风车

12.6 一些政治联盟

些政治联盟

12.7 国际联盟博弈

12112.1

自行车交易乔伊有辆自行车但身无分文他给自行车子估计货币

乔伊有一辆自行车,但身无分文,他给自行车子估计货币价值是80美元。米奇有100美元,没有自行车,他认为一美元

台自行车值100美元。 可供两人选择战略是出让或保留。乔伊可以将自行车卖给米奇也可以不卖;而米奇可用手中任意数量的美元交换米奇,也可以不卖;而米奇可用手中任意数量的美元交换自行车,或者一分不给。

假设乔伊把自行车卖给米奇假如把该问题看做非合作博弈,其结果与囚徒困境十分相似

假设乔伊把自行车卖给米奇,米奇要支付90美元

对于两个人来说保留都是占优战略,(保留,保留)都是占优战略均衡

乔伊(车值80美元)出让

保留1109010170米奇

(100美元)

出让110,9010,170保留

200,0

100,80

12112.1

自行车交易 市场中往往存在着能够促使买卖双方进行互利交易的机构,

这样就可以得到我们所期望的合作博弈解,即收益矩阵左上方的选择当乔伊和米奇对交易问题达成一致时他们上方的选择。当乔伊和米奇对交易问题达成一致时,他们就结成了联盟,将协调各自的战略

这个时候自行车交易不再是非合作博弈而变成了合作 这个时候,自行车交易不再是非合作博弈,而变成了合作博弈问题

假设乔伊把自行车卖给米奇在合作博弈中,买卖双方的转让支付是与协议联系在一起的,这种假设乔伊把自行车卖给米奇,米奇要支付90美元

支付叫做旁支付。

乔伊(车值80美元)出让

保留1109010170米奇

(100美元)

出让110,9010,170保留

200,0

100,80

12112.1

自行车交易前面的表并不是故事的全部把自行车价格定在美元只是其中种

前面的表并不是故事的全部,把自行车价格定在90美元只是其中一种情况,其价格可以升高或者降低,那么价格定为多少合适呢? A B 可行解是、之间的蓝线上的所有点

解集:允许旁支付的情况下,在保证每个参与者至少获得非合作博弈收益的基础上,使总收益达到最大值的所有合作联盟。

假设乔伊把自行车卖给米奇

假设乔伊把自行车卖给米奇,米奇要支付90美元

米奇的乔伊(车值80美元)出让

保留1109010170收益

米奇

(100美元)

出让110,9010,170保留

200,0

100,80

乔伊的收益

第十二章合作博弈的要素12.1 自行车交易

12.2 可信的承诺

12.3 房地产开发

12.4 合作博弈的几个概念和要点

124

12.5 顺风车

12.6 一些政治联盟

些政治联盟

12.7 国际联盟博弈

12.3 房地产开发

杰伊房地产发商他大联盟

联盟

收益

(杰伊是一个房地产开发商,他希望把两块或更多的地产聚集在一起联合开发凯劳拉马克(grand coalition )1

(KLM)11)

(KL)(M)(7)(4)起联合开发。凯、劳拉、马克各有一块地产,分别以K、L、M表示。杰伊详细地列出了地产联盟结2(KL) (M)(7) (4)

(KM)(L)(4)(4)所有者可能组成的各种联盟形式以及相应的收益

构︵c oalit 3(KM) (L)(4) (4)

4(LM) (K)(4) (4)

该博弈问题的解集包括两种可能

的联盟结构,一个是大联盟

(KLM)另个是第二行的(KL)ion struc 5(K)(L)(M)(3)(3)(3)

(KLM),另一个是第二行的(KL) (M),总收益为11,多于其他

cture

︶选择。

12.3 房地产开发

大联盟中,马克、凯和劳拉可以分别退出联盟,退出后收益可以达到4,为了保证三人都在联盟之中必须使每人的收联盟

收益

(证三人都在联盟之中,必须使每人的收益至少为4,而大联盟的总收益只有11,1(KLM)11)

(KL)(M)(7)(4)

所以大联盟不稳定

第二行的联盟是一个稳定的联盟,因为任何参与者都不会因脱离联盟组成新的联盟而获益我们称之为核合作博弈2(KL) (M)

(7) (4)(KM)(L)(4)(4)联盟而获益,我们称之为核。合作博弈的核包括所有能使联盟保持稳定的结盟方式

73(KM) (L)(4) (4)

4(LM) (K)(4) (4)

通过旁支付进行调整。如果劳拉和凯都退出联盟,两人的收益则分别为3,要想这两个人加入联盟则必须满足两人最5(K)(L)(M)(3)(3)(3)

这两个人加入联盟,则必须满足两人最低收益分别为3,一共是6。两人结盟的收益也恰好为7。所以通过旁支付使凯和劳拉每人分得3.5,马克得4,这一联盟就可以保持稳定

12.3 房地产开发

在一个新的合作项目中,杰伊面对的是诺琳、皮特、和昆西,分别以N、P、Q表示。

与上例一样解集是大联盟(

与上例样,解集是大联盟(NPQ)和第二行的(NP)(Q)

每人如果退出联盟,均可获得3的收益。所以要使他们结盟,必须使他们的收益至少为3。

如果旁支付适当第二行的联盟结构是稳定的

如果旁支付适当,第二行的联盟结构是稳定的

大联盟中,若收益为(4,4,3),第一行是稳定的

若收益分别为(3.5,3.5,4),则诺琳和皮特联盟收益(,,)

可以退出联盟,建成(NP)联盟,收益

可达到8,所以,只要保持昆西的收益为3,

且(1(NPQ)(11)

诺琳与皮特的收益之和为8,且(NP)收益在(3,5)至(5,3)之间大联盟就可以保持稳定2(NP) (Q)(8) (3) (NQ)(P)(4)(3)

在这个例子中,前两行的联盟结构是稳定的,构成了这个博弈的核。3(NQ) (P)(4) (3) 4(PQ) (N)(4) (3) 5(N)(P)(Q)(3)(3)(3)

第十二章合作博弈的要素12.1 自行车交易

12.2 可信的承诺

12.3 房地产开发

12.4 合作博弈的几个概念和要点

124

12.5 顺风车

12.6 一些政治联盟

些政治联盟

12.7 国际联盟博弈

12.4 合作博弈的几个概念和要点

124

合作博弈分析的要点

分析重点放在收益不同的联盟形式的选择上

博弈的核通常包含在解集中

收益往往是用货币来衡量的。联盟成员可以支

收益往往是用货币来衡量的联盟成员可以支

付货币的方式弥补参与者放弃其他联盟形式的

损失,此种货币支付叫做旁支付

损失此种货币支付叫做旁支付

以是否与货币联系在一起为标准,可以把合作

博弈分为存在转移效用和不存在转移效用两类。

两类

12412.4

合作博弈的几个概念和要点联盟成员(可能经过贿赂旁支付和金钱交易之后) 联盟成员(可能经过贿赂、旁支付和金钱交易之后)的所得,被称做一种配置,包括两方面:联盟结构和联盟成员的收益

有效配置意味着博弈的所有潜力都已被挖掘,如果想要使某些人变得更好,就不得不损害其他人的利益,P t ti 这种资源配置状态称为帕累托最优(Pareto optimum ) 很多情况下,有效的配置不止一个,博弈论才会出现解集的概念。

124

12.4 合作博弈的几个概念和要点

解集是全部有效(帕累托最优)联盟结构与收益分配方式的集合,参与者们至少可以获得非合作博弈下的收益。解集是一个带普遍意义的概念不管是否存在旁支付

存在旁支付的博弈中,解集由所有能够带来最大收益的协调战略组成。(如前面的两个房地产的例子)

合作博弈的核包含所有使团体中的任何成员都不能从联盟重

,

组中获益的配置方案, 核囊括了所有不被占优(理解此处占优的概念)的配置方式

合作博弈中的核的数量是任意的,可以是一个、多个甚至没不存在核的博弈没有稳定的联盟不管联盟结构如何有,不存在核的博弈,没有稳定的联盟,不管联盟结构如何,

总有部分成员会从退出联盟中获得利益,这种博弈叫空核博弈

12412.4

合作博弈的几个概念和要点解集中如果可以增加某人的收益同时任何其他人的收益又没有 解集中,如果可以增加某人的收益,同时任何其他人的收益又没有降低,则博弈者团体必定没有有效地协调他们的战略。此时,组建新的联盟可以提高团体的总收益,实现有效率的解。

新的联可以提高团体的总收,实现有效率的解。再看第二个房地产开发的例子联盟

收益1(NPQ)(11)再看第二个房地产开发的例子,(NP)联盟总收益为8

对于(NQ)(P)和(PQ)(N)来说,吸引第三人加2(NP) (Q)(8) (3)入形成大联盟(NPQ)能够增加团体的总收益。因此可以说,对于(NQ)(P)、(PQ)(N)和(N)(P)(Q),大联盟(NPQ)占优。3(NQ) (P)(4) (3)4(PQ) (N)(4) (3)()()()()而对于所有N 与P 的收益之和小于8的大联盟,联盟结构(NP)(Q)占优。(也即在这种情况下5

(N)(P)(Q)

(3)(3)(3)

N 与P 可以组建小联盟提高收益)

第十二章合作博弈的要素12.1 自行车交易

12.2 可信的承诺

12.3 房地产开发

12.4 合作博弈的几个概念和要点

124

12.5 顺风车

12.6 一些政治联盟

些政治联盟

12.7 国际联盟博弈

12.5 顺风车

125

A)、鲍勃(B)、卡罗琳(C)

安娜(鲍勃(卡罗琳(

和唐(D)就职于西费城大学,每天

上班要从费城西部郊区开车到学校。

他们对合伙使用汽车(也叫顺风车)

上下班十分感兴趣

不存在旁支付,顺风车成为无转移

效用博弈问题,不必考虑联盟总收

效用博弈问题不必考虑联盟总收益,只考虑每个人的收益状况

将受益表达为每个人上班路途中的

消耗

12512.5

顺风车 解集内的联盟结构应该满足:1.有效率2路线联盟结果收益1(ABCD)(7,7,7,7)(6,6.5,9)(12)(帕累托最优);2.参与者至少能够获得单人联盟可以得到的收益

第1行的联盟结构较第4行弱占优,比较第行大联盟相对于第2(ABC)(D)(6,6.5,9) (12)3(ABD)(C)(6.5,7,6.5) (16)4(ACD)(B)(8,8,7) (13)13行和第1行,大联盟相对于第13 行强占优,如果某联盟结构被弱占优或强占优,就可以将其从这个解集中剔除

5(A)(BCD)(11) (7,6.5,6)6(AB)(CD)(8,7) (7,8)(97)(89) 第6行至第15行被大联盟强占优,第4行被大联盟弱占优,所以本例的解集是第1至37(AC)(BD)(9,7) (8,9)8(AD)(BC)(7,9) (8,7)9(AB)(C)(D)(8,7) (16,12)行和第5行的联盟结构10(AC)(B)(D)(9,7) (13) (12)11(AD)(B)(C)(7,9) (13) (16)本例的核是第2行和第5行12(A)(B)(CD)(11) (13) (7,8)13(A)(C)(BD)(11) (16) (8,9)的联盟结构。大联盟被第3行和第5行的联盟结构占14(A)(D)(BC)

(11) (12) (8,7)

15

(A)(B)(C)(D)(11) (13) (16) (12)

优,第3行的联盟结构被第2行的联盟结构占优

解集是全部有效(帕累托最优)联盟结构

与收益分配方式的集合,参与者们至少可以获得非合作博弈下的收益。

合作博弈的核包含所有使团体中的任何成路线联盟结果收益

1(ABCD)(7,7,7,7)

(6,6.5,9)(12)

员都不能从联盟重组中获益的配置方案, 核囊括了所有不被占优的配置方式2(ABC)(D)(6,6.5,9) (12) 3(ABD)(C)(6.5,7,6.5) (16) 4(ACD)(B)(8,8,7) (13)

对于无旁支付的情况

解集:帕累托最优,占优是从每一个个5(A)(BCD)(11) (7,6.5,6) 6(AB)(CD)(8,7) (7,8)

(97)(89)

体的角度来考虑(如果想要使某些人变得更好,就不得不损害其他人的利益) 核:利用占优联盟的标准进行分析,与帕累托最优类似只关心联盟个体的收7(AC)(BD)(9,7) (8,9) 8(AD)(BC)(7,9) (8,7) 9(AB)(C)(D)(8,7) (16,12)

帕累托最优类似,只关心联盟个体的收

对于有旁支付的情况10(AC)(B)(D)(9,7) (13) (12) 11(AD)(B)(C)(7,9) (13) (16)

有旁支情况

解集:帕累托最优,解集由所有能够带来最大收益的协调战略组成。(如前面12(A)(B)(CD)(11) (13) (7,8) 13(A)(C)(BD)(11) (16) (8,9)

的两个房地产的例子)

核:占优是从“联盟”的总体收益的角14(A)(D)(BC)(11) (12) (8,7) 15(A)(B)(C)(D)(11) (13) (16) (12)

第十二章合作博弈的要素12.1 自行车交易

12.2 可信的承诺

12.3 房地产开发

12.4 合作博弈的几个概念和要点

124

12.5 顺风车

12.6 一些政治联盟??

些政治联盟??

12.7 国际联盟博弈

博弈论的基概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈论中的相关概念

新古典经济学前提: 理性选择——减少不确定; ——经济系统效用最大化。 理性——新古典经济学与博弈论的纽带 博弈论决策前提:理性的战略选择。 博弈论决策基础:最优反应,即带来最大收益的战略。 但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。 新古典经济学决策的背景: 理性的个体面临特定的制度环境(产权、货币、高度竞争的市场),在此基础上以获取利益最大化为目的。 隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。 弊端: ——限制了理论的使用范围,现实中竞争并不完全; ——无法解决货币经济以外的决策难题。 博弈论的优势: ——不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。 游戏规则: 两个选手,轮流取币; 每次至少取一枚硬币; 只能从一行中取任意数量的硬币,不许从两行中选取; 取走最后一枚硬币的为胜者 囚徒困境的启示: 囚徒困境仅仅是二人博弈,多人博弈在现实中更多; 如果囚犯可以交流,结果显著不同; 如果多轮博弈,结果也有不同; 导致困境结论的分析过程令人注目,但最后结论并非理性。 通常假设参与者将采取最优反应战略而理性行事,最大化利润、力争在游戏中获胜、达到主观收益最大化,或者惩罚最小化,皆属于理性行为。 最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战略。 博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。 依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来的最大收益的战略。 标准式——数字矩阵; 扩展式——树形图 不确定事件(contingency): 相机战略(contingent strategy):仅在不确定事件发生时才会采取的战略 信息集(information set):节点2包含了决策者掌握的所有信息,因此也称为信息集。 扩展式的优势: ——展示了每一阶段掌握的信息; ——展示了参与者掌握信息的不完全 所有博弈问题均可用标准式描述,即绘制一个表格,边缘列出参与者的战略,里面列出参与者的收益;

博弈论教学大纲

《博弈论》教学大纲 第一部分教学说明 1、课程的性质与任务 《博弈论》是经济学院本科生的限定选修课。 2、课程教学目标 课程教学目标是帮助学生获得必要的决策科学基本知识,了解学科发展前沿,掌握探索系统科学基本规律的一般方法;使学生学会应用博弈论的基本原理和方法分析政治、经济、军事、管理和社会生活等领域的博弈问题。 3、适用专业与学时数 本课程的教学大纲适用于经济学和非经济类的本科专业的本科生。为了让学生基本地掌握发展经济理论,我们计划用38个学时分五部分讲授知识,用4个学时进行经济实践活动,希望在教学与实践中,学生能够加强对发展经济学理论的理解和检验。 4、本课程与其他课程的关系 本课程以微观经济学为基础。 5、推荐教材与参考书 《博弈论与信息经济学》,张维迎著,上海三联书店、上海人民出版社; 《博弈论战略分析入门》,Roger A McCain著,原毅军等译,机械工业出版社; 《博弈论》施锡铨著,上海财经大学出版社,2002; 《Game Theory》,1991,D.Fudenberg& J.Tirole 中译本,中国人民大学出版社; 《经济博弈论》(第二版) 谢识予编著复旦大学出版社, 2002。 6、主要教学方法与媒体要求 本课程以老师课堂讲授为主,以学生课后实践为辅,同时鼓励学生参与经济实践与经济讨论的活动如举行经济散文竞赛和经济辩论等等。为适应科学教育的现代化、国际化和信息化,我们在教学媒体上逐步使用电脑、投影仪、幻灯片等硬件设备,与此相配套的就是使用诸如Powerpoint之类的电子讲稿,此外我们还将通过网络与学生多方面、多层次、多角度的交流,及时了解学生学习的动态和存在的问题。 7、开课与编写大纲单位:经济学教研室;课程负责人:卢燕平;审定单位:经济学院;

博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题?

博弈论复习题及答案

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另

外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 F 2 B 2 F 1 B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和“R ”的行动,其收益如下:当A 选左,B 选L 时,A 的收益为2 ,B 的收益为3;当A 选左,B 选R 时,A 的收益为1 ,B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1;当A 选右,B 选R 时,A 的收益为0 ,B 的收益为2。请画出该博弈的博弈树,并求出该博弈的均衡解。 N H

博弈论简明教材

博弈论 第一节博弈问题概述 一、博弈的基本概念 博弈论是近年经济学中发展得很快的一个分支。博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。换句话说,博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。 在前面几讲中,除了寡头市场外,消费者的效用或厂商的利润都只依赖于他自己的选择,而与其他人的选择无关。在这里,经济作为一个整体,各个经济主体的选择是相互影响的。但对于单个的消费者或厂商来说,所有其它经济主体的行为都被包括在一个参数里。这个参数就是价格。除此以外,经济主体在决策时,面临的似乎是一个非人格化的东西。经济主体既不需要考虑他人的选择对自己选择的影响,也何必需要考虑自己的选择对他人的影响。而在本讲所介绍的博弈论中,消费者的效用或厂商的利润不仅依赖于自己的选择,而且依赖于具体的某一个或某一些其它经济主体的选择。 在经济学中,博弈论通常是放在寡头市场的分析中,因为在寡头市场上,某一寡头企业在决策时,不得不考虑其他寡头企业的反应。但事实上,博弈行为是广泛存在的。 博弈分析的目的是使用博弈规则决定均衡。 博弈论的基本概念包括:参与人、行动、战略、博弈规则、信息、报偿、均衡。 参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。 行动是指参与人作的决策。 战略是指参与人选择行动的规则,它告诉参与人在什么情况下选择什么行动。 例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。这里,“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”,什么时候选择“不犯”。 博弈规则是指参与人共同接受的不同情况下的最优战略。信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。 报偿是参与人从博弈中获得的结果,它取决于所有参与人的行动或战略。 把全体参与人可能采取的不同战略及其报偿都列出来,称为报偿矩阵。 均衡是所有参与人的最优战略或行动的组合。 二、博弈的分类 可以从不同的角度对博弈进行分类。 根据博弈者选择的战略,可以将博弈分成合作博弈 (cooperative games) 与非合作博弈 (non-cooperative games). 合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。例如,如果几家寡头通过订立并实行协议,限制产量,制定垄断高价,则称这种博弈为合作博弈。若寡头们在市场竞争中没有达成有约束里的协议,每个企业仅仅是在考虑到

博弈论复习题及答案

名词解释(每题7 分,共 2 8 分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10 分,共40 分) 1、博弈的基本要素有哪些? 基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。

3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能 猎到所 需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代 理人行 动,造成信息不对称,从而出现代理人选择不利于委托人的行 为的一种现 象;解决道德风险的方法可以用签订合同、派人监督,以 及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 H B i 答:根据上方的矩阵图, 我们可得出其博弈中存在两种策略的纳 什均衡:分别是 H 选择F1和N 选择F2,以及H 选择B1和N 选择 B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和R ”的行动,其收益如下:当 A 选左,B 选L 时,A 的收益为2,B 的收益为3 ;当A 选左,B 选R 时,A 的收益为1 , B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1 ; 当A 选右,B 选R 时,A 的收益为0,B 的收益为2。请画出该博弈 的博弈树,并求出该博弈的均衡解。 四、论述题(16分) 1、请结合你的工作或生活,谈谈对行动的可信性的理解,有什么方 法可以建立可信的策略行动。 答:每一种策略性行动都面临着可信性的问题, 人们不一定相信 策略性行动的提出者会实施其行动。 因此提出者必须做一些辅助工作 F 2 B 2

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968) d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i,si*称为参与人 i的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就是 各参与人在其各自策略集中, 不断剔除严劣策略…如果最终 各参与人仅剩下一个策略,则 该策略组合就被称为重复剔除 严劣策略均衡。 (二):纳什均衡(Nash Equilibrium) 2.1纳什均衡定义:对于一个策略式表述的博弈G={N,S i, u i,i∈N},称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡,如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i的最优策略(经济理性策略),即:u i(s i*, s-i*) ≥ u i(s i, s-i*), 对于任意的s i∈S i ,任意的i∈N均成立。

博弈论基本概念

(1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。 (2)对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。 (3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。 (4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (5)得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 (6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 (7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的收益不会超过他采取原来的策略a*的收益。这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策

博弈论部分内容

博弈论基础 本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。 重点:博弈论的基本思想,纳什均衡的概念,信息不对称。 难点:博弈的构成要素,纳什均衡的概念。 一、博弈的基本要素 1、博弈论与古典经济学的区别 古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。 博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。 两者的根本区别:是否考虑对方的行为。 古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。消费者A不会考虑消费者B的影响。 古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。厂商A不会考虑厂商B的影响。 古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。国家A不会考虑国家B的影响。 博弈论:每个人要考虑别人的行为怎样影响自己的选择。 扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。 下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。 高手与俗手的区别也就在此。高手往往能够考虑10步甚至20步以后的变化。 总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。 2、博弈论简史 博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯?诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and Economic Behavior)一书,最早提出了博弈论的概念。

对博弈论的认识

对博弈论的认识 博弈论( Game Theory) 研究的是, 各个理性 决策个体在其行为发生直接相互作用时的决策及 决策均衡问题。冯·诺伊曼(John Von Neumann) 与摩根斯坦恩(Oskar Morgenstern) 合作出版的 《博弈论与经济行为》(1944) 一书第一次系统地将博弈论引入经济学中。到20 世纪50 年代, 合作博 弈发展到鼎盛期, 非合作博弈也开始产生。纳什(Nash ,J . F. ) 的《N 人博弈的均衡点》(1950) 、《非合作博弈》(1951) 明确提出了“纳什均衡”(Nash Equilibrium) ,图克( Tucker) 则定义了“囚徒困境”( Prisoners’ Dilemma , 1950) 。两人的著作奠定了现代非合作博弈论的基石。泽尔滕(R. Seleten , 1965) 首次将动态分析引入博弈论, 提出了纳什均 衡的第一个重要改进概念———“子博弈精炼纳什均衡”(Subgame Perfect Nash Equilibrium) 和相应的求解方法———“逆向归纳法” (Bakeward Induction) 。豪尔绍尼(J . C. Harsanyi ,1967) 首次把信息不完全性引入博弈分析, 定义了“不完全信息静态博弈” (Static Games of Incomplete information) 的基本均衡概念———“贝叶斯- 纳什均衡”(Bayesian - Nash Equilibrium) ,构建了不

完全信息博弈的基本理论。之后,不完全信息动态 博弈(dynamic games of incomplete information) 得到迅速发展, 弗得伯格和泰勒尔( Furdenberg and Tirole , 1991) 定义了它的基本均衡概念———“精炼贝叶斯—纳什均衡” ( Perfect Bayesian - Nash Epuilibrium) 。70 年代以后,博弈论形成了一个完整的体系;大体从80 年代开始,博弈论逐渐成 为主流经济学的一部分,甚至可以说成为微观经济 学的基础。1994 年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔滕三人,以表彰他们在博弈论的发展 及应用中所作出的开创性贡献。 一经济博弈论的基本理论——— 基本博弈结构、纳什均衡及其改进 这里,我们以完全信息静态、完全信息动态、不 完全信息静态、不完全信息动态四种博弈结构为主线, 对纳什均衡及其改进进行概括, 以阐明经济博弈论的主要思想内涵。 (一) 完全信息静态博弈———纳什均衡 纳什均衡是完全信息静态博弈的基本均衡概 念。完全信息静态博弈(Static Games of Complete Information) 是指, 博弈的每个局中人(参与竞争的具有不同利益的行为主体或决策者) 对所有其他

一、博弈论的基本概念

博弈与决策复习资料 第一章博弈论的基本理论 一、博弈论 (一)、博弈论的基本概念 ?博弈 博弈论 (二)、博弈论的构成要素 ?博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、结果、 均衡等。 ?(1)参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也 可以是团体); ?(2)行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策; ?(3)策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动 的预先安排; ?(4)得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或 行动的函数,这是每个参与人最关心的东西; ?(5)均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分 析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。 ?上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博 弈规则来决定均衡。 二、博弈论的发展简史 ?萌芽阶段 ?产生阶段1944 《博弈论与经济行为》 ?发展阶段纳什均衡 ?高潮阶段诺贝尔经济学奖 ?成熟阶段 三、博弈论的分类 ?参与人行动的先后顺序:静态和动态 ?参与人对其他参与人的了解程度:完全信息和不完全信息 ?参与人之间是否进行合作:合作和非合作 ?非合作博弈四种类型及对应的均衡: ?完全信息静态——纳什均衡、占优均衡 ?完全信息动态——子博弈精炼纳什均衡 ?不完全信息静态博弈——贝叶斯纳什均衡 ?不完全信息动态博弈——精炼贝叶斯纳什均衡

第二章简单博弈与博弈均衡 一、占优战略与占优战略均衡案例分析囚徒困境 二、纳什战略均衡案例分析性格大战纳什均衡的意义 占优战略均衡和纳什均衡的联系与区别: 第三章重复博弈与序列博弈 一、重复博弈 重复博弈中的“针锋相对”策略博弈 二、序列博弈 第四章博弈论在企业经济管理决策中的应用 一、扩大生产能力策略 二、保证最低价格策略 重点掌握保证最低价格策略 三、掠夺性定价策略 四、限制进入定价策略 红字部分内容参见教材 除红字部分外内容参见网上课堂课件、网上案例

博弈的构成要素

博弈 (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。 (2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 (4)对于博弈参与者来说,存在着一博弈结果 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B 亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b (属于策略集B),总有:对局中人A的偶对(a, b*)≤偶对(a*,b*);对局中人B 的偶对(a*,b)≤偶对(a*,b*)。 有了上述定义,就立即得到纳什定理: 任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。 纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要

期末复习博弈论基本概念

1.博弈论: 研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 一些个人或组织,面对一定的环境条件,在一定的规则下,同时或先后、一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。本质为存在策略依存性的决策问题。 2.博弈与一般决策的区别: 决策论在技术分析上将对方(其他参与人)的情况列入自己的约束条件,作为一个环境因素对待,将对方的影响作为外生变量处理,未考虑对自己效用的直接的主动的影响。 3.博弈模型的要素 a)参与人(局中人、博弈方):博弈中的决策主体。他的目的是通过选择策略以最大 化自己的支付(效用)水平。虚拟参与人(自然):指决定外生的随机 变量的概率分布的机制。自然作为虚拟参与人没有自己的支付与目标函数,即所有 的结果对他来说都是无差异的。 b)策略:参与人在给定信息集(信息集包含了一个参与人有关其他参与人之前行动的 知识,可理解为参与人在特定时刻有关变量值的知识。一个参与人无法准确指导的 变量全体属于一个信息集)的情况下的行动规则。它规定参与人在什么时候选择什 么行动。(策略是可供局中人选择对付其他局中人的完整行动方案)各参与人 的策略选择范围称为策略空间(策略集)。每个博弈方各选一个策略构成一个 策略组合(局势) c)博弈过程:各博弈方行为的顺序及博弈的规则等。关键是自己选择时能否知道其他

博弈方的选择。 d)支付(得益)函数:各策略组合下各博弈方获得的数值结果(常为效用)。表示为 Ui=Ui(s1,…,si,…,sn)。可见其不仅取决于自己的策略,还取决于他人的策略。 e)信息结构:博弈方对得益和博弈过程信息的掌握情况和程度 f)理性基础:博弈方的行为选择时以个体理性还是集体理性为基础,有完美理性还是 有限理性 若设定博弈时不专门设定后两个方面,就隐含假定就是完全、完美信息、完全理性的非合作博弈 4.博弈的分类(类型) a)据是否具有有约束力的协议:非合作博弈、合作博弈。(非合作博弈无约束力、核 心是策略选择、追求个人优化、不注重效率;合作博弈有约束力、核心是利益分配、 追求公平公正和效率) b)据理性程度:完全理性博弈、有限理性博弈。(完全理性指有完全的计算能力,不 会犯错) c)据博弈过程的不同:静态博弈、动态博弈 d)据博弈方对得益信息的掌握情况:完全信息博弈、不完全信息博弈。(完全信息: 指每个参与人的特征/类型、策略空间、支付函数在所有参与人中是共同知识) e)据策略数量:有限博弈(参与人数有限且策略集均为有限集)、无限博弈 f)据得益特征:零和博弈(对抗性最强)、常和博弈(对抗性较强)、变和博弈(可能 出现双赢或多赢)

博弈论的理论精华及其现实意义

48 [收稿日期]2002-02-25 [作者简介] 胡希宁(1952-),男,安徽芜湖人,中共中央党校经济学教研部教授;贾小立(1970-),男,山西洪洞人,中共 中央党校研究生院硕士研究生。 博弈论的理论精华及其现实意义 胡希宁 1 贾小立 2 (1.中共中央党校经济学教研部,北京100091; 2.中共中央党校研究生院,北京100091) [摘要]经济博弈论以贴近现实的方式,揭示了现代经济活动的内在规律。它的发展过程是 纳什均衡从提出到改进的过程。无论在理论上还是在实践上,博弈论都具有重要的现实意义。 [关键词] 博弈论;纳什均衡;信息经济学 [中图分类号] F062.5 [文献标识码]A [文章编号]1007-5801(2002)02-0048-06 第6卷第2期 2002年5月 中共中央党校学报 Journal of the Part y School of the Central Committee of the C.P.C. Vol.6,No.2Ma y .,2002 博弈论(Game Theor y )研究的是,各个理性决策个体在其行为发生直接相互作用时的决策及决策均衡问题。冯?诺伊曼(John Von Neumann )与摩根斯坦恩(Oskar Mor g enstern )合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中。到20世纪50年代,合作博弈发展到鼎盛期,非合作博弈也开始产生。纳什 (Nash ,J.F.)的《N 人博弈的均衡点》(1950)、《非 合作博弈》(1951)明确提出了“纳什均衡”(Nash E q uilibrium ),图克(Tucker )则定义了“囚徒困境”(Prisoners’Dilemma ,1950)。两人的著作奠定了 现代非合作博弈论的基石。泽尔滕(R.Seleten , 1965)首次将动态分析引入博弈论,提出了纳什均 衡的第一个重要改进概念———“子博弈精炼纳什均衡”(Sub g ame Perfect Nash E q uilibrium )和相应 的求解方法———“逆向归纳法”(Bakeward Induction )。豪尔绍尼(J. C.Harsan y i ,1967)首次 把信息不完全性引入博弈分析,定义了“不完全信息静态博弈”(Static Games of Incom p lete information )的基本均衡概念———“贝叶斯-纳什 均衡” (Ba y esian -Nash E q uilibrium ),构建了不 完全信息博弈的基本理论。之后,不完全信息动态博弈(d y namic g ames of incom p lete information ) 得到迅速发展,弗得伯格和泰勒尔(Furdenber g and Tirole ,1991)定义了它的基本均衡概念——— “精炼贝叶斯—纳什均衡”(Perfect Ba y esian -Nash E p uilibrium )。70年代以后,博弈论形成了一个完整的体系;大体从80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。1994年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔滕三人,以表彰他们在博弈论的发展及应用中所作出的开创性贡献。 一经济博弈论的基本理论———基本博弈结构、纳什均衡及其改进 这里,我们以完全信息静态、完全信息动态、不完全信息静态、不完全信息动态四种博弈结构为主线,对纳什均衡及其改进进行概括,以阐明经济博弈论的主要思想内涵。 (一)完全信息静态博弈———纳什均衡 纳什均衡是完全信息静态博弈的基本均衡概念。完全信息静态博弈(Static Games of Com p lete Information )是指,博弈的每个局中人(参与竞争的具有不同利益的行为主体或决策者)对所有其他局中人的特征(策略空间、支付函数等,前者指可供局中人选择的策略组合,后者指决定局中人损益得失的函数)有完全的了解;所有局中人同时选择行

相关文档
最新文档