经济博弈论5

经济博弈论5
经济博弈论5

第五章不对称信息静态博弈

在1960年代末和1970年代初,博弈论的研究开始进入信息不对称的时代。正是信息不对称的考虑,在博弈论的研究中将经济学家与数学家区分开来。本章我们考察静态情况下的不对称信息博弈。

第一节信息不对称博弈的表述

什么是信息不对称呢?参与人在博弈中掌握着不同的信息,就是信息不对称。信息不对称对于博弈的结果或者说预测有什么样的影响呢?我们可以通过一个例子来说明。

5.1.1信息不对称影响资源配置

例子5.1 二手车市场

小李通过了托福考试,被美国一所大学录取了。小李要出国留洋了,打算把自己的座驾卖掉,一是可以处置座驾,二是可以筹一笔钱,好在国外用作为生活费。

小李的座驾是比较新的,去年才买的新车,开了一年,没有什么机械问题,其实由于磨合很好,比起刚刚出厂的新车还要好用呢!小李估计自己的车价值至少值20万元。

老王是一位下岗的师傅,刚刚开了一个小作坊。他准备买辆二手车作为跑业务的交通工具,于是在二手车市场上与小李讨价还价上了。老王不清楚小李的车的质量情况,关于小李提出他自己的车是没有任何质量问题的新车这样的说法,老王是半信半疑的。老王认为小李的

车最多值20万元,但是又很可能在20万元之下,如果存在一些质量问题的话

当然,小李的车看起来还是蛮新的,试驾一下感觉也不错,至少还是值一些钱的,譬如10万元。因此,老王认为小李的车价值在10万到20万元之间。所以,他提出只愿意花一个平均的价格即15万元买小李的车。

但是,小李认为自己的车真正是没有任何质量问题的新车,价值的确是值20万元的。然而,不管小李怎么说,老王就是不相信。因为,老王不认为小李有积极性说真话。

小李现在面临的问题是,是蒙受损失把价值20万元的车以15万元卖掉,还是将车开回去,另外想办法筹钱去美国读书。对于小李来说,损失5万元还是很大一笔数字的。所以,他没有把车低价卖了,而是开回去了。

这边的老王呢?他回头又找到老张,因为老张正在卖一辆旧车。老张的车是与小李的车一样的牌子和车型,并且表面看起来新旧也差不多。

但是,其实老张的车比小李的车旧多了,并且还有机械问题,尽管不容易发现。老张自己也认为这车只值10万元。老王也报出15万元的价格,老张喜出望外,立即答应,并且乐呵呵地说马上帮助老王把车开到老王的家里,晚上还要请老王吃饭呢!

老王是有心计的,他知道,刚才小李不愿意将车以15万元卖给他,

说明小李的车价值一定在15万元之上——因为,小李比老王更加知道那车的质量问题,也就是说,小李与老王关于车的质量问题是信息不对称的。小李比老王知道车的情况要多一些,即拥有更多的信息。现在,老王见老张一口就答应以15万元成交,说明车的真实价值,或者是老张认为的价值,是在15万元之下。

于是,老王又反悔了,提出价格还应该继续下调。尽管老张对于老王的行为不满意,但是他还是很愿意与老王讨价还价。只要老张还愿意与老王讨价还价,就说明老张的估价还继续低于老王的喊价。老王对于这一点是心知肚明的。于是,老王一鼓作气地压价,终于将价格压到10万元;这时候老张怎么也不愿意让步了。于是,两个人以10万元成交。

其实,在这个故事里,小李事前就预期到这样的结果,知道他的车不可能以真实的价值卖出去,他根本就不会来二手车市场的。于是,在二手车市场上,其实都是老张那样有问题的车在兜售。

还有,老王也知道,或者说预期他在二手车市场只能够买到有问题的车,尽管价格便宜。如果老王不打算买有问题的车,他也根本不会来二手车市场的。

这里有几点结论:

1)二手车市场存在这样的问题,即没有好车卖,卖的都是有问题的车,这叫做”逆选择“;

2)二手车市场出售车的成交价格都很低;

3)如果没有多少人愿意买有问题的车,二手车市场很可能只有卖家没有买家,市场会崩溃。

其实,上面这些特征是二手车市场通常被观察到的现象。

美国经济学家Akelof首先发表论文指出二手车市场出现这些问题的原因,从而拉开了研究不对称信息博弈论的序幕。在1970年代,Akelof在论文《柠檬市场:质量的不确定性和市场机制》一文中提出,提出了信息不对称带来效率损失的问题。

这个博弈论领域非常著名的“二手车模型”,是信息不对称博弈论的经典模型。Akelof于2001年获得诺贝尔经济学奖,并且在三位获奖人中排在第一位,与他的这个发现以及随后启动的不对称信息博弈论革命是有关系的。

后来人们认识到,信息不对称带来的逆选择问题是广泛存在的,譬如,中国的上市公司过度包装,造成投资者的信息不对称,逆选择就是好的公司股票价值被低估,而差的公司股票价格被高估,成交价格低,导致资本市场不景气,只有依靠政府的政策造势或者机构的操纵来给股市注入动力。这样的变态资本市场所以形成就在于逆选择机制产生着作用。

再譬如,一个单位通常是能干的人才留不住,而庸才却长期呆在单位混饭吃。这也是因为单位的领导对于属下能力评价的信息不对称,造成给予高能力人才待遇偏低,而庸才待遇偏高,逆选择产生了作用。社会性的贪污,也有逆选择的推波助澜。一个社会在缺乏对于官员财

产申报的要求时,社会对于官员的真实财产情况不清楚,信息的不对称会造成社会对于清官的好评不够而对于贪官的打击不力,逆选择会带来清官减少而贪官盛行的局面。

信息不对称的问题是会造成资源配置的低效率,因为逆向选择导致最优资源配置难以实现。譬如,在二手车市场中,交易双方因为信息不对称导致潜在的交易不能够完成,潜在的帕累托改善不能够实现。

第二节海萨尼转换与类型依存策略

5.2.1 海萨尼转换

在1960年代末以前,人们普遍认为信息不对称情况下的博弈是难以表述的。因为,参与人不知道是与什么样类型的其他人进行博弈,是没有可能进行理性的策略选择的。但是,这种情况因为海萨尼的工作而发生了改变。

譬如,一个汽车制造企业在与竞争者进行价格竞争的时候,它可能不清楚竞争对手的成本情况。但是它知道,竞争对手的产品价格是按照其成本状况制定的。当它不清楚竞争对手的价格策略时,它会怎么制定自己的价格策略呢?事实上,这就是当年(在海萨尼提出“海萨尼转换”之前)人们对于信息不对称环境下建立博弈模型缺乏信心的原因之一。

海萨尼(Harsanyi,1967、1968)的方案是,尽管参与人对于别人的有关信息缺乏了解,但是在博弈开始之前知道自己的信息,譬如,企业知道自己的成本情

况,尽管不清楚别的企业的成本状况。企业知道自己的信息被叫做“私人信息”(private information)。另外,尽管不知道其他企业的成本,但是作为同样一个产业里面的企业,该企业可以根据自己的成本情况大致判断竞争对手的成本状况在什么样的范围,这种判断可以用概率方法来测量。譬如,用概率来预测竞争对手的平均成本等于任何一个可能数值的可能性。我们经常说不清楚某个事情,会说“天知道”。好了,海萨尼就是用这个“天知道”的概念,来刻画不对称信息。

他的假设是,有一个虚拟的参与人N(Nature),可以翻译成“自然”,“天公”和“老天”什么的。博弈在开始之前。先由“自然”选择各个参与人的“类型”,同时发送给每一个参与人。在这里,“类型”是将各个参与人的有关特征加以抽象出来的一个概念,用它概括别人不知道的私人信息。譬如,企业的成本就是企业的类型。企业的价格策略一般是根据成本情况制定的,所以称不对称信息博弈中的策略是“类型依存策略”。不同的类型将制定不同的策略。

每一个参与人在获得“自然”发送的信息后(注意,这里的“发送”是虚拟的),就知道了自己的类型,但是不知道别人的类型,然后根据自己的类型选择策略。

在这里,海萨尼通过植入一个虚拟的参与人“Nature”,将不对称信息的静态博弈转化为一个动态的博弈(当然,在海萨尼转换之后,博弈就仍然是静态博弈的了) ,当然仍然是不对称信息的。这种转换叫做“海萨尼转换”。

“海萨尼转换”提供了将不对称信息博弈进行描述和分析的方法论框架,并且与通常的对称信息博弈分析的方法是一致的。5.2.2 贝叶斯纳什均衡

在不对称信息博弈中,纳什均衡的概念将有一些特别的表达方式。由于参与人的策略选择是类型依存的,而参与人不知道别人的类型,因此也不知道别人的策略选择。参与人在这种情况下的策略选择就类似于前面介绍的混合策略情形中的策略选择,自然就想到可以用平均值的方法来度量参与人最大化的目标。参与人通过估计别的参与人类型的概率(称为“先验概率”,意思是在博弈进行之前就获得的有关其他参与人类型的不完全信息),并因此预测其他参与人选择的策略,通过计算给定自己选择的策略情况下获得的平均支付,来决定自己的策略选择——他会选择最大化这个平均支付来决定自己的策略选择。

如果所有参与人都是这样选择自己的策略,给定其他参与人的策略,每一个参与人的策略都是这种意义上的最优策略。我们就称为“贝叶斯纳什均衡”。

信息不对称与信息不完全是不同的概念,一些教科书在这方面存在着混淆。信息不对称指不同参与人获得的信息是不一样的,而信息不完全指获得的信息是有限的,也许所有参与人获得的信息是一样的,尽管都是不完全的。

例子5.1美女的帽子颜色

三位美女1,2,3面对面地坐在一起,每位美女都戴有一顶或者是红色或者是白色的帽子——每位美女都只能看见其他美女所戴帽子的颜色,但不知道自己戴着什么颜色的帽子。

每位美女的先验信念是每位姑娘所戴帽子的颜色以0.5的概

率是红色的,以0.5的概率为白色,并且是独立于其他美女所戴帽子的颜色。用i C 表示美女i 帽子的颜色,i =1,2,3。则参与人1

的类型(即她看到另外两人帽子的颜色)为23(,)C C ,参与人2的类型为13(,)C C ,参与人3的类型为12(,)C C 。

我们用R 表示红色,W 表示白色,123,,t t t 分别是三位美女的类

型,即她们看到其他两位美女的帽子颜色。

·表5.1 给出了状态先验概率。

表5.1 帽子颜色博弈中的先验概率

例子5.2 纸老虎博弈

中国人习惯将表面强大实质软弱的对手称为“纸老虎”。但是,在实际的博弈中,对手是不是真正的纸老虎还是一个问题呢!

对手有可能是纸老虎,也有可能是“真老虎”。如果挑战纸老虎,弱小的一方有可能取胜,并且弱小的一方战胜表面强大的对手,即使战胜的是纸老虎,也具有巨大的声誉效应。这对于弱小的参与人来说,是特别具有诱惑力的。但是,如果对手其实是真老虎,

t 2

t 1 RR

RW

WR

WW

贸然挑战就会招致毁灭性的打击,后果是严重的。

弱小的参与人在面对表面强大的对手时,有时候不知道对手是不是纸老虎,信息是不对称的。但是,战胜纸老虎带来的巨大声誉与遭遇真老虎带来的可怕后果,会将弱小的参与人置于左右为难的局面,微小的信息错误也时常驱使参与人铤而走险。下面的模型刻画了这种情形。

假设弱小的参与人不清楚第二个参与人是否真正强大。自然在博弈开始的时候进行“海萨尼转换”,赋予参与人2某种类型——强大的或者是软弱的,参与人2知道赋予自己的类型是什么,但是参与人1是不知道的。

参与人1赋予第二个人是真老虎即强大的概率为q。这个q叫做“信念”;因为是在博弈开始就作出判断,也叫做“先验信念”。每个人可选择的策略是战争还是和平。如果是和平,则第一个参与人得到支付0(无论他人作何选择);倘若他选择战争而其对手选择的是和平,则他得到支付1;若两人都选择战争,则当第二个人是强大的时候,他们的支付为(-1,1);如果第二个人是软弱的纸老虎,则他们的支付为(1,-1),见表5.2。假定q的数值他们都共同知道的,称为是他们的“共同知识”。

首先,注意到当第二个人是强大的时候,他总是选择战争。

还注意到当第二个人是软弱的时候,第一个人从选择战争中获得的支付总为1,大于从选择和平中得到的支付,因为后者恒为零。因此,第一个人从选择战

争中获得的期望支付等于(1)1(1)12

-+?-=-。于是,当

q q q

q>

q<时,第一个人的最优策略就是选择战争;当0.5

0.5

时的最优策略是和平。

当第二个人是软弱的时候,其最优策略是什么呢?对于他来说要做出最优决策,他不仅需要知道她自己

是软弱的,而且还要知道(i)倘若当他自己是强大的时候将选择的行动,以及(ⅱ)他关于参与人1的主观概率q 的信念(即他关于参与人1的信念的信念),记为w q 。若0.5w q >,

参与人2很有信心1不会选择战争,则他选择战争;若0.5w q <,参与人2认为1将选择战争且因此他自己选择和平。给定我们关于q 是共同知识的假定,w

q q =,因此若 q <0.5,软弱的2会选择和平;若 q >0.5,软弱的2会选择战争。

这个结果相当直观。参与人1将会选择战争,如果他认为2 看来很可能不是强大的话。参与人2在他自己是强大的情况下总是选择战争,因为他自信其力量。当他是软弱的时候,参与人2在决定战争与和平时会表现得慎重一些:仅当他认为对方认为他有较高的概率是强大的时候,他才会选择战争。

通过这个例子,我们看到不对称信息情况下的策略是“类型依存的”,即策略的选择是依赖于参与人类型的。

表5.2 纸老虎博弈

自然

1

第三节 应用例子

5.3.1成本信息不对称的古诺博弈

前面给出的古诺博弈中,每个厂商的成本函数是共同知识。这里,我们假设每个厂商的成本函数是私人

强大的2 软弱的2 战争

战争 和平 和平

信息,即厂商自己知道自己的成本信息。具体规定如下:两个企业生产相同产品并在同一市场上进行竞争性销售,市场需求函数为P a Q -=,0>a ,P 为产品价格,Q 为市场需求量。企业i 的成本函数为i i i q b C =,其中i C 为企业i 的总成本,i q 为其产量,i b 为其平均成本,i b 为常数且0>i b ,故i b 也是边际成本。i b 是企业i 的私人信息,企业j i ≠不知道i b 但认为i b 在],[e d 上呈均匀分布,0>d ,0>e ,e d ≤。且进一步假定i b 在],[e d 呈均匀分布是共同知识,,1,2i j =。

企业i 的支付函数是其利润函数

12 ()i i i

i i i

Pq C a q q q b q π=-=--- 设贝叶斯均衡为q i *

{}i =1,2,则由均衡策略的类型依存

性有

2,1),(**==i b q q i i i

给定公司2的平均成本2

b 及其相应之最优产量选择()22q b *, 公司1通过选择1

q 将得到: ()()()121221111

,b q a q b q q b q π*=--- 对其对企业2的类型取平均值,公司1的平均支付为:

()112111a q q q b q π---=

我们用字母上面的一横来表示平均值。

通过配方,我们得到

()21111

22

2

212112112

2212111()()()44()()24a q q q b q a q b a q b q a q b q a q b a q b q π-------=-+---+----??=--+????=

显然,企业1的最大化利润条件是

211()02

a q

b q ---= 即

211()2

a q

b q --= (5.1) 我们现在式(5.1)的两端同时对企业1的类型取平均值

21()22d e a q q +--=

根据模型的对称性,应该有

12q q =

于是就得到

21212()2

2

23

26d e a q q q d e a q q a d e +--==+-==--=

代入式(5.1)

1112()62

4612a d e a b q a d e b ---

-=++-=

即每个公司的产量是随着它的边际成本的增加而减少的。另外,比较两个公司的产量,我们发现当12b b ≥时,12

q q **≤,即成本较低的公司产量较大。 当d e =时,博弈退化成对称信息策略式博弈,为了与前面的古诺博弈相比较,进一步设c e d ==,c b b ==2

1,

)(31*2*1c a q q -== 这正好回到前面的古诺博弈结果。 5.3.2 运用不对称信息博弈解释混合策略博弈 如何理解混合策略博弈纳什均衡的问题。目前,对混合策略均衡的最具影响力的解释是由Harsanyi (1973)提出的。在Harsanyi 的理解里,参与人没有采用混合策略,但由于不同类型的参与人採用不同的纯策略,以致局外人看起来会得到这样一种印象即参与人是在玩一种混合策略均衡。大致说来,Harsanyi 证明了,对于几乎所有的策略式博弈,其混合策略均衡可用一个其支付是原博弈支付单纯化而来的贝叶斯博弈的纯策略纳什均衡来逼近。由于与这些结论相关的数学复杂性,我们在这里不给出证明;相反,我们通过一个例子来加以说明。 考虑下述博弈,不难验证,存在一个唯一的混合策略均衡: 参与人1以3/4概率选择T,而参与人2以1/2的概率选择L 。 表5.3 只有一个混合策略均衡的一个博弈

现在考虑一个贝叶斯博弈,其中的支付含有私人可观察的干扰项。

表5.4 支付中含有私人可观察噪声一个贝叶斯博弈

2 L R 1 T 0,0 0,-1 B 1,0 -1,3

这里,ε∈(0,1)是已知参数,θ1和θ2

为两个参与人的类型,是私人信息。假设参与人对于对方的私人信息都认为是在区间[]0,1上的均匀分布的。该不对称信息博弈的均衡是每一种类型的参与人将如何行动的一个方案,且对于给定其信息的类型来说该方案是最优的。 我们用组对12(,)θθ来刻画均衡,使得11θθ<的参与人1将选择B ,11θθ≥的参与人1选择T ,2

2θθ<的参与人2选择R 和2

2θθ>的参与人2选择L 。 我们现在来解这个均衡。

首先考虑参与人1,假设参与人1认为参与人2会分别以概率q 和1q -选择L 和R 。当他选择T ,他将得到111(1)q q εθεθεθ+-=;选择B ,他的期望收入为12q -+。

如果112q εθ>-+,即1(12)/q θε>-+,他会选择

T; 根据假定,当且仅当11θ

θ>时,T 是参与人1的最优选择,所以有 1(12)/q θε=-+. (5.2) 考虑参与人2,同样地,假设参与人2认为参与人1会分别以概率p 和1p -选择T 和B 。当他选择L, 他的期望收益是2

εθ;选择R ,他将得到34p -。 2 1 T εθ1,εθ2 εθ1,-1 B 1,εθ2 -1,3

当2(34)p εθ

>-,即2(34)/p θε>-;他选择L 根据假定,当且仅当22θθ>时,L 是参与人2的最优选

择,所以有 2(34)/p θε=-.

5.3) 同时,我们有21q θ=-以及11p θ=-;

将之代入式(5.2)与(5.3),

12(12)/(12(1))/q θε

θε=-+=-+-.

或者

1212(1)εθθ=-+-.

21(34)/(34(1))/p θε

θε

=-=--. 或者

2134(1)εθθ=--.

联立

1212(1)εθθ=-+-.

2134(1)εθθ=--.

1212(1)εθθ=-+-.

2211221(34(1))(4)4εθεθεεθεεθεθ=--=-++=. 于是有22222212(1)4144824εεθθεεθεε+=-+---==++

1212(1)εθθ=-+-.

122222222(12(1))/4(12(1))/8

282(8)(8)

2(8)

2(8)

θθε

εεεεεεεεεεεεεε=-+--=-+-+++-+=++=++=+.

整理可得:

1228ε

θε+=+ , 2248ε

θε-=+

令0ε→,则11/4,θ→2

1/2,θ→故参与人1以1/4的概率选择B ,参与人2以1/2的概率选择R 。也即在前面已得到的不存在扰动项的博弈之混合策略均衡,可以通过存在有扰动项的博弈中的纯策略均衡的极限结果而加以复制。 第四节相关均衡

到目前为止,在混合策略博弈中我们总假定参与人

独立地选择纯策略,每一个概率密度都与其它概率密度之间不存在相互依赖关系。现在,我们来考察这样一种可能性,即允许概率密度函数之间有着相关性。

5.4.1. 参与人看见相同信号

例子5.35 一个相关均衡例子

考虑下面这个例子(见表5.5)。该博弈有两个纳什均衡:(U,L)和(D,R),对应的支付分别为(5, 1)和(1, 5),还有一个混合策略均衡,其中每个参与人都以相同概率选择两个纯策略。不难验证,此混合策

略均衡的支付()

2.5,2.5。

表5.5 一个相关均衡例子

2

1 U 5, 1 0, 0 D 4, 4 1, 5

*************************************************

现在,假定他们同意达成一项非强制性协议,通过抛一枚硬币,若出现正面,参与人1选择U,参与人2选择L;若出现反面,参与人1选择D,参与人2选择R。也就是说,当出现正面时,要求参与人们选择纳什均衡(U, L);若出现反面,则要求参与人们选择纳什均衡(D, R)。

然后他们就开始博弈。现在假定,硬币现在的是正面。给定参与人2选择L,参与人1的最优反应就是选择U,且给定参与人1选择U,参与人2的最优反应就是选择L。即没有一个参与人会有动机偏离事前(非强制性)协议。类似地,倘若是反面出现,基于同样的理由,没有一个参与人会有动机偏离事前(非强制性)协议。

*******************************************

*********************

因此,结果(U,L )以概率1/2和(D,R )以概率1/2出现是这个扩充后博弈的一个纳什均衡,该均衡的期望支付为(3,3)。(注:不存在参与人独立地随机选择会生成这一结果的可能性)。到目前为止,我们假定结果(U, L )和(D, R )是以概率(0.5,0.5)随机出现的。一般地,我们可以任何满足0.5p ≠的概率(,1)p p -使其随机出现。然而,我们还能够使其以任何概率在这两个纯策略均衡与第三个混合策略均衡之间随机出现。例如,考虑下列的一个建议:假定有一个公开的信号,它有三种结果,分别以概率12,λλ和3121λλλ=--发生,其中1230,0,0λλλ>>>。在第一种情形,两个参与人选择(U, L );

********************************************************

在第二种情形;两个参与人选择(D, R );在第三种情形;其中每一个参与人以同样的概率在这两个行动之间进行随机选择。由于给定结果下规定的策略组成一个纳什均衡,整个协议就成为这个扩充后的博弈中的一个纳什均衡。在这个均衡里,两个参与人分别获得12351 2.5λλλ?+?+?和12315 2.5λλλ?+?+?。通过改变权重

,1,2,3j

j λ=,

对于任何等于原有博弈的三个均衡支付之某种凸组合的支付向量,我们总是可构造这个扩充后博弈的一个纳什均衡,使得它具有这样的均衡支付。在数学中,这样的一个集合被称为这三个点的凸组合,记为convexhull{(1,5),(5,1),(2.5,2.5)}。一般地,给定欧氏空间中的一个子集X ,我们称X 中的点所构成的所有凸组合的集合为其凸包convexhull()X 。即 ()11convexhull :......0,1,,n n i i i i X y y x x x X i αααα??==++≥=∈?????

**********************************************************************

在图5.1中,画出了原有博弈的三个均衡下的相应支付。这三点一起决定了一个区域,其中每一个点都是三个点中某些点的凸组合。任何位于该集合的支付向量都可以通过让参与人按照某个可观察向量选择纯策略协调行动而得到。进一步,只有这些结果才是可得到的。

图5.1 阴影部分为convexhull{(1,5),(5,1),(2.5,2.5)}

5.4.2 参与人看见不同信号

至此,我们考虑了所有人都可公开正确观察到的信号。我们现在要指出的是,通过设计一个可发送不同但是相关的信号,参与人还可获得更好的结果。为说明这一点,假定存在三种同样可能出现的状态:A, B

和C 。还假定参与人1的信息集为 {A },{B ,C }{

},参与人2的信息集为 {A ,B },{C }{

}。假定他们协议按照如下规则行动:

?参与人1:{}{},,A U B C D →→

(5,1)

(1,5)

(2.5,2.5)

1u

21u u u

?参与人

2:{}{},,A B L C R →→

不难证明,这是一个纳什均衡:若状态A 发生,参与人1的最优反应为选择U 。若状态B 或者C 发生(即参与人1没有看见A 出现),则参与人1不知道到底是哪一种状态出现。他可以按照如下方式计算参与人2看见A ,B {}的条件概率: ()Prob {,}{,}1/31Prob({,}{,})Prob({,})1/31/32A B B C A B B C B C ===+

因此,他估计参与人2将选择L 的概率为1/2,于是选D 是最优反应(显然,U 也是最优反应)。读者可自行验证关于参与人2的行动规定也是最优反应。注意:

()Prob(,)Prob {}{,}1/3U L A A B ==

()Prob(,)Prob {}{}0U R A C ==

()Prob(,)Prob {,}{,}1/3D L B C A B ==

()Prob(,)Prob {,}{}1/3D R B C C ==

它给每个参与人带来的期望支付为 10/3,且位于纳什均衡支付凸包之外(可以自己验证)。

第四节 拍卖中的博弈论

5.4.1 拍卖中如何避免围标

如果有一件古董需要拍卖,有许多人参加竞争性拍卖。这件古董在每个买主心中有一个价值评价。但 是,卖主不知道买主的评价,买主也不会老实将其对古董的评价告诉卖主。不同买主之间也不知道其 他人的价值评价。

如果采用“英式拍卖法”,买主们轮流出价,直到开出最高价的买主拿走古董并支付所开出的最高

论经济博弈论

论经济博弈论 “博弈即一些个人、对组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。”博弈由英文“game”翻译过来,过去每每听到博弈一词.都觉得这是一个高深莫测、充满神秘色彩的领域,如今通过了系统的学习,才终于可以对“博弈”有一些粗浅的理解。博弈论的英文名称为Gm,ne Theory,也翻译为对策论、游戏论。作为一门现代学科体系,博弈论早在半个世纪以前就已经出现,但长期以来并没有受到足够重视,除了少数博弈论专家以外,很少有人知道它。可是,近年来却受到高度的重视和青睐。1994 年三位致力于博弈论基础理论研究的经济学家共同获得了诺贝尔经济学奖,使得博弈论作为重要的经济学分支学科的地位和作用得到了最具权威性的肯定。此后1996年,诺贝尔经济学奖又由博弈论和信息经济学家莫里斯和维克瑞获得,这进一步肯定了博弈论在经济学中的重要地位,同时也从一个侧面体现出博弈理论已经渡过了成长期,步人了成熟期。 一、博弈论的发展进程 博弈论思想虽然有着悠久的历史,但是作为一门系统的学科来说还相当的年轻。近代以来,在学术研究的过程中许多学者逐渐认识到了博弈论的重要作用,对博弈理论进行了探索研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(W aldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Coumot)和波特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产茸决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反应函数。但是作为一种理论来说,1944年,冯·诺依曼(VonNeumann)和奥·摩根斯坦(Morgenstem)合著了《博弈论与经济行为》在总结了以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提较系统的博弈理论,因此这被认为是博弈理论初步形成的标志。50年代初,纳什(J.Nash)的两篇非合作博弈论奠基性论文发表之后。博弈论飞速发展。作为博弈论的一部分,非合作博弈比合作博弈的发展更加迅速,在经济学等其他学科中的应用也更为广泛。提起博弈论,现在差不多总是指非合作博弈论。50年代以来,纳什(Nash)、泽尔腾(Sehen)、海萨尼(Harsanyi)等人是

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

经济博弈论

1、纳什均衡的概念。 对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。 2、非合作博弈与合作博弈的区别。形成合作博弈的两个条件: (1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。 (2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。 如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。 3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数 在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。纯策略是混合策略的特例。 按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。 策略组合指参与者可能采取的所有行动方案的集合。策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。 所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略 反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博 弈、完美信息动态博弈和不完美信息动态博弈 博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。简单说就是人与人之间为了谋取利益而竞争。 静态博弈是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。 动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。 完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。 不完全信息博弈,也称贝叶斯博弈,是指对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。博弈参与者对于对手的收益函数没有完全信息。 完全信息动态博弈,是指博弈中信息是完全的,即双方都掌握参与者对他参与人的战略空间和战略组合下的支付函数有完全的了解,但行动是有先后顺序的,后动者可以观察到前者的行动,了解前者行动的所有信息,而且一般都会持续一个较长时期。 不完美信息动态博弈,在动态博弈中,在不完全信息条件下,至少有一个局中人对其他某些局中人的收益不清楚。由于行动有先后顺序,后行动者可以通过观察先行动者的行为,获得有关先行动者的信息,从而证实或修正自己对先行动者的行动。 6、在公司制企业中,股东、经理、债券人、顾客、供货商等都被称为利益相关者。试分析不同

经济博弈论复习重点

博弈:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立, 则称 为G 的一个纳什均衡 混合策略纳什均衡在博弈 中, 博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈)。 :包含混合策略的策略组合,构成纳什均衡。 多个纳什均衡的某一个给所有博弈方带来的得益都大于其他所有那好似均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕雷托效率,称此纳什均衡为帕累托上策均衡。 如果所有博弈方在预计其他博弈方采用各种策略的概率相同时,某一策略给他带来的期望得益最大,各博弈方都偏爱这样的策略的策略组合,就称之为风险上策均衡。 “聚点”均衡(focal point equilibrium)。在制度经济学中,信息就可以解释为参与一个社会必须存在的“道德传统”(D.诺斯称之为“文化意识型态”),从而可以决定在多个纳什均衡中会出现某一个特定的均衡。此处的聚点(focal point )作用被解释为:当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡。 相关均衡:博弈方根据观察到的信号或者相关信号来确定自己的行为而形成的更广泛意义下的纳什均衡 如果一个博弈的某个策略组合满足下列要求: (1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图; (2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果; (3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。 称为“防共谋均衡”。 从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法” 如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。 有限次重复博弈:给定一个基本博弈G (可以是静态博弈,也可以是动态博弈),重复进行T 次G ,并且在每次重复G 之前各博弈方都能观察到以前博弈的结果,这样的博弈过程称为“G 的T 次重复博弈”,记为G(T)。而G 则称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。无限次重复博弈:一个基本博弈G 一直重复博弈下去的博弈,记为G( )策略:博弈方在每个阶段针对每种情况如何行为的计划子博弈:从某个阶段(不包括第一阶 } ,;,{11n n u u S S G =),(* *n i s s ),...,,(**1*1*n i i i s s s s +- ),...,,,(),...,,,(**1*1***1**1*n i ij i i i n i i i i i s s s s s u s s s s s u +-+-≥ i j i S s ∈),(* *n i s s },;,{11n n u u S S G =

经济博弈论

用博弈论解释需求定理 企研08 282120202001 胡雁南 摘要:经济学中需求是指消费者在某一特定的时期内,在每一价格上愿意并且能够购买的商品和劳务的数量。需求定理或称需求规律,表明了某商品的价格与其需求量之间的关系。其基本内容是:在其他条件不变的情况下,某种商品的需求量与价格之间成反方向变动,即某种商品价格上升,则其需求量减少;反之,需求量增加。 一、背景介绍 商品的交易可以理解为供给者与需求者相互之间的博弈。供给者提供商品的时候可以考虑索取高价或者低价,需求者则考虑选择购买或者不购买。需求者对商品的需求是指消费者在某一特定的时期内,在每一价格上愿意并且能够购买的商品和劳务的数量。消费者对商品的需求量是指在某一特定时期内,消费者在特定价格水平上愿意并且能够购买的商品和劳务的数量。 很多因素都可能影响商品的需求,有经济因素,也有非经济因素。其影响因素主要有:1,商品本身的价格。商品本身价格高,需求少;价格低,需求多。2,消费者的偏好。一个消费者偏好某种商品,即使这种商品的价格不变,需求量也会增加。3,消费者的收入。当消费者收入增加时,消费者对某些商品在一定价格下的需求量也会增加,对另一些商品在一定价格下的需求量则可能会减少。4,其它商品的价格。有两种情况:两种商品为替代品,如果商品的价格上升则对其替代品的需求量就会增加(如茶叶和咖啡),反之亦然;两种商品为互补品,商品的价格上升会导致对其互补品需求量的下降(如汽车和轮胎),反之亦然。 本文将利用博弈论,通过建立一个供给者与需求者之间的博弈模型,来解释价格对消费者购买行为的影响。 二、博弈模型的建立

根据需求理论可以建立起供给者与需求者(为叙述方便,下文简称卖方和买方)的博弈模型。我们作如下假设: 假设1:两个参与者——卖方,买方。参与人Ⅰ是卖方,参与人Ⅱ是买方。 假设2:卖方仅提供一种商品A ,该商品仅有一种替代品B 。商品A 的单价为 1P ,商品B 的单价为2P ,买方的总购买能力为M ,M 总是不变。 假设3: 依据以上假设,可建立博弈模型的支付矩阵如表1-1. 表1-1 卖方与买方的支付矩阵 买方 购买y 不购买(1-y ) 卖 方 低价x (111CQ Q P -,111Q P CQ -) (1CQ ,11Q P ) 高价(1-x ) (*1*1*1CQ Q P -,*1*1*1Q P CQ -) (*1CQ ,* 1*1Q P ) 其中: 1P 是卖方采取低价时商品A 的价格; 1Q 是商品A 的价格为1P 时的需求量; C 是每件商品A 的成本; 当买方购买商品A 时付出购买商品的价格11Q P ,同时得到商品的成本1CQ ,于是买方购买商品时的支付为111Q P CQ -;而卖方则得到买方付给的价格但同时交付商品的成本,于是卖方的支付为111CQ Q P -; 当买方未购买商品A 时,卖方仍然持有商品的成本1CQ ,而买方仍然保有着商品的价格11Q P 。 当商家采取更高的价格* 1P 时,同理。 x 和y 分别代表卖方出低价和买方选择购买的概率。 三、模型的分析 首先用划线法分析表1-1:

浅谈经济博弈论

浅谈经济博弈论 姓名:李欣航学号:20081065 班级:02310802 人生如梦亦如戏,游戏人生,就要猜透别人怎么想,博弈论就是告诉你怎么跟人打交道,如何参透别人的心思。同时,用博弈论观照一些所谓的千古美谈,会发现那其实是无稽之谈。比如诸葛亮,其实远非司马懿之对手。 从一则故事说起,这个故事需要动点脑筋。 有五个海盗,劫掠了100两金子,需要分赃。办法是抓阄,盗亦有道。 抓到第一个阄的人,可以先提出一个分配方案,如果他的方案被一半以上的人同意,就照他的方案分金子,否则,第一个人就要被杀掉。余下的人也照此办理。 我们的问题是:如果你是第一个人,你会提出怎样的分配方案? 为了分析问题更确定,我们假定每个人都是追求自己利益极大化的人。

可能你会提出平均分配,每人20两,或者自己不要,等等。 可是正确的答案却并非如此。第一个人会说:“100两金子全归我!” 而且这个方案一定会被一半以上的人同意,这个人不会被杀掉。 这个问题比较复杂,当遇到复杂的问题时,我们可以从最后的环节开始考虑,这样,可以使问题清晰起来。 那我们就从抓到最后一个阄的人开始考虑。对于这个人来说,他知道,当轮到他提方案的时候,其他人都已经死掉了,金子将全是他一个人的。所以,他利益最大化行为便是,不管前边谁,包括第一个人,提了任何方案,他都一概摇头,不同意。 再看第四个人,他知道,不管自己提出什么方案,第五个人都不会同意,都会被杀掉,所以,他的利益最大化行为是,尽量不要轮到自己提方案。所以,不管第一个人提了怎样的方案,他都会表示同意。

第三个人,知道第四和第五个人的选择策略,所以,他的利益最大化的方案是100两金子全归自己。这个方案,因为自己和第四个人同意,超过了此时的一半以上的人的同意,可以行得通,所以,不管第一个人提出什么样的方案,第三个人都会反对。 第二个人,知道自己提什么方案,第三个人、第五个人都将反对,一旦轮到自己提,自己就死定了,所以,他会同意第一个人提出的任何方案,这是他的利益最大化行为。 所以,不管第一个人提出怎样的方案,第二个人与第四个人都会同意,加上第一个人自己的票,就是三票,一半以上,可以通过。 既然任何方案都可以通过,而第一个人又要追求自己利益的极大化,所以,他的方案是:100两金子全归自己。 这个例子告诉我们,想问题,确实需要方法论,靠直觉是不可以的,直觉在很多情况下是错误的,必须依靠方法,依靠逻辑的力量。 很多问题看起来没有头绪,是因为没有找到解决问题的路径,而方法的作用,就是帮我们找到切入点,找到了切入点,问

经济博弈论复习

《经济博弈论》复习精要 一.题型分值: 1.名词解释:4分* 5 = 20分; 2.判断题:2分* 10 = 20分; 3.简答题:7分*3=21分; 4.计算题:9分*1+10分*3=39分. 二.名词解释(4分* 5 = 20分,5题,共20 题) 1.博弈:指策略对抗,或策略有关键作用的游戏;博弈即一些个人、队组或其它 组织,面对一定的坏境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相 应结果的过程。 2.博弈论(Game Theory):指系统研究各种各样博弈中参与人的合理选择及其 均衡的理论,该理论思想的主要特征是博弈中各 参与人的策略和得益相互依存、相互依赖。 3.策略:博弈中各博弈方的选择内容(每个博弈方可选策略不一定完全相同, 即不一定对称) 4.得益:各博弈方从博弈中所获得的利益(利润、收入、量化的效用、社会 效益、福利等,有效用,有损失) 5.上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的 上策,必然是该博弈比较稳定的结果。 6.严格下策:不管其它博弈方策略如何变化,给一个博弈方带来的收益总是 比另一策略给他带来收益小的策略。(严格下策反复消去法)7.划线法:指用策略之间的相对优劣关系,而不是绝对优劣关系来进行博弈 选择以求纳什均衡的方法。(划线法的思路是先找出每个博弈方针 对其他博弈方所有策略(或策略组合)的最佳对策,然后再找出相 互构成最佳对策的各博弈方策略组成的策略组合,即纳什均衡) 8.纳什均衡:使每个参与人的策略是对其他参与人策略的最优反应的策略组合。 9. 反应函数:指一博弈方对另一博弈方每种可能的决策内容的最佳反应决策所 构成的函数。 10.帕累托上策均衡:指多重纳什均衡中给所有博弈方带来的得益都大于其他所 有纳什均衡带来的得益的那个纳什均衡。 11. 风险上策均衡:如果所有博弈方在预计其他博弈方采用各种策略的概率相同 时,能给博弈方带来最大期望得益,且被各博弈方偏爱策 略组合。 12.逆推归纳法:指从动态博弈的最后一个阶段博弈方的行为开始分析,逐步 倒推回前一个阶段相应博弈方的行为选择,一直到第一个 阶段的分析方法。 13.子博弈:指由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构 成的,有初始信息集和进行博弈所需要的全部信息,能够 自成一个博弈的原博弈部分。 14.子博弈完美纳什均衡:指如果一个完美信息的动态博弈中,各博弈方的策

博弈论复习题及答案

博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

第五章-博弈论与竞争策略

第五章博弈论与竞争策略 第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈 在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。因此,可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。 70年代以来,博弈论已经发展成为现代经济学的基础重要基础之一,改变了传统经济学的结构,这主要有两 个方面的原因: 1.传统经济学着重研究市场机制和价格制度,分析完全竞争市场中的最优决策,不考虑决策者之间的相互影响。但是,现实经济运行中市场是不完全竞争的,行为主体之间的决策具有相互影响。 2.完全竞争市场是以完全信息为条件的,这在现实经济运行中也难以保证。在信息不对称条件下,考虑行为主体相互影响的非价格制度可以用博弈论分析。 当然,应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计各参与者的策略空间和收益函数。 第一节博弈论的基本概念 一.博弈论及其特点 1.博弈和博弈论 博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。 博弈论(Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理性的多个行为主体的决策和行动直接相互作用和影响时,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2.特点: (1)参与者具有各自的目标: (2)参与者都是理性行为者; (3)参与者之间具有相关性; (4)事态发展的结果取决于全部参与者的共同行为; (5)参与者要根据对其他参与者的判断决定自己的行动,因而是对策。 可见,博弈论是与优化论不同的决策理论。优化论是一种单人决策理论;博弈论所揭示的规律是一种多人决策理论。 二.博弈论的基本概念 在博弈论中,博弈的基本要素被概括为以下概念: 1)参与者Players (玩家):即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,最少要有两个参与者。 2)策略Strategies (战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略空间。 接上页 3)收益Payoff(支付、得益)和收益函数:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。 4)结局 outcome(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。 5)均衡 Equilibrium (均势):指达到稳定的策略组合或结局。 6)博弈规则:指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。 例: 可口可乐与百事可乐(参与者)的价格决策: 双方都可以保持价格不变或者提高价格(策略) 博弈的目标和得失情况体现为利润的多少(收益) 利润的大小取决于双方的策略组合(收益函数) 博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

经济博弈论论文

经济博弈论论文 生活中的博弈 “博弈”一个围绕在每个人身边,却很少去深刻思考的生涩词汇,刚刚接 触这门学科的时候很多人不经要问:什么是博弈?书上是这样定义的:博弈是 指一些个人或者组织面对一定的环境条件,在一定的规则下同时或先后一次或 多次从各自允许选择夫人行为或策略中进行选择并加以实施,进而各自取得相 应结果的过程。 “弈”在中国古代是指围棋,“博弈”则是指对局和下棋,对手之间采取相互策略的行为。现代科学将这种“对策论”“对局理论”称之为博弈论。罗伯 特?尔曼是这样定义它的“策略性的互动决策”。用一句话简单概括博弈论就是 一套研究互动决策行为的理论。很多是人认为博弈论高深莫测,普通人难以触碰。这种想法是错误的,在中国古代很早就有了含有博弈思想的“田忌赛马” 的典故。其实我们每个人每天都在经历着大大小小的各种博弈。 一:购物中的博弈理论 经济学的最基本的假设就是经纪人或者理性人的目的就在于使收益最大化。参与博弈者正是为了自身收益的最大化而互相竞争。也就是说,参与博弈的各 方形成互相竞争、互相对抗的关系,以争得利益的多少来决定胜负,一定的外 部条件又决定了竞争和对抗的具体形式,这就形成了博弈在这个过程中双方各 自独立决策,但是双方的决策和利益具有相互依从关。 女生在外出购物时与老板砍价就是一场两方博弈。双方博弈的目的是利益,

利益形成博弈的基础。在购物砍价这类博弈中女生占据很大的优势,而男生则 相对较弱些在日常生活中,男生陪女朋友逛街买衣服经常会遇到这样一种情况,面对女朋友选择的高价衣服此时是否要砍价?此时就出现了一场单方博弈。作 为理性的人,首先可以做两种假设:①砍价,结果可能在女生面前显得很小气(不管女生觉不觉得,男生本身会有这种压力);②不砍,可能被商家出高价坑了。而对于商家而言也是一个单方博弈,一般商家有两种定价策略,①一种是 预料到顾客会砍价,于是故意定一个高价,给顾客砍价空间,也满足顾客的心 理需求;②一种是明码实价,坚定地拒绝顾客的砍价。如果男生选择砍价,商 家选择给高价,双方讨价还价就开始了一个新的两方博弈。在着这种供求关系下,买家在某一价格下,想以此价格买此商品,而想卖的人愿意在此价格下 卖出,此时达到了均衡。最终双方做出一个相对合理的决策,既满足男生的需求又保障商家有利可赚,这样才有了交易的完成,对于双方而言都是最优决策 达到均衡。 随着网络技术的发展网购成为很多人的新宠,在我们的身边非常普遍。在网上购物活动中,交易也可看作是一次博弈。交易者在进行交易及其信用模式 的选择时,做如下基本假设:①网购中交易者只存在两个参与人:买方和卖方, 且二者都是理性,同时不同的交易对象交易仅一次;②参与人在选择战略时,把其他参与人的战略当作给定;③虚拟市场信息是完全的;④无政府等第三方人干预;⑤双方的交易决策抽象为两种理想情况:守信和不守信;⑥买卖双方行动是同时进行的。 他们在进行交易时会面临以下三种情况:①交易双方都守信;②交易双方中 只有一方守信;③交易双方都不守信。整个交易活动中成员的守信情况就构成了社会的信用环境。如果双方都守信,那么他们的收益各为A,如果只有一方守信,则守信一方的收益为-A,不守信一方的收益为2A;如果双方都不守信,则 交易无法完成,双方收益为0。

经济博弈论5

第五章不对称信息静态博弈 在1960年代末和1970年代初,博弈论的研究开始进入信息不对称的时代。正是信息不对称的考虑,在博弈论的研究中将经济学家与数学家区分开来。本章我们考察静态情况下的不对称信息博弈。 第一节信息不对称博弈的表述 什么是信息不对称呢?参与人在博弈中掌握着不同的信息,就是信息不对称。信息不对称对于博弈的结果或者说预测有什么样的影响呢?我们可以通过一个例子来说明。 5.1.1信息不对称影响资源配置 例子5.1 二手车市场 小李通过了托福考试,被美国一所大学录取了。小李要出国留洋了,打算把自己的座驾卖掉,一是可以处置座驾,二是可以筹一笔钱,好在国外用作为生活费。 小李的座驾是比较新的,去年才买的新车,开了一年,没有什么机械问题,其实由于磨合很好,比起刚刚出厂的新车还要好用呢!小李估计自己的车价值至少值20万元。 老王是一位下岗的师傅,刚刚开了一个小作坊。他准备买辆二手车作为跑业务的交通工具,于是在二手车市场上与小李讨价还价上了。老王不清楚小李的车的质量情况,关于小李提出他自己的车是没有任何质量问题的新车这样的说法,老王是半信半疑的。老王认为小李的

车最多值20万元,但是又很可能在20万元之下,如果存在一些质量问题的话 当然,小李的车看起来还是蛮新的,试驾一下感觉也不错,至少还是值一些钱的,譬如10万元。因此,老王认为小李的车价值在10万到20万元之间。所以,他提出只愿意花一个平均的价格即15万元买小李的车。 但是,小李认为自己的车真正是没有任何质量问题的新车,价值的确是值20万元的。然而,不管小李怎么说,老王就是不相信。因为,老王不认为小李有积极性说真话。 小李现在面临的问题是,是蒙受损失把价值20万元的车以15万元卖掉,还是将车开回去,另外想办法筹钱去美国读书。对于小李来说,损失5万元还是很大一笔数字的。所以,他没有把车低价卖了,而是开回去了。 这边的老王呢?他回头又找到老张,因为老张正在卖一辆旧车。老张的车是与小李的车一样的牌子和车型,并且表面看起来新旧也差不多。 但是,其实老张的车比小李的车旧多了,并且还有机械问题,尽管不容易发现。老张自己也认为这车只值10万元。老王也报出15万元的价格,老张喜出望外,立即答应,并且乐呵呵地说马上帮助老王把车开到老王的家里,晚上还要请老王吃饭呢! 老王是有心计的,他知道,刚才小李不愿意将车以15万元卖给他,

经济博弈论论文

博弈论及其在现代经济生活中的应用 工造3班 魏XX [摘要]:本文从“囚徒困境模型”和“智猪博弈模型”两个方面来阐述博弈论及其 在现代经济生活中的运用。 [关键词]:博弈论囚徒困境模型智猪博弈模型应用 [正文]: 有一个典型的案例:甲乙两人合伙作案,结果被警察抓了起来,分别被隔离 审讯。在不能互通信息的情形下———也就是不知道对方是坦白还是缄默的前提 下,每个嫌疑犯都可以作出自己的选择:或者供出同伙,即与警察合作,从而背 叛同伙;或者保持沉默,也就是与同伙合作,而不是与警察合作。这样会出现以 下几种情况:如果两人都不坦白,警察会因证据不足而将两人各判刑! 年;如果 一人招供而另外一人不招,坦白者作为证人将不会被起诉,另一人将会被重判!" 年;如果两人都招供,则会因罪名成立各判!# 年。这两个嫌疑犯该怎么办呢? 是选择合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这 样对他们整体而言是最好的结果———都只判!年。但是他们不得不仔细考虑对 方可能采取的选择。问题就这样开始了,两个人都十分精明,而且只关心减少自 己的刑期,并不会在乎对方被判多少年。每个人都会这样推理:假如对方不招, 我只要一招供,马上可以获得自由,而不招却要坐牢! 年,显然招比不招好;假 如对方招了,我若不招,则要坐牢!" 年。招了只要坐牢!# 年,显然还是招更好 些。可见,对方无论招或者不招,我的最佳选择都是招认。两个人都会基于同样 的想法作出招供的选择,这对他们个人来说都是最佳策略,但对整体而言却是一 个最差的结果。 这就是博弈论的一个经典模型———“囚徒困境模型”。作为一种关于决策和 策略的理论,博弈论其实就在我们身边,它研究的许多例子来自于日常生活和经 济活动中的游戏和事物。 博弈的英文即,中文译为“博弈”是非常传神和贴切的,因为中国古代称下棋 为“弈”,“博”则含有争斗的意思。在下棋这样的游戏中有一个重要的特点:即策 略在其中起着举足轻重的影响和作用。精明慎重的棋手们相互揣摩、相互牵制, 人人争赢,布每一个棋子时,都必须考虑到对手的策略选择,从而选择自己的最 佳策略。这也就是博弈的核心问题:决策主体的一方行动后,参与博弈的其他人 将会采取什么行动?参与人为取得最佳效果应采取怎样的对策?我们可以将博 弈论定义为:一些个人、一些团队或其他组织,面对一定的环境条件,在一定的 规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的 行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。博弈 论是(# 世纪四五十年代发展起来的。美国经济学家冯?诺依曼与奥斯卡?摩根斯特 恩于!)**年合著的《博弈论与经济行为》被公认为博弈论诞生的标志。 博弈论可以分为合作博弈理论和非合作博弈理论。前者主要强调的是集体理 性;而后者主要研究人们在利益相互影响的局势中如何选择策略使自己的收益最 大,强调的是个人理性。所谓“个人理性”是反映个体的行为始终都是以实现自身 的最大利益为惟一目标,除非是为了实现自身利益的需要,否则不会考虑其他的 个体或社会利益这样一种决策原则。非合作博弈要求各参与人之间不能存在任何

经济博弈论第三版

经济博弈论第三版习题 博弈论 判断题(每小题1分,共15分) 囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。() 博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×) 上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

经济博弈论在实际生活中的运用

无人打扫的寝室 ——《博弈论》知识在现实生活中的应用 XXX 课程:经济博弈论 指导老师:XXX 这个学期我选修了肖老师的公共选修课《经济博弈论》,原本以为听起来高大上的课程会是一门高深枯燥的理论课,但是,在通过对这门课的初步学习和了解后,让我认识到博弈论的应用实际上在生活中是随处可见的。 最重要的一点是,我学会了运用博弈论中的一些经典模型来解决生活中的一些实际的问题。 在《博弈论》私人最优决策中的“修路博弈”时明确提到:在“成本由个人付出,而利益大家均占”的情况下,大家的最优策略都是不修路,最好是有一个人修路,由大家共同均占修路得来的利益。下面结合我在现实生活中的一个实际事例来分享一下我对“修路博弈”的理解与体会。 「问题描述」 我们学校的每间宿舍里一共有6名同学一起居住。由于一开始就没有安排值日的相关规则,所以寝室的公共区卫生也就靠大家的自觉偶尔打扫一下!开始一段时间,我们还会不时主动打扫。可时间一长打扫人数却越来越少,打扫的次数也越来越少……由于现在已经正直夏天的原因,每当看到地面脏乱不堪,无奈之下,我只好赶自己主动多打扫寝室卫生。 可是每每此时,我的心头总会产生一个疑问:明明宿舍里的每个同学都很爱干净,可为什么大家似乎都不太主动来打扫寝室公共卫生呢? 「建模与求解」 针对以上背景,对于我和我的舍友来讲,我们都需要一个地面洁净、空气清新的寝室环境,都希望能够有人能主动打扫寝室公共区卫生。 下面我们来建立一个博弈模型: 首先,假设把我们一共分为两组,一组是我,以字母A表示;另一组是我的舍友,以字母B表示。 其次,假设A和B的选择有两种:打扫或者不打扫。 然后,我们再次假设打扫卫生的成本为4,而我的舍友从打扫干净的卫生获得的好处为3;如果A和B联合打扫卫生,则每个人获得净好处为3-4/2=1;当只有A或B一个人打扫卫生时,打扫卫生的人得到的好处是3-4=-1,而没有打扫卫生的人的好处却是3-0=3. 最后,我们就按照以上的假设画出我们的博弈支付矩阵, 如下图:

经济博弈论教案

学习好资料欢迎下载 福州海峡职业技术学院教案 课程名称经济博弈论 授课班级 授课教师陈亮贤 总学时 3 2

《经济博弈论》教案 第一章导论 教学目的和要求: 通过本节课的学习,使学生了解什么是博弈,产生学习博弈理论的初步兴趣,同时要求学生掌握几类经典的博弈类型并能应用于现实生活中的相应案例,同时对博弈结构和分类有比较清晰的认识。 教学重点、难点: 博弈的定义、囚徒困境、产量决策的古诺模型、博弈策略。 教学方法: 讲授法与讨论法相结合,并结合案例进行分析。 主要参考资料 1、《妙趣横生博弈论》,阿维纳什K.迪克西特(Avinash K.Dixit), 巴里J.奈尔伯夫(Barry J.Nalebuff)编著,董志强、王尔山、李文霞译,机械工业出版社,第1版(2009年8月1日); 2、《博弈论教程》罗支峰编著,清华大学出版社,北京交通大学出版社,第1版(2007年9月1日)。 教学时数: 2课时 教学内容: 一、导入新课程:什么是博弈 学习一门新课程之前,我们首先要了解下这门课程名称:什么是“博弈”? 博弈,根据《辞海》的解释,就是在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为。说到底,博弈就是决策行为。 (一)从游戏到博弈 博弈起源于游戏中的策略对抗,因此博弈也可以定义为“策略起关键作用的游戏”,在英文中,“博弈”单词为Game,“博弈论”也即为Game Theory,

Game即游戏、竞技。 游戏和经济决策竞争有一些共同要素及特征,如:规则、结果、策略选择,策略和利益相互依存,策略的关键作用。例如: 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦 (二)一个非技术性定义 博弈——就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。博弈有四个核心方面: 博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs) 二、几个经典博弈模型 (一)囚徒的困境 一个经典的“囚徒困境”模型:话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人A和B,并从他们的住处搜出被害人家中丢失的财物。但是,他们都矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。这个时候,聪明的警官找他们谈话,分别告诉他们说:“你们的偷盗罪确凿,所以可以判你们1年刑期。但是,我可以和你做个交易: 如果你招了,他不招,那么你会作为证人无罪释放,他将被判8年徒刑; 如果你招了,他也招了,你们都将被判5年有期徒刑; 如果他招了,你不招,他无罪释放,你被判8年徒刑; 如果你们都不招,各判1年。” 根据这个模型,我们可以得出嫌疑人A、B的得益矩阵:

相关文档
最新文档