博弈论与经济模型第10章

博弈论与经济模型第10章
博弈论与经济模型第10章

第10章机制设计与拍卖

10.1 导论

在本章和下一章里,我们将介绍博弈论中用来处理机制和市场设计的主要工具。存在着许多这样一些类型的例子。政府可能会去规制(regulate)垄断企业,使其行为符合特定的所期望的准则;艺术品收藏家要在出售其手中的画作中获得尽可能高的收益;社会计划者要保证开支在使用者之间有效地分配;学校管理系统要按照某种准则把它的空间在学生之间进行配置,等等。在本章里,我们主要关心销售机制的设计问题;在下一章中,我们将处理两组个体之间的匹配问题。

10.2 拍卖

10.2.1 历史概述

在一个“拍卖”中,物品被卖给出价最高的人。广义的“拍卖”是指对重要的经济资源进行配置,从艺术品到短期政府公债到近海油气田开发权再到无线电频率使用权等等。它采用多种不同的形式。例如,可以用轮流报价的方法(如艺术品拍卖)或密封式提交报价等。支付的成交价可以是最高报价,或某些其它价格;如果拍卖的物品不止一种,则既可以采用所有物品打包式的同时报价,也可用每种物品陆续报价的方式。博弈论分析有助于我们理解各类报价设计的结果;例如,它建议出可以最有效配置资源且带来最高收入的拍卖机制设计。在这一节里,我们来讨论这样的拍卖,其中每个买者知道他自己以及每个其他买者对于物品的估价。在后面的章节里,我们还要发展出允许我们假定买者之间互相不知道别人对物品的估价的情况下,对拍卖进行研究的工具来。

拍卖的现实背景:从巴比伦到网上购物拍卖有着相当长的历史。Herodotus,公元前1500年的古希腊作家,曾与Thucydies一起创立了历史学,曾对巴比伦的拍卖加以了描述。他写道,巴比伦人“最引人注目”的传统就是每个村庄里一年一度的拍卖,这种拍卖是对到了结婚年龄的女子进行的拍卖。对男人最具吸引力的女人首先被出;他们要求一个正的价格,而最不具吸引力的女人则倒过来向娶她的男子支付价格。在每次拍卖中,报价是轮流出价的,出价最高的男子胜出,并支付他报出的价格。

拍卖也出现于公元前1500年和400年的雅典,是出售征税权,对没收的财产的处置权,以及出租土地与矿山等。关于这些拍卖的实质内容的证据很少,但有一些有趣的东西留了下来。例如,雅典政治家Andocides(C.440—391B.C.)曾对一个征税权拍卖中的串谋提出了一个报告。

在古罗马经常开展一些拍卖的活动,且在罗马帝国之后的中世纪欧洲还继续着这种活动(例如,在中世纪和早期现代低地国家中的城镇里,每年都要对征税权进行拍卖)。最早出现英语单

词“拍卖”(auction)的是1595年的《牛津英语词典》(Oxford English Dictionary),并对拍卖的注解为:“当要出售奴隶、家庭用品等等的时候”。这个时代留下来的拍卖规则表明至少在某些情形,拍卖是轮流出价的,以及最后剩下的报价者以其报出的价格获得物品。这一机制的一种变形是对报价的时间加上一个限定,英国日记作家和海军管理者Samnel Pepys(1633-1703)曾对此作过记录。拍卖人点燃一盏蜡烛,只有在蜡烛烧完之前的报价才是有效的。Pepys说在最后的一个时刻,大家都一阵风似的报出价格,造成骚动。在1662年9月的一次拍卖中,有一个“比别人更狡猾的”报价者告诉他,正当烛火熄灭,“烟气下降”的时候,这是一个可以报出价格的时刻的信号,Pepys发现这是一个“很棒”的观察。

索斯比拍卖行(Sotheby auction house)和克里斯蒂拍卖行(Christie auction house)组建于18世纪中叶。在21世纪初,它们已变得黯然失色了,至少在网上拍卖公司出售的价值上看是如此。例如,出现于1995年的eBay公司,在2000年第二季度里在6千2百万次拍卖中卖掉了13亿美元的商品,大约是前一年第二季度的二倍;在每个季度中,索斯比和克里斯蒂共卖掉大约10亿美元的艺术品和古董。

eBay采用的机制具有一些Pepys所观察到的特征:所有报价都必须在一定的固定时间里提交。价格决定的方式也是不同的。在一个eBay的拍卖中,一个报价者提交一个“代理报价”,它是保密的;普遍的价格是第二高代理价格的一个微小的增加。正如Pepys在17世纪的拍卖中所观察到的一样,许多eBay中报价者在最后时刻才报价——以在计算机中的虚拟空间中的“伏击”闻名的一种做法。其它的网上拍卖行不同的终止规则。例如,Amazon在关闭一次拍卖之前要在一个报价之后等待十分钟。在Amazon拍卖中出现的最后时刻报价没有在eBay拍卖中那么普遍这一事实吸引了博弈论专家的注意;Roth与Ockenfels(2002)用拍卖中的中止规则上的差别来解释。

近年来,许多国家都把无线通讯使用中的无线电频率使用权进行拍卖。博弈论专家大量研究了这些拍卖。

10.2.2 一些常见的拍卖方式

静态拍卖

一级密封价格报价拍卖(First price sealed bid auctions)

在一级密封价格报价拍卖中,每一个报价者被要求同时并且是独立地在一个信封里秘密地写出其报价;通常我们假定允许的最小报价为零,或接近零的数目。报出最高报价的报价着赢得物品;在有多个报价者报出最高价格时,选择其中某个报价者作为获得物品的赢家。在任何情况下,获得物品的赢家都必须支付等于其报价的价格,其他的报价着不需要支付任何价格。

二级密封价格报价拍卖(Second price sealed bid auctions)

“二级密封价格拍卖”与一级密封价格拍卖法唯一不同的是,二级密封价格拍卖是将拍卖品卖给出价最高的买主,同时要求其支付第二高的报价。曾经创造了这种拍卖机制的Vickery 在

一篇极有影响的论文中提出了这种拍卖方式,也由于他的贡献,“二级密封价格拍卖”也被称为Vickrey拍卖。在随后经过20年之后,经济学家们才知道事实上这种类型的拍卖在集邮买卖中已经使用了一个多世纪。图10.1中显示的是香港集邮商在邮票拍卖中作出了Vickrey拍卖的规则(第三及第四条)。(Vickrey于1996年与Mirrles一道获得当年的经济学诺贝尔奖,Vickrey 招投标法是一个重要因素,因为它是以往被认为是过于抽象的博弈论走向实用的一个重要代表。)

图10.1 香港《杨氏通讯拍卖》(2002年7月) 中的投标规则

10.2.3 动态拍卖

荷兰式减价拍卖(Dutch descending auctions)

在“荷兰式拍卖”中,拍卖人从一个高价开始,然后逐渐降低价格。当某个报价者喊出“我买(Mine)”时,他以当前价格获得物品,拍卖就结束;这个报价者于是就以这一价格赢得物品。这种类型的拍卖在荷兰被用于花卉拍卖,所以被称为“荷兰式拍卖”(Dutch auction)。

英国式升价拍卖(English ascending auctions)

在“英国式拍卖”中,拍卖人从一个极低的价格开始,然后逐渐提高价格。在当前价格上对此物品感兴趣的报价者被要求举手。当只剩下一个报价者时,拍卖就结束了,并且这个报价者就以那个价格赢得物品。这种类型的拍卖通常被用于土地拍卖。还存在着这种拍卖的其它许多不同的变化形式。特别地,有一种所谓的“简化英式拍卖”(simplified English auction),它在下列几个方面有不同之处:在每一个价格上,报价者决定是继续留下来呢还是永久地离去;报价者观察到当前的价格,但是不能观察到还有多少其他报价者留下来。

10.2.4 信息假定

私人价值模型(Private Value Model)

在本章,我们采用私人价值模型的假定。也就是说,每一个报价者知道他自己对于待售物品的评价,但不知道其他报价者的评价。更为重要的是,即使他知道其他报价者的评价,每一个报价者的评价也不会改变。

相关价值模型(Correlated Value Model )

对于许多有趣的问题,私人价值假定看来是不太合适的。在某些拍卖中,报价者间的主要差别不是他们对物品进行不同的估价,而是他们关于其价值有不同的信息。例如,关于近海石油地点的竞价中,竞价者们对于一桶石油的价值估计是相同的,但到底哪里有多少石油大家是有不同信息的。其结果是,如果报价者知道其他报价者掌握的信号后,他对于油田价值的估计可能会发生变化。这个信息假定被称为是一种相关价值模型假定。在本章中,我们将不理会这种类型的问题。

10.3 一级与二级密封价格拍卖的均衡解

有一件物品要通过拍卖来出售。存在N 个竞价者。假定卖者和竞价者都是风险中性的。假定物品对于卖者的价值为零,但物品对于每一个竞价者来说其价值分别为i x ,它们是独立同分布(i.i.d)函数随机变量,其分布函数为F ,有定义在[0,ω]中的支撑上的连续密度函数f 。在下面,我们来求解一级密封价格拍卖与二级密封价格拍卖的均衡解。

考虑N -1个分布函数为F 的独立同分布随机变量(i.i.d. variables) 中的最大值。那么,这个用1y 来表示的数值也是一个随机变量。分别用G 和g 表示1y 的分布函数和密度函数。不难验证1))(()(-=N x F x G 和)()()1()(2x f x F N x g N --=。在本章中将不断出现1y ,G 和g 。 10.3.1 二级密封价格拍卖

尽管一级价格拍卖模式看起来是十分自然的,我们还是先通过考虑二级价格拍卖来展开分析。在二级价格拍卖中竞价者面临的战略问题比起一级价格拍卖来说要简单得多,所以自然就从它开始。

在二级密封价格拍卖中,每一个报价者提交一个密封报价i b ,并且在给定这样一些报价的情况下,支付或收入就为:

max max 0 max i j i j i j i j i i j i j x b b b b b ≠≠≠->??∏=?

若若 我们还假定,如果有几个人的报价是相同的,使得max i j i j b b ≠=,这些报价者以相同的概

率赢得物品。 命题10.1 在一个二级密封价格拍卖中,按照β (x)=x 来报价是弱占优战略。

证明:考虑竞价者1,且假定j j b p 11max ≠=是其他人的最高竞价。通过报出价格1x ,竞价者1在11x p >时将赢得物品,但在11x p <时将得不到物品(如果11x p =,竞价者1在赢得物品与得不到物品之间是无差异的)。然而,假定他报出一个价格11z x <。如果111x z p >≥,则他仍

然会赢得物品且获得利润仍然为11x p -。 倘若111p x z >>,他仍然得不到物品。但是,如果有111x p z >>,则他会得不到物品,但当他报出的价格是1x 时他会得到一个正的利润。因此,报价低于1x 决不会增加其利润,而在某些情形实际上会降低利润。类似的分析表明报出大于1x 的价格也是不利的。因此, 按照()i i x x β=来报价是每人的弱占优战略。

应该注意到的是命题中的推理既不依赖于竞价者的估价是独立分布的,又不取决于它们是同分布的假定。只有私人价值这假定才是重要的,且只要是在这种场合命题就成立。

推论10.1:当估价是私人价值时(不一定是独立同分布的),则二级价格拍卖有一个有效均衡。

现在回到独立同分布假定,注意到其估价为1x 的竞价者1赢得物品的概率为1()G x ,且在赢得物品条件下的期望支付是[]111110()|,()

x y g y y dy E y y x G x =

10.3.2 一级密封价格拍卖

在一级密封价格拍卖里,每一个报价者提交一个密封价格i b ,并且给定这些报价,支付或收入就为:

max 0 max i i i j i j

i i j i j x b b b b b ≠≠->??∏=?

与前面一样,如果存在多个人都报出了最高的价格,他们也以相同的概率获得物品。

在一级密封价格拍卖里,均衡行为要比在二级密封价格拍卖里更加复杂一些。首先,我们注意到没有人会报出一个等于其估价的价格,因为这样只给其带来零收入。一定其他人的报价行为不变,在任何一个既不能保证一定会赢也不一定会输的报价水平上,报价者就面临一种简单的权衡。尽管报出一个较高的价格可以增加赢得物品的概率,但是同时也会减少从赢得的物品中获得的收益。为了看看这样一些效应之间是如何平衡的,我们从偏离对称均衡战略开始。

假定所有的竞价者(j ≠i )都按照均衡报价战略β(.)报出价格,并且β是对称的,递增的和可微的对称战略。假定报价者1接收到信号x ,以及报价b 。我们希望能够决定最优的b 。

首先要注意的是,选择一个报价()b βω>决不会是最优的,因为在这种情形,报价者1一定会赢得物品并且通过稍微降低一点报出来的价格还可以变得更好一些,这样他仍然可以赢得物品但只付出一个较低的价格。所以我们只需要考虑()b βω≤的情形。第二,具有零估价的报价者决不会提交一个正的报价,因为倘若在拍卖中取胜的话,他会蒙受损失的。因此,我们一定有(0)0β=。

竞价者i 仅仅当max ()j i j b x β≠>,或者1()max j i j b x β-≠>时才会赢得物品。这里的一级密封价格拍卖实际上保证了各个买主的报价是相互独立的,因而这种事件的概率恰好为

11((()))n F b β--。在赢得物品的情况下,竞价者i 的支付为x -b 。于是,第i 位买主的最大化问题是

)())((max 1b x b G -?-ββ

其中1()()n G F -= 。将其对于b 最大化,得到一阶条件:

111(())()(())0(())

g b x b b b ββββ-----=' 其中 g =G ' 是对应的密度函数。

在对称均衡的情况下,b =β(x ),且从因此上面的一阶条件得到微分方程:

)()()()(')(x xg x x g x x G =+ββ

或者等价地

)())()((x xg x x G dx

d =β 由于 β(0)=0,我们有

10111()()()[|]x y x yg y dy G x E y y x β=

=

注意β(x )

n x <-=1)(*β。显然,*()b x 随n 的增加而增加,当n 趋向无限大时,*b 趋于x ,即买主愈多,卖者得到的价格就愈高,故让更多的人加入竞标在招投标中是符合招标人的利益的。在公共管理中,政府的采购和公共工程招投标中通常规定要进行公开招标,并在参加竞标的公司数目上有下限规定,其缘故正是如此,因为更多的竞争者参加投标会压低工程报价,从而使政府开支得到一定程度的节省。

注意,我们假定一阶条件的确给出了最优报价战略。但是,要证明解出来的报价战略的确是最优的并不难,就留给读者作为练习吧。

10.3.3 收益等价性

在导出一级和二级价格拍卖中的对称均衡战略之后,我们现在可以来比较两种模式中的售价——对于卖者的收益。

在一级价格拍卖中,赢家支付他的报价且因此估价为x 的竞价者的期望支付价格为

11Pr[]()[|]G x E y y x ?=?<获得物品报价数量

它与在二级价格拍卖中的是一样的。因为卖者的期望收益正好是报价者们的事前(在知道他们的估价之前)期望支付价格之和,这也意味着在两种拍卖中的期望收益却是相等的。

命题10.2 如果私人价值是独立同分布的,则一级价格拍卖中的期望收益与二级价格拍卖中的期望收益相同。

注意,收益等价定理并不意味着在报价者的估价的任何实现下,卖者在两种拍卖形式下会获得同样的收益。考虑下列例子。假定正好有两个竞价者且估价均匀分布于[0,1],且有121,0.9x x ==。在二级价格拍卖中,竞价者1将赢得物品且支付价格0.9;在一级价格拍卖中,竞价者1仍然赢得物品但支付价格为0.5。因此,在特定的价值实现下,物品在一种拍卖中被卖出的价格可大于在另外一种拍卖中被卖出的价格。收益等价定理只是说,从卖者的角度看,在他知道每一个报价者的估价的实现之前,两种拍卖形式的预期收益是相同的。你可能要想知道收益等价性结果到底有什么样的潜在力量。在本章的后面部分将对此加以充分的讨论,我们在这里要指出的只是两种拍卖的均衡所共同享有的两个重要性质。首先,根据均衡,两种拍卖都是有效的——物品总是给了最高估价者。第二,在两种拍卖中,具有零估价的报价者总是获得了零收入。我们随后将证明,只要拍卖或销售机制有一个具有这种性质的均衡,拍卖就有与此相同的期望收益。

10.4 直接机制与显示性原理

10.4.1 一般性机制

四种拍卖模式只是我们在出售一件物品时,能够采用的诸多机制中的一些例子而已。一般地,什么是出售一件物品的最佳方式呢?也就是说,什么样的出售机制将为卖者带来最大的期望收益呢?这样一个看起来是非常困难的问题,因为有无限多个潜在的机制且要考察每一个是没有可能的。

除了在买者之间在其估价分布上存在不对称这一点上有不同之外,我们在关于卖者和买者的特征上都做出相同的假定。我们假定买者的估价是分布在区间[]0,i w 上的随机变量,分布函数为i F ,密度函数为i f 。

在形式上,一个机制(B ,π,μ)由三个要素组成。1(,......,)n B B B =,其中i B 是买者i 的信息集合;1(,......,)n πππ=:?→B 是这样一个配置规则,它在给定信息组合b 下,使得()i b π是买者i 获得物品的概率;最后1(,......,)n μμμ=:n B R →是一个支付规则使得在给定信息组合b 下,()i b μ是买者i 的期望支付。在整个这一节里,我们都假定局中人总是遵守机制规则。

这里是两个出售机制的例子。

例10.1:二级价格拍卖

在一个二级密封价格拍卖中,[]0,i i i B X ω==且

()11max ,...,0max 1/max ,i j i j i N i j i j i j i j b b b b b b k b b k π≠≠≠?>?=

若若若且不相等的报价组数

且最后有

1max max (,...,)0

max /max j i j i j i j i N i j i j i

i j i j b b b b b b b b k b b k μ≠≠≠≠?>?=

例10.2:彩票 考虑一种彩票,其中有一种固定的奖金给予了某个参与人。每一个参与者都同时地选择支付某个整数数量的货币,并且

一个参与人获得奖金的概率等于其开出的赌注在所有参与人所开出来的总的赌注中所占的份额;在所有参与人所开出来的总的赌注为零的场合,就不发奖金。此时,“报价者”支付愈高的价格他就愈可能得到想要得的东西;注意这里的报价是不可退还的——即使报价者在摇奖日没有获奖,报价也不会退还。

{}0,1,2,.....i B =

1(,...,)i i n j

j i

b b b b π≠=∑ 只要分母>0(否则为零) 1()((),......,())n b b b πππ=

1(,......,)i n i b b b μ=

且注意有1(,......,)n b b b μ=,我们得到1()((),......,())n b b b μμμ=。所以,(B ,π,μ)就完整定义了。

注意:一个机制是与某个博弈有关的,但是在下面的意义上不同于博弈。为了刻画一个博弈,我们需要刻画每一个局中人的信息假定及支付函数(或偏好)。在一个机制中,这两方面的信息是没有给出的,且除非给出进一步的信息,我们并不能说出局中人在一个机制中是如何行动的。由于这个原因,可以简单地称一个机制为一个博弈形式(game form )。

10.4.2 直接机制

一个直接出售机制是这样的一种出售机制,其中每一个报价者的信息集合简单地就是他自己可能估价的集合,即i i B X =,且要求每一个报价者把他的估价告诉出售者。此时,一个机制可表示为(Q ,M ),其中?→X Q :是一个配置规则和:n M X R → 是支付函数。特别地,我们称(Q (x ),M (x ))为机制在1(,......,)n x x x =的结果。

命题10.3:给定一个机制和这个机制的均衡,存在一个直接机制,其中

每一个报价者都真实地报告其估价是一个均衡;

结果与原有机制中的给定均衡是相同的。

证明:设X →?和M :X →n

R 的定义如下:Q (x )=π(β(x ))和M (x )=μ(β(x ))。换句话说,如图所示,直接机制(Q ,M )由(π,μ)与β构成。结论(i)和(ii)现在就可以按照通常的方式检验了。

图10.2 直接机制

显示性原理背后的思路是非常简单的。给定一个机制及其均衡β。现在并不要报价者提交信息()i i i b x β=且应用该机制规则来决定结果(谁得到物品和谁支付多少),我们可以直接要求报价者“报告”其估价i x 并且保证结果与他们提交报价()i i x β时是相同的,即用另一种方式,一个直接机制自动为报价者完成 “计算”。现在假定在直接机制中某些报价者发现说假话是有利可图的,且当其真实估价为i x 时报告价值为i z 。则在原有的机制中同样的报价者将发现提交报价()i i z β而不是()i i x β是有利可图的。但由于i β构成了一个均衡,这是不可能的。所以,我们只考察直接机制是不失一般性的。

我们通过两个评论来结束这里的讨论。首先,我们假定报价者能够承诺所采用的机制;即当他知道报价者们的报告时,他将坚持机制规则。仅当假定有这样的承诺时,采用直接机制才是不失一般性的。在不完全承诺的情形,采用直接机制是会失去一般性的。在本章后面的一个练习题中,我们考虑这样一种情形,其中一个间接机制中的一个均衡结果不能用任何直接机制中的任何均衡来复制(即给出一个机制,其中报价者希望在某些场合下事后反悔失言)。

其次,尽管当前这一节的目的是关注一件物品的出售和因为这样我们才研究出售机制,显示性原理是更为一般的且被适用于所有种类的机制。譬如,人们可以去研究如何在居民户之间有效分摊某个公共项目成本的问题,这些居民户拥有他们自己偏好的私人信息;或者去研究如何有效规制垄断者,而垄断者拥有他们自己成本的私人信息。所以,对于每一个这样的问题,根据显示性原理,只考察直接机制是不失一般性的。

10.5 激励相容机制

10.5.1 收益等价原理

在这里,我们把注意力集中于激励相容的直接机制,即其中存在每一个局中人都总是真实地报告其估价的均衡。上一节里曾经指出,给定我们的承诺假定,只考察直接机制是不失一般结果 报价 估价 β (π,μ) (π,μ) o β

性的。根据同样的显示性原理,可以证明对于在一个非激励相容直接机制中的任何均衡,存在另外的激励相容直接机制,这种直接机制有一个均衡会带来相同的结果。所以,只考察激励相容直接机制是不失一般性的。

给定直接机制(Q ,M ),定义

()(,)()i

i i i i i i i i X q z Q z x f x dx -----=? 为局中人i 报告他的估价为z 而其他买者真实地报告其估价时局中人i 获得物品的概率。类似地,定义

?-----=i

X i i i i i i i i dx x f x z M z m )(),()( 为局中人i 的报告为z 而所有其他局中人说实话时局中人i 的期望支付额。

重要的是要注意,因为估价值是独立分布的,获得物品的概率和期望支付额都只是依赖于报告值z ,并不依赖于真实的 估价值,譬如说是x 。买者i 的期望收入,在其真实估价为x 而他报告的是z 时,再一次假定所有其他的买者都真实地报告其估价的 情况下,就可以写成:

()()i i i i i q z x m z -

直接机制(Q ,M ) 被称为激励相容的(incentive compatible, IC )如果对于所有的i ,i x 和i z 以下成立,

)()()()()(i i i i i i i i i i i i z m x z q x m x x q x U -≥-=

i U 是买主i 的均衡函数。激励相容具有某些简单但是非常有力的推论。

命题10.4: 如果 直接机制(Q ,M ) 是激励相容,那么(i)i U 是一个凸函数,(ii)i q 是一个非降函数;(iii) 0()(0)()i x i i i i i i U x U q t dt =+

?。(iv )如果i q 是非降的,则机制(Q ,M )是激励相容的。

图10.3 激励相容机制

证明:

(i)对于任意的i ,对于任意的,i i x z ,及λ∈[0,1],有

()()()()

()()()()()()1()

(()())(1)(()())(1) where (1)(1)(1)((1))

((1))

i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i U x U z q x x m x q z z m z q t x m t q t z m t t x z q x z x z m x z U x z λλλλλλλλλλλλλλλλ+-=-+--≥-+--=+-=+-+--+-=+-

(ii)对于任意i x 以及i z

()()()()()()

()()().

i i i i i i i i i i i i i i i i i i i i q x z m x q x x m x q x z x U x q x z x -=-+-=+-

所以,IC 条件 等价于对于所有的x 和z ,有 ))(()()(i i i i i i i i x z x q x U z U -+≥ (10.1) 这意味着对于任意i x ,()i i q x 是一条直线的斜率,而这条直线在i x 点支撑着函数i U (见图10.3)。对于凸函数来说,它总是绝对连续的(absolutely continuous),并且因此是在其定义域的内部是几乎处处可微的(在图10.3中,i U 只在i x *点不可微)。所以,在i U 可微的每一个点处,有()()0i i i i U x q x '=≥。由于i U 是凸的,这就意味着i q 是一个非降函数。

(iii)每一个绝对连续函数(absolutely continuous function)是其导数(derivative)的定积分(definite integral)。用这性質可直接得出

0()(0)()i

x i i i i i i U x U q t dt =+? (10.2) (vi)注意,利用(10.2),可将(10.1)写为

?-≥i

i z x i i i i i x z x q dt t q ))(()(11

如果i q 是非降函数,这个不等式就一定成立。于是就完成了证明。

方程(10.2)是一个非常重要的关系式。它说的是除了一个相加的常数外,在激励相容的直接机制(Q ,M )里,买者的期望收入仅仅依赖于配置规则Q 。如果(Q ,M )与(Q ,M )是两个有着同样配置规则Q 但是有不同支付规则的激励相容机制,则与这两个机制相关的期望收入函数分别是i U 和'i U ,们之间至多相差一个常数——这两个机制是收入等价的。用另外一种方式来表达,计算说期望收入函数的“形状”是完全由配置规则Q 单独决定的。支付规则M 仅仅用来决定常数()0i U 。

命题10.5 如果直接机制(Q,M)是激励相容的,则对于所有i 和i x ,期望支付为

.)()()0()(0

?-+=i x i i i i i i i i i dt t q x x q m x m (10.3) 因此,任意两个有相同配置规则的激励相容机制的期望支付都等于同一个常数。

证明:由于 )()()(i i i i i i i x m x x q x U -=和)0()0(i i m U -=,(10.2)中的方程可以写成(10.3)。 该命题有一个十分有趣的含义——一旦我们知道了在每种可能情况下(由Q 刻画)谁获得了物品,以及每个买者在其估价为其最低可能水平(x =0) 时的期望支付为多少,则卖者从拍卖中

得到的期望支付并不依赖于产出函数M (只要机制是激励相容和个人理性的)。因此,譬如,对于任意两个拍卖机制,只要它们具有性质(1)物品总是卖给最高估价者和(2)如果其估价位于其最低可能估价,则买者的期望支付为零,则卖者会从它们中获得相同的期望支付。注意,在一级密封价格拍卖,二级密封价格拍卖,英式拍卖及荷兰式拍卖中,倘若竞价者是对称的,则存在一个均衡将物品配置给估价最高者,且估价为x i =0的竞价者决不会支付任何价格。因此,根据这个命题,在四种拍卖模式中存在着收益等价性。

10.5.2 应用:“一口价”拍卖

考虑以下一种简化英式拍卖的变种(具体的描述见本章 10.2.1节)。在这样的一种拍卖里,存在着一种牌价(posted price ),使得任何报价者都可以通过接受牌价购买商品,只要商品还没有被卖出。附加了一个“一口价”(take-it-now price )价格选择机制的这样的标价拍卖在网上拍卖中十分流行,如eBay, Amazon ,Yahoo 等公司的网上拍卖就常常采用这种方法。这样的拍卖可以以这样两种方式结束,即或者是有人决定支付这个标价或者是还只有一个买者留在拍卖现场,就看哪种情形先出现了。尽管卖者本来可以通过卖一个更高的价格而得到更多,但他却为价格设了一个上限,这看起来好象不明智,但其实并非如此。下面介绍的是Chiu 和Cheung (2004)所得到的结果。

为了把思考集中起来,我们来考虑下列假定。存在着n 报价者,其中每一个有一个估价值,它们都是来自一个定义在[0,w ]上的分布函数F 的i.i.d 随机变量。尽管每一个报价者都知道开始存在着n 个报价者,他在拍卖过程中却并不知道还有多少报价者仍然在参与拍卖。虽然拍卖看起来是动态进行的,每一个报价者的决策是什么时候停止报价和什么时候接受一口价,p 。对于估价x

p 的报价者,他需要的是决定一个价格()x β,在那里他将接受牌价。

假定β是严格递减函数——具有较大估价的报价者倾向于较早地接受一口价。(见图10.4,β(x )是严格向下倾斜的且β(w )>0)。那么,不需要进行进一步的计算,我们可以得到的结论是,在均衡中,配置是有效率的——物品总是归于估价最高的竞价者。连同另外一个性质即任何具有x =0的竞价者不会支付任何价格,立即就得到每一个局中人的期望支付和支付的价格——包括卖者和所有的买者——在两种拍卖模式中是相同的。

这个等价结果还可用于求解均衡战略β函数。对于一个估价为x >p 的竞价者,在原有的简化英式拍卖下,其期望支付为111()[|]y G x E y y x ?<;在有“一口价”的拍卖机制下,其期望支付是

[]11111Pr (())|()Pr (())y ob y x E y y x ob y x p βββ?

令两者相等,并通过一些推导,可得到

111[|()].y p E y x y x β=<< (10.4) 给定一口价p ,方程(10.4)可以被用于计算具有x >p 的报价者的一个严格递减战略β。存

在着一个临界值p*,使得对于任意的p ≥p*,t 计算出来的战略β的确是正确的和一致性的(consistent )。特别地,当p =p*时,满足x =w 的报价者会立即实施一口价。(当当前价格 = 0时)。对于p

错误!

图10.4 p 较高;物品有效配置 错误!

图10.5 p 较低;物品配置无效

汕 (

x )

p

x 0 β ( x )

p

ω

x 0

10.6 最优机制

10.6.1 最优机制

在这一节里,我们将卖者视作是机制的设计者,他要在所有激励相容及个人理性的机制范围内,考察那些机制最大化他的期望收益。我们再次强调,当进行这样的分析时,显示性原理保证了,只考虑直接机制时是不会失去一般性的。我们把满足激励相容及个人理性约束下最大化期望收益的机制称为最优机制。

利用(10.3) 并取期望值,卖方由竞价者i 取得的期望支付是

000[()](0)()()()()i i i i w w x x i i i i i i i i i i i i i i i E m x m q x x f x dx q t f x dt dx =+-???

注意,右端的最后一项等于

???-=i

i i i i w t i

i i i i w w t i i i i i i dt x f t F dt dx x f t q )())(1()()(0

所以,

()()01[()](0)()()()1(0)()()()i i i w i i x i i i i i i i i i i i i i i i i i i i i i i X i i F x E m x m x q x x f x dx f x F x m x q x x f x dx f x -??=+- ??

?-??=+- ???

?? 将所有竞价者的期望支付加总,卖者最大化下面的和

()01[()](0)()()()i i w i i x i i i i i i i i i i i N i i F x E m x m x q x x f x dx f x ∈-??=+- ???

∑? 问题就变为选择(Q ,M )使得在满足激励相容及个人理性约束下最大化下式

∑?∑??

? ??+i X i i i i i dx x f x Q x m )()()()0(ψ (10.5) 其中,

1()()

i i i i i x x x ψλ=- 被称为竞价者i 的实质价值(virtual value),其中/(1)i i i f F λ=-是与i F 相关的道德率函数( hazard rate function )。如果对于所有的i ,i ψ都是增函数,则称机制设计问题为正规的(regular )。对于一个问题是否是正规的一个充分条件是每一个局中人的道德率函数是递增的。 暂时不考虑激励相容和个人理性约束,考虑下面这个表达式:

()()i i i i

x Q x ψ∑ (10.6) 它来自式(10.5)中的第二项。函数 Q 于是就象一种权重函数,并且显然最好是把权重仅仅给予最大化的()i i x ψ,只要它们是正的。这就会在每一个点x 上最大化式(10.6) 中的函数,并

且因此也最大化它的积分。这样的一种配置规则可记为如下的形式:

1 ()max () ()0.()0 ()max ()

i i j i j j i i i i i j i j j x x x Q x x x ψψψψψ≠≠>≥??=?

10()()(,)0 ()x i i i i i i i i i i i i i x y x x y x Q z x dz x y x ----->?=?

?若若 (10.7) 其中-()i i y x 是给定其他局中人的报告i x 情况下,确保局中人i 赢得物品的最小报告,即: ()inf{:()0 ,()()}i i i i i i i j j y x z z j i z x ψψψ-=≥?≠≥且 (10.8) 最后,考虑支付额

() ()1()0

()0i i i i i y x Q x M x Q x -=?=?=?若若 (10.9) 命题10.5:假定机制设计问题是正规的,由式(10.7),(10.8)及(10.9)所刻画的机制(Q,M)就是一种最优机制。

证明:注意到用Q 所计算的函数i q 是非减的,也注意到对于所有的-i x 有-(0,) 0i i M x =,并且因此对于(0)i m 也是如此。因此,建议的机制既是激励相容的又是个人理性的。这种机制显然是最优的,因为它在满足(0)i m 是非正的约束下最大化式(10.5)。

按照这个机制,当且仅当最高的实质价值(virtual value)为正时,物品才能被售出。在物品被售出的情形,物品被配置给具有最高主观价值的报价者。只有得到物品的报价者才需要支付价格,并且支付的价格是报价者i 要击败i x -所需要的最小数值。

要注意的是,最优机制一般是无效率的。这种无效率的发生有两种可能性。首先,商品没有被卖出去,即使存在某些买者,他们对于商品的估价是大于商品拥有者的估价的情形。第二,商品被卖给了某些买者,这些买者对于商品的估价没有某些其他买者的估价高。对于这两种情形,我们分别来考虑一个具体的例子。

例10.3:物品不能售出的无效率情形

譬如,假设[0,100]i x ∈并且i x 是均匀分布在区间 [0,100]上,i=1,…,n 。则直接的计算给出每一个买者i 的实质价值为()2100i i i x x ψ=-。下面是一种最优销售机制。要求每一个买者报告其估值。如果最高的报告值是 50 或者小于50,就不卖。否则,把它卖给最高报告值的那一位(在有多人都报告出最高估值的情形,他们以同样的概率获得这个价格),收到物品的买者支付的价格是第二高的报告值。注意,每个买者的估值小于50的概率为0.5。通过宣布一个保留价格50,卖主冒着以概率0.5n 不能将物品售出。所以,在使用最优拍卖的场合,卖主提高了其期望收益,存在着某些机会,使得商品没有被卖出,并且这样的结果是无效率的。

例10.4:物品被卖给估价非最高的竞价者带来的无效率情形

当买主是不对称的时,最优拍卖有时甚至可能将物品卖给估价不是最高的一位买主。譬如,存在着两种买者且1x 与2x 是分别均匀分布于区间[0,100]和[50,150]上的。那么,不难计算出实质

价值111()2100x x ψ=-和222()2150x x ψ=-。最优销售机制如下。要求每一个买者都报告其估价。倘若报告的估价满足150x ≤和275x ≤就不卖。否则,当122-1002-150x x >时就把物品卖给买者1,当122-1002-150x x <时就把物品卖给买者2,当122-1002-150x x =时就以相同的概率把物品卖给任何一个人。事实上,对于估价上界较高的买主,最优拍卖是歧视他的。例如,当 1x =80和2x =100时,物品就被卖给了买者1,是无效率的。

最后注意到,在最优机制中,其估价x 为正的竞价者将获得某个正的剩余。这是因为“赢家”支付了一个通常会小于其估价i x 的价格()i i y x -。所得到的剩余的期望值[]()i i i E x y x --有时被称为竞价者i 所得到的信息租金。这是因为他是这个系统中唯一的一个知道i X 数值的人。卖者因此不能进行完全的价格歧视且获取所有的剩余;为了让竞价者显示其私人信息,就需要让渡予他们一些信息租金。

10.6.2 实质价值(VIRTUAL V ALUE )

根据前面的分析,物品的最优配置应该基于主观价值来进行。但是什么是主观价值呢?单独考虑一个特殊的竞价者,其估价的分布由分布函数F 决定。假定卖者给买者作了一个规定,要求他在价格水平p 上要么买走要么就走开。买者会接受这样一个规定的概率为1-F (p ),这是他的估价超过p 的概率。我们可以把这个购买概率看成是i 的“需求量”,且因此将买者i 隐含的“需求曲线”写为q (p )=1-F (p )。其逆需求曲线为1()(1)p q F q -=-,其中q 是购买的“数量”(或等价地是购买的概率)。卖者面临的所导出的“收益函数”为

1()(1)p q q qF q -?=-

将收益对q 求导数:

11(())(1)((1))

d q p q q F q dq F F q --?=--'- 由于1(1)F q p --=,故

)

()()

(1)(p p f p F p p MR ψ=--=

它是i 在p (q ) =p 的主观价值。所以,买者的主观价值ψ(p )可以被理解为一种边际收益,并且回忆我们曾经假定ψ 是严格增的。将这个买者孤立起来看,卖者会定一个“垄断价格”或者说是满足边际收益MR (p ) = 边际成本MC 的r*。由于假定边际成本为零,故 MR (r*)=ψ(r*)=0,或*1(0)r ψ-=。

图10.6给出了如何将买者的分布函数旋转后,通过在两条曲线上识别对应点来获得其“需求曲线”。图中还给出了相关的“边际收益”曲线和“垄断价格”r*。

图10.6 买者i 隐含的“需求曲线”

当面临许多买者时,最优机制要求卖者对买者定一个歧视性的保留价格*1(0)i r ψ-=。倘若没有一个买者估价i x 超过其保留价格*i r ,卖者就把物品留在自己手中。否则,将它配置给具有最高边际收益的买者,并且要求这个“赢家”买者支付价格1()i i p y x -=,这是他会赢得物品的最小价格。

一般地,最优机制在下面这种意义上会产生有利于“不利”买者的歧视效应。假定有两个买者,他们的估价分别由在[0,w ]上有相同支撑的分布函数1F 和2F 导出。进一步假定对于所有的x ,相关的风险满足12()()x x λλ≤。则买者2就是相对不利的,因为其估价看来是较低的;特别地,1F 随机占优于2F 。但是,给定两人都有同样实现了的估价x ,买者2的实質价值就会更高,因为有

)()

(1)(1)(2211x x x x x x ψλλψ=-≤-= 由于最优机制是在实質价值(virtual valuation )基础上来分配,与单独的个人估价相比,买者2就更多地会“赢”得物品。

10.6.3 独立性假设与“完全榨取”(full extraction )结果

在前面,我们假定买主的估价之间是相互独立的随机变量。独立性假设是过强的假定,故我们现在考虑一个例子,并表明其中的最优行动看起来好象并非估价是互相独立的。

为简单计,我们考虑一个离散的例子。假设有两个买主,其中每一个的估价或者为10或者为100。假设),(21x x 的联合概率分布为:

3

1)100,100()10,10(=

=prob prob 61)10,100()100,10(==prob prob F

显然,这两个估价值是相互不独立的。若两个买主都有较高的估价)100(21==x x ,则以价格100将物品卖给其中某个买主,并以相等的概率随机地决定哪一个买主得到物品。若一个买主有较高的估价(100)和另一个有较低的估价(10),则将物品卖给出价较高的(100)那位,且向报较低价格的买主索取30(但他得不到物品)。若两个买者都只有较低的估价(10),则将15单位货币给其中一位,且将5单位货币和物品交给另一位,同时随机地选择物品的获得者。

这个拍卖机制的产出函数),(M Q 是:

())10,10(2/1,2/1)100,100(Q Q ==

)0,1()10,100(),1,0()100,10(==Q Q

)10,10()10,10(),50,50()100,100(--==M M

)30,100()10,100(),100,30()100,10(==M M

这看起来是一个非常令人感到奇怪的拍卖,但事实上它是最优的。不难验证:在这个拍卖博弈中,说实话是一个纳什均衡,给定另一位买主说实话,任何买主都没有谎报估价的动机。进一步,物品总是转移给了估价最高者,并且无论其估价是高还是低,每一个买主从这个拍卖机制中获得的期望支付为零。故这个拍卖机制是可行的并且它使得卖主将买主的所有消费者剩余都拿走。因此,这是一个最优拍卖机制,并且它带给卖主的期望收益为

70)20(3

1)130(61)130(61)100(31),(0=-+++=x P U 为了看出为何这个拍卖机制如此运行,观察一下卖者实际上干着两件事情。首先,他将物品以最高的买主估价卖给估价最高的买主之一。其次,若买主说他的估价等于10,则这个买主就被强制性要求如下行事:“如果其他买主的估价为100,则支付10;如果其他买主的估价为10,则获得150”。对于真实估价为10的买主,这使得买主的期望值为0,因为在另一位的估价

为100时条件概率为3

1,另一位估价为10时条件概率为

3

2。但是,当一位买主的估价为100但他却说谎并报出10的价格,则这使得他的期望值为3

50)10(31)30(32-=+-(因为现在他将对于其竞争对手的估价为100和10的两种情况分别赋予条件概率32和31)。这个对于说谎买主的负数期望值恰好抵消了买主以较低价格买到物品的说谎诱惑。

在独立性假设下,这个方法是不可能发挥的,因为每个买主关于其他买主的估价的条件概率为常数。但是,在一般的非独立情形,我们可以预测这个方法很可能出现。即卖主总可以通过以最高报价者的估价将物品卖给最高出价者将物品的价值全部获取,然后设置一个这种方法,若说实话则获得零期望值但若说谎则获负的期望值。当这种方法被仔细设计时,他们就能抵消为了以低价购得物品而说谎的冲动。

当然,在这个分析中,我们大量使用了风险中性假设。对风险中性买主,最优拍卖不太极端。在我们这个例子中所提出的拍卖博弈有不太好的第二个均衡,其中两个买者总是声称是低类型,尽管可设计出其他的最优拍卖机制,其中说实话均衡是唯一的(例如,将x 变为:

)15,15()10,10(),100,100()100,100(--==M M

)40,0()10,100(),0,40()100,10(==M M

而Q 保持上述的不变)。

是否在我们的例子中存在一种最优拍卖,它没有这样一种奇怪的性质即有时让卖者向买者支付价格?答案是否定的。如果我们附加一种约束即卖者绝不向买主支付货币(即所有的

0)(≥x M i ),则没有一种可行的拍卖机制给卖者带来大于3

266的期望支付。为了证明这一点,我们观察到如上例中那样估价值是有限的情形拍卖设计问题是一个线性规划问题。该问题的目标函数是),(0M Q U ,它对于Q 和M 是线性的。可行约束有三种类型:概率约束

]1)(,0)([∑≤≥i

i i x Q x Q ,

个人理性约束]0),,([≥i i x M Q U 和激励相容约束。所有这些约束是P 和x 的线性函数。故我们得到一个线性规划问题,且对于我们的例子来说其最优值为70,以及上述最优解。但若我们对所有i 及x 添加约束0)(≥x M i ,则最优值跌落到3266(对于这个例子来说)。为了获取这个“次优”值3

266和非负的x ,卖主应在1021==x x 时保留物品,且否则卖主将物品卖与高出价买主从而获得100。

10.7 有效机制

现在,我们已经研究了最优销售机制,我们要把注意力转向有效机制。存在着两种理由说明研究这个问题是十分有趣的。首先,当卖者可能对于如何提高收益感兴趣时,社会计划者却要求物品的配置是要有效率的(我们通过例子已经说明最优机制可能在配置物品上是缺乏效率的:或者物品根本没有被卖出或者物品被卖给了在所有竞价者中不具有最高估价的那一个)。我们还发现二级密封价格拍卖(Vickery 拍卖)是满足有效性质的。(根据推論10.1),任何满足有效性质的机制一定与二级价格拍卖只差一个常数(命题10.5)。由此看来,我们已经彻底搞清楚了有效销售机制。

其次,除了研究物品的销售之外,机制设计还可用于研究其它场合的问题,其中局中人具有私人信息,譬如我们需要研究一个公共项目的成本分摊问题。在这样的问题里,主要关心的是效率,而且,我们对于探索那些可带来高效率的机制所具有的特征是蛮有兴趣的。为了让二级价格拍卖能够作为这类问题的一种特例,在机制中,我们得把卖者看成博弈中的一个局中人, 而不是机制的设计者。

考虑有N 个代理人(在销售的情形中包括卖者)的一个博弈,其中每一个局中人i 有一个类型集合[,]i i i X R αω=?,因此,当0i α<时,允许负值的概率(或者正成本)。一个配置规则*:Q X →?被说成为是有效的,如果它最大化了“社会福利”——即对于所有的x X ∈,有

*()arg max j j Q Q x Q x ∈?

∈ (10.10)

在没有多个人报出相同的最高价时,有效规则把物品配置给估价最高的那个人。任何具有有效配置的机制被称作是有效的。给定一个有效配置规则*Q ,当估值为 x 时,按照如下方式定义社会福利的最大值

*()()j j j N

W x Q x x ∈≡∑ (10.11)

类似地,定义

*()()i j j j i

W x Q x x -≠≡∑ (10.12)

为除i 之外的个人的福利。

10.7.1 VCG 机制

Vickrey-Clarke-Groves,或 VCG 机制(Q*, M V )一个有效机制,其中是 *Q 是一个有效配置,且N V R X M →:的定义为

)(),()(x W x W x M i i i V i ---=α (10.13) 其中,给定M i V (x ) 是在i 的最小可能估价i α处的社会福利,与其他代理人在i 的报告估价i x 处的福利之差;假定在两种情形都采用了有效配置规则Q*,而其他局中人如实报告i x -。

在拍卖的情况下,i α=0,且显然易见,VCG 机制与二级价格拍卖是相同的。在拍卖的情形,()(0,)()V i i i M x W x W x --=-,此外()V i M x 为正数,当且仅当j i j i x x ≠>max 。此时,)(x M V i 等于 j i j x ≠max ,即第二高私人价值。

VCG 机制是激励相容的。的确,不难看出,正如在二级价格拍卖中那样,在VCG 机制中说真话是一个弱占优战略。如果其他竞价者报告的估价为1x -,则通过报告估价i x ,代理人i 的支付为

()(

)∑∈-----=-N

j i i j i i j i i V i i i i i x W x x z Q x z M x x z Q ,),(),(,**α (10.14) 这里使用了式(10.11)及(10.12)。Q*在式(10.10)中的定义意味着所有的i x -,第一项通过令i z =i x 得到最大化;且由于第二项并不依赖于i z ,报告i i z x =是最优的。因此,当估价为x 时,i 的均衡支付就是

),()()()(*i i V i i i x W x W x M x x Q --=-α

它正好就是当i 报告其真实估价i x ,相对于其最低可能估价i α导致的在社会福利上的差别。 由于VCG 机制是激励相容的,它具有第10.5节中导出的性质。特别地,与VCG 机制有关的均衡期望支付(函数V U )

()()(,),i V i i x i i i i U x E W x x W x α---=-????

是凸的且是递增的。显然,0)(=i V i U α且U i V 的单调性现在意味着VCG 机制也是个人理性的。

如果(Q*, M )是其它的某个激励相容的有效机制,则由收益等价原理,我们知道,对于所有i ,这个机制的期望支付U i 与U i V 最多相差一个常数,譬如这个常数就是c i 。倘若(Q*,M ) 还是个

基于博弈论的恋爱模型

《数学建模》 课程考核论文 姓名:王湘衡齐久坤张程勇 学号:08100225 08100217 08100232 班级:08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型 摘要 本文用数学建模的方法研究博弈论中的问题,从不完全信息静态博弈建立模型建立模型,并利用纳什均衡原理程序来确定纳什均衡点,对不同均衡点进行分析,从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈,来模拟现实社会中的恋爱,再利用恋爱者不同类型的分布概率,求出恋爱者的期望,最终来决策恋爱者自己下一步的策略。 关键词:恋爱模型博弈论贝叶斯纳什均衡

1、问题重述 随着社会的进步和发展,现在恋爱问题越来越成为生们关注的热门话题,那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人,成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人,这其中将恋爱双方都理想化,这样将给我们研究恋爱问题和建立数学模型带来方便,使我们能将恋爱模型数学化,从而确定恋爱者的进一步决定。 2.模型假设及符号说明 模型假设: 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人,并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略 符号说明: 3. 问题分析与模型建立 3.1 问题分析 谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看,谈恋爱的男女双方,各有不同类型,我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象,寻求的是一般解释。有了这样的分类便有了不同的组合,有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美,却不会让他得逞,原因是理性经济人的假设。有人说这一点说不通,我不这样认为,经济学说所有人都是理性的并不影响不理性家伙们的存在,能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。 简单的博弈理论己深入人心,显然上面的问题是不完全信息博弈,无论是男追女还是女追男,信息的不完全或是不对称是显而易见的,用博弈论的话说是对对方的了解不够精确。因此,我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡,动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型 所谓静态是指所有参与生都同时行动,不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例,一个男生追求一个女生,在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人,虽然自己可以从各种渠道了解男生,但知生知面不知心,风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题,因为女生不仅不知道男生的类型(A还是B),而且还不知道不同类型的分布概率,但她对自己所属的类型是清楚的,这是她的私人信息。同理男生也是这样。 下面来设定支付函数的权值,以便求出纳什均衡点,设男A类追求者,只要他追求A类女生就得到10,他不追求A类女生就得到-10,A类女生接受得到10,拒绝得到-10;男B类追求者,他追求A类女生得到10,不追求得到-10,A类女生接受得到-10,拒绝得到10;男A类追求者,他追求B类女生得到-10,不追求得到10,B类女生接受得到10,拒绝得到-10;男B类追求者,他追求B类女生得到10,不追求得到0,B类女生接受得到10,拒绝得到0;他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明:

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

关于定价的博弈论模型

CH13 关于定价的博弈论模型 分析寡头市场的最大困难在于策略问题。在此情形下,市场上仅有几家企业,每一家企业在做决策时,都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。 一、基本概念 在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的选择,这种情况就可以看成是一个博弈。 1.博弈的三要素 任何一个博弈都必须具备三个要素: (1)博弈的参与者 参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。 (2)策略 策略是博弈参与者的行动规则。 在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。 (3)支付(payoffs ) 支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面,既包括显性的货币报酬,也包括隐性的参与者关于结果的心理感受。 2. 符号 两个参与者(A 和B )之间的博弈G 用下式表示 [,,(,),(,A B A B G S S U a b U a b 其中,A S 和B S 分别表示参与者A 和参与者B 的可选策略,(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时,各自所得到的支付(,A B a S b S ∈∈)。 二、Nash 均衡 市场均衡:在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。

Nash 均衡:对于策略组合(**,a b ),如果给定其它参与者的策略,没有一个参与者会选择单方面偏离,那么这个策略组合就构成一个Nash 均衡。也就是说 ** * (,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ** * (,)(,)B B U a b U a b '≥ 对于所有B b S '∈ 对纳什均衡的理解 设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特定的战略。那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?如果没有参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing ),这个协议就构成一个纳什均衡。否则,它就不是一个纳什均衡。 三、一个例子 两个厂商(A 和B )决定自己花多少钱用于做广告。每个厂商可以选择较高的预算(H )或较低的预算(L )。 1.博弈的扩展式表述 图13.1 2.博弈的策略式(规范式)表述 表13.1 3.占优策略和Nash 均衡 从表13.1可以看出,低预算(L )是厂商B 的占优策略,即不管厂商A 选择哪一种策略,L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识,厂商A 也知道L 是厂商B 的占优策略,所以厂商A 将选择L 。因此,该博弈的均衡是(L ,L )。 请验证(L ,L )构成一个Nash 均衡,而其它三个策略组合都不是Nash 均衡。

从博弈论角度看古诺模型

从博弈论角度看古诺模 型 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

博弈论的观点看古诺模型 罗思蕴 (华中师范大学数学与应用数学系,武汉430079) 摘要:运用博弈论的研究方法,对古诺模型的几种变式进行分析,给出模型解法的代数表达式,并对结果进行适当的对比分析,最后总结出不同模型对结论的改变情况。 关键词:古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈 古诺模型(Cournot model)是博弈论中最具有代表性的模型之一,也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年,足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度,它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。 在古诺生活的时代,大多数市场都只有少数的厂商经营,所以这个模型在当时是极具现实意义的。随着时间的推移,古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析,有四种情况极具代表性:完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型 古诺模型最初的形态是来自于经济学的。在经济学中,寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一,

假定一个产业只有两个寡头,每个寡头生产同质产品,并追求利润最大化。二,两个寡头之间进行的是产量的竞争而不是价格竞争,且产品的价格依赖于两者生产的产品总量。三,寡头之间无勾结行为。四,每个生产者都把对方的产出水平视为定值。五,边际成本为常数。 在经典的古诺模型中,每个企业具有相同的不变单位成本: 需求函数为: 第i个企业的利润为: 最优化的一阶条件为: 反应函数为: 解得纳什均衡为: 每个公司的利润为: 古诺模型是在假定寡头具有完全信息的基础上导出的。在这一均衡中,每个寡头都可以准确猜测对手的产量,从而选择自己的最大产出。 最重要的是,古诺均衡解在寡头无勾结的假定下求出的。如果考虑寡头之间相互勾结而达到均衡的情况,那么经过计算可以得到实际产出水平与实际价格上等于完全垄断条件下达到的产量与价格。更广泛的,考虑无勾结寡头市场、垄断市场、自由市场,可以得到:无论是产量还是价格,无勾结寡头市场都是处于中间的位置。也就是说,如果寡头市场不存在勾结的行为,其效率高于完全垄断,低于完全竞争。 2 博弈分类下的两种古诺模型 不完全信息静态博弈的古诺模型 完全信息静态博弈的古诺模型即经济学中最经典的形式,它假设了厂商相互完全

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析 摘要 随着市场经济的发展,人们对事物认知态度的变化,经济学的应用范围进一步扩大,人们的行事原则越来越趋向于经济学上的“理性”。就现状而言,经济学的分析不仅局限于某些领域,只要存在人类的社会活动,就存在经济,就存在资源合理配置问题,也就有经济分析的必要。谈恋爱是校园中的一个普遍现象,本文从经济学的视野中透视,爱情中的微观经济学问题,包括从预算线角度分析择偶以及爱情中的博弈关系,并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。 关键词:微观经济学;爱情;预算线;博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

豪泰林(hotelling)产品决策模型

豪泰林(hotelling )产品决策模型 对伯特兰德悖论(Bertrand paradox )的一种解释是引入产品差异性。如果不同企业生产的产品是有差异的,替代弹性就不会是无限的,在这种情况下,消费者对不同的产品具有不同的偏好,购买该产品的均衡价格就不会等于边际成本。 产品差异有多种形式,豪泰林(Hotelling ,1929)提出了一个考虑空间差异的产品决策模型。在此模型中,产品在物质性能上是相同的,但在空间位置上存在差异,因为不同位置上的消费者要支付不同的运输成本,这时他们关心的是价格和运输成本之和,而不仅是价格。 假定有一个长度为1的线性城市,消费者均匀地分布于[0,1]区间内,分布密度为1。假定有两个商店,分别位于城市两端,出售的产品性能相同,每个商店提供单位产品的成本为c ,消费者购买商品的旅行成本与距商店的距离成比例,单位距离的成本为t 。这样,住在x 处的消费者若去商店1购买要花费tx 的运输成本;若去商店2去购买,要花费)1(x t -的成本。为简单起见,现假定消费者具有单位需求,即或者消费1个单位,或者消费个0个单位。 假定两个商店同时选择自己的销售价格,现考虑两商店进行价格竞争的纳什均衡。 在该博弈中,两个参与者为商店1和商店2,其可选择的策略分别为各自的价格1p 、2p 。设),(21p p D i 为需求函数,2,1=i 。 若住在x 的消费者在两个商店之间是无差异的,则所有在x 左边的消费者都将在商店1购买,所有住在x 右边的消费者将在商店2购买,需求分别为x D =1,x D -=12,这里,x 满足 )1(21x t p tx p -+=+ (1) 由(1)式得两商店的需求函数分别为 t t p p x p p D 2),(12211+-==

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论在恋爱过程中的体现

博弈论在恋爱过程中的体现 在纷繁复杂的社会经济生活中,我们可以肯定的是,任何人的行动会对他人的利益产生影响,同时,他人的行动也肯定会对自己产生影响。即使在商城里买瓶酱油,其中设计的也不仅仅是你与这家商城的利害关系,同时也在无形中产生了你与其他消费者的利害关系,因为你买了这瓶酱油也就剥夺了他人买着瓶酱油的权利。除非你是一个人在荒芜人烟的孤岛上过着自给自足的生活,否则任何人都无法脱离这种利害关系。然而即便是一座孤岛,他的大气状况、周边的海洋环境也会受到某处其他人行动的影响。 所以,可以说我们周边所能看到的任何事物,都是我们在策略环境下作出决定后产生的结果,只是程度上有差异而已。换句话说,我们生活在这个社会中,不管是否喜欢,其实都是在不断地进行着策略性思考,找出有效地策略并付诸行动。 同时,我们会发现这种决策性决策不仅在商业中用用得到,在我们平常生活中也经常用到。自己不经意的一句话往往会造成一个我无法预料的结果,这样的经历相信谁都有过。但是相信也没有几个人喜欢这种经历。所以在生活中做出策略性的选择也是必须的。 而博弈论就是指在策略环境下进行思考并作出决策的工具。 爱情是人类永恒的话题,当今社会人们除了追寻事业上的成功之外,爱情的美满也是我们人生必须要交上的一份答卷,尤其在时下社会各种男女情感问题频发的情况下,是大家好好思考的时候了。博弈论在爱情中的应用也许会对我们有所启示的。 在爱情博弈中参与者是男女双方,两人之间会发生冲突,但也包含着合作,你的恋人既是你的合作伙伴,也是你的竞争对手。两者博弈的信息,也就是双方需要彼此了解的问题,主要包括:外貌、性格、学历、家庭背景、优缺点等。策略就是就是男女双方能够选择的手段和方法,但不论双方如何选择策略,两人最终的目的都是为了得到完满的爱情。在爱情这场“博弈”中,双方本性情感的迸发固然重要,但理性的相处更为重要。 先说“麦穗理论”,假设有一片麦地,我们走入麦地后就只许前进不许后退,走出去时只能选择一株自己认为最大最好的麦穗,而且选择了一个以后就不能扔了再选择第二个(这是假设现实社会不存在离婚的情况)。有的人刚一走入麦地就看见了一株大大的麦穗,于是就摘下,但越往下走就越发现还有更大更好的麦穗,于是就只能遗憾的走完全程;而有的人看到大的麦穗也不摘,总认为越往下面还会有更大更好的,于是不知不觉走出麦地时却还是两手空空;还有的人在刚进入麦地的时候他只是认真观察,做到心中有数,走了差不多一段路了,他才按照他心中分好的样子选择了大的麦穗而走完全程。 人的一生仿佛也是在麦地中行走,也在寻找那最大的一穗。有的人一早选择,日后遇到更好的却要后悔当初的选择而发生感情危机或者抱憾终生;有的人则东张西望,一再错失良机;有的人见了那颗粒饱满的“麦穗”,就不失时机地摘下它,得到了爱情的幸福。从这里我们可以看出在什么时候选择、到底要选择什么样对于自己才是最大的麦穗才是问题的关键。其实用博弈论中的风险规避来解释就是我们人生在做选择时不求得到最好,但一定要避免最坏的结果。我们在追求爱情的过程中,应为自己定好坐标,通盘审视,在遇到合适的情况时就要当机立断,莫要迟疑,选择属于自己的那束“麦穗”。 在下定决心要行动后,约会就变成了恋爱中一个必不可少的环节。而博弈论中策略集合的策略性做法,被很多餐厅运用的淋漓尽致。在餐厅吃晚饭时,长长的饮品单子就很让人头疼。一般这种店会有三个价格范围的饮品。其实这些不同的饮品之间价格差异不大,列在单子上确实让人眼花缭乱。除非你是一个对对方口味或者饮品很有研究的人。否则一定会陷入一定时间的混乱。而这些混乱的人,就会从单子的里面开始选第二个价格范围的饮品。这样做唯一的理由是,他们害怕挑选最便宜的会被对方瞧不起。所以这个价位的饮品也就成了他们的策略集合。最后,对餐厅来讲,只要把利润最高的饮品摆在那个位置就行了。而餐厅

博弈论的总结|博弈论总结

博弈论学习的个人总结刘艳丽 第一部分基本情况 视频来源耶鲁公开课《博弈论》1----5讲,人人影视 参考资料耶鲁校园网 《博弈论--战略分析入门》,美,罗杰A麦凯恩,原毅军译,机械工业出版社,2006,42元《策略博弈》,阿维纳什迪克西特,蒲勇健译,中国人民大学出版社,第二版,2009,65元班级工商,人力08级学生 课时8节 我的时间投入视频26个小时;书籍,25小时;上网时间,无法统计。 第二部分知识层面 一、The five lessons五个基本的结论 1、Don"t play a strictly dominated strategy

2、Rational choices can lead to bad outcomes 3、You can"t get what you want 4、Put yourself in other people"s shoes 5、Yale students are evil 二、Game 2: "pick a number."数字游戏 Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class. 三、The Prisoners" Dilemmasome examples囚徒困境 A joint project Price competition

博弈论培训心得

博弈论培训心得 -------李佳航 经过两次对博弈论的培训本人感触很深,也看了许多关于博弈的案例也从案例从学习了很多关系学习生活为人方面的博弈。 学习后现在简单总结一下: 1、博弈论中有很多的模型,其实记住模型并不是最重要的东西,掌握将问题变成博弈格局图以及进行优势策略标注法,找到纳什均衡更加重要。世界上的事情千变万化,仅仅靠这几个模型是无法全部解释的,而且模型与模型之间,仅仅变换几个数字,则发生变化。 2、博弈论可以将社会问题变成一个数学模型来计算推理,因此我们运用此模型时,需要相对准确地核定博弈各方的支付大小,解决问题的过程中,可设法改变参数让博弈对自己更加有利。 3、基本博弈模型的作用在于解决问题时更加容易去套,而不需要计算即知道博弈的结果将是什么,因此对于分析问题是有益的。有了模型在,对于一些谈判,容易让人站在博弈论的高度去分析它,这往往让人对谈判更加具有控制力。 4、对于较为简单的事件,完全不需要学习博弈论即能找到问题的答案,我们现实生活中的都自然而然的达到了博弈的均衡结果。 本周培训主要是讲的卡尼曼的前景理论和损失规避。 前景理论: 1、“二鸟在林,不如一鸟在手”,在确定的收益和“赌一把”之间,多数人会选择确定的好处。所谓“见好就收,落袋为安。称之为“确定效应”。 2、在确定的损失和“赌一把”之间,做一个抉择,多数人会选择“赌一把”。称之为“反射效应”。 3、白捡的100元所带来的快乐,难以抵消丢失100元所带来的痛苦。称之为“损失规避”。 4、很多人都买过彩票,虽然赢钱可能微乎其微,你的钱99.99%的可能支持福利事业和体育事业了,可还是有人心存侥幸搏小概率事件。称之为“迷恋小概率事件”。 5、多数人对得失的判断往往根据参照点决定,举例来说,在“其他人一年挣6万元你年收入7万元”和“其他人年收入为9万元你一年收入8万”的选择题中,大部分人会选择前者。称之为“参照依赖”。 损失规避: 如何理解“损失规避”?用一句话打比方,就是“白捡的100元所带来的快乐,难以抵消丢失100元所带来的痛苦”。 前景理论最重要也是最有用的发现之一是:当我们做有关收益和有关损失的决策时表现出的不对称性。对此,就连传统经济学的坚定捍卫者保罗·萨缪尔森,也不得不承认:“增加100元收入所带来的效用,小于失去100元所带来的效用。” 这其实是前景理论的第3个原理,即“损失规避”(lossaversion):

博弈论教材2013-2

第三章 纳什均衡及其应用 3.1 混合策略纳什均衡 1 鹰鸽博弈 我们知道老鹰具有攻击性,而鸽子爱好和平。在原始社会里有两个部落,可以做出两个行动:一是进攻一是和平,分别用鹰和鸽表示。 表1 鹰鸽博弈 乙 甲 鹰 鸽 该博弈的那是均衡为(鹰,鸽),(鸽,鹰)。一些学者研究发现,在同一个地域内,“鹰”和“鸽”的比例为0.36:0.64。事实上,设鹰鸽比为:1z z -,可以得出如下结果: ()2514(1)1439E e z z z =-+-=-; ()95(1)514E d z z z =-+-=- 9 0.3625 z = = 聪明的做法是:当鹰鸽比小雨0.36时,选择鹰策略;否则选择鸽策略。使用混合策略方法分析: 第一步:混合策略型表示: 乙 鹰 鸽 甲 鹰 p 鸽 1-p 第二步:计算期望效用: (925)514(259)514E p q q E q p p =-+-=++-甲乙 第三步:作出最优反应函数

91 259[0,1] 2590 25q p q q ???若若若, 90 259[0,1] 259 1 25p q p p ? ?? 如果如果如果 第四步:作出反应函数的图像 第五步:根据交点,找出纳什均衡:其中( 99 ,2525 )是混合策略纳什均衡。 2 斗鸡博弈 我的老家地处安徽最北部,苏鲁豫皖四省交界之处,东北处有条小河。河边的棉花地里,经常有鹌鹑栖息在其间。秋末冬初的农闲时节,小鹌鹑刚好长成。村民结网捕鹌鹑把玩、斗鸟儿为乐。每天早晨4点多钟出发,大约7点钟回来,雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑,真正熟练了,才拿出来和别人的相斗。设想两只鹌鹑要在场子里一决雌雄。每只鹌鹑都有两个策略:攻击或逃跑。由于两只鹌鹑实力相当,若同时选择进攻会两败俱伤;若一只进攻,一只逃跑,进攻者胜利。逃跑的鹌鹑算是玩完了,以后再也没胆量进场子,主人也不回在把玩它,会用一块黑布把它的笼子蒙起来,培养成“叫子”,以后后捕鹌鹑的时候拎出去吸引同伴。若同时逃跑不会败掉,以后还能斗,但是都会挨饿一天。 1 p q

博弈论与经济模型第10章

第10章机制设计与拍卖 10.1 导论 在本章和下一章里,我们将介绍博弈论中用来处理机制和市场设计的主要工具。存在着许多这样一些类型的例子。政府可能会去规制(regulate)垄断企业,使其行为符合特定的所期望的准则;艺术品收藏家要在出售其手中的画作中获得尽可能高的收益;社会计划者要保证开支在使用者之间有效地分配;学校管理系统要按照某种准则把它的空间在学生之间进行配置,等等。在本章里,我们主要关心销售机制的设计问题;在下一章中,我们将处理两组个体之间的匹配问题。 10.2 拍卖 10.2.1 历史概述 在一个“拍卖”中,物品被卖给出价最高的人。广义的“拍卖”是指对重要的经济资源进行配置,从艺术品到短期政府公债到近海油气田开发权再到无线电频率使用权等等。它采用多种不同的形式。例如,可以用轮流报价的方法(如艺术品拍卖)或密封式提交报价等。支付的成交价可以是最高报价,或某些其它价格;如果拍卖的物品不止一种,则既可以采用所有物品打包式的同时报价,也可用每种物品陆续报价的方式。博弈论分析有助于我们理解各类报价设计的结果;例如,它建议出可以最有效配置资源且带来最高收入的拍卖机制设计。在这一节里,我们来讨论这样的拍卖,其中每个买者知道他自己以及每个其他买者对于物品的估价。在后面的章节里,我们还要发展出允许我们假定买者之间互相不知道别人对物品的估价的情况下,对拍卖进行研究的工具来。 拍卖的现实背景:从巴比伦到网上购物拍卖有着相当长的历史。Herodotus,公元前1500年的古希腊作家,曾与Thucydies一起创立了历史学,曾对巴比伦的拍卖加以了描述。他写道,巴比伦人“最引人注目”的传统就是每个村庄里一年一度的拍卖,这种拍卖是对到了结婚年龄的女子进行的拍卖。对男人最具吸引力的女人首先被出;他们要求一个正的价格,而最不具吸引力的女人则倒过来向娶她的男子支付价格。在每次拍卖中,报价是轮流出价的,出价最高的男子胜出,并支付他报出的价格。 拍卖也出现于公元前1500年和400年的雅典,是出售征税权,对没收的财产的处置权,以及出租土地与矿山等。关于这些拍卖的实质内容的证据很少,但有一些有趣的东西留了下来。例如,雅典政治家Andocides(C.440—391B.C.)曾对一个征税权拍卖中的串谋提出了一个报告。 在古罗马经常开展一些拍卖的活动,且在罗马帝国之后的中世纪欧洲还继续着这种活动(例如,在中世纪和早期现代低地国家中的城镇里,每年都要对征税权进行拍卖)。最早出现英语单

基于博弈论的闭环供应链定价模型分析

第40卷第2期2008年4月 南 京 航 空 航 天 大 学 学 报Jou rnal of N an jing U n iversity of A eronau tics &A stronau tics V o l .40N o.2  A p r .2008基于博弈论的闭环供应链定价模型分析 王玉燕1 李帮义1 申 亮2 (1.南京航空航天大学经济管理学院,南京,210016;2.山东经济学院财政金融学院,济南,250014) 摘要:构建了基于第三方回收模式的闭环供应链定价模型,运用博弈理论分析该系统最优定价策略。研究表明:制造商与零售商、制造商与第三方回收商分别构成了Stackelberg 博弈关系,制造商只有在决策时必须分别考虑零售商、第三方回收商对自己决策的反应,才能实现自身利益最大化,反之,零售商、第三方回收商也要考虑制造商的决策才能实现自身利益的最大化。此外,该文还分析了模型结构对利润的影响。这些结果证实了闭环供应链的理论基础。 关键词:供应链;博弈论;制造商;定价策略 中图分类号:F 273;O 21 文献标识码:A 文章编号:100522615(2008)022*******  基金项目:江苏省研究生科技创新基金(X M 062142)资助项目。 收稿日期:2006207206;修订日期:2006212211  作者简介:王玉燕,女,博士研究生,1978年11月生;李帮义(联系人),男,教授,博士生导师,E 2m ail :libangyi @https://www.360docs.net/doc/3f3071444.html, 。 Ana lysis on Pr ice D ec ision of Closed -L oop Supply Cha i n Ba sed on Gam e Theory W ang Y uy an 1 ,L i B angy i 1 ,S hen L iang 2 (1.Co llege of Econom ics and M anagem ent ,N anjing U niversity of A eronautics &A stronautics ,N anjing ,210016,Ch ina ; 2.F inance Institute of Shandong Econom ic U niversity ,J inan ,250014,Ch ina ) Abstract :T he clo sed 2loop supp ly chain (CL SC )p ricing m odel is con structed based on the th ird 2party take 2back m odel .T h is system is m o st superi o r fixed p rice strategy th rough gam b ling theo ry analysis .T he research indicates that m anufactu rers and retailers ,m anufactu rers and the th ird p arty take 2back bu siness con stitu te the Stackelberg gam b ling relati on s ,separately .M anufactu rers can realize their ow n benefit m ax i m izati on on ly w hen they con sider sep arately retailers and the th ird party take 2back bu siness respon se to their decisi on 2m ak ing .O ther w ise ,retailers and the th ird p arty take 2back bu siness also need to con sider m anufactu rer ’s decisi on 2m ak ing ,and they can realize their ow n benefit m ax i m izati on .In additi on ,th is p ap er also analyzes the m odel structu re fo r affecting the p rofit .R esu lts con summ ate the rati onale of CL SC . Key words :supp ly chain s ;gam e theo ry ;m anufactu rer ;p ricing decisi on 引 言 闭环供应链是在传统的“正向”供应链上加入逆向反馈过程(即逆向供应链[1])而形成的一个完整的供应链体系(C lo sed 2loop supp ly chain , CL SC [2] )。通过产品的正向交付与逆向回收再利用,闭环供应链使“资源—生产—消费—废弃”的开环过程变成了“资源—生产—消费—再生资源”的 闭环反馈式循环过程,把经济活动对自然环境的影 响程度降低到尽可能小,减少了资源的消耗,降低了产品和服务的成本。 目前,一些学者对CL SC 进行了初步研究。 Gu ide ,Sam ee 探讨了CL SC 的实施方案[324] ; Su rendra 研究了CL SC 实施中的关键问题[5] ;D i m itri o s 借助计算机构建了CL SC 的仿真模型[6] ; 许志端从多方面分析了委托第三方回收商回收具有

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

一个恋爱的博弈论分析

1.博弈论分析—大学里的恋爱故事 2.模型1:期待恋爱 3.模型2:没有缘分的爱情 4.模型3:有钱人终成眷属 5.模型比较 6.模型中存在的问题:静态VS动态,完全信息VS不完全信息 7.反思:模型在现实中缺乏明确的支付矩阵 1.博弈论分析—大学里的恋爱故事 今天我想就恋爱问题,从经济学的角度来做一个简单的阐述。在经济学的分析框架内,成本—收益分析,供求分析是最为传统的分析方法,而博弈论的分析方法是主要侧重于分析存在策略相互依存的经济主体之间的行为的。 在我们的平时观察中,发现大学里面恋爱最后分手的居多,就这样一个现象,通过博弈模型的简化分析得出一些自己有关恋爱问题的思考。 2.模型1:期待恋爱 我们设计一个求爱模型,参与人是一个男生,一个女生,假定都是男生向女生求爱,男生的策略有求爱和不求爱,女生的策略有接受和拒绝,每个参与人的支付是决策后的感受。 在表1中,可以看到,当男生求爱女生接受时,男生得到3单位,女生得到3单位,因为大学时期的男女都渴望得到一份爱情,因此一旦男生主动向女生提出交往,那么女生也会很乐意的接受,所以男女都各得3单位的收益;当男生求爱而女生拒绝时,男生的到1单位,女生得到2单位,因为男生尽管求爱遭到拒绝,但是也在一定程度上知道如何追求女生,获得了一定的经验,所以得到1单位,而女生拒绝了男生,可能是一方面心有所属,另一方面知道自己还有吸引人的地方,多以得到2 单位;当男生不求爱女生接受时,男生的到2单位,女生得到1单位,因为男生觉得女生不是自己喜欢的类型,所以因自己的正确选择而感到心情愉快得到2单位,而女生“倒追”男生,尽管也许这个男生不喜欢自己,但是由于能够和自己喜欢的男孩子接触已经很满足了得到1单位;当男生不求爱女生拒绝时,男生女生都得到了0单位,因为彼此依旧是走在大路匆匆而过的陌生人。 这个博弈的均衡是男生求爱女生接受,男生和女生各得3单位。这反映了在现实的大学生活中一个很普遍的现象,由于大学生刚刚度过了艰苦的高考,进入大学生活,在时间和心理都是放松的,只要有适合的男生向女生发出信号,女生都会很乐意的接受,而不管这段爱情是否长久。 而在俩人毕业的时候,在一起的恋人很少,我想究其原因就是信息的不对称或者信息的不充分。因为我觉得要是两个人能够很长久的在一起甚至白头到老,主要体现在适合,就是说一对适合的男生和女生在一起的话感情经得起时间的考研,而一对不适合的男生和女生在一起,可能就会出现曲终人散的惨淡局面。 3.模型2:没有缘分的爱情 表2的求爱博弈模型是假定男女不适合的博弈模型,当男生求爱女生接受时,尽管俩人相处不愉快但男生和心爱的人在一起得到4单位,女生由于自己的错误选择而后悔得到-4单位;当男生求爱女生拒绝时,男生由于遭到拒绝深受打击得到-4单位,女生由于做出了正确的选择拒绝这个不该爱的人而得到4单位;当男生不求爱女生接受,男生由于感到自己“被追”而得到1单位,女生由于认为自己的选择大错特错,深感懊恼得到-6单位;当男生不求爱女 孩拒绝时,男女并不认识,没有任何联系,各得0单位。

相关文档
最新文档