博弈论66个经典例子

合集下载

博弈论PPT课件

博弈论PPT课件
有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)

博弈论案例

博弈论案例

博弈论案例案例一囚徒困境在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的"囚徒困境"(prisoner's dilemma)博弈模型。

该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。

假设有两个小偷A和B联合犯事、私入民宅被警察抓住。

警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

下表给出了这个博弈的支付矩阵。

囚徒困境博弈 [Prisoner's dilemma]A╲B坦白抵赖坦白8,8 0,10抵赖10,0 1,1对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择"坦白"总是最优的。

显然,根据对称性,B也会选择"坦白",结果是两人都被判刑8年。

但是,倘若他们都选择"抵赖",每人只被判刑1年。

在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。

但是,"坦白"是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。

不难看出,此处纳什均衡与帕累托存在冲突。

单从数学角度讲,这个理论是合理的,也就是选择都坦白。

但在这样多维信息共同作用的社会学领域显然是不合适的。

正如中国古代将官员之间的行贿受贿称为"陋规"而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的策发生改变。

比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的"出卖"角色将会使他损失更多。

博弈论及经典案例简介PPT课件

博弈论及经典案例简介PPT课件
⑶ 上策均衡是纳什均衡的一种特殊情况,但纳什均 衡却不一定是上策均衡。
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。 合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之。虽与之俱学, 弗若之矣。为是其智弗若 与?吾曰:非然也。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。
13
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形成了别具风情的博弈文化

博弈论总结(精选13篇)

博弈论总结(精选13篇)

博弈论总结第1篇最大化自己最坏情况下的收益。

着眼于自己的收益,保证自己收益,防止风险使得自己的收益变小。

以性别之战为例子:首先你得先得到一个关于妻子和丈夫的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育 xxx子期望收益(着眼于自己的期望收益): Uw(q,p)=2PQ + 0×P(1-Q) + 0×Q(1-P) +1×(1-P)(1-Q) = 3PQ - P -Q +1 前面的系数参考收益表(妻子收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,妻子的收益可能为0;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看体育,收益同样最小)这里只是在讨论妻子收益最小的可能性4.妻子的最坏收益为:minUw(p,q) = min(1-P,2P)5.最大化最坏收益: max(min(1-P,2P))解的:P=1/3则妻子的maxmin策略为:1/3概率选择韩剧,2/3概率选择体育。

同理得丈夫的maxmin策略为:1/3概率选择体育,2/3概率选择韩剧。

minmax策略 1.最小化对手最好情况下的收益。

是着眼于对手的收益。

还是这样的一个收益表 1.进行假设:妻子策略:P概率看韩剧、(1-P)概率看体育丈夫策略:Q概率看韩剧、(1-Q)概率看体育2.丈夫期望收益(着眼于对方的期望收益):(与maxmin不同要注意!!)Uw(q,p)=PQ + 0×P(1-Q) + 0×Q(1-P) +2×(1-P)(1-Q) = 3PQ - 2P -2Q +2前面的系数参考收益表(丈夫收益)3.妻子的最小收益可能为Q=0或Q=1(当丈夫选择Q=0时,意味着丈夫100%想看体育,如果这时妻子也想看体育,丈夫收益到2;当Q=1时,丈夫100%想看韩剧,如果这时妻子想看韩剧,收益同最大1)这里只是在讨论妻子收益最小的可能性xxx夫的最大收益为:maxUw(p,q) = max(2-2P,P) 5.最小化最好收益: min(max(1-P,2P))妻子的minmax策略:2/3概率选择韩剧,1/3概率选择体育同里丈夫为的minmax为…在零和博弈中,maxmin策略和minmax策略是等价的。

博弈论 金句 案例

博弈论 金句 案例

博弈论金句案例1. 博弈论啊,就像是一场看不见硝烟的战争,每个人都在算计着自己的最优解。

比如说在市场竞争里,两个卖水果的小贩,都想多赚点钱。

一个小贩想:“我要是降价,就能吸引更多顾客。

”另一个也这么想,结果都降价,最后谁也没多赚多少,这就是典型的博弈,都想自己利益最大化,却陷入了一种僵局。

2. 博弈论中,有时候选择合作可比单打独斗强多了,就像两根筷子,一根易折,两根抱团就坚韧得很。

我有俩朋友一起创业,开始都想自己占大头,互相算计,结果生意一塌糊涂。

后来想通了,合作共赢,齐心协力把公司做得红红火火。

这就是懂得博弈之后的智慧转变啊。

3. 嘿,博弈论可不是什么高深莫测的天书,它就在我们身边呢。

你看在家庭里,夫妻两人商量谁去洗碗,这也是一种博弈。

丈夫可能会想:“我要是先答应洗,以后这活儿不都归我了?”妻子也这么琢磨,于是就开始各种“谈判”,这小小的家务事里,可有着博弈论的影子呢。

4. 在博弈论的世界里,信息就是力量,就像在黑暗中你有一盏灯,而别人在摸黑。

我记得有一次参加竞拍,有个人知道那幅画的底价,我们其他人都蒙在鼓里。

他就巧妙地利用这个信息,用最低的价格拍到了画,这就是掌握信息在博弈中的厉害之处啊。

5. 博弈论里有个有趣的现象,有时候退让一步反而是向前一步。

这就好比下象棋,你为了保帅,舍掉一个小卒,看似亏了,其实是为了更大的胜利。

我工作的团队里,有两个人争一个项目负责人的位置,争得不可开交。

后来其中一个人主动退让,去辅助另一个人,结果项目成功后,他也得到了很多好处,还赢得了大家的尊重。

6. 博弈论告诉我们,别老想着占尽便宜,小心偷鸡不成蚀把米。

就像那只想要吃到葡萄又不想付出努力的狐狸,最后只能饿着肚子说葡萄酸。

有些商家为了多赚点钱,在商品里偷工减料,以为顾客发现不了,结果顾客发现后再也不买他家东西了,这就是贪婪在博弈中的下场。

7. 你知道吗?博弈论就像一场大棋局,我们每个人都是棋子,也都是下棋的人。

就像办公室里的同事们,都在为了升职加薪博弈。

博弈论的实例分析

博弈论的实例分析

博弈论的实例分析一.“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。

讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。

可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。

A和B均坦白是这个博弈的纳什均衡。

这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。

即是说,不管A坦白或抵赖,B的最佳选择都是坦白。

反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。

结果,两个人都选择了坦白,各判刑8年。

在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

二.电信价格竞争根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。

假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。

A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。

正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低10%。

这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。

在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。

这时候,A该怎么做?不妨假定:A降价而B维持,则A获利15,B损失5,整体获利10;A维持且B也维持,则A获利5,B获利10,整体获利15;A维持而B降价,则A损失10,B获利15,整体获利5;A降价且B也降价,则A损失5,B损失5,整体损失10。

博弈论的经典案例

博弈论的经典案例
(-1,-1)相对于(-8,-8)为Pareto最 优。
囚徒困境
“囚徒困境”反映的问题:
个人理性与集体理性的矛 盾!
囚徒困境
现实生活中哪些情形具有“囚徒困境”?
1. 寡头垄断市场上产量的确定,如石油输 出国组织(OPEC);
2. 公共产品的供给; 3. 美苏军备竞赛; 4. 素质教育与应试教育。
智猪博弈反映:
多劳者不多得!
智猪博弈
智猪博弈的实例:
1.股东对股份公司的监督; 2.股票市场; 3.大、小企业对新产品的开发; 4.公共产品的提供。
3 性别战
一对恋人决定周末出去活动。他们 的活动选择有——看足球和看芭蕾。
假设男孩喜欢看足球,女孩喜欢看 芭蕾,但他们又不愿意分开活动。如果 他们各自单独决策,将如何选择?
6 石头、剪刀、布
存在类似于猜硬币游戏的均衡吗?
7 市场进入阻扰博弈
在某一产品生产领域,一厂商(称为 在位者)单独生产该产品,获得高额利润 300。现有另一厂商(进入者)准备进入该 产品市场。
市场进入阻扰博弈
进入者面临的选择——“进入”或“不 进入”;
在位者面临的选择——“默许”或“斗 争”。
猜硬币
此时,甲乙都不再采用单纯“正”策 略和“反”策略,而是采用混合策略, 即以50%的概率选择策略“正”、 “反”。
甲——(50%,50%)
乙——(50%,50%)
6 石头、剪刀、布
B
石头 剪刀 布
石头 0,0 1,-1 -1, 1
A
剪刀 -1, 1 0, 0 1, -1
布 1,-1 -1,1 0, 0
囚徒困境
“囚徒困境”引申出来的结论:
一种制度(体制,协议)安排, 要 发 生 效 力 , 必 须 是 一 种 Nash 均衡。否则,这种制度安排便不 能成立。

博弈论案例分析

博弈论案例分析

(1)失火了,你往哪个门跑失火了,你往哪个门跑——这就是博弈论一天夜晚,你参加一个派对,屋里有好多人,你玩得很高兴。

这时候,屋里忽然失火,火势很大,没法息灭。

此时你想逃生。

你的眼前有两个门,左门和右门,你一定在它们之间选择。

但问题是,其余人也要争抢这两个门出逃。

假如你选择的门是好多人选择的,那么你将因人多拥堵、冲不出去而烧死;相反,假如你选择的是较少人选择的,那么你将逃生。

这里我们不考虑道德要素,你将怎样选择?这就是博弈论!你的选择一定考虑其余人的选择,而其余人的选择也考虑你的选择。

你的结果——博弈论称之为支付,不单取决于你的行动选择——博弈论称之为策略选择,同时取决于别人的策略选择。

你和这群人构成一个博弈(game)。

上述博弈是一个叫张翼成的中国人在 1997 年提出的一个博弈论模型,被称之为少量者博弈或少量派博弈( Minority Game)。

自然,本来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。

此刻好多学者在研究这个问题。

生活中博弈的案例好多,你会见到好多例子。

只需波及到人群的互动,就有博弈。

什么叫博弈?博弈的英文为 game,我们一般将它翻译成“游戏”。

而在西方, game 的意义不一样于汉语中的游戏。

在英语中, game即是人们按照必定规则下的活动,进行活动的人的目的是使自己“赢” 。

奥林匹克运动会叫Olympic Games。

在英文中,game有比赛的意思,进行 game的人是很仔细的,不一样于汉语中游戏的观点。

在汉语中,游戏有儿戏的滋味。

所以将对于game的理论,即 game theory 翻译成博弈论或许对策论,是适合的。

本书下边统称 game theory 为博弈论。

博弈论的出现只有 50 多年的历史。

博弈论的创始者为诺意曼与摩根斯坦,他们 1944 年第一版了《博弈论与经济行为》。

诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他逝世时博弈论还未对经济学产生宽泛影响,不然经济学的诺贝尔奖必定有他的名字,由于诺贝尔奖有规定,只颁发给在世的学者。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论66个经典例子篇一:《博弈论三大经典案例》经典的囚徒困境1950年,由就职于兰德公司的梅里尔•弗拉德(Merrill Flood)和梅尔文•德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特・塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。

经典的囚徒困境如下:警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:甲沉默(合作)乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑 10年乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。

参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。

另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。

就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择:若对方沉默、背叛会让我获释,所以会选择背叛。

若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论—-选择背叛。

背叛是两种策略之中的支配性策略。

因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。

以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。

但根据以上假设,二人均为理性的个人,且只追求自己个人利益。

均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。

这就是“困境”所在。

例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。

由囚徒困境可以写出类似的员工困境:一名经理,数名员工; 前提,经理比较苛刻;如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作如果某人不听从吩咐,其他人听从吩咐,则此人下岗。

其他人继续工作如果所有人都不听从经理吩咐,则经理下岗但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作.囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。

虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

{博弈论66个经典例子}.单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中,博弈被反复地进行。

因而每个参与者都有机会去“惩罚” 另一个参与者前一回合的不合作行为。

这时,合作可能会作为均衡的结果出现。

欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。

作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

智猪博弈理论在博弈论(Game Theory)经济学中,“智猪博弈”是一个著名的纳什均衡的例子。

假设猪圈里有一头大猪、一头小猪。

猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9 : 1;同时到槽边,收益比是7 : 3;小猪先到槽边,收益比是6 : 4。

那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。

{博弈论66个经典例子}.实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到 1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本,以下纯收益计算相同),而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。

在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。

这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。

“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。

这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。

斗鸡博弈斗鸡博弈(Chicken Game)其实是一种误译。

Chicken在美国口语中是“懦夫” 之意,Chicken Game本应译成懦夫博弈。

不过这个错误并不算太严重,非要把chicken game叫作斗鸡博弈,也不是不可以。

试想有两人狭路相逢,每人有两个行动选择:一是退下来,一是进攻。

如果一方退下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。

因此,对每个人来说,最好的结果是,对方退下来,而自己不退。

赢利矩阵(payoff matrix)如下:甲/乙前进后退前进(-2,-2)(1,-1)后退(-1,1)(-1,-1)上表中的数字的意思是:两者如果均选择“前进”,结果是两败俱伤,两者均获得-2的支付;如果一方“前进”,另外一方“后退”,前进者获得1的支付,赢得了面子,而后退者获得-1 的支付,输掉了面子,但没有两者均“前进”受到的损失大;两者均“后退”,两者均输掉了面子,获得-1的支付。

当然表中的数字只是相对的值。

这个博弈有两个纯策略纳什均衡:一方前进,另一方后退;或一方后退,另一方前进。

但关键是谁进谁退?当然,该博弈也存在一个混合策略均衡,即大家随机的选择前进或后退。

不过相对而言,我们更关注于纯策略均衡。

一博弈,如果有惟一的纳什均衡点,那么这个博弈是可预测的,即这个纳什均衡点就是事先知道的惟一的博弈结果。

但是如果一博弈有多个纳什均衡,则要预测结果就必须附加另外的有关博弈的细节信息。

比如,这里谁进谁退,可能就需要附加额外的细节信息才能做出判断。

选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。

这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。

但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己, 既不利己也不利他。

智猪博弈:智猪博弈(Pigs' payoffs)讲的是:猪圈里有两头猪,一头大猪,一头小猪。

猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。

如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。

当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。

对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。

反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。

{博弈论66个经典例子}.“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。

规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。

如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。

改变方案一:减量方案。

投食仅原来的一半分量。

结果是小猪大猪都不去踩踏板了。

小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。

谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

改变方案二:增量方案。

投食为原来的一倍分量。

结果是小猪、大猪都会去踩踏板。

谁想吃,谁就会去踩踏板。

反正对方不会一次把食物吃完。

小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。

对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。

改变方案三:减量加移位方案。

投食仅原来的一半分量,但同时将投食口移到踏板附近。

结果呢,小猪和大猪都在拼命地抢着踩踏板。

等待者不得食,而多劳者多得。

每次的收获刚好消费完。

对于游戏设计者,这是一个最好的方案。

成本不高,但收获最大。

原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。

但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。

为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。

而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。

比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。

这相当于“智猪博弈”增量方案所描述的情形。

但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了--- 就象“智猪博弈”减量方案一所描述的情形。

最好的激励机制设计就象改变方案三-- 减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。

许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。

股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。

相关文档
最新文档