囚徒困境与价格战
浅析博弈中的囚徒困境

浅析博弈中的囚徒困境班级:姓名:学号:摘要:囚徒困境是博弈论的非零和博弈中具代表性的例子,个人最佳选择并非团体最佳选择,个人理性有时会导致集体的非理性——机关算尽却因而作茧自缚,这就是囚徒困境所反映的问题。
一经典的囚徒困境“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
两个共谋犯罪的人被关入监狱,不能互相沟通情况。
如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人隐瞒,则揭发者因为立功而立即获释,隐瞒者因不合作而入狱五年;若互相揭发,则因证据确实,二者都判刑三年。
从集体上看,他们应当互相合作,都隐瞒,这样总服刑时间最短(为2年)。
但他们会仔细考虑对方可能采取什么样的选择,并从自身利益出发做出选择。
他们会意识到,如果同伙隐瞒而自己背叛,就能使自身利益最大化(0年)。
但他也意识到,他的同伙也不傻,也会这样来设想,这样的话,他就更不可能让同伙得利(服刑0年)而自己受害(服刑5年)所以结论就是,唯一正确的选择就是背叛同伙,把一切都告诉警方,如果他的同伙保持隐瞒,那么他就会是那个获释出狱,服刑0年。
而如果他的同伙也向警方交代了,那么,他只需服刑3年而不是5年。
所以结果只能是两个囚犯都坐牢服刑3年,而不是都服刑1年。
所以对于他们个人来说都是理性的,然而对集体来说却是非理性的。
二重复多次如果囚徒困境的情况重复多次,会有什么新的变化?假设重复10次。
我们可以合理地设想,如果囚徒第一次被对方指控,第二次这个囚徒也会指控对方。
相反,如果第一次相反,如果第一次别人保持隐瞒,建立了互信的关系,你也会保持隐瞒,导致最优。
当然,两个囚徒都会有相似的想法,在第一局保持隐瞒,以期望建立互信关系,所以双方都会保持隐瞒。
好的纳什均衡例子(一)

好的纳什均衡例子(一)好的纳什均衡什么是纳什均衡?纳什均衡是博弈论中的一个重要概念,指的是在博弈参与者之间形成的一种稳定和平衡的策略选择状态。
在纳什均衡下,任何一个参与者都无法通过改变自己的策略来获得更大的利益。
好的纳什均衡指的是存在多个纳什均衡时,其中某些纳什均衡比其他纳什均衡更为理想。
例子一:囚徒困境囚徒困境是博弈论中最经典的例子之一。
假设有两个犯人,他们因为涉嫌合谋犯罪被捕,警察只有有限的证据。
警察与每个犯人分别进行单独审讯,并给他们提供了合作和背叛两个选项,这两个选项对应于认罪和抵赖。
如果两个人都选择合作,即认罪,则每个人都会被判刑2年;如果两个人都选择背叛,即抵赖,则每个人都会被判刑5年;如果一个人选择合作而另一个选择背叛,则合作的人会被判刑6年,而背叛的人会被判刑1年。
在这个案例中,存在两个纳什均衡:互相背叛和互相合作。
然而,互相合作是更为理想的纳什均衡,因为如果两个人都选择合作,他们的总刑期将会最短,只有2年。
例子二:拍卖拍卖是另一个常见的博弈场景。
假设有两个竞拍者A和B,他们在一个拍卖会上竞价购买一件物品。
物品的最低价格为100元。
竞拍者A知道他的估值是200元,而竞拍者B知道他的估值是150元。
他们每次可以按照一定幅度加价,但不能超过自己的估值。
在这个案例中,存在两个纳什均衡:A出价200元,B不出价;B 出价150元,A不出价。
然而,对于卖家来说,A出价200元,B不出价是更好的纳什均衡,因为这样卖家可以以更高的价格售出物品。
例子三:价格战价格战是市场竞争中常见的博弈情景。
假设有两家公司A和B,它们在同一个市场上销售类似的产品。
它们可以根据自己的利润目标制定价格。
如果两家公司的价格相等,则它们将平分市场份额;如果一家公司的价格比另一家低,则它将获得更大的市场份额。
在这个案例中,存在两个纳什均衡:价格相等和一家公司的价格低于另一家。
然而,价格相等是更好的纳什均衡,因为这样两家公司可以共享更多的市场份额,并且避免因为价格战而导致的利润下降。
“博弈论”中的经典案例

“博弈论”中的经典案例“博弈论”中的经典案例“博弈论”中一些经典案例,不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然。
“博弈论”中有一些由点及面、发人深思的经典案例,这些案例不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然;不仅成为“博弈论”中的一道亮丽风景,也是整个经济学领域中的学术奇葩。
1、囚徒困境假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。
警察局将这两名嫌疑犯分别关押以防他们串供。
两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。
对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。
但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。
对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。
对于囚徒B而言也是如此。
最后两人都会选择交代。
因此,囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。
囚徒困境现象在现实生活中比比皆是。
记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。
住户在公共楼道里堆满了杂物,结果大家都极不方便,以致即将分娩的妇女都没法及时被送往医院。
但你如果不占用公共楼道,别人也会占用。
每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。
但占用的结果却最终损害了大家的利益。
前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的价格战使所有生产厂家都遭受重创,这也是一种囚徒困境。
2、斗鸡博弈两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。
在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。
囚徒困境的根源与启示

这种想法合理吗? 在第十局时,互信的关系明显是没有意义的,因为十局已经完结,囚徒
没有必要为维持互信的关系而沉默(没有第十一局),所以第十局囚徒一定会 背叛对方的,理由和只有一局囚徒困境一样。
问题是,既然大家都知道在第十局,无论如何对方都会背叛自己的,你 在第九局保持沉默也是没有意思的,要知道,保持沉默(友好关系)的原因是 为了希望下一局别人保持沉默。所以第九局双方都一定会背叛对方的。
下一个问题是,双方都有相同的想法,明知第九局对方会背叛自己,所 以第八局保持沉默也是没有意思的,第七局亦然,如此类推,纳什均衡是十 局都会互相背叛,建立互信关系是没有可能的。
只有在囚徒困境的局数大家都不肯定的情况下,上述的推论才不会发生, 才会出现互相保持沉默的现象
在个体之间存在行为和利益相互制约的博弈 结构中,以个体理性和个体选择为基础的分 散决策方式,无法有效地协调各方面的利益, 并实现整体、个体利益共同的最优。简单地 说,“囚徒的困境”问题都是个体理性和集 体理性的矛盾引起的。
自然,供应商也会如此推理。按照博弈论的 观点,这是唯一的平衡点,在这一点上,任何一 方改变策略,都会得到更差的结果。
囚徒困境的实际运用
但是,这与我们的日常经验不符合。为什么现 实中的供应商与经销商都会选择合作呢? 原因在于: 1.不嫉妒,现实中的博弈大多是非零合的。大家赚 取自己应有的利润,没有理由去嫉妒对方的高额利 润,因为对方的成功是你成功的前提。 2.不首先背叛,对合作或背叛都要给于惩罚。在契 约社会,有法律、行规的制约,背叛是要付出巨大 的代价的。再回到囚徒困境中,则是黑社会团伙对 囚犯家属的行动。这会让囚徒在做决策时,偏向于 合作。当双方尝到合作的甜头,又知道背叛的惩罚 后,合作就会成为第一选择。 囚徒困境的解决方法应该在困境本身之外。
走出价格战的浅议

企业之间的价格战将导致双方都陷入“囚徒困境”的艰难处境, 双方利益均遭到了损害, 让双方取得了与初衷完全相反的结果。
因此在通常情况下企业应避免进行对各方均不利的价格战。
要想走出“价格战”的困扰, 就必须更新市场观念,创新经营策略在品种创新、新品开发上下功夫以技术竞争取代价格竞争。
【关键词】博弈论价格战囚徒困境中国商品市场上的价格战是在中国特定的历史条件下发生的,是在计划经济向市场经济转型、由“卖方市场”向“买方市场”转变产生的。
按博弈论的理论,竞争双方往往只考虑降价对市场份额占有的增加,而没有考虑对双方利润的影响。
一、对价格战基于“囚徒困境”的理论分析囚徒困境(Prison Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。
价格战中,企业与竞争者的博弈为非合作博弈。
双方的策略为降价和不降价。
为分析简单起见,现考虑一个行业只甲,乙两个企业,生产同质的、完全替代的商品,完全占有市场的份额。
降价前双方的收益都为R。
现甲企业实行降价策略,以期扩大其市场占有份额,此时不考虑另一方的策略,即乙企业不降价,则甲企业通过降价增加的利润为a,此时乙企业将损失的利润额为 a.如果乙企业也实行降价策略,并且降价幅度与甲企业一样多,则甲乙企业利润将面临相同的损失b,并且此时乙的损失b小于降价前的损失a(见得益矩阵)。
由上表知,在给定甲企业的策略时,乙的占优策略是降价;同样的,在给定乙企业的策略时,甲的占优策略是降价。
因此(降价,降价)构成该非合作单次博弈的纳什均衡,相应的收益为(R-b,R-b)。
由此可见,现实生活中,如果有企业开始实行降价策略,而其他企业又面临选择时,为实现企业利润的最大化,任何一个理性经济主体的选择都是降价。
而经过上述分析,长久的看来,等该行业所有的企业都对价格调整到位的时候,整个行业的利润是会受到削减的。
这就是企业在实行价格战时掉入的“囚徒困境”。
二、解决方法的探讨由以上的博弈分析可见, 企业之间的价格战将导致双方都陷入“囚徒困境”的艰难处境, 双方利益均遭到了损害, 让双方取得了与初衷完全相反的结果。
从价格战看囚徒困境

微波炉这一领域 展开竞争 , 一开始的价格都是 P 。A( 其他厂商 ) 业, 实力比较雄厚 , 技术慢慢成熟 , 管理 目趋完善。
B 是微 波 炉 新 兴 企 业 , 是政 府 扶 植 起 来鼓 励 竞争 的 , 的 价 B
B不坦 白或者 B坦 白 A不坦 白 , 这是博 弈的结果 。A和 B均坦 白是这个博弈的纳什均衡 。假定 A选择坦 白的话 , 好是选 B最
逐 步壮大 , 到了一定程度 , A造成了影响。这时候 , 对 A该 怎么
做 ?不妨假定 : A降价而 B维持 , A获利 1 , 则 5B损失 5 整体获 ,
的收益 , 于是谁 也没有动力游离这个 组合 , 因此 这个组合 就是
纳 什 均衡 。 在 这 个 案 例 中 , 个 囚徒 从 自 私 的 立 场 出 发 做 出 自 己 的策 两 略 选 择 , 表 明 了 囚 徒 之 间信 用 的 缺 失 , 警 察 诱 导 的 作 用 也 这 但
择坦 白 , 为 B坦 白判 8年 而 抵 赖 却 要 判 1 ; 定 A 选 择抵 因 0年 假
老牌 企业 , 力雄厚 , 实 技术 成熟 , 管理 完 善 ; 格 兰仕 ) B( 新兴企
赖的话 , B最好还是选择坦 白,因为 B坦 白将 不被判 刑而抵赖 确要被判刑 1 年。换而 言之 , 不管 A坦 白或抵赖 , B的最佳选择 都是坦 白。同样地 , 不管 B是坦 白还 是抵赖 , A的最佳选择也是 坦 白。 结果 , 两个人都选择 了坦 白, 各判刑 8年。 坦 白、 白) 在( 坦
经 营
战 略
■r
【 摘要 】 价格战是一种非常重要 的营销 手段 , 合理利 用价
格 杠 杆 可 实现 有 效 的 市场 竞 争 , 频 繁 的 价 格 战 则是 违 背 市 场 但
从博弈论看价格战

案例:从博弈论看价格战一、从“囚徒困境”谈价格战的合作双赢假设两个企业垄断或几乎垄断了某种商品的市场,他们都想争夺市场,击败对手,以争取更大的利润.能否方彼此相残,在他们的争斗中会不会存在合作的可能性呢?我们用典型的博弈论案例来讨论他们之间关系的本质.可以看到,通过博弈论的分析.这些问题的答案是肯定的。
“囚徒困境”博弈是博弈论中的著名案例.警察抓住了两个罪犯.但是警察局却缺乏足够的证据指证他们所犯下的罪行,如果罪犯中至少有一人供认犯罪,就能确认罪名成立.为了得到所需的口供,警察将这两名罪犯分别关押以防止他们串供或结成攻守同盟,并分别跟他们讲清了他们的处境和面临的选择:如果他们两人中有一人坦白认罪.则坦白者立即释放而另一人将重判8年徒刑;如果两个人都坦白认罪,则他们将被各判5年监禁:当然若两人都拒不认罪.因警察手上缺乏证据,那他们会被以较轻的妨碍公事罪各判一年徒刑。
如果我们用-1、-5、-8分别表示罪犯被判1年、5年、8年的得益,用0表示罪犯被立即释放的得益,则可以用右图中的得益矩阵将这个博弈表示出来。
在这个博弈中,两个博弈方对对方的可能得益完全知晓,并且各自独立做出策略选择。
每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对自己得益的影响,因此他会根据对方两种可能的选择分别考虑自己的最佳策略。
该博弈的具有稳定性的解是两博弈方共同选择坦白策略,此时双方得益如上图矩阵中的黑体数字表示.更糟的是.通过运用有限次重复“囚徒困境”博弈的研究结果我们知道,如果该博弈在后来的时期内不断重复,因为每个博弈方互相知晓对方可能的得益,他们明白即使在最后一轮博弈中,也会被对方出卖。
因此,在任何一次重复的博弈中都不存在合作的激励因素.从头至尾他们都会出卖对方。
博弈双方在决策时都以自己的最大利益为目标,结果是无法实现最大利益或较大利益.甚至导致对各方都最不利的结局,这种情况在现实生活中具有相当普遍性。
囚徒困境典型案例:彩电价格战

囚徒困境典型案例:彩电价格战彩电价格和彩电“价格峰会”第一波:1988年在国内彩电市场仍处于供不应求的状态下,长虹以高于国家牌价,低于黑市价的手段,作价卖给四川工商银行一批17英寸彩电作为奖品开展有奖储蓄活动。
到1989年初,国家对彩电征收特别消费税,彩电市场一下陷入低迷,彩电企业产品普遍积压,资金短缺。
长虹敏锐捕捉到商机,从8月9日起,每台彩电降价350元,向消费者让利销售。
可以说,这是中国彩电第一次降价,而长虹是唯一的赢家。
第二波:1996年3月26曰,当时中国最大的电视机生产厂家四川长虹电器股份有限公司宣布大幅度降低其主导产品彩电的销售价格,其规格由43cin至74cm共76个品种,降价幅度从8%至18%,降价额由100元至850元。
虽然长虹声称此举是针对4月1日开始的大幅度降低进口关税而作出的重大举措,但是,人们几乎未看到进口彩电有何反应,倒是其他国内彩电企业纷纷闻风而动――TCL彩电宣布:以拥抱春天为题自4月份到奥运会结束期间让利5%;康佳则以迎奥运五环大奖回报消费者为口号,大搞产品促销活动――由此引发了自1989年以来彩电市场的又一次降价风潮。
如果说自上一次彩电降价后,几年来彩电市场的竞争还是比较温文尔雅的话,那么,此次长虹又一次率先大规模降价,则使竞争局面变得表面化,白热化。
有资料显示,在长虹降价后的一个月内,北京彩电市场的国产彩电销售格局发生重大变化,像长虹、康佳、TCL王牌等主动参与此次降价风潮的企业在北京的市场销售均有大幅度提高,尤其是长虹的销售几夺榜首,那些在生产规模、技术水平、资金实力方面有诸多不足的企业则明显大受影响。
第三波:然而,降价并未停止。
继长虹降价之后,康佳集团紧随其后,掀起了更大规模的降价浪潮。
1996年6月上旬,在中国几大新闻媒体《经济日报》、《中国电子报》等报刊上同时刊出一份深圳康佳电子集团的“宣言”,称康佳要“领先国内,赶超世界”,其广告词称:“谁升起,谁就是太阳”,矛头直指“长虹”,摆出了一决雌雄的架势。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
囚徒困境与价格战
"人不为己,天诛地灭"这句古话虽然过于极端,但揭露了人性中的理性自利一面。
在很多时候,个体理性带来的却很可能是集体的不理性,如果每个人都仅按照自利的原则行事,其结果往往是所有人都遭受损失。
博弈论中的"囚徒困境",正是对这一现象的真实写照。
在我们的日常社会经济生活中,"囚徒困境"可谓无处不在。
如家电企业和商场的价格战为何屡见不鲜?
博弈论发展至今,已成为一门显学,"囚徒困境"则是其中最经典的模型之一,由数学家Tucker于1950年提出。
"囚徒困境"描述的是,警方将两个嫌疑犯A
和B关在两个独立的房间里单独审讯,并告诉他们:如果有一人坦白,坦白者将被当场释放,不坦白者将被判重刑。
事实上如果两人都不坦白,则警方只能将他们都无罪释放,当然这一点警方是不会告诉他们的。
这样看来,A和B毫无疑问应该互相合作,共同保持沉默,但事实并非如此。
以A为例,他认为如果自己不坦白,而B坦白的话,B就会无罪释放,却留下自己独守牢狱;当然此时如果B 也不坦白,情况是最佳的,但A无法确信B在这样的诱惑下能不动心。
而在A
选择坦白的情况下,无论B坦白与否,A受到的惩罚都轻于前者。
因此A最终会选择坦白。
同理B也会做出坦白的决定,结果就是A、B二人一起坐牢。
"囚徒困境"说明的是,每个人都理性地考虑自身利益最大化,采取各自的最优策略,但最终结果却适得其反。
或许你会说如果A和B事先约定好"攻守同盟",情况就会不同。
但事实上,在缺乏足够制约和交流的情况下,"同盟"基本上会不攻自破。
现在家电业的"价格战"中也布满了"囚徒困境"的阴影。
多年来,国内各家电企业都在不停地降价、降价、再降价。
以彩电业为例,自1996年3月长虹发起第一轮价格战以来,一场又一场的价格大战此起彼伏,各家电企业杀得天昏地暗,结果是多败俱伤,出现全行业大面积亏损。
在产能严重过剩、产品同质化的市场
格局下,每个企业都希望通过降价占领市场份额,结果谁都没有从中获利。
当然有时候价格战的发起原因是为了降低库存等,但其本质并没有脱离"囚徒困境"的范畴。
有趣的是,家电业也曾搞过多次"价格联盟",姑且不论是否违背《反不正当竞争法》,其实这种约定本身就是无效的。
因为联盟内企业数量众多,经营状况各不相同,为了缓解生存压力等原因,总有个别企业迫不及待地又使出降价这一损招,于是联盟迅速瓦解,行业再一次陷入价格战的泥潭。
与家电业十分相似的是商场价格促销的日趋疯狂。
以"满就送"为例,从"满100送8"逐渐演绎到现在的"满400送400"。
曾经也有商家呼吁叫停这种近似疯狂的促销,也搞过类似家电业的"价格联盟",但结果还是瞬间瓦解。
与家电业不同的是,商场具有较强的区域性,一个地区的商场数量相对有限,按理说信息沟通和合谋相对容易,但事实上"囚徒困境"再一次发挥了魔力,合谋同样不可能真正实现。
这一方面是由于商场面临短期考核压力,有时以牺牲利润为代价拼命做大销售额;另一方面是因为谁又能保证其它商家一定会严格遵守合谋约定呢?更有甚者,部分商家丧失理性,其目标已不是自身利益最大化,而是把竞争对手挤垮。