博弈论——换一种方式思考问题_
刘庆财博弈论读后感

刘庆财博弈论读后感读了刘庆财的博弈论,我仿佛被打开了一扇全新的思维大门。
以前吧,我总觉得博弈是那种特别高深、特别复杂的东西,好像只有在商业巨头的谈判桌上,或者是国际政治的风云变幻中才会出现。
但刘庆财的这本书,用一种特别接地气的方式,把博弈论的精髓给讲得明明白白。
书里提到的那些例子,让我印象特别深刻。
比如说那个“囚徒困境”,两个小偷被抓了,分开审讯。
如果都不招供,可能都判得轻;要是一个招了一个没招,那招的那个就立功减刑,没招的那个就惨了;要是都招了,那就都没啥好果子吃。
这多像我们生活中的一些选择啊!有时候,我们和别人一起面对一个问题,都想着自己怎么能更有利,结果反而可能都陷入了不好的局面。
还有那个“智猪博弈”,大猪和小猪在一个食槽前。
大猪按按钮,小猪等着吃;小猪按按钮,大猪吃得更多,小猪可能还亏了。
这就好比在一个团队里,能力强的人可能付出得多,得到的也多,但能力弱一些的人,可能就会选择“搭便车”。
这让我想起了我工作的地方。
我们办公室有个项目,需要大家一起出力。
老张能力强,经验丰富,每次都是他冲在前面,出谋划策,干得最多。
而像我这样经验不足的,有时候就有点“偷懒”,等着老张把框架搭好,我再跟着做点边边角角的事儿。
现在想想,这不就是典型的“智猪博弈”嘛。
刘庆财在书里还讲了很多关于博弈中的策略和技巧。
他说,要学会换位思考,想想对方会怎么想,才能做出更好的决策。
这让我想起了我和我老婆去买东西的时候。
有一次我们去买家具,看中了一款沙发。
老板开价挺高,我老婆就开始砍价。
我在旁边看着,心想这能砍下来吗?结果我老婆不慌不忙,先夸了夸沙发的好,然后说我们在别的店也看到差不多的,但是价格比这低不少。
老板一听,脸色有点变了。
我老婆接着又说,要是能便宜点,我们马上就定。
我当时就在想,这老板会怎么回应呢?结果老板犹豫了一下,还真给降了点价。
后来我问我老婆,怎么这么厉害。
她说,她就是站在老板的角度想了想,老板肯定也想做成这笔生意,只要让他觉得有利可图,又不会亏太多,就能谈成。
博弈论

为将这一观点用于解释进犯行为,我们来研究一下史密斯所假设的一个最简单的例子。
假定有一个特定的物种叫鹰和鸽子(这两个名称系按人类的传统用法,但同这两种鸟的习性无关:其实鸽子是一种进攻性相当强的鸟。
)在这个物种的某个种群中只存在两种搏斗策略。
在我们这个假定的种群中,所有个体不是鹰就是鸽子。
鹰搏斗起来总是全力以赴,孤注一掷的,除非身负重伤,否则绝不退却;而鸽子却只是以风度高雅的惯常方式进行威胁恫吓,从不伤害其他动物。
如果鹰同鸽子搏斗,鸽子迅即逃跑,因此鸽子不会受伤。
如果是鹰同鹰进行搏斗,它们会一直打到其中一只受重伤或死亡才罢休。
如果是鸽子同鸽子相遇,那就谁也不会受伤;它们长时间地摆开对峙的架式,直到它们中的一只感到疲劳了,或者感到厌烦而决定不再对峙下去,从而作出让步为止。
我们暂且假定一个个体事先无法知道它的对手是鹰还是鸽子。
只有在与之进行搏斗时才弄清楚,而且它也记不起过去同哪些个体进行过搏斗,因此无从借鉴。
现在,作为一种纯粹是随意规定的比赛规则,我们规定竞赛者“得分”标准如下:赢一场50分,输一场0分,重伤者-100分,使竞赛拖长浪费时间者一10分。
我们可以把这些分数视为能够直接转化为基因生存的通货。
得分高而平均“盈利”也高的个体就会在基因库中遗留下许多基因。
在广泛的范围内,实际的数值对分析并无多大意义,但却可以帮助我们去思考这一问题。
鹰在同鸽子搏斗时,鹰是否有击败鸽子的倾向,对此我们并不感兴趣,这点是重要的。
我们已经知道这个问题的答案:鹰永远会取胜。
我们想要知道的是,究竟是鹰还是鸽子是进化上的稳定策略型。
如果其中一种是ESS型而另一种不是,那么我们认为属ESS型的那种才会进化。
从理论上讲,存在两种ESS型是可能的。
不论种群大多数成员所采取的碰巧是什么样的策略——鹰策略也好,鸽子策略也好——对任何个体来说,如果最好的策略是随大流的话,那么,存在两种ESS型是可能的。
在这种情况下,种群一般总是保持在自己的两种稳定状态中它首先达到的那一种状态。
《博弈论》学习体会范文(2篇)

《博弈论》学习体会范文《博弈论》是一门研究决策制定的数学理论,主要应用于经济学、政治学和生物学等领域。
在学习过程中,我深刻认识到博弈论对于理解决策过程和预测结果的重要性。
同时,学习博弈论的过程也启发了我对于决策策略的思考和分析能力的提升。
以下是我对于学习博弈论的体会和经验总结:一、博弈论的基本概念和模型在学习博弈论的初期,我首先了解了博弈论的基本概念和模型。
博弈论主要研究的是参与者在决策过程中的相互影响和相互作用,通过建立各个参与者的决策模型和收益函数,探讨他们在不同策略下的最佳决策方式。
在初步了解了博弈论的基本概念后,我开始学习博弈论的基本模型,包括零和博弈、非零和博弈、合作博弈等。
零和博弈是博弈论中最基本的模型之一,也是最简单的博弈模型。
零和博弈是指参与者之间的利益完全相反,一个人的收益就是另一个人的损失。
通过学习零和博弈模型,我了解到了博弈中的关键概念,例如纳什均衡和最优反应策略等。
非零和博弈是指参与者之间的利益不一定完全相反,他们的利益可能存在一定的重叠部分。
学习非零和博弈模型,我了解到了通过合作和策略选择来实现最优利益的方法。
合作博弈是指参与者之间可以通过合作来获得更好的收益的博弈模型。
合作博弈着重研究参与者之间的合作和协调,通过建立合作博弈的分配规则来实现利益的最大化。
通过学习合作博弈模型,我了解到了通过合理分配和合作博弈的方式来实现参与者之间的共赢。
二、博弈论在实践中的应用在学习了博弈论的基本概念和模型之后,我开始了解博弈论在实践中的应用。
博弈论主要在经济学、政治学和生物学等领域有广泛的应用。
在经济学中,博弈论可以应用于竞争策略、定价策略和合作博弈等方面。
通过分析参与者的策略选择和收益函数,可以为企业制定更合理和更优化的决策策略,提高利润和市场竞争力。
在政治学领域,博弈论可以用于分析选举策略、决策制定和外交政策等方面。
通过分析不同参与者的策略选择和收益函数,可以预测选举结果、分析政策争论和推断外交决策。
博弈论心得体会800字

博弈论心得体会800字博弈论心得体会博弈论是一门研究决策和策略的学科,它探讨了在不完全信息和互相依赖的情况下,个体如何作出最优的决策。
在学习博弈论的过程中,我深刻体会到了它在实际生活中的应用,并从中获得了一些有关决策和策略的心得体会。
首先,博弈论教会我更加细致地思考问题。
在博弈论中,我们需要考虑各方当事人的利益和可能的行动,推演出对方的可能反应,并根据这些信息来制定自己的策略。
这种思考方式要求我们将问题拆解成更小的部分,并综合考虑各种可能性。
通过这个过程,我发现在日常生活中,将问题拆解成更小的部分进行思考,能够帮助我更好地理清思路,做出更明智的决策。
其次,博弈论使我深刻理解了信息的重要性。
在博弈论中,信息是影响决策的关键因素之一。
不完全信息和对信息的解读都会影响到各方当事人的策略选择。
在现实生活中,我们也经常面临信息不完全的情况,比如在职场上,面试前了解对方公司的背景和行业动态能够帮助我们做出更好的准备,并在决策中获得更大的优势。
另外,博弈论让我认识到合作的重要性。
在博弈理论中存在不同的博弈策略,包括合作和对抗。
有时候,在特定的情况下,合作会带来比对抗更好的结果。
这让我深刻理解到,在团队合作中,共同努力、相互信任、互相协作是达到共赢的关键。
通过博弈论的学习,我明白了在某些情况下,放下对立的姿态,与他人建立合作关系会带来更大的收益。
最后,博弈论教会了我奉行长远思考。
在博弈中,我们需要考虑未来的利益和长期的收益,而不仅仅是眼前的利益。
这使我认识到,在生活中,一时的得失并不能代表整个结果。
我们需要从长远的角度去思考问题,并在决策中注重长远利益。
总的来说,博弈论是一门有用的学科,它在解决实际问题和决策中有着广泛的应用。
通过学习博弈论,我深刻体会到了细致思考、重视信息、合作合理利益和长远思考的重要性。
这些心得体会对于我的个人成长和职业发展都具有重要意义。
未来,我将继续学习和应用博弈论的知识,以更好地提升自己的决策能力和战略思维水平。
卡尔达诺论博弈论的原文

卡尔达诺论博弈论的原文卡尔达诺论博弈论,那可真是个挺有趣的事儿呢。
博弈论啊,就像是一场场看不见硝烟的战争,每个人都在里面算计着自己的得失。
卡尔达诺对博弈论的探讨,就好比是给我们打开了一扇通往一个神秘又充满智慧的房间的门。
博弈嘛,咱们生活里到处都是。
就拿下棋来说,下棋的时候,你得想着自己怎么走,还得琢磨着对手会怎么应对。
这就跟卡尔达诺说的博弈论有点像了。
你每走一步棋,就像是在博弈这个大棋盘上落下一子,你要考虑这一子下去,能给自己带来什么好处,又会给对手留下什么机会。
就像两个人在抢地盘,你得又聪明又谨慎。
这时候你要是能像卡尔达诺那样思考博弈论,就好像给自己脑袋里装了个小军师,在旁边给你出谋划策呢。
卡尔达诺的博弈论里肯定有很多关于概率的事儿。
你想啊,在生活中的博弈里,概率无处不在。
比如说买彩票,那就是一场超级大的博弈。
你花几块钱去买个彩票,就像是下了一个小赌注。
你心里可能想着万一中了大奖呢,可是实际上中奖的概率那是低得可怜。
这就像在一场博弈里,你做了一个选择,这个选择看似有很大的回报,可是背后的概率就像一只无形的大手,在很大程度上决定了结果。
卡尔达诺要是看到咱们现在的彩票,估计也会把它放进自己的博弈论研究里,然后告诉我们这里面的概率学问可大着呢。
再说说做生意吧。
做生意也是一种博弈啊。
你开个小商店,进什么货,定什么价格,这都是博弈的一部分。
你得想着顾客的喜好,市场的需求,还有竞争对手的情况。
这就像在一个大的博弈棋盘上,你要找到自己的立足之地。
你要是进了一堆没人要的货,就像是在博弈里走错了一步棋,可能就会面临损失。
而如果你能准确地把握市场的脉搏,就像在博弈里下了一手妙棋,就能赚得盆满钵满。
卡尔达诺的博弈论可能就会给这些做生意的人一些启示,让他们在这个复杂的商业博弈里更聪明地出牌。
在人际交往里也有博弈论的影子呢。
比如说两个人吵架了,你要是强硬地跟对方对着干,可能最后两个人的关系就破裂了。
可是如果你能换个方式,用一种温和一点、更有策略的方式去处理,就像在博弈里找到了一个新的战术。
博弈论读书笔记

博弈论读书笔记博弈论,简单来说,就是研究在互动情境中,人们如何做出决策以及这些决策会带来怎样结果的学问。
最近读了关于博弈论的相关书籍,深受启发,也有了不少思考。
博弈论中的一个核心概念是“策略”。
参与者需要根据自身的目标和对其他参与者行为的预期,来选择最优的策略。
比如在“囚徒困境”这个经典的博弈模型中,两个犯罪嫌疑人被分别审讯,如果两人都保持沉默,那么各自可能只会被轻判;但如果其中一人供出对方,而对方保持沉默,那么供出的一方将获得减刑,而沉默的一方将受到重罚。
在这种情况下,从个体角度看,供出对方似乎是最优策略,但如果两人都这样想,最终的结果却是两人都受到较重的惩罚。
这就引出了一个重要的问题:个体的最优策略不一定能带来整体的最优结果。
另一个有趣的概念是“纳什均衡”。
它指的是一种状态,在这种状态下,任何一方单方面改变策略都不会使自己的情况变得更好。
比如在商家竞争的例子中,假设两家公司 A 和 B 都在考虑是否降价促销。
如果 A 降价而 B 不降价,A 会获得更多市场份额;如果 B 降价而 A 不降价,B 会获得更多份额;如果两家都降价,利润都会减少;如果两家都不降价,利润维持在一个相对稳定的水平。
在这种情况下,两家都不降价就是一个纳什均衡,因为任何一家单方面降价都不会带来更好的结果。
博弈论在现实生活中的应用非常广泛。
在商业领域,企业之间的竞争就是一场博弈。
比如在市场份额的争夺中,企业需要考虑竞争对手的策略来制定自己的营销策略、定价策略等。
又比如在谈判中,双方都在揣摩对方的底线和期望,以争取最有利的结果。
在国际关系中,博弈论也有着重要的地位。
国家之间在贸易、军事、外交等方面的互动都可以用博弈论来分析。
例如,在核裁军谈判中,各国需要权衡自身的安全需求和国际压力,做出相应的决策。
在日常生活中,博弈论同样无处不在。
比如在和朋友玩游戏时,我们会思考对方可能的行动来决定自己的下一步;在分配家务时,家庭成员之间也存在着某种程度的博弈。
博弈论技巧

博弈论技巧博弈论技巧在现实生活中有着广泛的应用,无论是在商业领域、政治决策还是个人交往中,都可以看到博弈论的身影。
博弈论是研究决策制定者如何在有限信息和利益冲突的情况下做出最优决策的一门学科。
在这篇文章中,我将简要介绍几种常见的博弈论技巧,并且通过具体的例子来说明它们的应用。
我们来谈谈“囚徒困境”。
这是博弈论中最著名的例子之一,用于描述两个囚犯面临的选择。
在这个博弈中,如果两个囚犯都选择合作,则会得到较轻的刑罚;如果两个囚犯都选择背叛,则会得到较重的刑罚;如果一个囚犯选择合作,另一个囚犯选择背叛,则背叛者会得到较轻的刑罚,而合作者则会得到较重的刑罚。
这个博弈的核心是互相信任和合作的重要性。
如果两个囚犯都能够相信对方会合作,那么他们就可以达成最优解。
接下来,我们来谈谈“拍卖”。
拍卖是一个常见的博弈论场景,用于描述多个竞争者之间的竞争。
在拍卖中,每个竞争者都会根据商品的价值和自己的预算来制定竞价策略。
如果一个竞争者估计商品的价值高于其他竞争者,他就会提高竞价;如果一个竞争者估计商品的价值低于其他竞争者,他就会放弃竞价。
在这个博弈中,竞争者需要根据对其他竞争者的了解来制定自己的竞价策略,以达到最优解。
还有许多其他的博弈论技巧,如“合作博弈”、“博弈树”等。
这些技巧都有助于我们在决策过程中做出最优选择。
通过运用博弈论的思维方式,我们可以更好地理解他人的决策动机,从而更好地应对各种复杂的情况。
博弈论技巧对于我们的决策制定和交往方式都有着重要的启发。
通过学习和运用博弈论,我们可以更加理性地思考问题,并在有限的信息和资源下做出最优选择。
无论是在商业谈判、政治协商还是个人交往中,博弈论都能够为我们提供有力的支持和指导。
希望这篇文章能够帮助读者更好地理解和运用博弈论技巧,提高决策的效果和交往的质量。
博弈论知识点总结完整版

博弈论一:基本知识1.1定义:博弈论;又称对策论;是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论;是研究竞争的逻辑和规律的数学分支..即;博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用;以及不同决策主体之间的均衡..1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数;是博弈最重要的基本要素..1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论..两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议binding agreement..倘若不能;则称非合作博弈Non-cooperative game..合作博弈强调的是集体主义;团体理性;是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大;强调个人理性、个人最优决策;其结果有时有效率;有时则不然..目前经济学家谈到博弈论主要指的是非合作博弈;也就是各方在给定的约束条件下如何追求各自利益的最大化;最后达到力量均衡..博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息;是否了解两个角度进行..把两个角度结合就得到了4种博弈:a、完全信息静态博弈;纳什均衡;Nash1950b、完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾1965c、不完全信息静态博弈;贝叶斯纳什均衡;海萨尼1967-1968d、不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾1975 Kreps; Wilson1982 Fudenberg; Tirole19911.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5博弈模型的两种表示形式:策略式表述 Strategic form; 扩展式表述Extensive form1.6占优均衡:a、占优策略:在博弈中如果不管其他参与人选择什么策略;一个参与人的某个策略给他带来的支付值始终高于其他策略;或至少不劣于其他策略;则称该策略为该参与人的严格占优策略或占优策略..对于所有的s-i; si称为参与人i的严格占优战略;如果满足:uisi;s-i>uisi';s-is-i; si' sib、占优均衡:一个博弈的某个策略组合中;如果对应的所有策略都是各参与人的占优策略;则称该策略组合为该博弈的一个占优均衡..1.7重复剔除严劣策略均衡:a、“严劣”和“弱劣”的含义:设 s i’和s i’’是参与人i可选择的两个策略;若对其他参与人的任意策略组合s-i; 均成立u i s i’; s-i < u i s i’’; s-i; 则说策略s i’严劣于策略s i’’ ..上面式子中;若将“<”改为“≤”;则说策略s i’弱劣于策略s i’’ ..b、定义:重复剔除严格策略就是各参与人在其各自策略集中;不断剔除严劣策略…如果最终各参与人仅剩下一个策略;则该策略组合就被称为重复剔除严劣策略均衡..二:纳什均衡Nash Equilibrium2.1纳什均衡定义:对于一个策略式表述的博弈G= {N;S i; u i; i ∈N}; 称策略组合s=s1; …s i; …; s n是一个纳什均衡;如果对于每一个i ∈N; s i是给定其他参与人选择s-i={s1; … ;s i-1; s i+1; … ;s n} 情况下参与人i的最优策略经济理性策略;即:u i s i; s-i≥ u i s i; s-i; 对于任意的s i∈S i ;任意的i∈N均成立..通俗定义:纳什均衡是一种策略组合;给定对手的策略;每个参与人选择自己的最优策略..纳什均衡是一种稳定的策略组合:当所有参与人的选择公开以后;每个人都满意自己作出了正确的选择;没有人能得到更好的结果了..在博弈论中这种结果被称为纳什均衡NE..2.2定理:Nash在1950年证明:任何有限博弈;都至少存在一个NE——Existence of Nash Equilibrium..即在一个有n个参与人的策略式博弈G={S1;…;Sn; u1;…;un}中;如果n是有限的;且Si是有限集i=1;…;n;则该博弈至少存在一个纳什均衡在混合策略意义下Wilson1971证明;几乎所有有限博弈;都存在有限奇数个NE;包括纯策略NE和混合策略NE..——Oddness Theorem2.3纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理 a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡;但反过来不一定成立;定理 b 纳什均衡一定不能通过重复剔除严劣策略方法剔除..2.4划线法先找出自己针对其他博弈方每种策略或策略组合对多人博弈的最佳对策;即自己的可选策略中与其他博弈方的策略或策略组合配合;给自己带来最大得益的策略这种相对最佳策略总是存在的;不过不一定唯一;然后在此基础上;通过对其他博弈方策略选择的判断;包括对其他博弈方对自己策略判断的判断等;预测博弈的可能结果和确定自己的最优策略..这就是划线法..2.5箭头法箭头法对于理解博弈关系很有好处;是寻找相对稳定性策略组合的分析方法..对博弈中的每个策略组合进行分析;考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益..如能;则从所分析的策略组合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组..最后综合对每个策略组合的分析情况;形成对博弈结果的判断..划线法和箭头法的结果是一致的;可以相互替代..三:混合策略Mixed Strategies 纳什均衡3.1定义:混合策略的定义:在博弈G={N; Si; ui; i∈N}中;假设参与人i的纯策略构成的策略集合为Si={si1;…; sik};若参与人i 以概率分布pi=pi1;…; pik 在其k 个可选策略中随机选择“策略”;称这样的选择方式为混合策略..这里;0≤pij ≤ 1;对于j=1 ;…; k 都成立;且有; pi1+…+ pik=1..纯策略可看成特殊的混合策略..上述定义是在有限博弈前提下进行的..3.2混合策略意义下策略组合的表述{x1∈X1; …; xn∈Xn};其中Xi ; i =1; …; n表示参与人i所有纯策略生成的概率空间;xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为{1/2; 1/2;1/2; 1/2}3.3VNM效用函数Von Neumann and Morgenstern冯·诺依曼和摩根斯坦如果某个随机变量X以概率Pi 取值xi;i=1;2;…;n;而某人在确定地得到xi时的效用为uxi;那么;该随机变量给他的效用便是: UX =P1ux1 + P2ux2 + ... + Pnuxn表示关于随机变量X的期望效用..因此UX称为期望效用函数;又叫做冯·诺依曼——摩根斯坦效用函数VNM函数..3.4基于混合策略意义下的博弈策略式表述定义:基于v-N-M效用的策略式博弈由 a、参与人集合 b、每个参与人有一个纯策略集合 c、对于每一个参与人来说;由所有参与人纯策略组合构成的风险结果空间;存在一个v-N-M效用3.5混合策略意义下的纳什均衡定义:对于博弈G= {N; Si; ui; i∈N};基于v-N-M效用的混合策略组合α是一个纳什均衡;若对于每一个i; 以及i的任意一个混合策略αi;α对应的期望支付至少和αi;α-i 的期望支付一样大换句话说;称混合策略组合α是一个纳什均衡;如果没有一个参与人通过偏离策略αi 实现支付的增加3.6一个定理对于N-人静态博弈问题;设混合策略纳什均衡对应的策略组合为Xi ; X –i ..对于任意的i ;若最优混合策略为Xi= {x1;…;xl;0…0}不失一般性;假设前l个分量严格大于0;记分量xk k=1;…; l 对应的纯策略sk;则对于参与人i而言;sk与其他参与人的最优混合策略组合X –i 形成的局势的收益值;等于纳什均衡混合策略组合 Xi; X –i 的收益值..即ui sk; X –i = ui Xi; X –i 成立 ; k=1;…; l3.7方法:a、求解混合策略均衡可以用期望收益等值法b、2×2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡四:多重纳什均衡解及其分析4.1 帕雷托占优均衡帕雷托占优均衡的含义是:在多个纳什均衡中;若存在一个纳什均衡;其支付结果针对每个参与人而言都严格优于其它纳什均衡;则该纳什均衡是帕雷托占优纳什均衡..4.2风险占优均衡risk-dominant equilibrium参与人对风险占优均衡的选择倾向;有一种强化的机制..当部分或所有参与人选择风险占优均衡的可能性增强的时候;任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小;而这又使得帕雷托占优均衡策略的支付更小;从而形成一种选择风险占优均衡策略的正反馈机制;并使其出现的概率越来越大..当参与人数目增加时;选择合作的风险将会更大;可借助该点考虑招标机制如何减少投标方勾结问题..上述问题是我们知道建立诚信机制社会的重要意义..上述问题引出一个博弈相关分支为协调博弈coordination game4.3聚点均衡由实际问题抽象出来的博弈模型中;更多的一类问题是:多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系;如夫妻爱好问题的两个纯策略均衡..这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例;在实际中往往二人很默契地知道如何进行博弈;双方往往知道怎么进行选择策略;且能够相互了解这里面排除了互相协商后达成的一致实际博弈中参与人往往会利用博弈模型以外的信息;实现对特定博弈均衡一致关注的“聚点”这些信息如:参与人共同的文化背景或规范;共同的知识;具有特定意义事物的特征;某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规律性;但因为涉及因素太多;对于一般博弈模型很难总结普遍规律;只能具体问题具体分析聚点:人们通常会协调彼此的行为..你弱他就强;先例产生的影响远大于逻辑或者法律效力;人们总是乐于安守现状或接受自然形成的界线三八线4.4相关均衡correlated equilibrium实际上;在现实中遇到选择困难时;特别是在长期中反复遇到相似选择难题时;常会通过收集更多信息;形成特定的机制和规则;为某种形式的制度安排等主动寻找思路..相关均衡就是这样的一种均衡选择机制..对于实际中比较复杂的博弈问题;参与人是否有能力设计这种机制;并且有足够能力理解、信任这种机制;是有一定疑问的..相关均衡作为社会经济制度创新的一种解释也许更有意义..4.5防共谋均衡coalition-proof equilibrium 定义:如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果;即单独改变策略无利可图该策略组合是纳什均衡..b、给定选择偏离的参与人有再次偏离的自由时;没有任何两个参与人通过“串通”改变博弈的结果..c、依此类推;直到所有参与人都参加的串通也不会改变博弈的结果..满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中;若部分参与人通过某种形式的默契或串通形成小团体;可能得到比不串通个大的支付..这就是多人博弈的共谋问题..防共谋均衡是指这样的一个纳什均衡;在该均衡局势下;少数参与人集合不能通过均衡策略的偏离;实现更好的局部利益..防共谋均衡是两个以上参与人参加的博弈中;参与人在帕雷托占优均衡中进行合作思想的扩展..五:动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成;具有明显的阶段性..博弈的结局、各参与人的收益由多阶段决策结果确定..各参与人的决策有一定的顺序..由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性;通常用扩展式extensive form表述法描述这些信息..5.2博弈的扩展式表示参与人集合:i=1; … ;N..用N表示虚拟参与人“自然”;自然的含义是某些外生的客观概率分布事件参与人的行动顺序the orderof moves:描述各参与人在什么时候行动;参与人的行动空间actionset:在每次行动时;参与人可选择的行动集合;参与人的信息集information set:每次行动时参与人知道什么;参与人的收益函数:在行动结束之后;每个参与人得到些什么..自然选择的概率分布假定自然状态是共同知识..对于有限博弈;博弈树是常用的表述方式..5.3博弈树a若动态博弈是有限博弈;则可用博弈树表示该博弈..这里有限的含义是:各阶段各参与人的行动数目有限;博弈的阶段数有限..b博弈树的基本结构为结点nodes..包括决策结及终点结..决策结是参与人采取行动的时点;终点结是博弈行动路径的终点..枝branches..从一个决策结到它的直接后续结的连线;每一个枝代表参与人的一个行动选择..信息集..是决策结集合的一个子集..将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集..注:每个决策结都是同一个参与人的决策结..该参与人知道博弈进入该集合的某个决策结;但不知道自己究竟出于哪一个决策结若该信息集有两个或两个以上元素..5.4对于有限动态博弈;若参与人对彼此在各决策结点的行动集合;彼此的效用函数;历史的行动有着完全的了解;则称这样的博弈为完全信息动态博弈..如果博弈树的所有信息集都是单元素集;称该博弈为完美信息博弈game of perfectinformation..上述两个定义的差别在于对自然行动信息的描述..5.5动态博弈的策略式表述a相机选择contingent play动态博弈中参与人的策略是各自预先设定的;在博弈的各阶段;针对各种情况做出相应决策..即“等待”博弈到达自己的信息集包含一个或多个决策结后再决定如何行动..在策略式表述博弈中;参与人似乎是博弈开始之前就制定出了一个完全的相机选择;即“如果……发生;我将选择……”..b从扩展式表述构造战略式表述若把B的信息集从左到右排列;上述四个纯策略可以简单记为{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}..上面四个纯策略含义:当A选择开发时;B选择大括号中前面的策略;当A选择不开发时;B选择大括号中后面的策略..B的纯策略为:{开发;开发}{开发;不开发}{不开发;开发}{不开发;不开发}A的纯策略为:SA=开发;不开发于是可以写成策略式表述形式;为开发;开发开发;不开发不开发;开发不开发;不开发开发-3;-3-3;-31;01;0不开发0;10;00;10;0在扩展式表述博弈中;所有n个参与人的一个纯战略组合s=s1;…;sn决定了博弈树上的一个路径..比如开发;{不开发;开发}决定了博弈的路径为A 开发 B 不开发1;05.6完全信息动态博弈纳什均衡存在性定理如果有限博弈是完美信息博弈;他还有一个纯战略纳什均衡Zermelo;1913..5.7逆向归纳法:a逆向归纳法求解策略:从动态博弈的最后一个阶段出发;对该参与人采用经济理性原则进行分析;逐步到推回前一个阶段相应参与人的行动选择;一直到第一阶段的分析方法..b逆向归纳法是求解完美信息动态博弈的经典方法..逆推归纳法是完美信息动态博弈分析中使用最普遍的方法..c与策略式分析比较:如果A选择U;那么B的信息集不能达到;我们说B的信息集不在均衡路径上out-of-equilibrium path.. 此种情况下;B的选择对A没有什么影响..因此;纳什均衡对一个参与人在非均衡信息集上的选择没有限制..但是;一个参与人在非均衡信息集上的战略可以影响其他参与人在均衡信息集上的选择..d逆向归纳法实质上是重复剔除劣战略法在扩展式博弈中的应用..逆向归纳法适不用于无限博弈和不完美信息博弈..逆向归纳法剔除了“非理性”的均衡策略5.8子博弈完美均衡子博弈精炼纳什均衡①子博弈概念:一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结Tx组成;它满足下列条件:x是一个单结信息集;即hx={x};对于所有的Tx中的x’;如果x’’与x’同属于一个信息集;则x’’也在Tx中..需要说明的是;G本身是自己的一个子博弈..②子博弈完美纳什均衡子博弈精炼纳什均衡扩展式博弈的一个战略组合s=s1;…;s i;…;s n是一个子博弈完美纳什均衡;如果它是原博弈的纳什均衡..它在每一个子博弈上都是纳什均衡③纳什均衡与子博弈精炼纳什均衡的关系前面分析说明;一个特定的纳什均衡决定了原博弈树上唯一的一条路径;这条路径称为“均衡路径”equilibrium path..相对该纳什均衡;其他路径称为非均衡路径out-of-equilibrium path..在每一个子博弈上给出纳什均衡意味着;构成子博弈纳什均衡的战略不仅在均衡路径的决策结上是最优的;同时在非均衡路径的决策结上也是最优的..对于有限完美信息博弈;前面介绍的逆推归纳法得出的纳什均衡即是子博弈精炼纳什均衡..六多阶段静态博弈6.1该类模型中至少在某个阶段参与人同时选择其决策..这类模型实质上就是完美信息动态博弈;因此仍然可以采用逆推归纳法进行分析..因为存在同时选择;因此每个阶段不再是单人优化问题;而是一个静态博弈..6.2前向归纳法:前面已经说明;完美信息动态博弈的经典求解方法为逆序归纳法..还有一种分析方式;就是前向归纳法forward induction..前向归纳法由科尔博格和莫顿斯1986提出..这里不进行严格的数学描述;仅通过一个例题进行说明..6.3重复博弈重复博弈repeated game的定义指同样结构的博弈重复多次;其中的每次博弈称为“阶段博弈stage game”..如两个多次犯罪的“囚徒问题”..由于动态博弈是相机行动;反映到重复博弈中;就是可以使自己在某个阶段的博弈选择依赖于其他参与人过去的行动历史..影响重复博弈均衡结果的主要因素是博弈重复次数和信息的完备性completeness..重复次数对参与人可能会有的影响是:参与人为了获得长远利益而牺牲眼前利益的策略成为可能..关于完备性;简单地说;但一个参与人的支付函数不为其他参与人所知时;该参与人可能有积极性建立一个“好”的声誉reputation以换取长远利益..在社会行为中;经常可以看到本质不好的人在相当长的时期内干好事的原因..定理:令G是阶段博弈;GT是G重复T次的重复博弈T<∞..那么;如果G有唯一的纳什均衡;重复博弈GT的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次即每个阶段博弈出现的都是一次性博弈的均衡结果..上述定理说明;只要博弈的重复次数是有限的;重复本身并不改变囚徒困境的均衡结果..上述定理中“唯一性”是一个重要条件..如果纳什均衡不是唯一的;上述结论就不一定成立..当博弈有多个纳什均衡时;参与人可以使用不同的纳什均衡惩罚前面阶段的不合作行为或奖励第一阶段的合作行为..(七)不完全信息静态博弈不完全信息静态贝叶斯博弈贝叶斯纳什均衡海萨尼转换拍卖理论八合作博弈可传递效用 transferableutility合作博弈的特征函数合作的分配可行分配核心的定义 Shapley 值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论——换一种方式思考问题博弈论——换一种方式思考问题花了一个月的时间研究了下博弈论,收获很多,于是又花了一个礼拜写了这篇算是读后感的日志,希望能激起大家对博弈论的兴趣,尤其是几个经典博弈,真的很有意思。
Ø 博弈论的内涵什么是博弈论?简单的说,就是“互动的决策论”,指在充分考虑对方的决策后做出的决策。
“博弈论”的英文是“Game Theory”,所以博弈论最贴切的直译是“游戏理论”。
现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,对于冯·诺伊曼我们更为熟知的头衔是“计算机之父”,其实,他还有另一个身份,就是“博弈论之父”。
1944年,他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。
诺伊曼与摩根斯特恩认为,博弈论就是运用数学的方法研究有利益冲突的双方在竞争性活动中制定最优化策略的理论。
但是诺伊曼所解决的只有二人零和博弈,1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法。
这是整个现代博弈论中最重要的思想之一。
相信很多人都知道纳什,因为那部经典的奥斯卡最佳影片《美丽心灵》,他传奇的人生,坚强的毅力,深深的打动了我。
他在普林斯顿大学深造时,冯·诺伊曼正好在普林斯顿任教,那个时候的普林斯顿还聚集了众多著名的科学大师,包括罗伯特?奥本海默、诺曼·斯蒂恩罗德以及爱因斯坦,据说纳什曾经造访过爱因斯坦,向他讲述自己对于重力的看法。
在一个小时的讨论之后,爱因斯坦对纳什说:“年轻人,你应该来学一点物理。
”1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。
他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。
表面上看,博弈论似乎是数学家玩的游戏,而事实上,博弈论首先是我们思考现实世界的一套逻辑,其次才是把这套逻辑严密化的数学形式,博弈论的目的在于巧妙的策略,而不是解法。
我们学习博弈论的目的,不是为了享受博弈论的分析过程,而在于赢得更好的结局。
说到底,博弈论只是一个分析问题的工具,用这个工具来简化问题,使问题的分析清晰明了就够了。
Ø 博弈论的基本概念首先我们需要了解的是纳什均衡。
在某个房地产开发中,假定市场需求有限,只能满足某种规模的开发量,A、B两个开发商都想开发这一规模的房地产,如果A选择开发,则B的最优策略是不开发,同样,如果B选择开发,则A 的最优策略是不开发。
这时无论对A还是B,都不存在一种策略优于另一种策略,也不存在严格劣策略(不论其它人采取的策略,某人采取对自己不利的策略)。
研究这类问题的均衡解,需要引入纳什均衡。
在纳什均衡中,每个参与人都确信,在给定其它参与人的策略情况下,己方选择了最优策略。
所以在纳什均衡点上,每个参与者的策略都是最好的,此时没人愿意先改变或主动改变自己的策略。
在博弈论中,博弈行为都可以分为两类,即零和博弈与非零和博弈。
零和博弈是一种完全对抗,强烈竞争的对局。
参与者的总收益为零,因此一个参与者的所得必然是另一个参与者的损失。
而非零和博弈,是各参与者的目标不完全对立,参与者只按本身的厉害关系单方面做出决策,有时为了共同利益而合作,有时为了个人利益而对立,收益的总和是可变的,参与者可以同时有所得和有所失。
在博弈论中,最基本的假设之一就是:人是理性的。
所谓理性人是指行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。
而现实生活中,人们在做决策时往往是有限理性的。
每个人都不是绝对聪明的人,而且绝对聪明的人也未必会用绝对聪明的方式去做决策,因此博弈论是有局限性的。
尽管如此,人类至今还没有找到一种比博弈更好的思考工具,可以对现实的客观世界进行如此近似的描述。
就像力学是自然科学的哲学和数学一样,博弈论是社会科学的哲学与数学。
没有牛顿力学我们连最简单的物理现象都无法理解;同样的道路,没有博弈论我们也无法解释分析很多的社会现象。
Ø 囚徒困境:博弈论的经典模型有这样一个案例:两个共同偷窃的犯罪嫌疑人甲和乙被带到警察局。
警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到同伴的选择。
警方虽然怀疑他们作案,但手中没有掌握确凿的证据,于是分别告知两名犯罪嫌疑人:对犯罪事实的认定及相应的量刑完全取决于他们自己的招供。
如果你们一方供认,而另一方抵赖,那么供认方将作为证人无罪释放,而另一方将被判10年徒刑;如果双方都与警方合作,共同招认,则都将被判5年有期徒刑;如果双方均不认罪,则各判2年。
我们先不管这样的量刑方式是否合理,假设规则就是这个样子,从常理来看,双方都不认罪是最好的选择,但从博弈论角度出发,对于A 来说,如果B招供,则A如果不招供的话,将会受到重罚,因此A的最佳策略是招供,如果B 不招供,A的最佳策略仍然是招供,所以理性的A一定会选择招供,对于B来说,也是一样的道理。
这样双方都招供就是一个纳什均衡。
从逻辑上分析确实没问题,但生活中我们可以这样来分析问题吗?有这样一则故事:两位交往甚密的大学生修化学课。
两人在小考、实验和中期考中都表现都很优秀。
在期末考试前的周末,他们非常自信,于是去参加了一场聚会。
聚会太尽兴了,结果周日这天睡过了头,来不及准备周一的考试,要知道,大学里的考试全都要看考前一两天的复习。
他们没有参加考试,而是向老师撒了个谎,说在回来的路上轮胎爆了,由于没有备用胎,只好整夜在路边整夜等待救援。
现在他们太累了,请求老师容许他们隔天再考。
老师想了想,同意了。
他们便好好准备了一个晚上,周二来考试了。
老师安排他们在两间教室做答。
第一个题目在考卷第一页,占了十分,非常简单,两人都写出了正确答案,心情舒畅的翻到了第二页,第二页只有一个问题,占了九十分,题目是:“请问是哪只轮胎爆了?”结果不言而喻,两位学生只有乖乖向老师认错。
所以利用囚徒困境,我们至少可以学到一点,在生活中,如果能善于建立囚徒困境,往往能将看似很棘手的问题用很简单的方法解决。
也许你现在跟我一样有一个疑问,按照上面的分析,对每个参与者来说选择背叛永远比选择合作获得更多的利益,在现实生活中,这显然不合理。
原因在于博弈的次数问题,在任何博弈中,表现最好的策略直接取决于对方采用的策略,总的来说,如果你认为今后将难以与对方相遇,或者你不关心自己未来的利益,那现在就选择背叛。
而事实上,现实生活中反复交往的人际关系,则是一种“不定次数的重复博弈”。
因此,我们在博弈过程中,必然要考虑是否还有重复博弈的可能,如果将来的重复博弈带来的利益要更多的话,那当前博弈就会选择合作。
有了重复博弈还是不够的,当我们在确定合作时必须要制定相应的规则,规定背叛后的惩罚,只有带剑的契约才是游戏合作的保证。
当参与者在博弈过程中选择背叛后为此要付出更大的代价后,就自然降低了他的背叛动机。
从囚徒困境中我们获得以下几点启发:第一,善于建立囚徒困境,如上面警察与教授就通过建立囚徒困境成为了“渔翁得利”者。
第二,当自己处于不利地位时可以将对方也拉入囚徒困境中,为自己谋得最大利益。
《战国策》有这样一则故事,公元前522年,楚平王怀疑太子谋反,迁怒于伍家,将伍子胥的父亲与哥哥均杀害,伍子胥只身逃往吴国。
在逃亡中,伍子胥被守关的斥候抓住,伍子胥说:“你知道楚王为什么要抓我吗?是因为有人跟楚王说我有一颗宝珠,可我的宝珠已经丢失了,楚王不信,以为我在欺骗他。
没有办法,我只有逃走,现在你抓住我,还要把握交给楚王,那我将在楚王面前说是你夺去了我的宝珠,并吞到肚子里,楚王为了得到宝就一定会先把你杀掉。
”斥候信以为真,就赶紧把伍子胥给放了。
这是书中提到的一个故事,听起来有点假,不过还是可以说明问题的。
在这个故事中,伍子胥自身处于极不利的形式,但他巧妙的构造了一个囚徒困境,而且自己先做了决策。
本来斥候的最大利益是将伍子胥送给楚王,并且伍子胥不揭发他,而这是伍子胥的严格劣策略,也就是说伍子胥肯定不会采取这个策略的,而在伍子胥肯定揭发他这个前提下,斥候做出的最好选择就是放了伍子胥。
呵呵,是不是有点绕啊,不过把关系理顺了,还是觉得用博弈论来分析问题确实挺有意思的。
第三,也是囚徒困境最直接告诉我们的一个道理,在大多数情况下,背叛都是最优的选择。
也许你要说道德问题,当然,如果是朋友跟亲人,那就先忘了博弈吧,而如果我们身陷囚徒困境中,就应该分析形势,首先判断与对方有无再合作的可能,如果本次合作会为双方将来谋得更大利益,则选择合作;如果不是的话,而双方又无严格的相互约束的话那就要选择背叛,因为对方同样有背叛的倾向,不背叛自己的利益就会受到侵害。
Ø 酒吧博弈:混沌系统中的博弈这也是博弈论中的一个经典模型,而且很有意思,案例是这样的:假设有100个人很喜欢泡酒吧。
这些人在每个周末,都要决定是去酒吧活动还是待在家里休息。
酒吧的容量是有限的,也就是说座位是有限的。
如果去的人多了,去酒吧的人会感到不舒服。
此时,他们留在家中比去酒吧更舒服。
假定酒吧的容量是60人,如果某人预测去酒吧的人数超过60人,他的决定是不去,反之则去。
这100人如何做出去还是不去的决定呢?这个博弈的前提条件做了如下限制:每一个参与者面临的信息只是以前去酒吧的人数,因此,他们只能根据以前的历史数据,归纳出此次行动的策略,没有其它的信息可以参考,他们之间更没有信息交流。
酒吧问题所模拟的情况,非常接近于一个赌博者下注时面临的情景,比如股票选择、足球博彩。
这个博弈的每个参与者,都面临着这样一个困惑:如果许多人预测去的人数超过60,而决定不去,那么酒吧的人数会很少,这时候做出的这些预测就错了。
反过来,如果有很大一部分人预测去的人数少于60,他们因而去了酒吧,则去的人会很多,超过了60,此时他们的预测也错了。
因而一个做出正确预测的人应该是,他能知道其他人如何做出预测。
但是在这个问题中每个人预测时面临的信息来源都是一样的,即过去的历史,同时每个人无法知道别人如何做出预测,因此所谓正确的预测几乎不可能存在。
呵呵,如果知道怎么去预测,那了解博弈论的人都可以去买炒股了。
有位学者通过真实的人群以及计算机模拟两种实验得到了两个迥异的、有趣的结果。
在对真实人群的实验中,实验对象的预测呈有规律的波浪状形态,更多的博弈者是根据上一次其他人做出的选择而做出这一次的预测,这种预测是一个非线性的过程。
所谓这样一个非线性的过程是说,系统的未来情形对初始值有着强烈的敏感性,这就是人们常说的“蝴蝶效应”:在北京的一只蝴蝶动了一下翅膀,华盛顿就下了一场大暴雨。
通过计算机的模拟实验,得出了另一个结果:起初,去酒吧的人数没有一个固定的规律,然而,经过一段时间后,这个系统去与不去的人数之比接近于60:40,尽管每个人不会固定地属于去或不去的人群,但这个系统的这个比例是不变的。