从博弈实验看博弈论作为社会科学方法论的局限性

从博弈实验看博弈论作为社会科学方法论的局限性
从博弈实验看博弈论作为社会科学方法论的局限性

博弈论课堂实验

博弈论课堂实验。 第一个实验是二级价格拍卖,拍卖品被强制地规定为对每个同学价值10元。让他们出价。结果有1人出8元,有2人出9元,有9人出10元,有5人出11元,有2人出12元,有1人出13元,还有7人出到15元或以上。 第二个实验是苏比克拍卖。我以10元人民币向同学拍卖。依次有同学出价5元,6元,7元,10元,11元,最后叫10元的同学放弃。我10元钱拍卖得到21元(净赚11元)。 第三个实验是选美博弈,结果如下: 学生编号第一轮第二轮第三轮第四轮 1503972 2252533 3313186 4402333 52520207 6281772 723622320 83030102 9251276 101312100 115216 12505071 1390901414 142556100 1551000 163212 176860148 181111 19262642 20351532 21444411

220022 23252075 2440000 25101003 26251205 2755500 282548155 293029157 30303274 3138844 32251386 3315752 34152582 35250.9 2.53 36303073 372510010 ===================== 补充:二级价格拍卖规则是,每个人写下他们的出价交给拍卖者,出价最高的人得到拍卖物品,但他只需要付出次高价格的价钱。其余人未得到物品,也不付钱。课堂的实验结果表明约有1半的人出价超过了其对于物品的评价,这并不是理性的选择。理性的结果应该是出价为其对物品的评价。但是,这也可能是因为事前强制了物品对他们价值10元有关(每个人都清楚此物对其他人价值十元)。不过,出价高于、低于十元仍是不理性的。 苏比克拍卖规则:直接叫价拍卖,喊价最高者得到拍卖品(10元钱),但是喊价最高和次高的都需要付出其喊价给拍卖者。理性的做法是不参加拍卖,或者一旦有人参加则自己放弃参加。因为会出现轮番加价的陷阱。 选美博弈规则:每人任选[0,100]区间的一个整数,然后以众人的选择求平均,再在平均值基础上乘0.5,得到一个数,与这个数越接近的选择就得到越高的回报(成绩分数,譬如确定分数计算的公式为100-|xi-0.5∑xi/n|,以此记载学生平时成绩一次)。标准的博弈论解最后是大家都会选择0。但是很多实验表明结果并不如此,因为很多时候人们不一定有这么深的推理能力,即使自己有这样的推理能力也不能确保其他人有同样深的推理能力。课堂实验结果与其他许多同样的实验结果是差不多的。最初人们多选择20-40的数字,但是重复数次后就出现向零方向的收敛,尤其是在获悉前次博弈的结果的时候。选美博弈的思想最早可

博弈论的书心得体会

博弈论的书心得体会 篇一:阅读博弈论类书籍的心得体会 阅读博弈论类书籍的心得体会 图书情报宋静思 最近阅读的书目主要围绕在博弈论领域,由浅入深的从博弈论平话类书籍到博弈论的理论应用类书籍都有一些涉猎。近一个月来我所阅读的书目主要有王则柯的《新编博弈论平话》、高志明的《生存博弈》、黄涛的《博弈论教程—理论、应用》以及张维迎的《博弈论与信息经济学》。由于个人能力与知识储备的限制,对以上书目的认识理解和心得也是有限的,下面我仅对上述书目中能够引起我思考的一些理论和案例展开分析并阐述我的一点见解,以及提出我所认为的这些博弈理论可以分析的社会现象。 一、对博弈论平话类书籍的心得 首先从王则柯教授的《新编博弈论平话》和高志明教授的《生存博弈》这两本书使我我深刻的认识到博弈论作为一种科学的思维方法对我们在日常生活中科学的做出决策有重大的意义。它们都是以比较浅显的例子和故事普及博弈论的一些知识和方法,阐发博弈论的一些思想和观念。从囚徒困境、情侣博弈、诺曼底登陆模拟和慕尼黑谈判模拟等能够引起读者兴趣的故事入手,介绍静态博弈、动态博弈、纳

什均衡、零和博弈、双赢对局、帕累托优势、子博弈精炼纳什均衡等博弈论的基本概念,以及劣势策略消去法、相对优势策略下划线法、确定混合策略纳什均衡的反应函数法、动态博弈的倒推法等博弈论基本方法,在以上两本书的论述中很少使用到高等数学的知识,这两本书是使我对博弈论产生兴趣的启蒙老师,帮助我了解博弈论的若干初步知识。 从最初对这两本书的阅读我真正理解了什么是博弈决策,就拿我们生活中报考什么学校、从事什么职业、选择何种方式度过周末闲暇时光等这些例子来说,之所以称之为博弈决策,是因为在这些例子当中,我的身边往往存在和我情形相似的决策者,我们的思维和行动相互之间产生着很微妙的互动影响。博弈论研究的目的,就是要清晰地揭示蕴涵于这种互动影响中的基本概念和原理,从而帮助我们建立策略思维的意识。 看过囚徒困境后,我明白了为什么寡头企业不选择在市场上结盟而是竞相采取低价策略企图抢占更多的市场份额;又为什么多数情形是非合作博弈。虽然通过囚徒困境的博弈分析我可以理解上述现象产生的原因,然而究其根本原因,是什么导致了囚徒困境呢?这不禁引发了我的思考。设想如果两个罪犯充分相信同伙遵守最初的约定死咬着抵赖会有最后的困境出现么?如果联盟内部成员相信彼此遵守约定

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论第七章习题

第七章习题 一、判断下列表述是否正确,并作简单分析 (1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。 答:错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。 (2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。 答:正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。 (3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。 答:正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。 (4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。

答:错误。不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择,其他博弈方也会替他考虑。因为设定自己所有类型下的行为,实际上是要弄清楚其他博弈方对自己策略的判断。 (5)“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。 答:错误。“鼓励—响应”机制也就是说真话的直接机制,实际上只保证博弈方揭示,也就是说出自己的真实类型。 博弈方不直接选择行为,也不保证根据真实类型行为,更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带有随机选择机制的,并不一定理想。实际上对所有博弈方都理想的结果在静态贝叶斯博弈中本身不一定存在。 二、双寡头古诺模型,倒转的需求函数为 ()P Q a Q =-, 其中12Q q q =+为市场总需求,但a 有h a 和l a 两种可能的情况,并且厂商1知道a 究竟是h a 还是l a , 而厂商2只知道h a a =的概率是θ, l a a =的概率是1θ-,这种信息不对称情况双方都是了解的。双方的总成本仍然是i i i c q cq =。如果两厂商同时选择产量,问双方的策略空间是什么?本博弈的贝叶斯纳什均衡是什么? 解:设厂商1已知h a a =时的产量为11()h q a q =,已知l a a =时的产量是11()l q a q =;再假设厂商2的产量是 2q ,这两个函数关系就是两个厂商的策略空间。 11211()h h h h h a q q q cq π=---

博弈论课程心得体会

《博弈论与信息经济学》课程心得体会 作为一名会计专业硕士,我选修这门课程是为了了解和学习一种思想方法,这种方法我很早就感兴趣,电影《美丽的心灵》中纳什的故事让博弈论在我心中显得非常神秘和高大上。第一堂课吕老师谈到博弈论已经成为一种主流方法时,学习的欲望变得更为强烈。经过九周的学习,尽管由于有些地方因为数学能力有限,不得尽懂,但我觉得自己起码已经揭开了这种方法的入门和核心的面纱。 我认为,会计专业硕士是为了培养立足于会计的高级管理人才而设置的,除了扎实的专业知识和理论功底,我觉得掌握思想方法是尤为重要的能力。面对会计行业的变革,作为一名研究生,财务管理能力和管理会计能力是我的核心竞争力。这两种能力需要缜密的思维,科学的方法。如果说缜密的思维更需要在学习和实践中不断历练,科学的方法就需要不断地去接触和了解,不断地去主动学习。博弈论就是一种科学的方法。我觉得博弈论是一种寻求均衡的科学,也是一种创造规则的科学。它让我了解面对不同利益相关者时怎么去寻求均衡、博弈,甚至创造有益的规则。同时,它让我有了一种更加科学、简洁的视角看待事物,非常实用有效而且简单漂亮。 博弈论的核心应该是纳什均衡,这是一个理性的策略组合,每个参与者在对方的选择一定情况下会做出纳什均衡策略组合中的策略。这种选择将是每个理性参与人最终的选择。这个道理很明了,也正是明了让这个理论非常有力。吕老师带着我们解决一个又一个案例中的问题时,我感觉到这种方法的神奇和独特。我印象里最深的是吕老师对法律的看法:法律让不可置信的承诺变成可置信的承诺,好的法律是看似严苛,但很少有人触犯它。以前在学习经济法时,我对“法律是一种合同”这种观点不是很在意,吕老师的说法让我有了新的认识。让不可置信承诺变成可置信的承诺,使得最有益的策略组合成为纳什均衡,在这一点上合同和法律的目的和性质是一样的。我还记得吕老师说《反国家分裂法》是一部非常好的法律,在以前我因为它几乎很少被使用而感觉不到这部法律的重量,但从博弈论的角度来看,这部法律使得针对台湾,宣布独立就会被制裁成为一种可置信的承诺,吕老师的解释让我非常赞同。我真的觉得自己看某些问题的视角发生了变化,更加地深刻和科学。 我觉得正是这种视角是我学习这门课程最大的收获。我知道,短短九周的学习远远不足以掌握博弈论,我甚至或许不能完整地计算出一道例题,但是我对它有了一个基本的认识,理解它的理论基础,最重要的在看一些问题时我可以尝试着用博弈论的角度去试试看。最可怕的不是不会用博弈论的技术和方法,可怕的是在能够使用它时我不知道以它的角度去看待问题,知道可以使用这门科学的技术和方法。经过这两个多月的课程,相信将来如果用的着这种方法时,我知道从哪里着手去学习。

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

(数学建模教材)7第七章对策论

第七章 对策论 §1 引言 社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来 解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,Leibnitz 等。现代对 策论起源于 1944 年 J.,V on Neumann 和 O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。 对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展 的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常 生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。 在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对 抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目 标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并 力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否 存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。 §2 对策问题 对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的 努力而是各方所采取的策略的综合结果。 先考察一个实际例子。 例 1(囚徒的困境) 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大 量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个 人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑 18 个月;如果双 方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从 宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A 、 B 被判刑的几种可能情况列 于表 1。 表 1 表 1 中每对数字表示嫌疑犯 A 、B 被判刑的年数。如果两名疑犯均担心对方供认并希 望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i )局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局 中人。通常用 I 表示局中人的集合.如果有 n 个局中人,则 I = {1,2,L , n }。一般要求 一个对策中至少要有两个局中人。在例 1 中,局中人是 A 、B 两名疑犯。 (ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参 加对策的每一局中人 i , i ∈ I ,都有自己的策略集 S i 。一般,每一局中人的策略集中 至少应包括两个策略。 -154- 嫌疑犯 B 供认 不供认 嫌疑犯 A 供认 不供认 (3,3) (0,7) (7,0) (1.5,1.5)

(完整word版)博弈论给我的心得

博弈论给我的心里体会 潘慧明 201202034049 12金融数学 我是大学第二学期开始选修学习《博弈论》的,并且以前对它停留在表面意思。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过这个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。并且学习后我还有个感受就是:博弈论有两个比较enlightening的观点,一是more information can hurt you(掌握更多的信息可能是一件坏事),二是more options can hurt you(拥有更多的选择可能是一件坏事).虽然博弈论主要用于研究经济问题,但是我觉得这些原理在我们现实生活中同样是适用的。 而且经过这段时间的学习,我现在对《博弈论》有了些比较肤浅的认识。诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。因此在生活中我们要懂得学以致用,要会灵活的去使用这门学科。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。这些双赢的事例,在商务上经常可以看到的。如:商务上的谈判,完完全全的运用到了《博弈论》的知识与原理来分析问题,并且从而找到最佳的均衡点,也就是最好的解决方法。 在所有的对抗和较量中,其胜负成败常常取决于三个基本的因素:机会或者说运气、体能和智能。头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每

博弈论与纳什平衡

博弈论与纳什平衡 博弈论(game theory)对人的基本假定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。 纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。 所有的博弈问题都会遇到三个要素。在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略(strategies)是承认了杀人事实,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人,另外一个抵赖,不承认杀人,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的死刑判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。 类似的:我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。 在互联网这个原始丛林中:最优策略是如何产生的呢? 一、博弈中最优策略的产生 艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。 社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。 显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。 对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选C,他选D得5

博弈论初学心得总结(可编辑修改word版)

博弈论学习心得 (全校性选修课期末论文) 序:初识博弈论 通过“囚徒困境”,我走进了博弈论这一精彩世界。为了让大家对博弈思想有一认识与掌握,老师课堂上让我们思考了不少或生动或实际的问题,比如“帽子”问题、强盗分金币问题、猜 全班数字的平均数问题、拍卖问题、市场进入问题等等。我曾自嘲地对舍友说:博弈论简直就 是对智商的考验,总觉得自己脑子不够使啊。不过,我相信,学习博弈论是会使人变聪明的,脑子越用越灵嘛。 学习博弈论的过程中,脑子里经常出现的几句话是:原来这个问题可以这么去想,原 来这种问题还可以用博弈的思想来解决,原来博弈的应用范围这么广,原来看似与数学无 关的问题都可以通过数学来解决。 博弈论,为我呈现了一方新天地。我好奇它的广度,敬畏它的深度,视之如导师如利器,小心摸索着。 一、博弈思想 学习博弈论,我最大的收获不是记住了什么模型、公式、转换,而是博弈思想。“授之 以鱼,不如授之以渔”,博弈思想尤如“渔”一般重要,是分析问题的基础。 博弈,需要换位思考,需要知已知彼。一定要充分考虑自己和其他参与者的各种战略 以及对彼此的影响,从而采取最佳行动。 比如课堂上一个问题:让每个人选一个介于1~100的数,谁的数字最接近全班平均 数的2/3,谁就是赢家。如果每个人随机选择的话,大家平均值应该在50 左右,50 的2/3 应该是33. 3,不过其他人可能也想到了这一点,这样就应该写22.2。如果继续想下去, 大家的平均值应该越来越小,最后1应该是理性分析的最佳答案。实际结果,普通如我的 只想了一步,33,有的人多想了一步,有的人多想了两步……答案总不会是1。 其实答案是什么不重要了,重要的是一个思考的过程。是一个“你知道我知道你知道 我知道你知道……”的N次换位思考的过程,你要知道他人有有多聪明,还要站在对方的 角度考虑对方认为你有多聪明…… 面对一些事情时,可能不需要过分多虑,太过天才,在一群平凡人中,反而不会是赢家。比如那些选了1的人。但是换位思考的方式却是受用终生的,可指导我们少吃亏、少 走弯路、尽可能快乐且适如地生活在复杂的社会中。 博弈的另一个重要思想,我认为是缜密的逻辑推理、全局意识以及化繁为简的转换。 比如在不完全信息博弈中,你所了解的信息是有限的,这就需要你想出各种可能性以及各 种战略组合下的收益。要分析别人的心理、分析影响别人行动的因素,分析各种战略组合 的概率,从而执果索因,比如完全信息动态博弈中的“逆向归纳法”,比如通过“海萨尼转换”将不完全信息博弈表述为完全但不完美信息的博弈(市场进入问题),从而充分利用已 有信息找到最优战略或均衡。可谓是“眼观六路,耳听八方”,“运筹帷幄”。 二、博弈案例分析两则

博弈论

1.“求爱博弈”:“自然”以P和1-P的概率决定求爱者是善良还是邪恶,但被求爱者不知道求爱者的真实情况,只知道其不同类型的概率分布,得益矩阵如下:通过海萨尼转换表示以上博弈问题; 找出该静态贝叶斯博弈贝叶斯纳什均衡。 *善良求爱者得益矩阵 被求爱者 接受不接受 求爱者求爱100,100 -50,0 不求爱0,0 0,0 *邪恶求爱者得益矩阵 被求爱者 接受不接受 求爱者求爱100,-100 -50,0 不求爱0,0 0,0 https://www.360docs.net/doc/d89663957.html,im、Peter和John三人,由于Wet特被谋杀而受到传讯。犯罪现场的证据表明,可能有一名律师参与了对Wet特的谋杀。 这三人中肯定有一人是谋杀者,每一名可疑对象所作的两条供词是:Laim:(1)我不是律师。(2)我没有谋杀德怀特。 Peter:(3)我是个律师。(4)但是我没有杀害德怀特。 John:(5)我不是律师。(6)有一个律师杀了德怀特。 警察最后发现:a.上述六条供词中只有两条是实话;b.这三个可疑对象中只有一个不是律师。 你知道是谁杀害了德怀特吗? 3.张教授、李同学和王同学一起做推理实验。张教授用两张小纸片,各写一个正整数,且两者差是1。他把一张纸片贴在李同学额头上,另一张贴在王同学额头上。于是,两个人只能看见对方额头上的数。张教授不断地问:你们谁能猜到自己头上的数吗? 李说:“我猜不到。” 王说:“我也猜不到。” 李又说:“我还是猜不到。” 王又说:“我也猜不到。” 李仍然猜不到; 王也猜不到。 李同学和王同学都已经三次猜不到了。 可是,到了第四次,李同学喊起来:“我知道了!”王同学也喊道:“我也知道了!”问:李同学和王同学头上各是什么数?

博弈论心得体会

博弈论心得体会 最初选择博弈论,是因为看了《美丽心灵》电影后,因而对John Forbes Nash Jr和博弈论产生了浓厚的兴趣。当看到选修课新开了博弈论,简直激动的不能自已,迫不及待就报名参加了。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在。 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 在社会中,人与人之间的对抗和较量是一个不容回避的话题,只有直面这些问题,个人才更有可能获得成功的机会。在所有的对抗和较量中,其胜负成败常常取决于3个基本的因素:机会或者说运气、体能和智能。通过抛硬币来赌输赢是纯粹依赖于个人运气的游戏;百米赛跑的胜负基本上取决于个人的全身技能;而篮球赛、战争等对抗,虽然也会受到运气的影响,体能也很重要,但决定胜负的更重要的因素是头脑技能的较量。 头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每个人每天都在与他人打交道,或竞争或合作。身处这样高度互动的环境之中,无论一个人是否知道博弈论,实际上他都不断地在与他人进行博弈,无论是他的父母、亲人、兄弟、老师还是商场对手、政治敌人……一个人可能不知道博弈论为何物,但是他的确常常在与他人进行着对抗和较量,在进行着一场又一场博弈;而生存本能,也让人们在不知不觉中学会了不少技巧。难怪经济学家萨缪尔森这样说着:“要在现代社会做一个有文化的人,你必须对博弈有一个大致的了解。”不过,对于大多数的人来说,学习博弈论并不是一件轻松的事情。 因为正式的博弈理论往往是用数学语言表达出来的,而社会中的大多数人都有数学恐惧症,虽然对于少数人来说数学的形式是那么优美,但大多数人把博弈论的学习看做是一件艰难的而痛苦的事情。 如果我们能熟练地掌握这一部分博弈论知识,对我们的学习和工作都大有裨益。深感短短一个学期的时间,对于博弈论这一门独具魅力的课程,只是从皮毛上略有了解。尽管如此,我还是学会了一种以博弈的观点来思考、分析、判断、解决问题的方法。就好比囚徒博弈的现象,我以前可能能够猜到结果,但这只是知其然而不知其所以然罢了。然而现在可就不同了,相似的问题我都能够用所学的博弈论知识去解释,能够了解其本质了。 我学过一段时间博弈论,一些思维过程中也可能自觉不自觉地使用一些博弈论思想,当制订政策或游戏规则,要保证所有人有参与积极性。这来源于“纳什均衡”概念,说起来当然简单。但我自己觉得,以前所知道的这条道理——制订游戏规则要保证所有人有参与积极性——是简单接受,没有逻辑,或者,在直觉层次觉得这是对的,但没有认识到它为什么对。千万不能把别人当傻瓜,如果把别人当傻瓜,吃亏的是自己,就像那个卖猫的故事。

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论与实验研究(泽尔腾)

我今天讲的是博弈理论,这也是实验研究的一个重要基础。首先是博弈论的起源,它来自德国冯·诺依曼1928年的文章。但博弈论的真正开始是冯·诺依曼和摩根斯腾(John von Neumann-Oskar Morgenstern)1944年的著作《博弈论和经济行为》。 先来讲一下什么是博弈论,博弈论是基于目标导向的冲突和合作中交互作用的数学建模和分析方法,即一种数学建模的分析方法。博弈论研究的情况发生在几个参与者发生目标导向交互作用的时候,交互作用包括冲突、合作或者二者并存。参与者可以是人,也可以是动物,还可以是人类构成的组织,如企业间的冲突和合作等。 下面,我们需要澄清一些误解,即博弈论不是什么。为何它不是帮助我们赢得纸牌赌博或者轮盘赌的学问?从长期来讲,你是不会赢得这些人机游戏的,它们不是多个参与者的活动。博弈论也不是告诉人们如何通过投机在股票市场上致富的理论。另外,博弈论给你一些基本的思考原则和启示,但也不是帮你赢得下棋或者扑克等复杂游戏的理论。那么,博弈论对于什么有帮助呢?博弈论是一种提供参与者在交互过程中策略和行动的内在逻辑洞察力的学问,可以应用到人类社会的经济理论、政治理论、军事理论或者生态演化理论中,也可以用于机制设计和成本会计等具体领域。 接下来,我们通过一个例子来说明博弈论的一些基本概念。 这里有三个企业(i =1, 2, 3)互相竞争,处在一种求大于供的市场,x i (x i 的取值区间为0到20)为各个企业的产品供应数量,总供应量x 为三者之和,即x =x 1+x 2+x 3。当x ≤20时,价格由公式p =20-x 给出,其它情况价格为0。各个厂商的利润P i 为x i 乘以p 。这个实验可以以学生为对象参与进行,获得结果后随机分 博弈论与实验研究 ○ (德)莱茵哈德·泽尔滕 第一种情况下,三个厂商供应量分别为4、8、6个单位,总量为18,所以价格为2,三个厂商的利润分别为8、16和12。第一问题是谁表现最出色?是否为厂商2?因为在此次博弈中它的利润比其他两个厂商高。不过,我们可以看到,在第二种实验情况下,如果它将供应量调整为5,那么价格为5,它的利润便会提升为25。实际上它犯了一个错误,自己损失了9个利润单位,在这个错误中,它的利润高于其他厂商是因为它对其他厂商的损害大于对自己的损害。 第二个问题是这种情况下应该如何做。有人讲,每个厂商供应量应该为3,则三个厂商总的最大利润为99,每个厂商利润为33。那么这是满意的解决方案吗?还不是,如果每个人供应量为3,而第一个厂商如果提供7个而不是3个单位,那么它就得到49的利润,其他人获得21的利润,这是一个很大的诱惑,供应量都为3的情况容易被否决,所以某个厂商如果获悉其他人的供应量为3,那么它就可以在3到7之间进行选择。也就是每个人都提供三个产量在具有绑定的协议的情况下是可以实现的;但是绑定的协议在这

博弈论心得体会

博弈论心得体会 今年是我刚刚进入中央广播电视大学的第一年,刚进入大学的第一学期我就学到了一门新的课程,这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过一个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述,他就是《博弈论》。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。 经过一段时间的学习,我对博弈论有了一些肤浅的理解,诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。 在社会中,人与人之间的对抗和较量是一个不容回避的话题,只有直面这些问题,个人才更有可能获得成功的机会。在所有的对抗和

较量中,其胜负成败常常取决于3个基本的因素:机会或者说运气、体能和智能。通过抛硬币来赌输赢是纯粹依赖于个人运气的游戏;百米赛跑的胜负基本上取决于个人的全身技能;而篮球赛、战争等对抗,虽然也会受到运气的影响,体能也很重要,但决定胜负的更重要的因素是头脑技能的较量。 头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每个人每天都在与他人打交道,或竞争或合作。身处这样高度互动的环境之中,无论一个人是否知道博弈论,实际上他都不断地在与他人进行博弈,无论是他的父母、亲人、兄弟、老师还是商场对手、政治敌人……一个可能不知道博弈论为何物,但是他的确常常在与他人进行着对抗和较量,在进行着一场又一场博弈;而生存本能,也让人们在不知不觉中学会了不少博弈技巧。 然而,通过本能所学习的博弈技巧,是既不系统也相当费劲的。因此,人们有必要以一种最为节省的方式来学习策略技巧。而最节省的方式,莫过于直接学习博弈论的知识了。难怪经济学家萨缪尔森这样说着:“要在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”事实上,不单一般人应该了解博弈论,各个领域的专家更应该了解博弈论——20世纪后半叶的历史表明,博弈论在军事、政治、商业、法律、经济学、生物学、心理学、社会学、历史学等诸多领域都已有非常成功的运用。

相关文档
最新文档