博弈论(第四章)

博弈论(第四章)
博弈论(第四章)

博弈论结课论文——大学生活中的困境与突围

是课上所说的“存在优势策略”。 (2)绝色美女困境: 受很多影视作品和网络文学的影响,人们心目中恋爱组合的影像应是“帅哥+美女”,但是在校园里我们常常会看到“美女+野兽”、“帅哥+恐龙”的恋人组合,为什么? 在现实生活中,绝色美女被冷落并非特例,她们的条件比别人好,却没人追求。这种现象的发生根源于信息的不对称,对绝色美女有好感的优秀男生会想:这么美的女孩一定有很高的门槛,自己与其受人家的拒绝后没人要,不如在自己喜欢的女孩中去选择。而野兽们自己没人追求,也就没有受到拒绝后损失的成本机会,他会一心一意、锲而不舍的放手去追那朵“鲜花”,如果追到则其收益无穷大;而如果失败了,也没什么损失。所以“美女+野兽”的组合也就合情合理了,而“帅哥+恐龙”的原因也是如此。 解决“绝色美女困境”的方法就是:假如很多人都对一个特定环境里德绝色美女展开攻势,你放弃是一种优势策略。但当别人都群体冷落这位美女的时候,你就应该勇敢地去追求。当然,这需要很好的观察力和判断力。 二:博弈论在高校考试中的应用——混合策略博弈与完全静态博弈研究对象:学校,学生群体(区分为优秀生与差等生)——分析舞弊者与他们之间的博弈关系,监考老师;其中学生与学校的博弈为混合策略博弈,而学生与学生群体之间的博弈为完全静态博弈。 相互关系:大学生与高校的博弈

A、大学生与高校的博弈分析: 1、事实说明:学生参加考试,其作弊行为发生与否,与高校的考试制度息息相关,而考试制度的直接表现者为监考老师,所以本博弈分析,将高校具体为监考老师,即考察学生与老师的博弈分析,而且该博弈用到的信息均为深大目前的考试制度信息。 2、学生与监考老师的博弈分析模型(此博弈为混合策略博弈)。 假设:老师和学生都是理性人,二者在决策的过程中不会考虑道德成本,而且只要老师监考尽职,学生舞弊行为一定被发现。 (1)支付矩阵的构建。假设以下参数: ①监考老师认真监考的成本 B1;认真监考的收益 A1 ②不认真监考的成本 C2,监考老师不认真监考的收益 R2 ③学生诚信考试的收益 C1。 ④学生舞弊考试的收益 G2;学生舞弊的成本 M (3)均衡意义:①由于学生的作弊概率与老师认真监考的成本B1 和不认真监考的收益 R2 成正比,与老师认真监考的收益A1 和不认真监考的成本 C2 成反比,而在现实学校生活中,老师认真监考的

基于博弈论的夫妻冲突分析

一个女人能有多美,通常是由与她相伴的男人来决定;一个男人能走多远,往往是由与他相随的女人来决定。夫妻之间的物质生活水平,通常是由收入较高的一方来决定;夫妇之间的精神生活水平,往往是由素质较低的一方来决定。 囚徒困境 在囚徒困境这个例子中,两个囚犯的上策都是坦白,因此最容易出现的结局也就是两人都被判5年。这个结局构成了一种博弈均衡状态,当对局者选择的都是上策的时候,这种均衡叫做上策均衡。在博弈论中,所谓均衡是指一种稳定的结局,当这种结局出现的时候,所有对局者都不想再改变他们所选择的策略。二.情侣冷战对峙 现将囚徒困境的报酬矩阵分析引入到一对情侣的冷战对峙中,见下图: H表示主动的一方感觉自己付出更多从而受到伤害,生出不平衡感;E代表不主动的一方有种优越成就感谈过恋爱的人都会对此有深刻的体会吧。闹矛盾有别扭之后,有时也可能两人都想主动了,但谁也不先迈出这一步,在不知道对方策略和想法的情况下,一权衡一算计就总害怕自己亏了,又或者碍于情面拉不下面子,不肯服个软。于是乎,秋水望穿了,花瓣也掰完了,最后是怎样呢?在这个矩阵中我们需要考虑的是,或者说我们的假设前提是,双方都是完全理性的,是完全以利己目的和最大化利益为原则行事的人。上策均衡显然并非最好的结局,但却是博弈双方经过反复权衡后所采取的认为对自己最有利的选择。但我们知道,所谓的爱情是没有理性可言的,它是一种激情,一旦斤斤计较反复权衡利弊得失,那就不叫爱。所以非常有意思的是,这个矩阵中出现的上策均衡(O,O——OVER),即双方都不主动从而导致感情破裂爱情失败的结局,正说明了爱情只要一权衡一算计,俩人都矜持和自私的话,那么最终铁定玩完。 三、夫妻关系的博弈分析 感情,爱情,亲情夫妻关系尴尬的了现实的活动中,夫妻关系既有和谐、融洽的一面,也存在冲突、矛盾的一面。每5对佳侣新婚燕尔之时,就有一对夫妻分道扬镳。 无论是丈夫还是妻子,双方都有自己的利益追求和价值取向,而家庭生活成为他们博弈的载体和工具。

自己写的博弈论结课论文

自己写的博弈论结课论文 博弈论论文 博弈论结课论文 宿舍是我们在上课之余,活动最频繁的场所之一,和舍友们有缘能住在一起,朝夕相处,一起打水,一起吃饭,一起学习,对培养我们合作能力和集体生活能力起了重要的作用。但宿舍的同学来自天南地北,由于生活习惯、成长背景以及价值取向等不同,对不同的事情意见难免会产生分歧,这就出现了各种大大小小的博弈。 为了打造一个温馨和谐的宿舍氛围,身为宿舍长,就要对这个宿舍好好管理。这里每个人之间每天都在进行着一场场博弈,所以博弈就在身边,有人存在的地方就会有博弈的存在。而这一场场的博弈催促着我们长大,学习并且合理的使用能让我们更好的适应这个社会,并且通过合作实现共赢。 每个宿舍都会有本“难念的经”,而我们宿舍最大的问题是因大家的作息时间不统一引出的。宿舍楼除了周五,周六晚上每晚都是十一点准时熄灯,而A同学和B同学习惯了晚睡,所以在熄灯后总会“挑灯夜战”,而这影响了喜欢早睡早起的C同学,使得C同学总是抱怨A,B同学都熄灯了才去洗漱或者发出响声影响睡眠;而A,B同学又抱怨C同学早晨起床太早而弄得休息不好。双方都不肯让步,这一度使得宿舍气氛很不和谐,并且所有同学都开始抱怨宿舍不够好,不够温馨。于是我和C同学单独聊了聊,又和A,B同学私下里沟通,其实大家都愿意宿舍是个温暖的“窝”,只是不知用什么方式达到同时又不愿失了面子,于是我们达成共识:每晚熄灯前所有人必须洗漱完毕,熄灯后尽量不再发出响声,彼此互相体谅,尽量不要打扰别的同学休息;早起的同学也一样,尽量做到不打扰他人。如果可以,尽量宿舍成员作息时间能达成一致。一段时间后,宿舍又恢复了从前的欢声笑语。 页 1

基于博弈论的恋爱模型

《数学建模》 课程考核论文 姓名:王湘衡齐久坤张程勇 学号:08100225 08100217 08100232 班级:08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型 摘要 本文用数学建模的方法研究博弈论中的问题,从不完全信息静态博弈建立模型建立模型,并利用纳什均衡原理程序来确定纳什均衡点,对不同均衡点进行分析,从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈,来模拟现实社会中的恋爱,再利用恋爱者不同类型的分布概率,求出恋爱者的期望,最终来决策恋爱者自己下一步的策略。 关键词:恋爱模型博弈论贝叶斯纳什均衡

1、问题重述 随着社会的进步和发展,现在恋爱问题越来越成为生们关注的热门话题,那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人,成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人,这其中将恋爱双方都理想化,这样将给我们研究恋爱问题和建立数学模型带来方便,使我们能将恋爱模型数学化,从而确定恋爱者的进一步决定。 2.模型假设及符号说明 模型假设: 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人,并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略 符号说明: 3. 问题分析与模型建立 3.1 问题分析 谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看,谈恋爱的男女双方,各有不同类型,我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象,寻求的是一般解释。有了这样的分类便有了不同的组合,有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美,却不会让他得逞,原因是理性经济人的假设。有人说这一点说不通,我不这样认为,经济学说所有人都是理性的并不影响不理性家伙们的存在,能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。 简单的博弈理论己深入人心,显然上面的问题是不完全信息博弈,无论是男追女还是女追男,信息的不完全或是不对称是显而易见的,用博弈论的话说是对对方的了解不够精确。因此,我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡,动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型 所谓静态是指所有参与生都同时行动,不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例,一个男生追求一个女生,在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人,虽然自己可以从各种渠道了解男生,但知生知面不知心,风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题,因为女生不仅不知道男生的类型(A还是B),而且还不知道不同类型的分布概率,但她对自己所属的类型是清楚的,这是她的私人信息。同理男生也是这样。 下面来设定支付函数的权值,以便求出纳什均衡点,设男A类追求者,只要他追求A类女生就得到10,他不追求A类女生就得到-10,A类女生接受得到10,拒绝得到-10;男B类追求者,他追求A类女生得到10,不追求得到-10,A类女生接受得到-10,拒绝得到10;男A类追求者,他追求B类女生得到-10,不追求得到10,B类女生接受得到10,拒绝得到-10;男B类追求者,他追求B类女生得到10,不追求得到0,B类女生接受得到10,拒绝得到0;他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明:

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

自己写的博弈论结课论文

博弈论结课论文 宿舍是我们在上课之余,活动最频繁的场所之一,和舍友们有缘能住在一起,朝夕相处,一起打水,一起吃饭,一起学习,对培养我们合作能力和集体生活能力起了重要的作用。但宿舍的同学来自天南地北,由于生活习惯、成长背景以及价值取向等不同,对不同的事情意见难免会产生分歧,这就出现了各种大大小小的博弈。 为了打造一个温馨和谐的宿舍氛围,身为宿舍长,就要对这个宿舍好好管理。这里每个人之间每天都在进行着一场场博弈,所以博弈就在身边,有人存在的地方就会有博弈的存在。而这一场场的博弈催促着我们长大,学习并且合理的使用能让我们更好的适应这个社会,并且通过合作实现共赢。 每个宿舍都会有本“难念的经”,而我们宿舍最大的问题是因大家的作息时间不统一引出的。宿舍楼除了周五,周六晚上每晚都是十一点准时熄灯,而A同学和B同学习惯了晚睡,所以在熄灯后总会“挑灯夜战”,而这影响了喜欢早睡早起的C同学,使得C同学总是抱怨A,B同学都熄灯了才去洗漱或者发出响声影响睡眠;而A,B同学又抱怨C同学早晨起床太早而弄得休息不好。双方都不肯让步,这一度使得宿舍气氛很不和谐,并且所有同学都开始抱怨宿舍不够好,不够温馨。于是我和C同学单独聊了聊,又和A,B同学私下里沟通,其实大家都愿意宿舍是个温暖的“窝”,只是不知用什么方式达到同时又不愿失了面子,于是我们达成共识:每晚熄灯前所有人必须洗漱完毕,熄灯后尽量不再发出响声,彼此互相体谅,尽量不要打扰别的同学休息;早起的同学也一样,尽量做到不打扰他人。如果可以,尽量宿舍成员作息时间能达成一致。一段时间后,宿舍又恢复了从前的欢声笑语。

反而会使自己的利益也受到损害,得不偿失。由此可以看出,生活在集体中就不能只以自己为中心,要多为他人着想,多为集体着想,多一些理性的交流和沟通,互相学习、团结互助、彼此尊重、取长补短,营造出和谐温馨的氛围对于个人的身心发展都大有好处,同时会使每个人的收益大幅增加达成共赢,获得更好的结局。

博弈论泽尔腾简介

莱茵哈德?泽尔腾简介 一、人物生平 莱茵哈德?泽尔腾(Reinhard Selten),德国人,1930年10月10日出生于德国的布莱斯劳。由于犹太人的身份,泽尔腾自小对政治、经济学感兴趣,对数学的爱好伴随其一生。 1951~1957年,他在法兰克福大学学习数学,1957年获硕士学位。 1961年,泽尔腾获得马恩法兰克福大学的数学博士学位。 1967~1968年,泽尔腾去伯克利加州大学商学院当客座教授。 1969年接受柏林大学聘请,担任经济学教授至1972年。 1984年,他到波恩大学任经济学教授。 1991年,泽尔腾和夫人伊丽莎白都患上了严重的糖尿病。伊丽莎白因此下肢瘫痪,并且视力也接近失明。但泽尔腾夫妇对生活仍充满了自信。泽尔腾多次来中国访问,并到过多所大学进行学术演讲。泽尔腾在学术报告中展示出的大师的学术精神与态度、深刻的思想见解以及伟大的学术抱负令聆听其报告的每一个人所敬佩。 1994年泽尔腾教授因在“非合作博弈理论中开创性的均衡分析”方面的杰出贡献而荣获诺贝尔经济学奖。 泽尔腾现还任计量经济学社团委员、美国艺术与科学学院外籍名誉院士、青岛大学名誉教授、南开大学公司治理研究中心顾问、南京审计学院名誉教授。

二、主要著作和学术贡献 1、主要著作 泽尔腾的主要学术论著有:《一项寡头垄断实验》、《关于扩展性博弈中均衡完善概念的再检验》、《连锁商店之谜》、《博弈中均衡选择通论》、《价格制定者厂商的一般均衡》(1974年)、《博弈均衡选择的一般理论》(1988年,与哈萨尼合作)、《战略理性模型与决策理论丛书:《系列C:博弈论、数学规划及运筹学研究》(1988年)。1994年,由于“莱茵哈德?泽尔腾教授的均衡分析中的完善性的观念大大扩展了非合作博弈论的应用”,他与约翰?纳什、约翰?哈萨尼共同荣获该年度诺贝尔经济学奖。 2、学术贡献 他的主要学术研究领域为博弈论及其应用、实验经济学等。博弈论是作为数学的一个分支出现的,但是它在军事、政治、经济许多方面都有很多重要的运用,其中以在经济学内的运用最多也最为成功。博弈论整个改写了经济学理论。博弈论对人类的更大贡献是,加强了国际间的交流合作机会。各国对博弈论的研究,促进了人类社会的文明发展。此外,博弈论的思维方式推动了人类思维模式更高层次的发展。 泽尔腾针对纳什均衡中的静态分析的不足,在1965年将扩展型博弈推广为动态博弈,并提出了子博弈的概念和子博弈完美均衡的概念,发展了倒推归纳法。1975年发表“关于扩展型博弈中完美均衡概念的再检验”一文,提出了被称之为“颤抖手完美纳什均衡”的概念,

基于博弈论的爱情浅析

基于经济学的爱情攻略浅析 摘要 随着市场经济的发展,人们对事物认知态度的变化,经济学的应用范围进一步扩大,人们的行事原则越来越趋向于经济学上的“理性”。就现状而言,经济学的分析不仅局限于某些领域,只要存在人类的社会活动,就存在经济,就存在资源合理配置问题,也就有经济分析的必要。谈恋爱是校园中的一个普遍现象,本文从经济学的视野中透视,爱情中的微观经济学问题,包括从预算线角度分析择偶以及爱情中的博弈关系,并试图以经济学的理论提出缓解和解决有关爱情现象问题的建议。 关键词:微观经济学;爱情;预算线;博弈论

Analysis based on the economics of love Raiders 【Abstract】:With the development of market economy, people's attitudes change perception of things, to further expand the scope of application of economics. More and more people tend to act on the principle of "rational" economics. On the current situation, the analysis is not limited to certain areas of economics. As long as the existence of human social activities, there is the economy. There is a reasonable allocation of resources, there is need for economic analysis. Love is a common phenomenon in the campus. This paper is from the perspective of economy. The love of microeconomics issues, including the budget line from the perspective of the relationship between mate and love the game, and tried to ease the economic theory proposed and recommendations to address issues related to the phenomenon of love. 【Key words】:Game theory; microeconomics; love; budget line

博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考答案

————————————————————————————————作者:————————————————————————————————日期: 2

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。 如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

博弈论的相关知识

零和博弈 博弈是一种策略的相互依存状况:你的选择或策略将会得到什么结晶,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他的选择称为行动。一个博弈当中的参与者的利益可能严格对立,一人所得永远等于另一人所失。这样的博弈称为零和博弈。不过,更常见的情况是,既有共同利益,也有利益冲突,从而可能出现导致共同受益或者共同受禹的策略组合。但是,我们通常还是会把这个博弈当中的其他参与者称为一方的对手。一个博弈的行动可能是相继进行,也可能是同时进行。在相继行动的博弈里,存在一条线性思维链:假如我这么做,我的对手可以那么做,反过来我应该这么应对。。。。。。这种博弈通过描绘博弈树进行研究。其中要遵循法1则:向前展望,倒后推理,就能找出最佳的行动方式。 策略组合 而在同时行动的博弈中,存在一个逻辑循环的推理过程:我认为他认为我认为。。。。这个循环必须解开,一方必须看穿对手的行动,哪怕他在行动时候并不知道这是怎么一回事。要想解开这么一种博弈,可以建立一张图,这张图能显示所有可能想得到的策略组合将会相应产生什么结果。然后按照下列步骤进行分析:首先看参与各方有没有优势策略,优势策略意味着,无论对手采取什么策略,这一策略都将胜过其他的任何组合策略。这就引出法则2:假如你有一个优势策略,请照办。假如你没有优势策略,但你的对手有,那么,尽管认定他一定会照办吧,然后相应选择你自己的策略。 优势策略 接着,假如没有一方拥有优势策略,那就看看有没有人拥有一个劣势策略,劣势策略意味着无论对手采取什么策略,这一策略都将逊于其他作任何策略。如果有,请遵循法则3:剔除劣势策略,不予考虑。如此一步一步做下去。假如在这么做的过程中,在简化之后的博弈里出现了一个优势策略,应该应用这个优势策略。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动法则以及这个博弈的结果。即便这个过程可能有会导出一个独一无二的结果,这么做也可以缩小整个博弈的规模,使其变得更加容易控制。最后,假如既没有优势策略也没有劣势策略,又或者这个博弈已经经过第二步进行了最大限度的简化,那么请遵循法则4:寻找这个博弈的均衡,即一对策略,按照这对策略做,各个参与者的行动都是对对方行动的最佳回应。假如存在一个这样的独一无二的均衡,我们就有很好的证据证明为什么所有的参与者都应该选择这个均衡。假如存在许多这样的均衡,你就需要用一个普遍认帐的法则或者说惯例做出取舍。假如并不存在这样的均衡,这通常意味着一切有规则可循的行为都有可能被对方加以利用,这时候你需要将你的策略混合运用。在实践过程中,博弈可能包含一些相继行动过程,也可能包含一些同时行动过程,因此须将上述技巧综合起来,灵活运用,思考和决定自己的最佳行动应该是什么。[2] 《博弈思维》- 零和博弈 简介 零和(zero sum). 赌博中,双方相同的获胜概率。这个词也经常用在政治中,两个国家的势均力敌的实力可以被称作“零和”。“零和”是博弈论的一个概念,意思是双方博弈,一方得利必然意味着另一方吃亏,一方得益多少,另一方就吃亏多少,双方得失相抵,总数为零,所以称为“零和”。“囚徒困境”产生的最主要原因是因应了这种“零和”思维——每个人都在你输我赢的博弈中,追求自身利益的最大化。人们发现在社会的方方面面都能发现与“零和游戏”类似的局面。从个人到国家,从政治到经济,似乎无不验证了世界正是一个巨大的“零和游戏”场。游戏中不是“你赢我输”,就是“你输我赢”。任何一方的收获,即是对方的损失。 零和理论

博弈论结课论文

博弈论基础 结课论文 课程名称:博弈论基础授课教师: 专业班级: 学生姓名:学号 成绩:

博弈随笔 以前,只是听说博羿——认为是那些?谍战片?似的斗心机,拼命得到所谓的胜利,让我想到?左右互搏术?。今天,挺欢喜的,值得一听,更加值得一想。 老师与学生第一节课,以(身边)故事开场,吸引了在玩、在谈、在写、在愣神的学友的耳朵和眼球,学友们——也学到了些东西,或者与博羿之思想能碰撞闪现出火花,有利益关系吗?一个,望学术或教育水平得到提高或责任的心。另一个,得点学分或找点乐子或陪伴人或还真有少许的是学的。俗话说的好?愿打,也得愿挨?呀!要么,人数成?抛物线?一样变化,要么是?倒梯形?,这也许就是学生,大学生的规律!而师,或呆板地照本宣科或妙趣横生或平平淡淡。显然,我们比较幸运点! 注:学点东西——还是比较好的。如何提高教学质量与学习效果?一个人,当TA面对TA喜欢或感兴趣的,才会花时间去听(无意评价教育体系),这可能占到大部分吧(希望),少部分随意的点的(暂评),因此,怎么才能延长其喜欢的持续时间:才是关键(除一些真学的)。 总之,?少壮不努力,老大徒伤悲?! 效率——单位个体在单位时间内获得的成果。现在,自己,的确是在玩时间战术,耗得起吗?也许只有在有效时间内完成自己的任务,努力加信心 (说偏了)。没话了,挂住了。 记于二零一二年三月一号晚二十三点五十六分(写了将近四十分

钟) 今天晚上,上课,感觉到了无聊与无奈,选修与专业,浅与深。主要讲了一些博弈的基础知识(概念类),自己也记了一些笔记(各人有各自的学习方法)。而我是靠时间磨靠笔磨的!偏了,,回归正传。她(老师)讲了一些故事——这的确挺吸引人眼球与耳朵的。但下面因为玩,其他的继续。同志们,半推半就的去 STUDY! 3月中旬的一次课,忘了忘了! 今天——2012年3月22日,博弈论的第三次课了(好像学生上课,都是这样似的)。 她,老师讲了纳什均衡的运用实例——一些经典例子:双垄断的博弈——也推倒出了于今下有实际意义的结论!但,我好像没有像第一次上课那样——认认真真的听:边看着鲁迅的小说边听着老师的?絮叨?,其实——自己挺喜欢数学的:可由初中的喜爱得出,只是随着时间的推移与知识的无奈——?膨胀?,自己也被自己慢慢的舍弃了! 难道自己没有想过吗?答案,不言而喻! 一个人,可悲的不是知道,而是无知与明明知道而又偏偏无知! 莫伤,也伤不起!三月的最后一节,老师讲了一些?概率性?的纳什均衡。第一小节,师已讲了个例子,同时也演算了一个例子,当下课布臵了一个小问题,在课间做,却无人问津。上课时?自然?鸦雀无声。

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论的读书笔记

博弈论的读书笔记 【篇一:博弈论读书笔记】 博弈论读书笔 博弈论 :亦名“对策论”、“赛局理论”,属应用数学的一个分支,主要研究公式化了的激励结构间的相互作用。是研究决策主体的行 为发生直接相互作用时候的决策以及这种决策的均衡问题,具有斗 争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优 化策略。 博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈 的思想既然来自现实生活,它就可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。没有高深的数 学知识,我们同样通过博弈论的学习成为生活中的策略高手。孙膑 没有学过高等数学,但是这并不影响他通过运行策略来帮助田忌赢 得赛马。 博弈时时存在,它就在你的身边。本书就是试图通过日常生活中常 见的例子,来介绍博弈论的基本思想及运用,并且寻求用种智慧来 指导生活决策的方法。 在李凌、王翔的《论博弈论中的策略思维》中,作者从博弈论的起 源谈起,回顾了博弈论在诺贝尔经济学奖上所取得的成就,把博弈 论中的经典案例同生活中的实际例子联系起来进行分析,从合作、 模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是 如何影响人们的行为的, 又是如何使得博弈达到均衡的。最后,围 绕演进博弈论的基础理论与实例案例来分析对传统博弈论的冲击, 及其使博弈论的发展上升到了一个新的阶段和深度。

! 以下是对这篇文章中的囚徒困境、智猪博弈和演进博弈论的简述和分析: 一、囚徒困境—合作还是不合作 在这个模型中,合作还是不合作问题得到了很好的解释,纳什均衡解就是都选择坦白,也就是跟对方囚徒不合作,但这个解对两个囚徒来说并不是帕累托最优解,囚徒困境反映了集体理性和个人理性的矛盾。联系到实际生活中的例子政府提供公共物品,如果让使用资源者自愿承担费用,则会由于搭便车现象的出现,而无法实现共同提供公共物品的目标,所以需要政府通过纳税的方式来提供,以实现帕累托最优,达到资源的有效配置。囚徒困境有限次重复博弈中,当一次性违约的收益大于失信所必须付出的代价时, 企业就存在偏离合同规 定行事的激励,这种内生的激励表明,“损人利己”也是行为人的理性选择。在无限次重复博弈中,如果企业之间致力于长期合作, 就应当设法改变合作机制, 降低合作企业发生机会主义行为的概率。除了健全社会诚信体系之外, 一种行之有效的方法便是提高失信成本。然而在实际生活中的局中人可能受各种外部环境因素或者市场地位的影响,并非是完全理性的,所以在合作方面还存在着一定的风险,这就需要订立合作契约,将这种风险最小化,从现实经济利益的角度提高失信成本,使失约威胁实现真正的可置信。 二、智猪博弈—创新还是模仿 在智猪博弈中,在理性人的假设下,大猪和小猪的支付矩阵决定了大猪选择按,小猪选择等待。类似的,在股票市场中,大户是大猪, 他们进行技术分析, 收集信息、预测股价走势, 所付出的成本高,而相应得到的收益也比较高,而大量散户就是小猪, 他们几乎不花成本去进行技术分析, 而是跟着大户的投资策略进行股票买卖, 这就是股票市场上著名的“散户跟大户”现象。在股份公司中, 大股东是大猪, 他们收集信息、监督经理, 拥有决定经理任免的投票权,

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈论的理论精华及其现实意义

48 [收稿日期]2002-02-25 [作者简介] 胡希宁(1952-),男,安徽芜湖人,中共中央党校经济学教研部教授;贾小立(1970-),男,山西洪洞人,中共 中央党校研究生院硕士研究生。 博弈论的理论精华及其现实意义 胡希宁 1 贾小立 2 (1.中共中央党校经济学教研部,北京100091; 2.中共中央党校研究生院,北京100091) [摘要]经济博弈论以贴近现实的方式,揭示了现代经济活动的内在规律。它的发展过程是 纳什均衡从提出到改进的过程。无论在理论上还是在实践上,博弈论都具有重要的现实意义。 [关键词] 博弈论;纳什均衡;信息经济学 [中图分类号] F062.5 [文献标识码]A [文章编号]1007-5801(2002)02-0048-06 第6卷第2期 2002年5月 中共中央党校学报 Journal of the Part y School of the Central Committee of the C.P.C. Vol.6,No.2Ma y .,2002 博弈论(Game Theor y )研究的是,各个理性决策个体在其行为发生直接相互作用时的决策及决策均衡问题。冯?诺伊曼(John Von Neumann )与摩根斯坦恩(Oskar Mor g enstern )合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中。到20世纪50年代,合作博弈发展到鼎盛期,非合作博弈也开始产生。纳什 (Nash ,J.F.)的《N 人博弈的均衡点》(1950)、《非 合作博弈》(1951)明确提出了“纳什均衡”(Nash E q uilibrium ),图克(Tucker )则定义了“囚徒困境”(Prisoners’Dilemma ,1950)。两人的著作奠定了 现代非合作博弈论的基石。泽尔滕(R.Seleten , 1965)首次将动态分析引入博弈论,提出了纳什均 衡的第一个重要改进概念———“子博弈精炼纳什均衡”(Sub g ame Perfect Nash E q uilibrium )和相应 的求解方法———“逆向归纳法”(Bakeward Induction )。豪尔绍尼(J. C.Harsan y i ,1967)首次 把信息不完全性引入博弈分析,定义了“不完全信息静态博弈”(Static Games of Incom p lete information )的基本均衡概念———“贝叶斯-纳什 均衡” (Ba y esian -Nash E q uilibrium ),构建了不 完全信息博弈的基本理论。之后,不完全信息动态博弈(d y namic g ames of incom p lete information ) 得到迅速发展,弗得伯格和泰勒尔(Furdenber g and Tirole ,1991)定义了它的基本均衡概念——— “精炼贝叶斯—纳什均衡”(Perfect Ba y esian -Nash E p uilibrium )。70年代以后,博弈论形成了一个完整的体系;大体从80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。1994年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔滕三人,以表彰他们在博弈论的发展及应用中所作出的开创性贡献。 一经济博弈论的基本理论———基本博弈结构、纳什均衡及其改进 这里,我们以完全信息静态、完全信息动态、不完全信息静态、不完全信息动态四种博弈结构为主线,对纳什均衡及其改进进行概括,以阐明经济博弈论的主要思想内涵。 (一)完全信息静态博弈———纳什均衡 纳什均衡是完全信息静态博弈的基本均衡概念。完全信息静态博弈(Static Games of Com p lete Information )是指,博弈的每个局中人(参与竞争的具有不同利益的行为主体或决策者)对所有其他局中人的特征(策略空间、支付函数等,前者指可供局中人选择的策略组合,后者指决定局中人损益得失的函数)有完全的了解;所有局中人同时选择行

耶鲁大学公开课博弈论笔记 博弈论 讲

博弈论作业(博弈论24讲)数应专业 一、 1、理性人:指代这一类人,他们只关心自己的利益。 2、如果选择a的结果严格优于b,那么就说a相对于b来说是一个严格优势策略。结论: 不要选择严格略施策略。 3、理性人的理性选择造成了次优的结果 4、举例:囚徒困境、宿舍卫生打扫问题、企业打价格战等 5、协和谬误收益很重要,“如欲得之,必先知之” 6、要学会换位思考,站在别人的立场上看别人会怎么做,在考虑自己受益的同时,要注 意别人会怎么选择 二、 1、打渔问题、全球气候变暖与碳排放问题 2、博弈的要素:参与人、策略集合、收益 3、如果策略a严格劣于策略b,那么不管他人怎么选择,b总是更好的选择 4、军队的入侵与防卫问题 5、所有人都从1到100中选个数字,最接近所有人选的数字的均值的2/3者为胜,这个数 字是多少呢?作为理性人,每个人都会选择67(100*2/3)以下的数,进一步假设你的对手也是理性的,你会选择45(100*4/9)以下的数……依据哲学观点,如果大家都是理性程度相当的,那么最后数字将为1,然而结果却是9,这说明博弈的复杂性 6、共同知识与相互知识的区别 三、 1、利用迭代剔除法领悟中间选民问题 2、迭代剔除法就是严格下策反复消去法,不断地把劣势策略剔除出去,最后只剩下相对 优势的策略 3、中间选民问题就是,在两党制中,政党表述施政纲领要吸引位于中间位置的选民,他 们认为在选举中处于中间标度可以吸引左右两边的选民,并以此获得胜利。 4、中间选民问题理论成立的条件是有两个参与人;政治立场能使选民相信。 5、由此延伸出来的还有加油站选址问题,两家加油站不是在不同的路口选址,而是在不 确定哪个位置较佳的时候会选在同一处,这也是“中间选民定理”的凸显 6、在迭代剔除法不能运用时,比如说该博弈中博弈方1和2均没有严格下策,可以用二 维坐标系画出选择策略之后的收益分布

相关文档
最新文档