博弈论期末复习重点

博弈论期末复习重点
博弈论期末复习重点

1、博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自去得相应结果的过程。

2、博弈论:就是系统研究各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略选择和合理选择策略时博弈的结果,并分析这些结果的经济意义、效率意义的理论和方法。

3、囚徒的困境:两决策者从各自最大的利益出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体的最大利益。

4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈。

5、动态博弈:各博弈方的选择和行动不仅有先后次序,而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动,甚至还包括自己的选择和行动,

6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息。

7、不完全信息(不对称信息):是指经济行为主体掌握了某种经济环境状态的部分信息。

8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解。

9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程。

10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,那么这个策略组合肯定是所有博弈方都愿意选择的,必然是该博弈比较稳定的结果。

11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略。在两人博弈的情况下,“给定你的策略,我的策略就是我最好的策略,给定我的策略,你的策略也是你的最好的策略”。

12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决

策方式。

13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡。这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益。

14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈。

15、完全且完美信息动态博弈:动态博弈中既是完全信息又是完美信息的部分

16、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略均衡构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个~

17、逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一阶段的分析方法。

18、颤抖手均衡:在博弈时也要考虑到合作者可能会发生轻微的失误而影响整个结果,即使在这种小概率事件发生时,所选策略依然是最优的。

19、道德风险:从事经济活动的人在最大限度地增进自身效用时作出不利于他人的行动,损害委托人或是其他代理人的利益。交易后的信息不对称性,掌握较多信息的一方在交易后的利己倾向,如隐瞒欺骗、不负责任、不努力工作。

20、逆向选择:指交易双方在交易前的信息不对称,导致市场上交易的劣质商品的比例越来越高,甚至导致优质品完全被驱出市场的一种现象。

简答[2*10%]

一、设定一个博弈模型必须确定的方面:

1、博弈方:即博弈中进行决策并承担结果的参与者;

2、各博弈方各自可选择的全部策略或行为的集合(策略空间):即博弈方选择的内容,可

以是方向、取舍选择、量值;

3、进行博弈的次序:即博弈方行为、选择的优先次序或重复次数等。次序不同一般就是不同的博弈,即使博弈的其他方面都相同;

4、博弈方的得益:即博弈方行为、策略选择的相应后果、结果必须是数量或者能够折算成数量,对应于各博弈方的每一组可能的决策选择都应有一个结果表示该策略组合下各博弈方的所得或所失。得益应该是客观存在,但不意味着各博弈方都了解各方的得益情况。

5、信息结构,即博弈方相互对其他博弈方行为或最终利益的了解程度;

6、行为逻辑和理性程度,即博弈方是依据个体理性还是集体理性行为以及理性的程度等。

二、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。

1、烟草厂商新产品的开发、价格定位的效果,常常取决于其他厂商、竞争对手的相关竞争策略。例如某卷烟厂推出一种高价烟,该计划能否成功常取决于其他厂商是否采取同样的策略、如果其他厂商也推出高价烟而且档次宣传力度比前者还要高、大,那么前者的计划成功的难度就很大,但如果没有其他厂商推出同类产品,那前述某厂的计划成功的可能性就大;

2、房地产开发企业在选址、开发规模、目标客户定位等方面也常常存在相互制约的问题。例如一个城市当时的住房需求约10000平方米,如果其他厂商已经开发了8000平方米,那么你再开发5000平方米就会导致供过于求,销售就会发生困难,但如果其他厂商只开发不到5000平方米,那么你的5000平方米就是合理的。

3、麦当劳的新产品所带来的收益、价格产量、产品开发

三、“囚徒困境”内在根源是?举出现实生活中的具体例子。

根源在于个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单第说,都是个体理性与集体理性的矛盾引起的。

四、分析保险市场、资本市场道德风险的逆向选择。

1、汽车保险:假设张三有财产¥100000,其冯诺依曼-摩根斯坦效用指数为对数函数,即U(W)=ln(W),并有价值为¥20000的汽车一辆。如果该汽车没有向保险公司投保,将有25%的可能性被偷窃。因此,期望效用为:0.75U(100000)+0. 25U(80000)=0.751nl00000+0.25ln80000=11.457l,如果保险公司只索取成本而管理成本为0,那么,公平的保险费用为¥20000×0.25=¥5000。如果张三将汽车完全保险,无论汽车是否被盗,其财富都是¥95000,预期效用U(95000)=ln(95000)=11. 4616因此,当张三购买公平保险后,其效用高于不购买保险。现在讨论张三是否安装防盗装置的问题,假设安装一个防盗装置的成本为¥1950,如果安装该装置、汽车被盗概率从0.25减小到0.15。如果没有投保,安装防盗装置的预期收益(¥20000×0.10=¥2000)超过成本,因而安装防盗装置有效率,其期望效用为:0.85ln(100000-1950)+0.15ln(100000-2000-1950)=11.4590超过不安装的期望效用11.457l,因此,如果张三没有投保,那么,购买防盗装置是理性的。但是,当张三投保后,情况发生了变化。假设张三购买汽车保险的价格是¥5200(其中¥5000为预期损失,¥200为管理费)。如果保险公司并不检查投保人是否安装防盗装置,那么,投保的预期效用为1n94800=11.4595,该预期效用超过安装防盗装置的预期效用。张三将会选择投保。但投保后将没有动力安装防盗保险装置,并且可能产生麻痹心而提高被盗的可能性。结果、发生火灾的概率从0.005上升到0.008,保险公司的实际预期损失为¥800。结果,每出售一张保险单平均都会损失S300。这种保险单对于保险公司来说不可行。由于代理人隐蔽行动难以观察,火灾保险市场经常出现投保人经营亏损后,有意纵火索取高额保险金的案例。

2、火灾保险的道德风险:假设某厂商产品仓库价值为¥100000,厂商采取防火措施的成本为¥50。采取防火措施后小心谨慎,发生火灾概率为0.005;没有防火措施且疏于防范,发生火灾概率为0.008。又假设保险公司以预期火灾损失¥500,以此作为保险费用出售保险

单。在这种环境下,如果厂商向保险公司投保后,就可能不会有动力继续执行防火措施,且可能疏于防范。

3、健康保险市场:投保人一旦获得健康保险,相当于降低投保人的医疗护理费用。因此,理性的个人将增加他在这方面的消费量,相应地增加了医疗保险支付的数量,即增加社会成本的数额,因为个人保险费的增加意味着社会医疗支出费用的增加。在这种状态下,社会的风险服务和医疗服务都将低效率。

4、资本市场:每个借贷者要求同样数目的贷款条件下,银行不能将借款者按照回报率的大小给予不同的利息率。银行能否收回贷款并获得利润,既取决于借款者的经济效益,也取决于银行所处环境状态的各种不确定性。当银行以借款者的经济收益为利息率标准时,借款者就会利用银行难以观察或不可能观察到的隐蔽行动采取相应行动,如虚报利润额、非法转移资金,人为地扩大成本等道德风险行为,由此使银行承担的风险比签定委托-代理合同前有所增加。

5、证券市场的“逆向选择”:在信息不对称的情况下,投资者无法确定哪些上市公司是高质量的、有投资价值的公司,哪些是低质量的上市公司。因此,投资者在作出投资决策时,往往只能根据整个市场所有发行企业的平均质量来决定其愿意投资的价格。这种投资者的“折中”行为就会抑制那些高于平均质量水平的发行企业提高经济效率和管理水平的积极性,而鼓励投资者向低质量企业流动。因为高于平均质量水平的上市公司并不能在证券市场体现其应有的价值,因此就会造成高质量企业不情愿进入证券市场。造成低质量的上市公司横行于证券市场。信息不对称的结果造成股票价格与上市公司经营业绩的背离则使证券市场失去了评价上市公司业绩、约束上市公司经营行为的市场机制,这种市场选择的结果只会导致整个市场的上市公司质量的降低,并成为市场过度投机的主要根源,最终会导致市场的低效率甚至是市场的崩溃。

判断

一、博弈的分类方法:

1、行为逻辑,是否允许存在有约束力协议:合作博弈、非合作博弈

2、理性层次:完全理性博弈、有限理性博弈(进化博弈);

3、博弈过程:静态博弈、动态博弈、重复博弈

4、信息结构:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈;

5、得益特征:零和博弈、常和博弈、变和博弈

6、博弈方数量:单人博弈、两人博弈、多人博弈;

7、策略数量:有限博弈、无限博弈

二、上策均衡、纳什均衡、严格下策反复消去法的关系区别:

1、上策均衡是各博弈方绝对最优策略的组合,而纳什均衡则是各博弈方相对最优策略的组合。上策均衡一定是纳什均衡,但纳什均衡不一定就是上策均衡。对同一个博弈来说,上策均衡的集合就是纳什均衡集合的子集,但不一定是真子集;

2、严格下策反复消去法与上策均衡分布对应两种有一定相对性的决策分析思路:严格~对应排除法即排除绝对最差策略的分析方法。上策~对应选择法,即选择绝对最优策略的均衡概念。二者并不矛盾,甚至可以相互补充。严格~不会消去任何上策均衡,可以简化博弈;

3、严格~和纳什均衡也是相容和补充的,严格~不会消去任何上策均衡,可以简化博弈,使纳什均衡分析更加容易。

Welcome To Download !!!

欢迎您的下载,资料仅供参考!

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论结课论文——大学生活中的困境与突围

是课上所说的“存在优势策略”。 (2)绝色美女困境: 受很多影视作品和网络文学的影响,人们心目中恋爱组合的影像应是“帅哥+美女”,但是在校园里我们常常会看到“美女+野兽”、“帅哥+恐龙”的恋人组合,为什么? 在现实生活中,绝色美女被冷落并非特例,她们的条件比别人好,却没人追求。这种现象的发生根源于信息的不对称,对绝色美女有好感的优秀男生会想:这么美的女孩一定有很高的门槛,自己与其受人家的拒绝后没人要,不如在自己喜欢的女孩中去选择。而野兽们自己没人追求,也就没有受到拒绝后损失的成本机会,他会一心一意、锲而不舍的放手去追那朵“鲜花”,如果追到则其收益无穷大;而如果失败了,也没什么损失。所以“美女+野兽”的组合也就合情合理了,而“帅哥+恐龙”的原因也是如此。 解决“绝色美女困境”的方法就是:假如很多人都对一个特定环境里德绝色美女展开攻势,你放弃是一种优势策略。但当别人都群体冷落这位美女的时候,你就应该勇敢地去追求。当然,这需要很好的观察力和判断力。 二:博弈论在高校考试中的应用——混合策略博弈与完全静态博弈研究对象:学校,学生群体(区分为优秀生与差等生)——分析舞弊者与他们之间的博弈关系,监考老师;其中学生与学校的博弈为混合策略博弈,而学生与学生群体之间的博弈为完全静态博弈。 相互关系:大学生与高校的博弈

A、大学生与高校的博弈分析: 1、事实说明:学生参加考试,其作弊行为发生与否,与高校的考试制度息息相关,而考试制度的直接表现者为监考老师,所以本博弈分析,将高校具体为监考老师,即考察学生与老师的博弈分析,而且该博弈用到的信息均为深大目前的考试制度信息。 2、学生与监考老师的博弈分析模型(此博弈为混合策略博弈)。 假设:老师和学生都是理性人,二者在决策的过程中不会考虑道德成本,而且只要老师监考尽职,学生舞弊行为一定被发现。 (1)支付矩阵的构建。假设以下参数: ①监考老师认真监考的成本 B1;认真监考的收益 A1 ②不认真监考的成本 C2,监考老师不认真监考的收益 R2 ③学生诚信考试的收益 C1。 ④学生舞弊考试的收益 G2;学生舞弊的成本 M (3)均衡意义:①由于学生的作弊概率与老师认真监考的成本B1 和不认真监考的收益 R2 成正比,与老师认真监考的收益A1 和不认真监考的成本 C2 成反比,而在现实学校生活中,老师认真监考的

完整word版,博弈论期末复习题

一、支付矩阵 1、试给出下述战略式表述博弈的纳什均衡 B A U D 解:由划线解得知有一个纯战略均衡(R D ,) 再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件: γγγ-=-+?=2)1(21)(U V A γγγ26)1(64)(-=-+?=D V A γγ262-=- 得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战 略均衡。 2、试将题一中的支付作一修改使其有混合战略均衡 解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。 B A U D 将博弈改成上述模型,则 )1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 5 4 = γ 同样,设A 的混合战略为)1,(θθ-,则

)1(25)1(16θθθθ-+=-?+ θθ3251+=+ 2 1= θ 于是混合战略均衡为? ???????? ????? ??51,54,21,21。 二、逆向归纳法 1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P , 则1选L '的支付P P P 32)1(25+=-+= 1选R '的支付P P P P 3233)1(36+>+=-+=

故1必选R '。 ? 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡 为 {}),(,,d a R L ' 四、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为 11q c =,其中1q 为厂商1的产量。第2个厂商的成本函数为22cq c =,其中2q 为厂商 2的产量,c 为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在?? ????2 3,21上呈均匀分布。设市场需求函数为 214q q P --=,其中P 为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均 衡为何? 解:给定2q ,厂商1的问题是 1 211 1)14( )1(max 1 q q q q P q ---=-=π 因)(22c q q =。厂商1不知道c ,故目标函数为 ?? ????--=---??2 /3212 112 /31212112 11 )(3max )1)(4(max dc c q q q q dc q c q q q q 一阶条件: 0)(232 /3212 1 =- -? dc c q q 得 ?-=2 /3212 1)(2123dc c q q (1) 厂商2的问题是: 22 2122212 2)4( )4( )(max 2 q q q q c q c q q q c P q ---=---=-=π 一阶条件: 02)4(21=---q q c

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

自己写的博弈论结课论文

自己写的博弈论结课论文 博弈论论文 博弈论结课论文 宿舍是我们在上课之余,活动最频繁的场所之一,和舍友们有缘能住在一起,朝夕相处,一起打水,一起吃饭,一起学习,对培养我们合作能力和集体生活能力起了重要的作用。但宿舍的同学来自天南地北,由于生活习惯、成长背景以及价值取向等不同,对不同的事情意见难免会产生分歧,这就出现了各种大大小小的博弈。 为了打造一个温馨和谐的宿舍氛围,身为宿舍长,就要对这个宿舍好好管理。这里每个人之间每天都在进行着一场场博弈,所以博弈就在身边,有人存在的地方就会有博弈的存在。而这一场场的博弈催促着我们长大,学习并且合理的使用能让我们更好的适应这个社会,并且通过合作实现共赢。 每个宿舍都会有本“难念的经”,而我们宿舍最大的问题是因大家的作息时间不统一引出的。宿舍楼除了周五,周六晚上每晚都是十一点准时熄灯,而A同学和B同学习惯了晚睡,所以在熄灯后总会“挑灯夜战”,而这影响了喜欢早睡早起的C同学,使得C同学总是抱怨A,B同学都熄灯了才去洗漱或者发出响声影响睡眠;而A,B同学又抱怨C同学早晨起床太早而弄得休息不好。双方都不肯让步,这一度使得宿舍气氛很不和谐,并且所有同学都开始抱怨宿舍不够好,不够温馨。于是我和C同学单独聊了聊,又和A,B同学私下里沟通,其实大家都愿意宿舍是个温暖的“窝”,只是不知用什么方式达到同时又不愿失了面子,于是我们达成共识:每晚熄灯前所有人必须洗漱完毕,熄灯后尽量不再发出响声,彼此互相体谅,尽量不要打扰别的同学休息;早起的同学也一样,尽量做到不打扰他人。如果可以,尽量宿舍成员作息时间能达成一致。一段时间后,宿舍又恢复了从前的欢声笑语。 页 1

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论重点

第一章 1.囚徒困境的均衡是:剔除严格劣势策略 2.猜硬币的均衡是:纯策略纳什均衡 3.博弈的基本要素(填空): 博弈的标准式表达包括以下八个基本要素: 1. 博弈的参与者(Players) 2. 各博弈方各自可选择的全部策略(Strategies)或行为(Actions)的集合 3. 进行博弈的次序(Orders) 4. 博弈方的得益(Payoffs) 5.博弈行为(action) 6.博弈信息(information) 7.结果(outcome)* 8.均衡(equilibrium) *-分析追求的结果 理性假设:参与者聪明的,利己的;聪明人假设 4.博弈的分类(填空) 1.按照博弈者的先后顺序,博弈持续的时间和重复的次数进行分类,博弈可以划分为静态博弈(Static game)和动态博弈(Dynamic Game)。 动态博弈是指在博弈中,博弈者的行动有先后顺序(Sequential-Move),且后行动者能够观察到先行动者所选择的行动或策略,因此, 动态博弈又叫做序贯博弈。 动态博弈的一类特殊形式叫做重复博弈(Repeated Games),又分为有限次重复博弈和无限次重复博弈。“有限次重复博弈”(Finitely Repeated Games)“无限次重复博弈”(Infinitely Repeated Games)。 5.策略表达方式:1)矩阵式(静态博弈)2)扩展式(动态博弈) 第二章 1.占优策略均衡(不需要理性人假设) 2.求严格下策消去法(填空或计算) 所谓“严格劣策略”(Strictly Dominated strategies)是指:在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略。 思路: 1、先找出某个参与人的劣策略(假定存在),把它剔除,重新构造一个不包含已剔 除策略的新博弈; 2、然后再剔除新博弈中某个参与人的劣策略;…… 3、直至剩下一个唯一的策略组合。该策略组合就是博弈的均衡解,称为“重复剔 除的占优策略均衡”。 3.纳什均衡(问答或填空)

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

自己写的博弈论结课论文

博弈论结课论文 宿舍是我们在上课之余,活动最频繁的场所之一,和舍友们有缘能住在一起,朝夕相处,一起打水,一起吃饭,一起学习,对培养我们合作能力和集体生活能力起了重要的作用。但宿舍的同学来自天南地北,由于生活习惯、成长背景以及价值取向等不同,对不同的事情意见难免会产生分歧,这就出现了各种大大小小的博弈。 为了打造一个温馨和谐的宿舍氛围,身为宿舍长,就要对这个宿舍好好管理。这里每个人之间每天都在进行着一场场博弈,所以博弈就在身边,有人存在的地方就会有博弈的存在。而这一场场的博弈催促着我们长大,学习并且合理的使用能让我们更好的适应这个社会,并且通过合作实现共赢。 每个宿舍都会有本“难念的经”,而我们宿舍最大的问题是因大家的作息时间不统一引出的。宿舍楼除了周五,周六晚上每晚都是十一点准时熄灯,而A同学和B同学习惯了晚睡,所以在熄灯后总会“挑灯夜战”,而这影响了喜欢早睡早起的C同学,使得C同学总是抱怨A,B同学都熄灯了才去洗漱或者发出响声影响睡眠;而A,B同学又抱怨C同学早晨起床太早而弄得休息不好。双方都不肯让步,这一度使得宿舍气氛很不和谐,并且所有同学都开始抱怨宿舍不够好,不够温馨。于是我和C同学单独聊了聊,又和A,B同学私下里沟通,其实大家都愿意宿舍是个温暖的“窝”,只是不知用什么方式达到同时又不愿失了面子,于是我们达成共识:每晚熄灯前所有人必须洗漱完毕,熄灯后尽量不再发出响声,彼此互相体谅,尽量不要打扰别的同学休息;早起的同学也一样,尽量做到不打扰他人。如果可以,尽量宿舍成员作息时间能达成一致。一段时间后,宿舍又恢复了从前的欢声笑语。

反而会使自己的利益也受到损害,得不偿失。由此可以看出,生活在集体中就不能只以自己为中心,要多为他人着想,多为集体着想,多一些理性的交流和沟通,互相学习、团结互助、彼此尊重、取长补短,营造出和谐温馨的氛围对于个人的身心发展都大有好处,同时会使每个人的收益大幅增加达成共赢,获得更好的结局。

博弈论重点

博弈论期末复习要点 纳什均衡(P52):指的是参与人的这样一种策略组合,在该策略组合中,每个人的策略都是最优的,任何参与人单独改变策略都不会得到好处。换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略。 完全信息(P34):各个博弈方都完全了解所有博弈方在各种情况下的得益状况。 上策均衡(P41):在某个博弈中,如果不管其他博弈方选择什么策略,一博弈方的某一个策略给他带来的收益始终高于其他策略,至少不低于其他策略。 帕累托上策均衡(P92):多个纳什均衡的某一个均衡策略给所有博弈方带来的得益都大于其他所有纳什均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕累托效率。 聚点均衡(P97):在多重纳什均衡博弈中,双方同时会选择一个聚点构成的纳什均衡。 合并均衡(P268):具有完美信息的博弈方在博弈中,不管自己情况如何,都采取相同的市场均衡。(在合并均衡中,完美信息博弈方的情况不同,并不会导致他们的行为不同,因此他们的行为不会给不完美信息的博弈方透露任何有用的消息) 分开均衡(P268):在不同情况下,完美信息博弈方所采取完全不同的市场策略。(在分开均衡中,由于博弈方的情况不同,采取的不同的市场策略,因此完美信息博弈方的策略可以完全反映他的情况,因此能够给不完美信息博弈方的“判断”提供充分的信息和依据) 海萨尼转换(P292):将得益不了解转化为类型不了解的基础上,进一步将不完全信息静态博弈转化为完全但不完美信息动态博弈进行分析的思路。 完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全了解的博弈。 不完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全不了解的博弈。 混合策略(P72):博弈方以一定的概率分布在可选策略中随机选择的决策方式。 一致性预测(P53):如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略。简单来说,各个博弈方的实际选择行为与他们自己的预测是一致的。 严格下策反复消去法与纳什均衡的关系(P55): (1)在n个博弈方的博弈G={S1,…,S n;u1,…,u n}中,利用严格下策反复消去法排除了除(s1*,…,s n*)之外的所有策略组合,那么(s1*,…,s n*)一定是该博弈唯一的纳什均衡; (2)在n个博弈方的博弈G={S1,…,S n;u1,…,u n}中,如果(s1*,…,s n*)是G的一个纳什均衡,那么严格下策反复消去法一定不会将它消去。 动态博弈中引入纳什均衡的原因,他与纳什均衡的关系(P119): 子博弈完美纳什均衡即动态博弈中具有这样特征的策略组合;它们不仅在整个博弈中构成纳什均衡,而且在所有的子博弈中也都构成纳什均衡。在动态博弈分析中引进子博弈完美纳什均衡概念的原因在于,动态博弈中各个博弈方的行为有先后次序,因此往往会存在相机抉择问题,也就是博弈方可能在博弈过程中改变均衡策略设定的行为,从而使得均衡策略存在可信性问题,而且纳什均衡无法消除这种问题,只有子博弈完美纳什均衡能够解决它。 子博弈完美纳什均衡一定是纳什均衡,但纳什均衡不一定是子博弈完美纳什均衡。因此一个动态博弈的所有子博弈完纳什均衡是该博弈所有纳什均衡的一个子集。 有限次重复博弈与无限次重复博弈的区别(P188): 从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中

博弈论结课论文

博弈论基础 结课论文 课程名称:博弈论基础授课教师: 专业班级: 学生姓名:学号 成绩:

博弈随笔 以前,只是听说博羿——认为是那些?谍战片?似的斗心机,拼命得到所谓的胜利,让我想到?左右互搏术?。今天,挺欢喜的,值得一听,更加值得一想。 老师与学生第一节课,以(身边)故事开场,吸引了在玩、在谈、在写、在愣神的学友的耳朵和眼球,学友们——也学到了些东西,或者与博羿之思想能碰撞闪现出火花,有利益关系吗?一个,望学术或教育水平得到提高或责任的心。另一个,得点学分或找点乐子或陪伴人或还真有少许的是学的。俗话说的好?愿打,也得愿挨?呀!要么,人数成?抛物线?一样变化,要么是?倒梯形?,这也许就是学生,大学生的规律!而师,或呆板地照本宣科或妙趣横生或平平淡淡。显然,我们比较幸运点! 注:学点东西——还是比较好的。如何提高教学质量与学习效果?一个人,当TA面对TA喜欢或感兴趣的,才会花时间去听(无意评价教育体系),这可能占到大部分吧(希望),少部分随意的点的(暂评),因此,怎么才能延长其喜欢的持续时间:才是关键(除一些真学的)。 总之,?少壮不努力,老大徒伤悲?! 效率——单位个体在单位时间内获得的成果。现在,自己,的确是在玩时间战术,耗得起吗?也许只有在有效时间内完成自己的任务,努力加信心 (说偏了)。没话了,挂住了。 记于二零一二年三月一号晚二十三点五十六分(写了将近四十分

钟) 今天晚上,上课,感觉到了无聊与无奈,选修与专业,浅与深。主要讲了一些博弈的基础知识(概念类),自己也记了一些笔记(各人有各自的学习方法)。而我是靠时间磨靠笔磨的!偏了,,回归正传。她(老师)讲了一些故事——这的确挺吸引人眼球与耳朵的。但下面因为玩,其他的继续。同志们,半推半就的去 STUDY! 3月中旬的一次课,忘了忘了! 今天——2012年3月22日,博弈论的第三次课了(好像学生上课,都是这样似的)。 她,老师讲了纳什均衡的运用实例——一些经典例子:双垄断的博弈——也推倒出了于今下有实际意义的结论!但,我好像没有像第一次上课那样——认认真真的听:边看着鲁迅的小说边听着老师的?絮叨?,其实——自己挺喜欢数学的:可由初中的喜爱得出,只是随着时间的推移与知识的无奈——?膨胀?,自己也被自己慢慢的舍弃了! 难道自己没有想过吗?答案,不言而喻! 一个人,可悲的不是知道,而是无知与明明知道而又偏偏无知! 莫伤,也伤不起!三月的最后一节,老师讲了一些?概率性?的纳什均衡。第一小节,师已讲了个例子,同时也演算了一个例子,当下课布臵了一个小问题,在课间做,却无人问津。上课时?自然?鸦雀无声。

博弈论信息经济学知识点

博弈论与信息经济学 完全信息静态博弈 考察占优战略均衡概念及求解 解题思路:理性参与人做出是最优选择,该博弈存在占优战略均衡,据此可知答案为(3)。 考察重复剔除劣战略占优战略均衡概念及求解 说明:考察重复剔除劣战略,求解占优均衡的方法。答案:(U,L) 下面考察PNE及其解法

妻子 丈夫 (a )请检验,纳什均衡(最优战略组合)是同生共死;均衡结果是同生,或者共死; (b )请检验,占优均衡(占优战略组合)是坚强活着;均衡结果是同生(互相煎熬); (c )请检验,纳什均衡(最优战略组合)是你死我活;均衡结果是死活,或者活死; 显然,(c )情形之下,二人之间的仇恨比(b )中更深。 一些类型的博弈中,PNE 未必存在。以下考察MNE 及其解法 说明:猜谜游戏,是一种典型的零和博弈。这类博弈没有纯战略NE ,但是却存在混合战略 (c ) 活着 死了 (b ) 活着 死了 活着 死了 (a ) 活着 死了 活着 死了

NE。希望大家通过这个例子,加深对NE的概念及NE存在性定理的理解。同时,混合战略NE求解也是本题考察点。以下两个例子,与此相同,供大家练习使用。 模型化如下博弈:两个小朋友一起做猜拳游戏,每人有三个纯战略:石头、剪刀、布。胜负规则为:石头胜剪刀,剪刀胜布,布胜石头,如二人出手相同则未分胜负。二人同时出手。胜者的支付为1,负者的支付为-1,未分胜负时支付均为0。(1)请写出该博弈的支付矩阵,并判断其是否存在占优战略均衡。(2)该博弈是否存在纯战略纳什均衡,是否存在混合战略纳什均衡?如果存在,请写出。 下例来自张维迎,P131。 美国普林斯顿大学“博弈论”课程中有这样一道练习题:如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市。而敌人的守备是三个师,规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比敌人守备部队兵力少或者相等,你就失败。你如何制定攻城方案? 与零和博弈不同,有些博弈既有PNE,又有MNE。如以下性别战博弈和斗鸡博弈。 性别战博弈:

博弈论论文

博弈论课程论文生活中的博弈论 学院: 姓名: 学号:

生活中的博弈论 摘要:本文从实际生活入手,主要是把生活中所会出现的一些问题、一些选择用博弈论的思想进行分析。有时候看起来很简单的问题,其实深究起来并不是那么简单,不能只看表面,要仔细分析每一个问题参与者的心理,做出多种情况的假设,才能做出最有利的选择。 关键词:博弈,心理,生活,假设 一、博弈论简介 博弈论又被称为对策论既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。 基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。 类型: (1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益分配问题。 (2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己的收益最大,即策略选择问题[1]。 (3)完全信息/不完全信息博弈:参与者对所有参与者的策略空间及策略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。 (4)静态博弈和动态博弈 静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。 动态博弈:指双方的行动有先后顺序并且后行动者可以知道先行动者的策略。 二、博弈例证

博弈论与社会科学方法论(潘天群)

通识课 课程中文名称:博弈论与社会科学方法论 课程英文名称:Game Theory and Methodology of Social Sciences 课程代号:开课学期:第一学期(秋学期) 主讲教师:潘天群职称:教授、博导 研究专长:博弈论、逻辑学、科学方法论 所在院系:哲学联系电邮:tqpan@https://www.360docs.net/doc/f312539921.html, 授课对象:全校二、三年级本科生(不限专业) 一、主讲教师简介: 潘天群,哲学博士,现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才(2006)。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。 主要研究领域为:逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部:《行动科学方法论》,《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》,自2002年出版以来深受读者欢迎,为畅销书与长销书,已出版第三版。 主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”(2009)。 二、课程简介 由于“他人”与“我”是既合作又竞争的关系,研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来,对社会现象表现出强大的解释力,已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖,许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学(如生物学、人工智能)之中。 本课程突破数理博弈论的框架,结合主讲教师十年来的研究工作,构建适合

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论期末论文终稿

关于考试作弊中的博弈分析 蔡於期 又到了期末,对于我们学生来说,又要开始应对各门的考试了。学校的图书馆、教室等地方的复习的身影越来越多,但是,也有一些人没有复习,他们现在想的是找各种学霸,以便在期末考试的时候能抱上“大腿”(即考试作弊)。如果能抱上“大腿”,考试就没有压力了。其实,抱“大腿”这种行为蕴含着许多的博弈论的知识,我们可以通过对其的探讨,来了解博弈论的知识在我们生活中的应用,了解博弈论并非是高不可攀的东西,它就在我们的身边。 关键词:考试作弊;智猪博弈(“搭便车”);进化博弈;不可置信威胁 一、智猪博弈(“搭便车”) 其实,不管是考试作弊还是什么作弊,我们都知道这是不好的行为,因为它造成了不公平,而它的不公平性从博弈论的角度看,主要是因为它是一种会造成坏影响的“搭便车”的行为。我们可以假设有两个平时关系比较好的同学,分别是A和B。A是平时认真学习的乖学生,而B则相反,平时只知道玩,成绩很差。现在到了期末,B就要求A在考试时“帮助”B,即考试作弊。这时A有两个选择,帮助或者不帮助。当A选择不帮助时,就会被别人说是“小气”,同时影响自己和B的要好关系,这对A来说是一笔损失。当A选择帮助B作弊时,A心理面难免会有不满,因为B可以“坐享其成”,而且A帮助B作弊也要冒着被学校处罚的风险。对于B来说,也有两个选择,作弊或者不作弊,这里B除非有重大变故,否则的话会选择作弊。当然,也不排除B良心发现,不想作弊了。所以我们可以得出如下的得益矩阵: B A 作弊不作弊帮助5, 55, 0 不帮助3, 04, 0 表1. 考试作弊得益矩阵 从上面的得益矩阵我们看出,经过博弈的分析,不管A同学内心愿意还是不愿意,最终都会选择帮助B来考试作弊,因为这样是最优的策略。所以A同学就得在考试前的期末复习期间像个勤奋的“大猪”,早出晚归,来往奔波于自习室和宿舍之间,而B同学就只需像“智猪博弈”里面的“小猪”在槽边安心等待享受成果就行了。所以,帮助别人考试作弊往往会使自己成为一只辛苦的“大猪”,而让别人安享成果,这样不仅对自己不公平,对于其

【方案】博弈论与信息经济学期末复习题.doc

博弈论与信息经济学期末复习题 1、在下面的战略式表述博弈中,说明两个参与人是否有占优战略及其理由。 2、在下面的战略式表述博弈中,证明战略组合(U, L)是纳什均衡,(U, R)不是纳什均衡。 3、求下面扩展式表述博弈的纳什均衡及结果。 4, 2 7, 0 2, 4 4, 2 L R Column Row U D 8, 4 3, 3 5, 8 10, 10 L R Column Row U D 进入者 (40, 50) (10, 40) (0, 200) (0, 200)

4、求出下面战略式表述博弈的全部纳什均衡,画出反应对应图。 5、在下面的扩展式表述博弈中,写出两个参与人的战略空间,求其子博弈精炼纳什均衡及结果。 1, 1 0, 0 0, 0 2, 2 L R Column Row U D 进入者 (0, 500) (0, 300) (200, 200) (100, 300)

6、求下面扩展式表述博弈的子博弈精炼纳什均衡及结果。 7、图示以下列战略式表述博弈为阶段博弈的无限重复博弈的纳什威胁点、可行支付集合、个人理性支付集合、个人理性可行支付集合和子博弈精炼可达到的支付集合。 1 (10, 60) (100, 200) 6, 6 0, 6 6, 0 1, 1 L R Column Row U D

8、写出下列扩展式表述博弈的战略式表述,求出这个博弈的纳什均衡及结果。 9、在以下静态贝叶斯博弈中,在位者知道自己是高成本的,进入者不知道在位者是高成本还是低成本,但知道在位者是高成本的概率是50%,两个参与人同时行动,画出这个博弈的扩展式表述,说明在位者在两种成本情况下的战略选择,计算进入者两种战略选择的期望支付,写出这个博弈的贝叶斯纳什均衡。 消费者 (1, 2) (2, 1) (0, 0) (0, 0) 在位者 高成本 低成本 进入 者 进入 不进入

(完整word版)博弈论知识点总结,.docx

博弈论知识总结 博弈概述: 1、博弈概念: 博弈:就是研究决策主体的行生直接相互作用的决策以及种决策的均衡。 博弈研究的假: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知 3、每个参与人被假定可以所境以及其他参与者的行形成正确的信念与期 2、和博弈有关的量: 博弈参与人:博弈中行以最大化自己受益的决策主体。 行:参与人的决策 略:参与人的行,即事件与决策主体行之的映射,也是参与人行的。信息:参与人在博弈中的知,尤其是其他决策主体的略、收益、型(不完全信息) 等的信息。 完全信息:每个参与人其他参与人的支付函数有准确的了解;完美信息:在博弈 程的任何点每个参与人都能察并之前各局中人所的行,否不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、略空及支付函数等信息, 即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主所的行的函数。 从学的角度,博弈是决策主体之的相互作用,因此和个人决策存在着区: 3、博弈与决策的区: 1、微学的个人决策就是在定市价格、消者收入条件下,最大化自己 效用,研究工具是无差异曲。可表示:maxU(P,I),其中 P 市价格, I 消 者可支配收入。 2、其他消者个人的合影响表示一个参数——市价格,所以在市价格既定 下,消者效用只依于自己的收入和偏好,不用考其他消者的影响。但是在 博弈理个人效用函数依于其他决策者的和效用函数。 4、博弈的表示形式:略式博弈和展式博弈 略式博弈:是博弈的一种范性描述,有亦称准式博弈。 略式博弈是一种假每个参与人一次行或略,并且参与人同行的决策模型,因此,从本上来略式博弈是一种静模型,一般适用于描述不需要考博弈程的完全信息静博弈。 1、参与人集合{ 1 , 2,...,n }: 2、每位参与人非空的略集S i n s i(s 1 ,...,s i ,..., s n ) 上的效用函数Ui(s1,s2,?,sn). 3、每位参与人定在略合 i1 展式博弈:是博弈的一种范性描述。 与略式博弈重博弈果的描述相比,展式博弈更注重参与人在博弈程中遇到决策序列构的分析。 包含要素: 1 、参与人集合{ 1 , 2,...,n }

相关文档
最新文档