杭电博弈论复习

合集下载

(完整word版)经济博弈论期末复习资料(word文档良心出品)

(完整word版)经济博弈论期末复习资料(word文档良心出品)

经济博弈论复习资料一、名词解释1、零和博弈:是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作可能的博弈。

2、常和博弈:是指各博弈方的得益之和是一个非零常数的博弈。

常和博弈中各博弈方之间利益关系也是对立的,博弈方之间的基本关系也是竞争关系。

3、纳什均衡:在博弈G={}n n u u S S ,,;,,11 中,如果由各个博弈方的各一个策略组成的某个策略组合()**1,,n s s 中,任一博弈方i 的策略*i s ,都是对其余博弈方策略的组合()**1*1*1,,,,,ni i s s s s +- 的最佳对策,也即()()**1**1*1**1**1*1,,,,,,,,,,,,n i ij i i n i i i i s s s s s u s s s s s u +-+-≥ 对任意i ij S s ∈都成立,则称 ()**1,,n s s 为G 的一个纳什均衡。

4、混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。

5、纳什定理:在一个有n 个博弈方的博弈G={}n n u u S S ,,;,,11 中,如果n 是有限的,且i S 都是有限集(对i=1, ,n ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。

(这个定理就是说,每一个有限博弈都至少有一个混合策略纳什均衡)6、帕累托上策均衡:是指帕累托效率意义上的优劣关系,因此用这种方法选择出来的纳什均衡,也称为“帕累托上策均衡”。

7、风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个风险上策均衡。

8、子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息和进行博弈所需要的全部信息。

9、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

矿产

矿产

矿产资源开发利用方案编写内容要求及审查大纲
矿产资源开发利用方案编写内容要求及《矿产资源开发利用方案》审查大纲一、概述
㈠矿区位置、隶属关系和企业性质。

如为改扩建矿山, 应说明矿山现状、
特点及存在的主要问题。

㈡编制依据
(1简述项目前期工作进展情况及与有关方面对项目的意向性协议情况。

(2 列出开发利用方案编制所依据的主要基础性资料的名称。

如经储量管理部门认定的矿区地质勘探报告、选矿试验报告、加工利用试验报告、工程地质初评资料、矿区水文资料和供水资料等。

对改、扩建矿山应有生产实际资料, 如矿山总平面现状图、矿床开拓系统图、采场现状图和主要采选设备清单等。

二、矿产品需求现状和预测
㈠该矿产在国内需求情况和市场供应情况
1、矿产品现状及加工利用趋向。

2、国内近、远期的需求量及主要销向预测。

㈡产品价格分析
1、国内矿产品价格现状。

2、矿产品价格稳定性及变化趋势。

三、矿产资源概况
㈠矿区总体概况
1、矿区总体规划情况。

2、矿区矿产资源概况。

3、该设计与矿区总体开发的关系。

㈡该设计项目的资源概况
1、矿床地质及构造特征。

2、矿床开采技术条件及水文地质条件。

博弈论期末复习重点

博弈论期末复习重点

1、博弈:一些个人、队组或其他组织;面对一定的环境条件;在一定的规则下;同时或先后;一次或多次;从各自允许选择的行为或策略中进行选择并加以实施;各自去得相应结果的过程..2、博弈论:就是系统研究各种博弈问题;寻求在各博弈方具有充分或者有限理性、能力的条件下;合理的策略选择和合理选择策略时博弈的结果;并分析这些结果的经济意义、效率意义的理论和方法..3、囚徒的困境:两决策者从各自最大的利益出发选择行为;结果是既没有实现两人总体的最大利益;也没有真正实现自身的个体的最大利益..4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈..5、动态博弈:各博弈方的选择和行动不仅有先后次序;而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动;甚至还包括自己的选择和行动;6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息..7、不完全信息不对称信息:是指经济行为主体掌握了某种经济环境状态的部分信息..8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解..9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程..10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策;那么这个策略组合肯定是所有博弈方都愿意选择的;必然是该博弈比较稳定的结果..11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略..在两人博弈的情况下;“给定你的策略;我的策略就是我最好的策略;给定我的策略;你的策略也是你的最好的策略”..12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决策方式..13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡..这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益..14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈..15、完全且完美信息动态博弈:动态博弈中既是完全信息又是完美信息的部分16、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中;各博弈方的策略均衡构成的一个策略组合满足;在整个动态博弈及它的所有子博弈中都构成纳什均衡;那么这个策略组合称为该动态博弈的一个~17、逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析;逐步倒推回前一个阶段相应博弈方的行为选择;一直到第一阶段的分析方法..18、颤抖手均衡:在博弈时也要考虑到合作者可能会发生轻微的失误而影响整个结果;即使在这种小概率事件发生时;所选策略依然是最优的.. 19、道德风险:从事经济活动的人在最大限度地增进自身效用时作出不利于他人的行动;损害委托人或是其他代理人的利益..交易后的信息不对称性;掌握较多信息的一方在交易后的利己倾向;如隐瞒欺骗、不负责任、不努力工作..20、逆向选择:指交易双方在交易前的信息不对称;导致市场上交易的劣质商品的比例越来越高;甚至导致优质品完全被驱出市场的一种现象..简答210%一、设定一个博弈模型必须确定的方面:1、博弈方:即博弈中进行决策并承担结果的参与者;2、各博弈方各自可选择的全部策略或行为的集合策略空间:即博弈方选择的内容;可以是方向、取舍选择、量值;3、进行博弈的次序:即博弈方行为、选择的优先次序或重复次数等..次序不同一般就是不同的博弈;即使博弈的其他方面都相同;4、博弈方的得益:即博弈方行为、策略选择的相应后果、结果必须是数量或者能够折算成数量;对应于各博弈方的每一组可能的决策选择都应有一个结果表示该策略组合下各博弈方的所得或所失..得益应该是客观存在;但不意味着各博弈方都了解各方的得益情况..5、信息结构;即博弈方相互对其他博弈方行为或最终利益的了解程度;6、行为逻辑和理性程度;即博弈方是依据个体理性还是集体理性行为以及理性的程度等..二、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子..1、烟草厂商新产品的开发、价格定位的效果;常常取决于其他厂商、竞争对手的相关竞争策略..例如某卷烟厂推出一种高价烟;该计划能否成功常取决于其他厂商是否采取同样的策略、如果其他厂商也推出高价烟而且档次宣传力度比前者还要高、大;那么前者的计划成功的难度就很大;但如果没有其他厂商推出同类产品;那前述某厂的计划成功的可能性就大;2、房地产开发企业在选址、开发规模、目标客户定位等方面也常常存在相互制约的问题..例如一个城市当时的住房需求约10000平方米;如果其他厂商已经开发了8000平方米;那么你再开发5000平方米就会导致供过于求;销售就会发生困难;但如果其他厂商只开发不到5000平方米;那么你的5000平方米就是合理的..3、麦当劳的新产品所带来的收益、价格产量、产品开发三、“囚徒困境”内在根源是举出现实生活中的具体例子..根源在于个体之间存在行为和利益相互制约的博弈结构中;以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益;并实现整体、个体利益共同的最优..简单第说;都是个体理性与集体理性的矛盾引起的..四、分析保险市场、资本市场道德风险的逆向选择..1、汽车保险:假设张三有财产¥100000;其冯诺依曼-摩根斯坦效用指数为对数函数;即UW=lnW;并有价值为¥ 20000的汽车一辆..如果该汽车没有向保险公司投保;将有25%的可能性被偷窃..因此;期望效用为:0.75U100000+0. 25U80000=0.751nl00000+0.25ln80000=11.457l;如果保险公司只索取成本而管理成本为0;那么;公平的保险费用为¥ 20000× 0.25=¥ 5000..如果张三将汽车完全保险;无论汽车是否被盗;其财富都是¥95000;预期效用U95000=ln95000=11. 4616因此;当张三购买公平保险后;其效用高于不购买保险..现在讨论张三是否安装防盗装置的问题;假设安装一个防盗装置的成本为¥1950;如果安装该装置、汽车被盗概率从0.25减小到0.15..如果没有投保;安装防盗装置的预期收益¥20000×0.10=¥ 2000超过成本;因而安装防盗装置有效率;其期望效用为:0.85ln100000-1950+0.15ln100000-2000-1950=11.4590超过不安装的期望效用11.457l;因此;如果张三没有投保;那么;购买防盗装置是理性的..但是;当张三投保后;情况发生了变化..假设张三购买汽车保险的价格是¥ 5200其中¥ 5000为预期损失;¥200为管理费..如果保险公司并不检查投保人是否安装防盗装置;那么;投保的预期效用为1n94800=11.4595;该预期效用超过安装防盗装置的预期效用..张三将会选择投保..但投保后将没有动力安装防盗保险装置;并且可能产生麻痹心而提高被盗的可能性..结果、发生火灾的概率从0.005上升到0.008;保险公司的实际预期损失为¥800..结果;每出售一张保险单平均都会损失S300..这种保险单对于保险公司来说不可行..由于代理人隐蔽行动难以观察;火灾保险市场经常出现投保人经营亏损后;有意纵火索取高额保险金的案例..2、火灾保险的道德风险:假设某厂商产品仓库价值为¥100000;厂商采取防火措施的成本为¥50..采取防火措施后小心谨慎;发生火灾概率为0.005;没有防火措施且疏于防范;发生火灾概率为0.008..又假设保险公司以预期火灾损失¥500;以此作为保险费用出售保险单..在这种环境下;如果厂商向保险公司投保后;就可能不会有动力继续执行防火措施;且可能疏于防范..3、健康保险市场:投保人一旦获得健康保险;相当于降低投保人的医疗护理费用..因此;理性的个人将增加他在这方面的消费量;相应地增加了医疗保险支付的数量;即增加社会成本的数额;因为个人保险费的增加意味着社会医疗支出费用的增加..在这种状态下;社会的风险服务和医疗服务都将低效率..4、资本市场:每个借贷者要求同样数目的贷款条件下;银行不能将借款者按照回报率的大小给予不同的利息率..银行能否收回贷款并获得利润;既取决于借款者的经济效益;也取决于银行所处环境状态的各种不确定性..当银行以借款者的经济收益为利息率标准时;借款者就会利用银行难以观察或不可能观察到的隐蔽行动采取相应行动;如虚报利润额、非法转移资金;人为地扩大成本等道德风险行为;由此使银行承担的风险比签定委托-代理合同前有所增加..5、证券市场的“逆向选择”:在信息不对称的情况下;投资者无法确定哪些上市公司是高质量的、有投资价值的公司;哪些是低质量的上市公司..因此;投资者在作出投资决策时;往往只能根据整个市场所有发行企业的平均质量来决定其愿意投资的价格..这种投资者的“折中”行为就会抑制那些高于平均质量水平的发行企业提高经济效率和管理水平的积极性;而鼓励投资者向低质量企业流动..因为高于平均质量水平的上市公司并不能在证券市场体现其应有的价值;因此就会造成高质量企业不情愿进入证券市场..造成低质量的上市公司横行于证券市场..信息不对称的结果造成股票价格与上市公司经营业绩的背离则使证券市场失去了评价上市公司业绩、约束上市公司经营行为的市场机制;这种市场选择的结果只会导致整个市场的上市公司质量的降低;并成为市场过度投机的主要根源;最终会导致市场的低效率甚至是市场的崩溃..判断一、博弈的分类方法:1、行为逻辑;是否允许存在有约束力协议:合作博弈、非合作博弈2、理性层次:完全理性博弈、有限理性博弈进化博弈;3、博弈过程:静态博弈、动态博弈、重复博弈4、信息结构:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈;5、得益特征:零和博弈、常和博弈、变和博弈6、博弈方数量:单人博弈、两人博弈、多人博弈;7、策略数量:有限博弈、无限博弈二、上策均衡、纳什均衡、严格下策反复消去法的关系区别:1、上策均衡是各博弈方绝对最优策略的组合;而纳什均衡则是各博弈方相对最优策略的组合..上策均衡一定是纳什均衡;但纳什均衡不一定就是上策均衡..对同一个博弈来说;上策均衡的集合就是纳什均衡集合的子集;但不一定是真子集;2、严格下策反复消去法与上策均衡分布对应两种有一定相对性的决策分析思路:严格~对应排除法即排除绝对最差策略的分析方法..上策~对应选择法;即选择绝对最优策略的均衡概念..二者并不矛盾;甚至可以相互补充..严格~不会消去任何上策均衡;可以简化博弈;3、严格~和纳什均衡也是相容和补充的;严格~不会消去任何上策均衡;可以简化博弈;使纳什均衡分析更加容易..。

博弈论复习总结

博弈论复习总结
如果甲选择策略N,得益只有1,所以作为先行动者,他肯定 不会选择这个策略,对于乙来说,虽然不知道甲的选择,但 他自己肯定选择策略R,所以对这个动态博弈来说,博弈路径 必定是甲选择策略T,乙选择策略R。
追 B:女方
不接受
A:追求者 不追 均衡路径
B:女方
接受
不接受
(10,-10) (-50,-40)
(0,0)
(0,0)
第三个NE的均衡结果:(追,(接受,不接受))均衡路径上符合纳什
均衡,非均衡路径上女方不接受得益是0不小于接受的得益0,非均衡路
径是NE,则该均衡是SPNE。
接受
追 B:女方
不接受
囚徒的话: 1、集体理性和个人理性常常是冲突的:民主常常
不能代表“民意”;公司好不见得你就好;如果 我们都强大了,国家不见得就强大了…… 2、承认人是自私的,一切都好办了。
10
2.纳什均衡是唯一的吗?
美国会打朝鲜吗
同时有两个纳什 均衡
美国打了越南,打了阿富汗,打了 伊拉克,也已经打过朝鲜,它还会 再打朝鲜吗?如果美国智库计算出 如下简化的支付矩阵,那么结果会 怎样呢?
博弈论总复习总结
• 博弈类型
类型
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
其他博弈
• 博弈的类型关系
非合作博弈 博弈
合作博弈
是否同时 决策
对他人的 了解程度
静态博弈
动态博弈
完全信息 博弈
不完全信 息博弈
• 博弈的分类
博弈 分类
是否有协议 决策的顺序
是否连续 持续时间 得益情况 得益信息 过程信息
在案例博弈之中,如果局中人甲T、S、N三个策略,那么博

博弈论期中复习大纲知识讲解

博弈论期中复习大纲知识讲解

博弈论期中复习大纲博弈论第一讲——第五讲复习大纲第一讲博弈的基本规则1、博弈论的假定是:人是理性的。

2、博弈论关注的是:意识到其行动将相互影响的决策者们的行为。

3、一个博弈可以根据参与人行动的先后顺序划分为静态博弈(一次性博弈)和动态博弈(序贯博弈)。

4、博弈论可分为合作博弈和非合作博弈:若参与人之间能达成有约束力的协议,则该博弈称为合作博弈,否则为非合作博弈。

合作博弈强调的是团体理性和效率、公正、公平;非合作博弈强调的是个人理性、个人最优决策,其结果可能是有效率的,也可能是无效率的。

5、博弈论的基本概念包括(1)参与人:是指作决策的个体(可能是个人也可能是团体,如国家、企业)。

每个参与人的目标都是通过选择行动来最大化自身的效用。

(虚拟参与人:自然是一个虚拟参与人,它在博弈的特定时点上以特定的概率随机选择行动。

)(2)信息:参与人在特定的时点对不同变量取值的了解。

(3)信息集:参与人的信息集还包括对已发生的行动的了解,因此,信息集随着博弈进程的变化而变化。

(4)策略:策略是参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。

【注意:参与人想采取的行动取决于自然和其他参与人过去的行动,所以策略的概念不可或缺。

参与人的策略是一个关于其行动程序的完备集合,它告诉参与人在每种可预见的情况下选择什么行动,即使参与人并不预期那种情况真的会出现。

策略与行动的不同之处在于策略是不可观测的。

】(5)行动:行动是参与人的行动变量。

(6)支付函数:支付函数是参与人从博弈中获得的(期望)效用水平,它是所有参与人策略或行动的函数,是每个参与人真正关心的东西。

(7)结果:是指博弈论分析者感兴趣的要素的集合。

(8)均衡:是所有参与人与人的最有策略或行动的组合。

参与人、行动、结果统称为博弈规则;博弈分析的目的是使用博弈规则决定均衡。

(9)均衡策略:(Equilibrium strategies )是指由博弈中的n 个参与人在最大化各自支付时所选取的策略。

博弈论的复习资料精品文档7页

博弈论的复习资料精品文档7页

名词解释:1,共同知识:是指所有当事人对该事件都知道,并且也所有当事人都知道其他当事人也知道这一事件,并且所有当事人都知道所有当事人都知道这一事件。

那么该事件就是共同知识。

2,先动优势:在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。

这种局中人先动得益大于后行得益的情况,叫做先动优势。

3,后动优势:后行动的得益比先行动的得益大的情况4,信息集:我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。

•单点集:我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。

•触发策略:即只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。

•冷酷策略:双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛。

即任何局中人的一次性不合作将触发永远不合作。

•礼尚往来策略:开始的时候和冷酷策略一样,即双方从合作开始,在以后的每个阶段,如果你的对手在最近的一次博弈中还是采取合作策略,则你继续跟他合作;如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略惩罚他,但是如果你的对手在下一次博弈中改邪归正,采用合作策略,则你在下次继续博弈中还是跟他合作。

触发策略是带有奖励和惩罚措施的一种博弈机制。

在这个机制中,惩罚措施是其中的关键。

注意:(1),一个信息集罩住的必须是同一个局中人的决策点。

•必须是同一个局中人在同一个时点的决策节点。

同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。

因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。

简答题:1,博弈的构成要素:•局中人决策主体,目的是通过选择行动(或策略)以最大化自己的支付(效用、得益)水平。

博弈论复习思考题.doc

博弈论复习题1、静态博弈的三要素?动态博弈的•五要素?参与人、策略(行动)、支付函数参与人、每个参与人选择行动的时点、每个参与人在每次行动时可供选择的行动集合、每个参与人在每次行动时有关过去行动选择的信息、支付函数在这里行动和策略分开2、博弈的分类及分类的标准。

P4按照参与人行动的先后顺序,分为静态博弈(博弈中,参与人同吋选择行动, 或虽非同时但后行动者并不知道前行动者采取了什么具体行动)呵动态博弈(只参与人行动有先后顺序,并且后行动者能观察出先行动者的行动选择)按照信息结构:参与人对有关其他参与人的特征、战略空间、支付函数的知识分为完全信息呵不完全信息。

3、给下列每一个博弈举出一•个生活屮的实例,并构建其矩阵式表述,进一步分析它的纳什均衡。

(1)智猪博弈;(2)情侣博弈;(3)斗鸡博弈;(4)囚徒困境;(5)零和博弈。

4、请准确地写出“纳什均衡”的定义,并举一个用矩阵图表示的实例,说明纳什均衡战略形成的条件。

5、纳什均衡与西方经济学屮“一般均衡”有什么不同?6、举出一•个优势均衡的实例和一•个非优势均衡的实例,并作适当的解释。

7、请分析海盗分宝问题。

8、寻找均衡的方法你会哪一•种?用你知道的方法举例予以解释。

9、请举例解释混合策略,给出矩阵图,计算其混合策略纳什均衡。

P1210、熟悉连续情形的纳什均衡的求解方法。

P811、举例说明什么是共同知识。

P912、帕累托优势是什么意思?帕累托优势是博弈论屮一个非常有名的定理,它有一个准则,即帕累托效率准则:经济的效率体现于配置社会资源一改善人们情况,主要看资源是否己经被充分利用。

如果资源已经被充分利用,要想再改善我就必须损害你或是别的什么人,要想再改善你就必须损害某个人。

-•句话,要想在改善任何人都必须损害别人,这是后就说一•个经济已经实现了帕累托效率。

打个简单的比方:假设有AB两人,两个人分别做同一样工作吋收益为分别4,若两-人合作,每人收益都为10 很显然,两人合作所得(10 10)大于两人单独行动(44)13、计算下列问题的纳什均衡:(1)库诺特产量纳什均衡;垄断条件下的企业产量及收益;斯坦克尔伯格寡头竞争均衡;对比以上三种产量及收益,指出他们的差别及其蕴涵的意义。

博弈论复习..

36
1.1.7 博弈的主要方面〔要素〕
►博弈的挨次〔Orders〕:行为决策挨次,不同的博 弈挨次产生的博弈结果可能会不同。 ►博弈方的得益〔Payoffs〕:对应于各博弈方的每一 组的可能决策选择,都应当有一个结果表示该策略组 合下各博弈方的所得或所失。“这些”所得所失就是 博弈方的得益,也叫做“支付”。 通常来说,一个博弈,最困难的地方就是确定各博弈方 的得益。博弈的多样性也都是由得益的多样性产生的。
39
1.2.1 囚徒逆境
1.囚徒逆境的根本模型 〔1〕囚徒逆境的根本模型是 塔克 1950年提出的。 〔2〕主题:个人理性与集体理性冲突。 〔3〕囚徒逆境博弈的主要方面〔要素〕: ►局中人:两个共同作案的囚徒;囚徒1、囚徒2; ►策略集合:{坦白,不坦白}; ►博弈的挨次:双方同时选择策略; ►博弈方的得益:如下页得益〔支付〕矩阵中所示。
罗斯
沙普利 20
1.1.3 博弈论与诺贝尔经济学奖
2023年,来自法国图卢兹大学的法国教授让-梯假设尔 (Jean Tirole)因其对市场力气和管制的争论分析获得诺 贝尔经济学奖。
梯假设
21
1.1.4 纳什的故事
《 美 丽 心 灵 》
22
1.1.4 纳什的故事
1928年6月13日,约翰·福布斯·纳什〔John Forbes Nash〕诞生于美国西弗吉尼亚州〔美国较穷的州〕 的布鲁菲尔德市。20岁,1948年9月入普林斯顿 大学作争论生;22岁,1950年获数学博士学位, 并留校任讲师一年。23岁,1951年到麻省理工学 院任教,直到31岁,1959年因精神分裂症而离职。 66岁,1994年获诺贝尔经济学奖。
► 50年月,合作博弈论鼎盛时期,讨价还价模型 —纳什〔1950〕和夏普里〔1953〕,核的概念— 吉利斯和夏普里〔1953〕;

博弈论复习题及答案

博弈论复习题及答案标准化工作室编码[XX968T-XX89628-XJ668-XT689N]囚徒困境说明个人的理性选择不一定是集体的理性选择。

(√)子博弈精炼纳什均衡不是一个纳什均衡。

(×)若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。

()博弈中知道越多的一方越有利。

(×)纳什均衡一定是上策均衡。

(×)上策均衡一定是纳什均衡。

(√)在一个博弈中只可能存在一个纳什均衡。

(×)在一个博弈中博弈方可以有很多个。

(√)在一个博弈中如果存在多个纳什均衡则不存在上策均衡。

(√)在博弈中纳什均衡是博弈双方能获得的最好结果。

(×)在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。

(×)上策均衡是帕累托最优的均衡。

(×)因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

(×)在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

(×)在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。

囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。

(×)纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。

(√)多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。

(√)如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t<T,在t阶段的结局并不是G的Nash均衡。

浙江大学经济学院博士生博弈论课程习题及答案

纳什均衡1.在下表所示的战略式博弈中,找出重复删除劣战略的占优均衡表1.1于R策略,所以M为严格劣策略。

删除后M再找出S1的劣战略,显然对于S1而言,M策略和D策略严格劣于U策略,所以M和D为严格劣策略。

删除M与D后找占优均衡为(U,L)即,(4,3)。

2.求解下表所示的战略博弈式的所有的纯战略纳什均衡表1.2首先看S1选择X策略。

如果S2同样选择X策略,那么S3一定选择Y策略;同样,如果S3选择Y策略,S2也一定会选择X策略,因此(X,X,Y)是一个纳什均衡;如果S2选择Y策略,那么S3一定选择X策略;同样,如果S3选择X策略,S2也一定会选择Y策略,因此,(X,Y,X)是一个纳什均衡。

其次看S1选择Y策略。

如果S2选择X策略,S3一定选择X策略;同样,如果S3选择X策略,S2也一定会选择X策略,因此(Y,X,X)是一个纳什么均衡。

如果S2选择Y策略,S3选择Y策略是理性的,如果S3选择X,S2将选择X,这样(Y,Y,X)将不是一个纳什均衡;同样,如果S3选择Y策略,S2也一定会选择Y策略,因此(Y,Y,Y)是一个纳什均衡。

所以该博弈式的纯战略纳什均衡有4个:(X,X,Y)(X,Y,X)(Y,X,X)(Y,Y,Y)。

3.(投票博弈)假定有三个参与人(1、2和3)要在三个项目(A、B和C)中选中一个。

三人同时投票,不允许弃权,因此,每个参与人的战略空间Si={A,B,C}。

得票最多的项目被选中,如果没有任何项目得到多数票,项目A被选中。

参与人的支付函数如下:U1(A)=U2(B)=U3(C)=2U1(B)=U2(C)=U3(A)=1U1(C)=U2(A)=U3(B)=0求解以上博弈的所有纯战略纳什均衡。

由上,若参与人1选择A策略。

如果参与人2同样选择A策略,那么参与人3选择ABC策略是无差异的,但均衡策略只能是参与人3选择A策略,因此(A,A,A)是一个纳什均衡。

如果参与人2选择B策略,参与人3选择AB策略是差异的,但均衡策略只能是其选择A,因此(A,B,A)是一个纳什均衡。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
雄蛙2
鸣叫
不鸣
雄蛙1
鸣叫
P-z, P-z m-z,1-m
不鸣
1-m ,m-z
0,0
例8
两家电视台竞争周末黄金时段晚8点到10点的收视率,可选择把较好的节 目放在前面还是后面,他们决策的不同组合导致收视率如下:
电视台2
前面
后面
电视台1
前面
18,18
24,20
后面
6,24
15,15
⑴如果两家是同时决策,有纳什均衡吗?
例13
在两人分1万元的讨价还价问题中,假设博弈方1风险中性,博弈 方2是风险规避的(u2=s2b,b=0.8),假设不管谈判是否成功, 这1万元中的2千元必须留给博弈方2,要求这个两人讨价还价问题 的纳什解。
例14
在破产博弈中,债权人1有债权100万元,债权人2有债权500万元。 若两人都是风险中性的,分别求可清偿资产为100万、300万和500 万情况下的纳什讨价还价解和K-S讨价还价解。
Lq
R 1-q

Up
9,9
0,8
D 1-p
8,0
5,5
答:纯策略纳什均衡:(U,L) (D,R) 9p=8p+5(1-p) p=5/6 9q=8q+5(1-q) q=5/6 混合策略纳什均衡: 博弈方甲以(5/6,1/6)的概率随机选择U和D,博弈方乙以( 5/6,1/6 )的概率随机选择L和R。 帕累托上策均衡: (U,L) 。 因为(U,L)的双方得益大于 (D,R)的双方得益。 风险上策均衡: (D,R)。因为。。。
⑵如果电视台1先选择,结果有什么?若电视台2先选择呢?
⑶如果两家谈判合作,电视台1许诺将好节目放在前面,这许诺可信吗? 结果可能是什么?
例9
双寡头古诺模型,反需求函数为P=a-Q,其中Q=q1+q2为市场 总需求,但a有ah和al,厂商1知道a究竟是ah,还是al;而厂商2只 知道a=ah的概率是θ,a=al的概率是1-θ,两个厂商的成本函数 分别为C1=cq1,C2=cq2,其中,c是大于0的常数。如果同时选择 产量的话,本博弈的贝叶斯纳什均衡是多少?

博弈方2选R的支付πR为 2(1-δ)+0δ=2(1-
博弈方1选U的支付πU为10(1-ε)+6ε=10-4ε
δ)
πU >πD
只要δ<2/3.
博弈方1此时就不会再坚持选择D了,因此均衡(D,L)不稳定。 πR >πL
均衡(U,R)稳定。
例4
求出下列博弈矩阵所有纳什均衡,其中a>0
回到第一阶段 博弈方选择L的得益为3,选择R的得益为4,选择R
所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R,博弈方2 第二阶段选择D,即(4,1)是该博弈的完美纳什均衡。
例7
在某一范围内有两只雄蛙。如果它们都不鸣叫,则吸引来的雌蛙数量0,即它 们都没有交配的机会;如果有一只雄蛙鸣叫,那么会吸引来1只雌蛙,而鸣叫 的雄蛙获交配的机会为m,0.5<m<l,但鸣叫者有成本z;如果它们都鸣叫,則 获得交配的机会为P,m<P<1,此时各有成本z。这样两只雄蛙之间构成下图得 益矩阵代表的博弈。 (P233)

L a/(a+2)
R 2/(a+2)

U0
3,4
2,2
D1
1,1
D, R) 混合策略纳什均衡是否存在呢???
例5
某行业有两个厂商,一个是产量的领导者,一个是产量的追随者。该行业的 需求曲线为p=α-βq,q代表行业的总产出。设两个厂商的边际成本为0,领 导者首先选择它的产量,并且知道追随者将观察领导者的选择并根据领导者 的产量随之选择使自己利润最大化的产量。则领导者和追随者将选择的产量 为多少?
当“包装”费用是5万元时,“包装”是个劣策略,销售2元/股的股票对我来说肯定值5元/ 股。因此,我会卖此股票。即博弈的贝叶斯纳什均衡是:“好”企业“卖”,“坏”企业 “不卖”,我“买”。
当“包装”费用是5千元时,我作“买”的最坏打算,假定“坏”企业会“包装”销售2元/ 股的股票。我“买”的期望(净)得益为(0.5×5+0.5×1-2)×1=1万元; “不买”的期 望(净)得益为0。因此,我也会卖此股票。此时, “坏”企业也肯定会“包装”销售2元/ 股的股票。即博弈的贝叶斯纳什均衡是:“好”企业和“坏”企业都“卖”,我会全“买”。
例1
给定博弈矩阵 (1)该博弈有没有优势(或上策,或占优)策略均衡?没有 (2)找出该博弈的纯策略纳什均衡。(U,L)(D,R)

L
R

U
1,9
7,7
D
0,0
9,1
例2
计算下列得益矩阵的所有纳什均衡(包括混合策略均衡),并指出哪个是帕 累托上策均衡,哪个是风险上策均衡,为什么?

例12
若你正在考虑收购一家公司的1万股股票,卖方的开价是2元/股。 根据经营情况的好坏,该公司股票的价值对于你来说1元/股和5元/ 股两种可能,但只有卖方知道经营情况的真实情况,你所知的只是 两种情况各占50%的可能性。如果在公司经营情况不好时,卖方做 到使你无法识别真实情况的“包装”费用是5万元,问你是否会接 受卖方价格买下这家公司?如果“包装”费用是5千元,你是否会 接受卖方价格买下这家公司?
例15
两户居民同时决定是否维护某合用的设施。如果只要有一户人家维护,两户人家 就都能得到1单位好处;没有人维护则两户人家均没有好处。设两户人家维护的成 本不同,分别为c1和c2。 (1)如果假设c1和c2分别是0.1和0.5,该博弈的纳什均衡是什么?博弈结果会如何? (2)如果c1和c2都是独立均匀分布在[0,1]上的随机变量,真实水平只有每户人家 自己知道,该博弈的贝叶斯纳什均衡是什么?
例10
求出下列扩展型博弈的完美贝叶斯均衡(写出求解过程)
R
1
L(p)
M(1-p) (1,3)
2
U
DU
D
(0,1) (0,2,) (0,0) (2,1)
例11
假设参与人小张和小王分配10元钱。他们同意最多用3天的时间协 商分配问题。第1天,小张给出一个报价;第2天,小王可以接受 也可以拒绝这个报价,如果他拒绝,他要提出一个新报价;第3天, 小张提出最终的报价。如果他们不能在3天之内达成协议,那么, 双方都将一无所获。假定小张和小王的贴现因子分别为α和β,求 子博弈完美纳什均衡。
例6
利用逆向归纳法求出下列扩展型博弈的子博弈完美纳什均衡(写出求解过程)
1
l
R
2
2
U
D
D
U
(3,0)
(2,-2()2,0)
答:1、该博弈共包括两个子博弈:
(1)从博弈方1选择L后的博弈方2第二阶的单人博弈、
(2)从博弈方1选择R后的博弈方2第二阶段的单人博弈
(4,1)
根据逆向归纳法:
第二阶段(1)博弈方2选择U得益为0,选择D得益为-2,选择D(2)博弈方二选择U得益为0,选择D得益为1,选择D
寡占的斯塔克博格模型: 设领导者和追随者的产量分别为q1,q2。q=q1+q2. 边际生产成本c1=c2=0。 领导者的得益函数:u1=q1p=q1[a- β(q1+q2)]=aq1-βq1^2-βq1q2 追随者的得益函数:u2=q2p=q2[a- β(q1+q2)]= aq2-βq2^2-βq1q2 逆推递归法: 先分析第二阶段追随者的决策:a-βq1-2βq2=0;q2=(a-βq1)/2β 领导者知道追随者的决策思路: u1= aq1-βq1^2-βq1q2= (aq1-βq1^2)/2 a/2- βq1=0 q1=a/2 β q2= a/4β
例3
找出下列博弈的颤抖手均衡

L
R
同样,对于均衡(U,R)

U
10,0
6,2
来说,如果博弈方1犯错
误(即选D)的概率为δ。
D
10,1
2,0
博弈方2选L的支付πL为0
(1-δ)+δ=δ

对于均衡(D,L),如果博弈方2犯错误(即选R)的概率为ε。 博弈方1选D的支付πD为10(1-ε)+2ε=10-8ε
一般情况下的得益矩阵
完全信息情况下的得益矩阵
居民 1
提供 不提供
居民2
提供
不提供
1―c1,1―c2 1―c1,1
1,1―c2
0,0
居民1 提供 不提供
居民2
提供
不提供
0.9,0.5
0.9,1
1,0.5
0,0
例15
选择临界值策略:对于居民1来说,如果c1<s,选择“提供”;如果c1≥s,选 择“不提供”。对于居民2来说,如果c2<t,选择“提供”;如果c2≥t,选择 “不提供”。
居民1、2选择“提供”的概率分别为s和t。 对于居民1来说,选择“提供”的得益=1-c1,而选择“不提供”的得益=t,选
择“提供”的条件是1-c1>ts=1-t(临界条件相同),或s+t=1。 同理,根据居民2的情况,也能推出s+t=1。 因此,满足s+t=1条件所有组合均为贝叶斯纳什均衡。
答:第一天,小张的方案是自己得S1,小王得10-S1。小王接受或不接受,接受则小张和小王的得益分别为S1和10-S1,不接受则进入下一回合。 第二天,小王的方案是小张得S2,自己得10-S2。小张接受或不接受,接受则小张和小王的得益分别为β ( 10-S2 )和α S2。不接受则进入下一回
合。 第三天,小张的方案是自己得S,小王得10-S。此时小王必须接受,小张和小王的得益分别为α ^2S 和β ^2( 10-S)。 第二回合,小张的得益α S2= α ^2S 即S2= α S。小王的得益为 β ( 10- α S )=10 β- α β S。。。。。。不会了
相关文档
最新文档