博弈论(整理过名词解释和简答)
博弈论名词解释

博弈论名词解释博弈论是一种研究冲突和合作决策的数学理论。
在博弈论中,玩家通过制定决策来实现自己的利益,同时也要考虑其他玩家的决策对自己利益的影响。
博弈论的研究对象是在有限的资源和信息条件下,决策制定者之间的相互作用。
以下是一些常见的博弈论名词解释:1. 纳什均衡(Nash equilibrium):是指在博弈过程中,每个玩家依据其他玩家的行为选择自己的最佳策略,而没有动机单方面改变策略。
纳什均衡是一种稳定状态,即每个玩家的策略都是最优的。
2. 零和博弈(zero-sum game):是指一个玩家的收益与另一个玩家的损失完全相等,总收益为零。
在零和博弈中,一个玩家的利益的增加必然导致另一个玩家的利益的减少,双方利益存在完全的对立关系。
3. 非零和博弈(non-zero-sum game):是指一个玩家的利益的增加不一定导致另一个玩家的利益减少。
在非零和博弈中,玩家之间的利益可以相互协调、互利互惠。
4. 博弈树(game tree):是博弈论中常用的一种图形表示方式,用于展示博弈过程中的决策步骤和可能的结果。
博弈树由顶点和边组成,顶点表示玩家的决策点,边表示不同的行动选择。
5. 最优策略(optimal strategy):在博弈论中,最优策略是指玩家的最佳选择,使得在对手的任何策略下,自身获得最大利益。
最优策略可能根据玩家的目标和信息不同而变化。
6. 合作与背叛(cooperation and defection):博弈论中常涉及到的两个关键概念。
合作指玩家之间通过协调行动来获得共同利益,背叛指玩家为了自身利益而选择对方不合作。
7. 博弈矩阵(game matrix):是一种表示博弈参与者和策略选择关系的表格。
博弈矩阵以参与者为行,以策略选择为列,用数字表示参与者在不同策略下的收益情况。
8. 支配策略(dominant strategy):在博弈论中,一种策略如果在所有可能的对手策略下都能带来最佳结果,则被称为支配策略。
博弈论期末复习重点

1、博弈:一些个人、队组或其他组织;面对一定的环境条件;在一定的规则下;同时或先后;一次或多次;从各自允许选择的行为或策略中进行选择并加以实施;各自去得相应结果的过程..2、博弈论:就是系统研究各种博弈问题;寻求在各博弈方具有充分或者有限理性、能力的条件下;合理的策略选择和合理选择策略时博弈的结果;并分析这些结果的经济意义、效率意义的理论和方法..3、囚徒的困境:两决策者从各自最大的利益出发选择行为;结果是既没有实现两人总体的最大利益;也没有真正实现自身的个体的最大利益..4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈..5、动态博弈:各博弈方的选择和行动不仅有先后次序;而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动;甚至还包括自己的选择和行动;6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息..7、不完全信息不对称信息:是指经济行为主体掌握了某种经济环境状态的部分信息..8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解..9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程..10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策;那么这个策略组合肯定是所有博弈方都愿意选择的;必然是该博弈比较稳定的结果..11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略..在两人博弈的情况下;“给定你的策略;我的策略就是我最好的策略;给定我的策略;你的策略也是你的最好的策略”..12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决策方式..13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡..这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益..14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈..15、完全且完美信息动态博弈:动态博弈中既是完全信息又是完美信息的部分16、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中;各博弈方的策略均衡构成的一个策略组合满足;在整个动态博弈及它的所有子博弈中都构成纳什均衡;那么这个策略组合称为该动态博弈的一个~17、逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析;逐步倒推回前一个阶段相应博弈方的行为选择;一直到第一阶段的分析方法..18、颤抖手均衡:在博弈时也要考虑到合作者可能会发生轻微的失误而影响整个结果;即使在这种小概率事件发生时;所选策略依然是最优的.. 19、道德风险:从事经济活动的人在最大限度地增进自身效用时作出不利于他人的行动;损害委托人或是其他代理人的利益..交易后的信息不对称性;掌握较多信息的一方在交易后的利己倾向;如隐瞒欺骗、不负责任、不努力工作..20、逆向选择:指交易双方在交易前的信息不对称;导致市场上交易的劣质商品的比例越来越高;甚至导致优质品完全被驱出市场的一种现象..简答210%一、设定一个博弈模型必须确定的方面:1、博弈方:即博弈中进行决策并承担结果的参与者;2、各博弈方各自可选择的全部策略或行为的集合策略空间:即博弈方选择的内容;可以是方向、取舍选择、量值;3、进行博弈的次序:即博弈方行为、选择的优先次序或重复次数等..次序不同一般就是不同的博弈;即使博弈的其他方面都相同;4、博弈方的得益:即博弈方行为、策略选择的相应后果、结果必须是数量或者能够折算成数量;对应于各博弈方的每一组可能的决策选择都应有一个结果表示该策略组合下各博弈方的所得或所失..得益应该是客观存在;但不意味着各博弈方都了解各方的得益情况..5、信息结构;即博弈方相互对其他博弈方行为或最终利益的了解程度;6、行为逻辑和理性程度;即博弈方是依据个体理性还是集体理性行为以及理性的程度等..二、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子..1、烟草厂商新产品的开发、价格定位的效果;常常取决于其他厂商、竞争对手的相关竞争策略..例如某卷烟厂推出一种高价烟;该计划能否成功常取决于其他厂商是否采取同样的策略、如果其他厂商也推出高价烟而且档次宣传力度比前者还要高、大;那么前者的计划成功的难度就很大;但如果没有其他厂商推出同类产品;那前述某厂的计划成功的可能性就大;2、房地产开发企业在选址、开发规模、目标客户定位等方面也常常存在相互制约的问题..例如一个城市当时的住房需求约10000平方米;如果其他厂商已经开发了8000平方米;那么你再开发5000平方米就会导致供过于求;销售就会发生困难;但如果其他厂商只开发不到5000平方米;那么你的5000平方米就是合理的..3、麦当劳的新产品所带来的收益、价格产量、产品开发三、“囚徒困境”内在根源是举出现实生活中的具体例子..根源在于个体之间存在行为和利益相互制约的博弈结构中;以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益;并实现整体、个体利益共同的最优..简单第说;都是个体理性与集体理性的矛盾引起的..四、分析保险市场、资本市场道德风险的逆向选择..1、汽车保险:假设张三有财产¥100000;其冯诺依曼-摩根斯坦效用指数为对数函数;即UW=lnW;并有价值为¥ 20000的汽车一辆..如果该汽车没有向保险公司投保;将有25%的可能性被偷窃..因此;期望效用为:0.75U100000+0. 25U80000=0.751nl00000+0.25ln80000=11.457l;如果保险公司只索取成本而管理成本为0;那么;公平的保险费用为¥ 20000× 0.25=¥ 5000..如果张三将汽车完全保险;无论汽车是否被盗;其财富都是¥95000;预期效用U95000=ln95000=11. 4616因此;当张三购买公平保险后;其效用高于不购买保险..现在讨论张三是否安装防盗装置的问题;假设安装一个防盗装置的成本为¥1950;如果安装该装置、汽车被盗概率从0.25减小到0.15..如果没有投保;安装防盗装置的预期收益¥20000×0.10=¥ 2000超过成本;因而安装防盗装置有效率;其期望效用为:0.85ln100000-1950+0.15ln100000-2000-1950=11.4590超过不安装的期望效用11.457l;因此;如果张三没有投保;那么;购买防盗装置是理性的..但是;当张三投保后;情况发生了变化..假设张三购买汽车保险的价格是¥ 5200其中¥ 5000为预期损失;¥200为管理费..如果保险公司并不检查投保人是否安装防盗装置;那么;投保的预期效用为1n94800=11.4595;该预期效用超过安装防盗装置的预期效用..张三将会选择投保..但投保后将没有动力安装防盗保险装置;并且可能产生麻痹心而提高被盗的可能性..结果、发生火灾的概率从0.005上升到0.008;保险公司的实际预期损失为¥800..结果;每出售一张保险单平均都会损失S300..这种保险单对于保险公司来说不可行..由于代理人隐蔽行动难以观察;火灾保险市场经常出现投保人经营亏损后;有意纵火索取高额保险金的案例..2、火灾保险的道德风险:假设某厂商产品仓库价值为¥100000;厂商采取防火措施的成本为¥50..采取防火措施后小心谨慎;发生火灾概率为0.005;没有防火措施且疏于防范;发生火灾概率为0.008..又假设保险公司以预期火灾损失¥500;以此作为保险费用出售保险单..在这种环境下;如果厂商向保险公司投保后;就可能不会有动力继续执行防火措施;且可能疏于防范..3、健康保险市场:投保人一旦获得健康保险;相当于降低投保人的医疗护理费用..因此;理性的个人将增加他在这方面的消费量;相应地增加了医疗保险支付的数量;即增加社会成本的数额;因为个人保险费的增加意味着社会医疗支出费用的增加..在这种状态下;社会的风险服务和医疗服务都将低效率..4、资本市场:每个借贷者要求同样数目的贷款条件下;银行不能将借款者按照回报率的大小给予不同的利息率..银行能否收回贷款并获得利润;既取决于借款者的经济效益;也取决于银行所处环境状态的各种不确定性..当银行以借款者的经济收益为利息率标准时;借款者就会利用银行难以观察或不可能观察到的隐蔽行动采取相应行动;如虚报利润额、非法转移资金;人为地扩大成本等道德风险行为;由此使银行承担的风险比签定委托-代理合同前有所增加..5、证券市场的“逆向选择”:在信息不对称的情况下;投资者无法确定哪些上市公司是高质量的、有投资价值的公司;哪些是低质量的上市公司..因此;投资者在作出投资决策时;往往只能根据整个市场所有发行企业的平均质量来决定其愿意投资的价格..这种投资者的“折中”行为就会抑制那些高于平均质量水平的发行企业提高经济效率和管理水平的积极性;而鼓励投资者向低质量企业流动..因为高于平均质量水平的上市公司并不能在证券市场体现其应有的价值;因此就会造成高质量企业不情愿进入证券市场..造成低质量的上市公司横行于证券市场..信息不对称的结果造成股票价格与上市公司经营业绩的背离则使证券市场失去了评价上市公司业绩、约束上市公司经营行为的市场机制;这种市场选择的结果只会导致整个市场的上市公司质量的降低;并成为市场过度投机的主要根源;最终会导致市场的低效率甚至是市场的崩溃..判断一、博弈的分类方法:1、行为逻辑;是否允许存在有约束力协议:合作博弈、非合作博弈2、理性层次:完全理性博弈、有限理性博弈进化博弈;3、博弈过程:静态博弈、动态博弈、重复博弈4、信息结构:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈;5、得益特征:零和博弈、常和博弈、变和博弈6、博弈方数量:单人博弈、两人博弈、多人博弈;7、策略数量:有限博弈、无限博弈二、上策均衡、纳什均衡、严格下策反复消去法的关系区别:1、上策均衡是各博弈方绝对最优策略的组合;而纳什均衡则是各博弈方相对最优策略的组合..上策均衡一定是纳什均衡;但纳什均衡不一定就是上策均衡..对同一个博弈来说;上策均衡的集合就是纳什均衡集合的子集;但不一定是真子集;2、严格下策反复消去法与上策均衡分布对应两种有一定相对性的决策分析思路:严格~对应排除法即排除绝对最差策略的分析方法..上策~对应选择法;即选择绝对最优策略的均衡概念..二者并不矛盾;甚至可以相互补充..严格~不会消去任何上策均衡;可以简化博弈;3、严格~和纳什均衡也是相容和补充的;严格~不会消去任何上策均衡;可以简化博弈;使纳什均衡分析更加容易..。
博弈名词解释

一、名词解释:1、零和游戏——游戏者有输有赢,但整个游戏的总成绩永远为零。
2、纳什均衡——只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。
这一点就是纳什均衡。
3、帕累托最优——指资源分配的一种状态,在不使任何人境况变坏的情况下,不可能再使某些人的处境变好。
说得更经济学点,群体所有的社会资源的配置已将整个群体的效用最大化了,没人能够在不减损别人的利益的同时改善自己的利益。
二、简答题1.博弈的四个要素是什么?1.博弈要有2个或2个以上的参与者(Player)。
2.博弈要有参与各方争夺的资源或收益(Resources或Payoff)。
3. 参与者有自己能够选择的策略(Strategy)。
4. 参与者拥有一定量的信息(Information)。
2.什么是触发策略?触发策略有何优点如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略(Trigger strategy),或称冷酷策略好的策略必须具有的一个特点是“清晰性”,针锋相对策略就有很好的清晰性,让对方很快发现规律,从而不得不采取合作的态度。
如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。
因此,只要有人采取触发策略,那么双方均愿意采取合作策略。
3.请描述“囚徒困境”的案例。
两个嫌疑犯(甲和乙)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”:如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年;如果都不坦白则各判1年。
从表面上看,他们应该互相合作,保持沉默。
但他们不得不仔细考虑对方可能采取什么选择。
甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。
甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。
博弈论名词解释

博弈论名词解释(总2页) -CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除博弈名词解释1.博弈论: 根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论。
2.参与人(局中人)(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。
3.策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
4.信息(information):参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识。
5.支付(payoff)函数:,参与人从博弈中获得的效用水平,它是所有参与人取定的一组策略的函数。
6.结果(outcome):博弈者感兴趣的要素的集合。
7.静态博弈:在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。
8.动态博弈:在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
9.零和游戏(零和博弈):属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。
双方不存在合作的可能。
零和博弈的结果是一方吃掉另一方,一方的所得正是另一方的所失,整个社会的利益并不会因此而增加一分。
两个人下棋、或是打乒乓球。
10.常和博弈:又叫非零和博弈,是指各博弈方的得益之和是一个非零的常数。
自己的所得并不与他人的所失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在“双赢”的可能,进而合作。
博弈论名词解释

博弈论名词解释博弈论名词解释1、博弈:是指代表不同利益主体的决策者,在⼀定的环境条件和规则下,同时或先后、⼀次或多次从各⾃允许选择的⾏动⽅案中加以选择并实施。
从⽽取得各⾃相应结果的活动。
2、参与⼈:也称局中⼈或博弈⽅。
是指博弈中能独⽴决策、独⽴⾏动并承担决策结果的利益主体。
3、⾏动:是参与⼈在博弈的某个时点的决策变量。
4、博弈信息:是参与⼈在博弈中的知识,包括博弈的环境条件、博弈的规则、⾃然的“安排”、其他参与⼈的特征及⾏为、博弈的结果、进程等等。
5、策略:是指各博弈⽅可选择的⾏动⽅案,亦称战略。
6、纯策略:指⼀个策略规定参与⼈在每⼀个给定的信息情况下只选择⼀种特定的⾏动。
7、混合策略:指⼀个策略规定参与⼈在给定信息情况下以某种概率分布随机地选择不同的⾏动。
8、⽀付函数:也称得益。
是指博弈⽅(参与⼈)策略实施后所获得的效⽤⽔平。
9、结果:是指博弈分析者所探寻的各种要素的集合,⽐如策略组合、⽀付向量等。
10、纳什均衡:是指在对⽅策略确定的情况下,每个参与⼈的策略都是最好的。
此时没有⼈愿意单独改变⾃⼰的策略。
11、两⼈博弈:就是参与⼈是两⽅的博弈。
12、多⼈博弈:是参与⼈有三个或三个以上的博弈。
13、零和博弈:每个⽀付向量的“总和”始终等于零的博弈称为零和博弈。
14、常和博弈:我们把每个⽀付向量的“总和”始终等于某个常数的博弈称为常和博弈。
15、变和博弈:我们把每个⽀付向量的“总和”并不相同的博弈称为变和博弈。
16、静态博弈:我们把所有参与⼈同时或可看作同时选择策略的博弈称为静态博弈。
17、动态博弈:我们把各参与⼈不是同时,⽽是先后、依次进⾏选择、⾏动。
⽽且后选择⾏为的参与⼈通常能观察到先进⾏选择、⾏为的参与⼈的选择、⾏为的博弈称为动态博弈。
18、重复博弈:就是同样结构的博弈重复进⾏多次。
19、完全信息博弈:如果所有策略组合下的⽀付向量都是共同知识,我们就说这⼀博弈是“完全信息”的,称为完全信息博弈。
博弈论考试重点

一、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
博弈论 研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中 博弈论是研究经济主体的二、博弈论基本要素博弈参与者、各博弈方各自可选择的全部策略或行为的集合、进行博弈的次序、博弈方的利益、博弈行为、博弈信息、结果、均衡三、名词解释静态博弈:同时决策或者同时行动的博弈属于静态博弈—田忌赛马、猜硬币、古诺模型动态博弈:先后或序贯决策或者行动的博弈属于动态博弈—弈棋、市场进入、领导完全信息博弈:所有博弈方都清楚其他博弈方的得益状况不完全信息博弈(贝叶斯博弈):至少有一个博弈方不完全清楚其他博弈方的得益或得益函数囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈纳什均衡:在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的冷酷战略:重复博弈中,任何博弈方的一次性不合作将引起其他博弈方的永远不合作,从而导致的所有博弈方的收益减少。
针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛重复博弈:静态或动态博弈的重复进行,即重复进行的博弈过程聚点均衡:在理论上一个博弈中可能有多个纳什均衡点,这时在现实生活中,行为人往往利用在理论上省略掉的那些信息,找到一个大家都感兴趣的点,这个点往往成为现实世界中博弈的最终解。
当参与人之间没有正式的信息交流时,他们存在于其中的“环境”往往可以提供某种暗示,使得参与人不约而同地选择与各自条件相称的策略(聚点),从而达到均衡卡尔多-希克斯标准:一种变革使得受益者的所得足以弥补受损者的所失,这种变革就是卡尔多-希克斯改进。
博弈论复习题

博弈论复习题一、名词解释1.博弈:即若干个人、队组或其他组织,面对一定的环境,在一定的规则下,同时或先后,一次或多次,从各自允许的行动或策略中进行选择并加以实施,各自取得相应结果或收益的过程。
2.囚徒困境:囚徒困境是两个嫌疑犯作案后被警察抓住,分别被关在不同房间审讯。
警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(因证据不足);如果其中一人坦白另—人抵赖,坦白者放出去,抵赖的判刑10年。
结果,两个嫌疑犯都选择坦白,各判刑八年。
事实上,如果两人都抵赖,各判一年,显然这个结果好,但帕累托改进办不到,因为它不能满足人类的理性要求。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性,聪明的人类会因为自己的聪明而作茧自缚。
它是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择,揭示了个人理性和集体理性的矛盾。
3.非合作博弈与合作博弈:非合作博弈与合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议。
如果有,就是合作博弈;如果没有,就是非合作博弈。
4.常和博弈与变和博弈:零和博弈是指在任意战略组合下“总支付”均为零的博弈,如通常的打赌博弈.常和博弈是指在任意战略组合下“总支付”均为一个常数的博弈,如若干个人分一笔固定奖金的博弈.变和博弈也称非常和博弈,意味着不同的策略组合或结果下各博弈方的得益之和一般是不相同的.5.博弈论:博弈论是研究决策主体的行动发生直接相互作用时候的决策以及这种决策的均衡问题的,也就是说,当一个主体,好比一个人或一个企业的选择受到其它人或其它企业选择的影响,而且反过来影响其它人、其它企业选择时的决策问题和均衡问题.6.战略:也称策略,是参与人在给定信息集的情况下的行动规则,它规定参与人在何时采用哪种行动;也是一种“相机行动方案”,指导参与人如何对其它参与人的行动做出反应.7.均衡:是指所有参与人的最优的战略组合,在均衡战略组合下,任何参与人没有改变自己战略的动机,即如果改变战略,自己的支付不会得到增加或效用得到改善.8.均衡路径:一个纳什均衡结果在博弈树中所形成的路径.9.占优均衡:在一个博弈中,如果每个参与人都有“占优战略”存在,那么每个参与人的占优战略的组合就称为“占优战略均衡”,并且是唯一的“占优战略均衡”.(一个战略称为某个参与人的“占优战略”是指不管其他参与人选择什么战略,这个战略都是该参与人的最好的战略.)10.重复剔除劣战略的占优均衡:对于一个理性的参与人,是不可能选择“劣策略”的,因此可以在战略式表述(支付矩阵)中将其剔除,再重新构造一个不含这个“劣策略”的新的博弈,然后在新的博弈中寻找某个参与人的劣策略,再将其从博弈中剔除,重复进行下去,直到剩下唯一一个战略组合,该组合称为“重复剔除劣战略的占优均衡”.11.纳什均衡:纳什均衡是指这样的一个战略组合:在这个战略组合之下,所有参与人都没有改变战略的动机,即改变战略不会给该参与人带来支付的增加或效用的改善.12.混合战略:混合战略指的是参与人以一定的概率选择某种战略。
博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】一、名词解释(每题7分,共28分)1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。
2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。
用策略性思维来分析问题,从中找出合理策略,实现目标最优。
3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。
4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。
5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。
每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。
二、简要回答问题(每题10分,共40分)1、博弈的基本要素有哪些?基本特点是什么?答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。
博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。
2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。
3、猎鹿博弈反映的基本思想是什么?答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。
4、什么是道德风险?有什么办法可以解决道德风险问题?答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论(整理过名词解释和简答)一、名词解释:1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。
3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。
4、常和博弈:是指博弈双方的得益总和为非零的常数变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。
在经济学中,博弈论是研究经济主体的决策相互影响6、战略:参与人在给定信息集的情况下的行为规则的完备描述。
7、均衡:所有参与人的最优战略组合。
8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。
9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。
10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。
11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。
12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。
13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件:(1)决策结x是单结信息集;(2)在一个信息集的决策结必须是同一个决策结的后续结。
14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。
15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动;动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。
16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。
同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。
17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。
18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。
19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。
20、博弈的战略式表述:(1)参与人集合(2)每个参与人的战略集合(3)参与人的支付函数博弈的扩展式表述:(1)参与人集合(2)参与人的行动顺序(3)参与人的行动机构(4)参与人的信息集(5)参与人的支付函数(6)外生事件的概率分布21、信息集:每次行动时,参与人知道什么;参与人在决策结上所拥有的信息的集合,拥有同样信息的决策结属于同一个信息集,即信息集包含的决策结拥有同样的信息。
22、颤抖手均衡:在任何一个博弈中,每一个博弈方都有一定的概率出现错误,一个战略组合,只有当其在允许所有博弈方都可能犯错误时,仍然是每一个博弈方的最优策略时,才是一个颤抖手均衡。
23、序贯理性:在每一个信息集中,应该行动的参与人对于给定该参与人在此信息集上的推断,以及其他参与人随后的战略必须是最优反应,即在任何后续博弈中都是理性的。
24、推断理性:在处于均衡路径和非均衡路径的信息集上,推断由贝叶斯法则及参与人的均衡战略决定。
25、海萨尼转换:在处理不完全信息博弈问题中,引入一个虚拟的参与人“自然”,自然首先行动决定参与人的特征,参与人知道自己的特征,其他参与人不知道。
26、不完全信息博弈:在博弈中至少有一个博弈方不完全清楚其他博弈方的得益函数。
27、后续博弈:每一个信息开始的博弈的剩余部分。
28、贝叶斯纳什均衡:是一种类型依从战略组合,在给定自己类型和其他参与人的类型的概率分布情况下,每一个类型依存战略使得每个参与人的期望效用最大,也就是说,没有人有积极性选择其他战略。
29、逆向归纳法:从博弈树行动的相反顺序,从后往前依次求得各自博弈的纳什均衡。
30、信号传递博弈:31、机制设计激励相容约束:给定委托人不知道代理人类型的情况下代理人在所设计的机制下必须有积极性选择委托人希望他选择的行为,也就是说,只有当代理人选择委托人所希望的行为时得到的期望效用不小于他选择其他行为时得到的期望效用时,代理人才会有积极性选择委托人所希望的行动。
32、机制设计参与约束:如果要一个理性的代理人有任何兴趣接受委托人设计的机制(从而参与博弈)的话,代理人在该机制下得到的期望效用必须不小于他在不接受这个机制时得到的最大希望效用。
33、间接机制:参与人声明自己的类型依附战略,战略是除类型以外的信号,如拍卖中的声明报价。
34、直接机制:参与人直接声明自己的类型,而所声明的类型可能不同于真实类型,如拍卖中声明对拍卖品的估价。
二、简答题(1) 将博弈的信息特征和行为时间特征结合,博弈分为哪几类,并分析几种类型博弈的特点?答:将博弈的信息特征和行为时间特征结合,可以把博弈细分为下面四种类型的非合作博弈:静态博弈:是指所有博弈方同时或可看作同时选择策略、采取行动的博弈。
动态博弈:是指博弈方的选择、行动有先有后,而且后选择、后行动的博弈方在自己进行选择、行动之前可以看到在他之前选择、行动的博弈方的选择、行动的博弈。
完全信息博弈:是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。
不完全信息博弈:是指参与者只了解上述信息中的一部分的博弈。
(2)博弈论博弈论产生与发展过程?答:1、萌芽阶段(1944年以前):古诺(Cournot,1838,法国经济学家)模型(同时决策的产量博弈);斯坦克尔伯格(1934,Stackelberg,德国经济学家) (不同时决策的产量博弈)2、产生阶段(1944年-1959年):冯·诺依曼和摩根斯特恩合著《博弈论与经济行为》(1944年),博弈模型的解的概念和分析方法,理论基础,主要合作博弈,非合作零和博弈;纳什均衡(完全信息静态)(1950,1951),论文“N人博弈中的均衡”点(50年),“非合作博弈”(51年),提出了非合作博弈均衡解,并证明了均衡解的存在,纳什均衡基本思想:在解集中所有博弈者的策略都是对其他博弈者所用策赂的最佳对策3、发展阶段(1960年-1979年):精练纳什均衡(完全信息动态)(泽尔腾,1965),1965年论文《一个具有需求惯性的寡头博弈模型》,德国波恩大学教授,数学家、经济学家;贝叶斯纳什均衡(不完全信息静态,海萨尼,1967)与贝叶斯精练纳什均衡(不完全信息动态,海萨尼,1975),美国加州大学教授,经济学家4、繁荣阶段(1980年以后):纳什,泽尔腾和海萨尼共同获得诺贝尔经济学奖(1994);维克里和莫里斯获诺贝尔经济学奖(1996),2001,2005,2007年诺贝尔经济学奖,不对称信息下激励理论。
(3)博弈论成为经济学主要课程的成因是什么?答:1)博弈论在经济学中的应用越来越广泛. 博弈论许多成果也是借助于经济学的例子来发展的, 相比其他领域来说,在经济领域应用最为成功的,已经形成了一套完整的经济博弈理论,并且发挥了巨大经济效益。
2)经济学和博弈论的研究模式是一样的,这就是强调个人理性.也就是在给定的约束条件追求效用最大化。
在这一点上,博弈论与经济学是完全一样的,使得博弈论分析方法在经济分析中发挥着重要作用。
3)传统经济学研究个人行为时,总是假设其外部环境是给定的。
现代经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用,这与博弈论研究内容相一致,所以,随着现代经济学的发展,博弈论显得更加重要。
4) 经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。
而博弈论不完全信息博弈模型正是解决这类问题的有效工具。
5) 博弈论和信息经济学专家获得了诺贝尔经济学奖,凸现了“博弈论”在主流经济学中日益重要的地位。
(4)博弈有哪几大要素,并解释几大要素的内涵?答:规则:规定博弈各方的行动顺序、方式、以及最终的结果等。
局中人(Player, 选手,玩家):博弈参与人战略:一整套的行动方案,规定了各种情况下的行动。
如人不犯我,我不犯人;人若犯我,我必犯人。
行动:局中人行为。
信息:在行动时所掌握的信息。
报酬(payoffs, 支付):博弈结束时,各方得到的收益。
(5)混合策略和不完全信息博弈联系与区别答:共同点:博弈参与人不能够确切知道其他博弈参与人的选择行为,只知道选择行动的概率分布;不同点:前者的不确定性只是因为各博弈方为了不让其他博弈方占任何先机而必须故意随机选择行动,后者的不确定性源于其他博弈方的类型,即类型的不确定性,按照期望支付选择最优战略(纯战略)。
(6)战优均衡、重复剔除劣战略的战优均衡和纳什均衡相互之间的关系是什么?答:几个均衡之间的关系如图:在重复剔除的占优策略均衡中.最后剩下的惟一策略组合,一定是在重复剔除劣战略过程中无法被剔除的战略组合。
因此,重复剔除的占优战略均衡也一定是纳什均衡。
(7)简述子博弈精练纳什均衡的理性要求答:逆向归纳法理论要求的“所有参与人是理性的,并且要求参与人知道其后续参与人是理性的;参与人知道其后续参与人知道其后续参与人是理性的”,等等。
上述理性要求大大高于静态博弈中的理性要求。
在动态博弈中有时不能满足理性要求导致子博弈精炼纳什均衡不存在。
(8)信息经济学与博弈论不同点答:信息经济学是非对称信息博弈论在经济学上的应用,非对称信息指的是某些参与人拥有但是另一些参与人不用有的信息。
1)博弈论是方法论导向的,而信息经济学是问题导向的。
2)博弈论研究目的:结定信息结构,均衡结果是什么;信息经济学研究的目的:给定信息结构,契约安排是什么。
3)博弈论研究方法涉及经济、军事、政治、日常生活等,信息经济学只研究经济领域方面的问题。
4)博弈论包括完全信息和不完全信息模型,而信息经济学重点研究非完全信息博弈问题。