2011博弈论期末复习要点

合集下载

(完整word版)经济博弈论期末复习资料(word文档良心出品)

(完整word版)经济博弈论期末复习资料(word文档良心出品)

经济博弈论复习资料一、名词解释1、零和博弈:是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作可能的博弈。

2、常和博弈:是指各博弈方的得益之和是一个非零常数的博弈。

常和博弈中各博弈方之间利益关系也是对立的,博弈方之间的基本关系也是竞争关系。

3、纳什均衡:在博弈G={}n n u u S S ,,;,,11 中,如果由各个博弈方的各一个策略组成的某个策略组合()**1,,n s s 中,任一博弈方i 的策略*i s ,都是对其余博弈方策略的组合()**1*1*1,,,,,ni i s s s s +- 的最佳对策,也即()()**1**1*1**1**1*1,,,,,,,,,,,,n i ij i i n i i i i s s s s s u s s s s s u +-+-≥ 对任意i ij S s ∈都成立,则称 ()**1,,n s s 为G 的一个纳什均衡。

4、混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。

5、纳什定理:在一个有n 个博弈方的博弈G={}n n u u S S ,,;,,11 中,如果n 是有限的,且i S 都是有限集(对i=1, ,n ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。

(这个定理就是说,每一个有限博弈都至少有一个混合策略纳什均衡)6、帕累托上策均衡:是指帕累托效率意义上的优劣关系,因此用这种方法选择出来的纳什均衡,也称为“帕累托上策均衡”。

7、风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个风险上策均衡。

8、子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息和进行博弈所需要的全部信息。

9、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略构成一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

博弈论期末复习重点

博弈论期末复习重点

1、博弈:一些个人、队组或其他组织;面对一定的环境条件;在一定的规则下;同时或先后;一次或多次;从各自允许选择的行为或策略中进行选择并加以实施;各自去得相应结果的过程..2、博弈论:就是系统研究各种博弈问题;寻求在各博弈方具有充分或者有限理性、能力的条件下;合理的策略选择和合理选择策略时博弈的结果;并分析这些结果的经济意义、效率意义的理论和方法..3、囚徒的困境:两决策者从各自最大的利益出发选择行为;结果是既没有实现两人总体的最大利益;也没有真正实现自身的个体的最大利益..4、静态博弈:所有博弈方同时或可看作同时选择策略的博弈..5、动态博弈:各博弈方的选择和行动不仅有先后次序;而且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择行动;甚至还包括自己的选择和行动;6、完全信息:是指经济行为主体掌握了某种经济环境状态的全部信息..7、不完全信息不对称信息:是指经济行为主体掌握了某种经济环境状态的部分信息..8、完美信息:动态博弈中在轮到行为时对博弈的进程完全了解..9、不完美信息:动态博弈中在轮到行为的博弈方不完全了解此前全部博弈进程..10、上策均衡:如果一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策;那么这个策略组合肯定是所有博弈方都愿意选择的;必然是该博弈比较稳定的结果..11、纳什均衡:每个博弈方的策略都是针对其他博弈方策略或策略组合的最佳策略..在两人博弈的情况下;“给定你的策略;我的策略就是我最好的策略;给定我的策略;你的策略也是你的最好的策略”..12、混合策略:博弈方以一定的概率分布在可选择策论中随机选择达到一种稳定/均衡的决策方式..13、混合策略纳什均衡:如果一个严格意义上的混合策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时构成的纳什均衡..这时候意味着任何博弈方单独改变自己的策略或者随机选择各个纯策略的概率分布都不能给自己添加任何利益..14、完全信息静态模型:各博弈方同时决策且所有博弈方对各方得益都了解的博弈..15、完全且完美信息动态博弈:动态博弈中既是完全信息又是完美信息的部分16、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中;各博弈方的策略均衡构成的一个策略组合满足;在整个动态博弈及它的所有子博弈中都构成纳什均衡;那么这个策略组合称为该动态博弈的一个~17、逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析;逐步倒推回前一个阶段相应博弈方的行为选择;一直到第一阶段的分析方法..18、颤抖手均衡:在博弈时也要考虑到合作者可能会发生轻微的失误而影响整个结果;即使在这种小概率事件发生时;所选策略依然是最优的.. 19、道德风险:从事经济活动的人在最大限度地增进自身效用时作出不利于他人的行动;损害委托人或是其他代理人的利益..交易后的信息不对称性;掌握较多信息的一方在交易后的利己倾向;如隐瞒欺骗、不负责任、不努力工作..20、逆向选择:指交易双方在交易前的信息不对称;导致市场上交易的劣质商品的比例越来越高;甚至导致优质品完全被驱出市场的一种现象..简答210%一、设定一个博弈模型必须确定的方面:1、博弈方:即博弈中进行决策并承担结果的参与者;2、各博弈方各自可选择的全部策略或行为的集合策略空间:即博弈方选择的内容;可以是方向、取舍选择、量值;3、进行博弈的次序:即博弈方行为、选择的优先次序或重复次数等..次序不同一般就是不同的博弈;即使博弈的其他方面都相同;4、博弈方的得益:即博弈方行为、策略选择的相应后果、结果必须是数量或者能够折算成数量;对应于各博弈方的每一组可能的决策选择都应有一个结果表示该策略组合下各博弈方的所得或所失..得益应该是客观存在;但不意味着各博弈方都了解各方的得益情况..5、信息结构;即博弈方相互对其他博弈方行为或最终利益的了解程度;6、行为逻辑和理性程度;即博弈方是依据个体理性还是集体理性行为以及理性的程度等..二、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子..1、烟草厂商新产品的开发、价格定位的效果;常常取决于其他厂商、竞争对手的相关竞争策略..例如某卷烟厂推出一种高价烟;该计划能否成功常取决于其他厂商是否采取同样的策略、如果其他厂商也推出高价烟而且档次宣传力度比前者还要高、大;那么前者的计划成功的难度就很大;但如果没有其他厂商推出同类产品;那前述某厂的计划成功的可能性就大;2、房地产开发企业在选址、开发规模、目标客户定位等方面也常常存在相互制约的问题..例如一个城市当时的住房需求约10000平方米;如果其他厂商已经开发了8000平方米;那么你再开发5000平方米就会导致供过于求;销售就会发生困难;但如果其他厂商只开发不到5000平方米;那么你的5000平方米就是合理的..3、麦当劳的新产品所带来的收益、价格产量、产品开发三、“囚徒困境”内在根源是举出现实生活中的具体例子..根源在于个体之间存在行为和利益相互制约的博弈结构中;以个体理性和个体选择为基础的分散决策方式无法有效地协调各方面的利益;并实现整体、个体利益共同的最优..简单第说;都是个体理性与集体理性的矛盾引起的..四、分析保险市场、资本市场道德风险的逆向选择..1、汽车保险:假设张三有财产¥100000;其冯诺依曼-摩根斯坦效用指数为对数函数;即UW=lnW;并有价值为¥ 20000的汽车一辆..如果该汽车没有向保险公司投保;将有25%的可能性被偷窃..因此;期望效用为:0.75U100000+0. 25U80000=0.751nl00000+0.25ln80000=11.457l;如果保险公司只索取成本而管理成本为0;那么;公平的保险费用为¥ 20000× 0.25=¥ 5000..如果张三将汽车完全保险;无论汽车是否被盗;其财富都是¥95000;预期效用U95000=ln95000=11. 4616因此;当张三购买公平保险后;其效用高于不购买保险..现在讨论张三是否安装防盗装置的问题;假设安装一个防盗装置的成本为¥1950;如果安装该装置、汽车被盗概率从0.25减小到0.15..如果没有投保;安装防盗装置的预期收益¥20000×0.10=¥ 2000超过成本;因而安装防盗装置有效率;其期望效用为:0.85ln100000-1950+0.15ln100000-2000-1950=11.4590超过不安装的期望效用11.457l;因此;如果张三没有投保;那么;购买防盗装置是理性的..但是;当张三投保后;情况发生了变化..假设张三购买汽车保险的价格是¥ 5200其中¥ 5000为预期损失;¥200为管理费..如果保险公司并不检查投保人是否安装防盗装置;那么;投保的预期效用为1n94800=11.4595;该预期效用超过安装防盗装置的预期效用..张三将会选择投保..但投保后将没有动力安装防盗保险装置;并且可能产生麻痹心而提高被盗的可能性..结果、发生火灾的概率从0.005上升到0.008;保险公司的实际预期损失为¥800..结果;每出售一张保险单平均都会损失S300..这种保险单对于保险公司来说不可行..由于代理人隐蔽行动难以观察;火灾保险市场经常出现投保人经营亏损后;有意纵火索取高额保险金的案例..2、火灾保险的道德风险:假设某厂商产品仓库价值为¥100000;厂商采取防火措施的成本为¥50..采取防火措施后小心谨慎;发生火灾概率为0.005;没有防火措施且疏于防范;发生火灾概率为0.008..又假设保险公司以预期火灾损失¥500;以此作为保险费用出售保险单..在这种环境下;如果厂商向保险公司投保后;就可能不会有动力继续执行防火措施;且可能疏于防范..3、健康保险市场:投保人一旦获得健康保险;相当于降低投保人的医疗护理费用..因此;理性的个人将增加他在这方面的消费量;相应地增加了医疗保险支付的数量;即增加社会成本的数额;因为个人保险费的增加意味着社会医疗支出费用的增加..在这种状态下;社会的风险服务和医疗服务都将低效率..4、资本市场:每个借贷者要求同样数目的贷款条件下;银行不能将借款者按照回报率的大小给予不同的利息率..银行能否收回贷款并获得利润;既取决于借款者的经济效益;也取决于银行所处环境状态的各种不确定性..当银行以借款者的经济收益为利息率标准时;借款者就会利用银行难以观察或不可能观察到的隐蔽行动采取相应行动;如虚报利润额、非法转移资金;人为地扩大成本等道德风险行为;由此使银行承担的风险比签定委托-代理合同前有所增加..5、证券市场的“逆向选择”:在信息不对称的情况下;投资者无法确定哪些上市公司是高质量的、有投资价值的公司;哪些是低质量的上市公司..因此;投资者在作出投资决策时;往往只能根据整个市场所有发行企业的平均质量来决定其愿意投资的价格..这种投资者的“折中”行为就会抑制那些高于平均质量水平的发行企业提高经济效率和管理水平的积极性;而鼓励投资者向低质量企业流动..因为高于平均质量水平的上市公司并不能在证券市场体现其应有的价值;因此就会造成高质量企业不情愿进入证券市场..造成低质量的上市公司横行于证券市场..信息不对称的结果造成股票价格与上市公司经营业绩的背离则使证券市场失去了评价上市公司业绩、约束上市公司经营行为的市场机制;这种市场选择的结果只会导致整个市场的上市公司质量的降低;并成为市场过度投机的主要根源;最终会导致市场的低效率甚至是市场的崩溃..判断一、博弈的分类方法:1、行为逻辑;是否允许存在有约束力协议:合作博弈、非合作博弈2、理性层次:完全理性博弈、有限理性博弈进化博弈;3、博弈过程:静态博弈、动态博弈、重复博弈4、信息结构:完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈、不完全信息动态博弈;5、得益特征:零和博弈、常和博弈、变和博弈6、博弈方数量:单人博弈、两人博弈、多人博弈;7、策略数量:有限博弈、无限博弈二、上策均衡、纳什均衡、严格下策反复消去法的关系区别:1、上策均衡是各博弈方绝对最优策略的组合;而纳什均衡则是各博弈方相对最优策略的组合..上策均衡一定是纳什均衡;但纳什均衡不一定就是上策均衡..对同一个博弈来说;上策均衡的集合就是纳什均衡集合的子集;但不一定是真子集;2、严格下策反复消去法与上策均衡分布对应两种有一定相对性的决策分析思路:严格~对应排除法即排除绝对最差策略的分析方法..上策~对应选择法;即选择绝对最优策略的均衡概念..二者并不矛盾;甚至可以相互补充..严格~不会消去任何上策均衡;可以简化博弈;3、严格~和纳什均衡也是相容和补充的;严格~不会消去任何上策均衡;可以简化博弈;使纳什均衡分析更加容易..。

博弈论重点

博弈论重点

博弈论期末复习要点纳什均衡(P52):指的是参与人的这样一种策略组合,在该策略组合中,每个人的策略都是最优的,任何参与人单独改变策略都不会得到好处。

换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略。

完全信息(P34):各个博弈方都完全了解所有博弈方在各种情况下的得益状况。

上策均衡(P41):在某个博弈中,如果不管其他博弈方选择什么策略,一博弈方的某一个策略给他带来的收益始终高于其他策略,至少不低于其他策略。

帕累托上策均衡(P92):多个纳什均衡的某一个均衡策略给所有博弈方带来的得益都大于其他所有纳什均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕累托效率。

聚点均衡(P97):在多重纳什均衡博弈中,双方同时会选择一个聚点构成的纳什均衡。

合并均衡(P268):具有完美信息的博弈方在博弈中,不管自己情况如何,都采取相同的市场均衡。

(在合并均衡中,完美信息博弈方的情况不同,并不会导致他们的行为不同,因此他们的行为不会给不完美信息的博弈方透露任何有用的消息)分开均衡(P268):在不同情况下,完美信息博弈方所采取完全不同的市场策略。

(在分开均衡中,由于博弈方的情况不同,采取的不同的市场策略,因此完美信息博弈方的策略可以完全反映他的情况,因此能够给不完美信息博弈方的“判断”提供充分的信息和依据)海萨尼转换(P292):将得益不了解转化为类型不了解的基础上,进一步将不完全信息静态博弈转化为完全但不完美信息动态博弈进行分析的思路。

完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全了解的博弈。

不完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全不了解的博弈。

混合策略(P72):博弈方以一定的概率分布在可选策略中随机选择的决策方式。

一致性预测(P53):如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略。

博弈论知识点总结完整版

博弈论知识点总结完整版

博弈论知识点总结完整版博弈论是数学和经济学中一个重要的分支,研究决策制度下的相互作用和决策策略。

它是通过数学模型来描述和分析不同参与者的决策行为和决策结果,并找到最优的决策策略。

下面是博弈论中的一些重要知识点的总结。

1.博弈的定义和基本概念:-博弈是指参与者在一定的规则下做出决策,并根据其他参与者的决策结果来确定自己的收益或损失。

-参与者称为博弈者,他们的决策称为策略,策略的组合称为策略组合。

-博弈可以是合作博弈或非合作博弈,合作博弈强调协作,非合作博弈强调竞争。

2.标准博弈:-标准博弈是博弈论中最基础的形式,参与者之间的策略和收益都是确定的。

-标准博弈可以是零和博弈(总收益为零)或非零和博弈(总收益不为零)。

3.纳什均衡:-纳什均衡是指在博弈中,不存在一个参与者可以通过改变自己的策略来获得更高收益的情况。

-纳什均衡是博弈论中的核心概念,它描述了博弈中的稳定状态。

-一个博弈可能有一个或多个纳什均衡,也可能没有纳什均衡。

4.基本博弈:-二人零和博弈是一种特殊的博弈,其中一个参与者的利益是另一个参与者的损失。

-石头、剪刀、布是一个典型的二人零和博弈,存在一个纳什均衡策略。

-行棋游戏如国际象棋、围棋也是二人零和博弈,但策略空间较复杂。

5.博弈理论的扩展:-广义博弈是对博弈理论的扩展,考虑了更复杂的情况,如多人博弈、不完全信息博弈等。

-多人博弈是指博弈中有多个参与者,每个参与者都会影响其他参与者的决策。

-不完全信息博弈是指博弈中参与者对其他参与者的信息是不完全的。

6.博弈论在经济学中的应用:-博弈论在经济学中有广泛的应用,如市场竞争、拍卖等。

-例如,决定定价策略的厂商可以使用博弈论来确定最优的定价策略。

-拍卖是一种常见的博弈形式,在博弈过程中参与者可以选择不同的竞标策略。

7.演化博弈:-演化博弈是博弈论的一个重要分支,研究博弈在一定的演化过程中的演化规律。

-演化博弈通过数学模型来描述和分析参与者的策略演化和演化结果。

博弈论复习总结

博弈论复习总结
如果甲选择策略N,得益只有1,所以作为先行动者,他肯定 不会选择这个策略,对于乙来说,虽然不知道甲的选择,但 他自己肯定选择策略R,所以对这个动态博弈来说,博弈路径 必定是甲选择策略T,乙选择策略R。
追 B:女方
不接受
A:追求者 不追 均衡路径
B:女方
接受
不接受
(10,-10) (-50,-40)
(0,0)
(0,0)
第三个NE的均衡结果:(追,(接受,不接受))均衡路径上符合纳什
均衡,非均衡路径上女方不接受得益是0不小于接受的得益0,非均衡路
径是NE,则该均衡是SPNE。
接受
追 B:女方
不接受
囚徒的话: 1、集体理性和个人理性常常是冲突的:民主常常
不能代表“民意”;公司好不见得你就好;如果 我们都强大了,国家不见得就强大了…… 2、承认人是自私的,一切都好办了。
10
2.纳什均衡是唯一的吗?
美国会打朝鲜吗
同时有两个纳什 均衡
美国打了越南,打了阿富汗,打了 伊拉克,也已经打过朝鲜,它还会 再打朝鲜吗?如果美国智库计算出 如下简化的支付矩阵,那么结果会 怎样呢?
博弈论总复习总结
• 博弈类型
类型
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
其他博弈
• 博弈的类型关系
非合作博弈 博弈
合作博弈
是否同时 决策
对他人的 了解程度
静态博弈
动态博弈
完全信息 博弈
不完全信 息博弈
• 博弈的分类
博弈 分类
是否有协议 决策的顺序
是否连续 持续时间 得益情况 得益信息 过程信息
在案例博弈之中,如果局中人甲T、S、N三个策略,那么博

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳

《博弈论》知识点总结归纳《博弈论》知识点总结归纳摘要:博弈论是研究决策者之间相互影响和决策制定的数学分析工具。

本文对博弈论的基本概念、解的概念、均衡理论、博弈策略和应用等方面进行了总结归纳,以帮助读者更好地理解和应用博弈论的相关知识。

关键词:博弈论、基本概念、解的概念、均衡理论、博弈策略、应用引言博弈论是研究决策者之间相互影响和决策制定的数学分析工具,源自于经济学和数学两大学科的交叉。

博弈论在经济学、管理学、政治学、社会学、计算机科学等多个领域都有广泛的应用。

本文将对博弈论的相关知识进行详细的总结和归纳。

一、基本概念1.1 博弈博弈是指决策者之间相互影响和策略选择的过程。

博弈的基本要素包括:参与者、策略、收益和信息。

1.2 参与者参与者是指博弈中的决策者,可以是个人、团体、企业、国家等。

参与者的目标是实现自身利益的最大化。

1.3 策略策略是指参与者在博弈中所能采取的行动或选择。

通常分为纯策略和混合策略。

1.4 收益收益是指在博弈中参与者根据所选择的策略所能得到的结果或利益。

收益可以用来衡量参与者的利益大小。

1.5 信息信息是指参与者在博弈中所了解的有关其他参与者或博弈环境的信息。

信息可以分为对称信息和非对称信息。

二、解的概念2.1 均衡均衡是指在博弈中各参与者选择了策略后,没有动力再改变策略,从而达到一种稳定状态。

常见的均衡概念有纳什均衡、帕累托最优和博弈解。

2.2 纳什均衡纳什均衡是指在博弈中的一组策略选择,使得每个参与者选择的策略是对其他参与者的策略选择的最佳应对,没有动机再改变策略。

2.3 帕累托最优帕累托最优是指在博弈中的一组策略选择,使得至少有一个参与者的收益达到最大,而其他参与者的收益至少不会减小。

帕累托最优是一种资源分配的有效方式。

2.4 博弈解博弈解是指在博弈中的一组策略选择,使得没参与者都没有动力再改变策略。

博弈解往往是均衡的特殊情况。

三、均衡理论3.1 零和博弈零和博弈是一种特殊的博弈形式,即参与者的利益总和为零。

博弈论的复习资料精品文档7页

博弈论的复习资料精品文档7页

名词解释:1,共同知识:是指所有当事人对该事件都知道,并且也所有当事人都知道其他当事人也知道这一事件,并且所有当事人都知道所有当事人都知道这一事件。

那么该事件就是共同知识。

2,先动优势:在序贯情侣博弈中,任何一方率先采取行动可能得到的好处,都比他或她后行动可能得到的好处大。

这种局中人先动得益大于后行得益的情况,叫做先动优势。

3,后动优势:后行动的得益比先行动的得益大的情况4,信息集:我们用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集。

•单点集:我们把不被扁椭圆虚线罩住的每个决策节点也给以信息集的地位,称为单点集。

•触发策略:即只要他的对手在博弈中一直采取合作策略,则该局中人也会在博弈中继续采取合作策略;但是,一旦对手在某一个阶段采取背叛策略,将会触发该局中人在往后的一段时期内采取不合作策略,甚至永远采取不合作策略,从而对对手实施惩罚。

•冷酷策略:双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛。

即任何局中人的一次性不合作将触发永远不合作。

•礼尚往来策略:开始的时候和冷酷策略一样,即双方从合作开始,在以后的每个阶段,如果你的对手在最近的一次博弈中还是采取合作策略,则你继续跟他合作;如果你的对手在上一阶段的博弈中采取背叛策略,则你在下次的博弈中采取背叛策略惩罚他,但是如果你的对手在下一次博弈中改邪归正,采用合作策略,则你在下次继续博弈中还是跟他合作。

触发策略是带有奖励和惩罚措施的一种博弈机制。

在这个机制中,惩罚措施是其中的关键。

注意:(1),一个信息集罩住的必须是同一个局中人的决策点。

•必须是同一个局中人在同一个时点的决策节点。

同时,即使是同一个人在同一时点进行决策,也不一定构成一个信息集,他还必须满足:在每一个决策点他的行动选择集合必须是相同的。

因为局中人在做行动选择时并不知道自己位于哪个决策点,因此,他不可能做出不同的行动选择。

简答题:1,博弈的构成要素:•局中人决策主体,目的是通过选择行动(或策略)以最大化自己的支付(效用、得益)水平。

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习《经济博弈论》期末考试复习一、导言在当今的经济学领域中,博弈论已经成为一个不可或缺的工具。

它不仅为我们提供了对策略行为深入理解的理论框架,而且还帮助我们更好地分析许多现实世界的经济现象。

在本次复习文章中,我们将逐步探讨博弈论的基本概念、主要理论,以及在经济学中的应用。

二、基本概念1、博弈:指的是一组决策者,他们根据各自的知识和信息,在给定的规则下,做出决策并采取行动。

2、策略:策略是决策者针对其他决策者可能采取的行动而制定的行动计划。

3、均衡:当所有参与者在其他人的策略中选择最优策略时,就达到了博弈的均衡状态。

三、理论与应用1、纳什均衡(Nash Equilibrium):纳什均衡是一种稳定的策略组合,其中每个参与者都采取了最优策略来应对其他参与者的策略。

2、零和博弈(Zero-Sum Game):零和博弈是一种博弈,其中一方的收益必然等于另一方的损失。

例如,棋类游戏就是零和博弈的典型例子。

3、非零和博弈(Non-Zero-Sum Game):在非零和博弈中,各方的收益或损失不是完全相等的。

例如,国际贸易就是一种非零和博弈。

四、案例分析让我们通过一个简单的例子来理解这些概念。

假设两个国家在进行贸易谈判。

每个国家都有两种策略:开放贸易(Open Trade)或关闭贸易(Closed Trade)。

如果两国都选择开放贸易,则双方都能从贸易中获益。

然而,如果一个国家选择开放贸易,而另一个国家选择关闭贸易,那么选择关闭贸易的国家将获得额外的收益,而选择开放贸易的国家则会遭受损失。

在这个例子中,开放贸易和关闭贸易就是策略,而每个国家都试图在考虑对方策略的情况下做出最优决策。

五、结论通过本次复习,我们深入理解了博弈论的基本概念和主要理论,并探讨了它们在经济学中的应用。

博弈论为我们提供了一个强大的工具来分析策略行为和竞争环境,并帮助我们更好地理解各种经济现象。

希望这些内容能帮助大家在即将到来的期末考试中取得好成绩。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1博弈:博弈就是策略对抗,或策略有关键作用的游戏。

一个非技术性定义:一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程 。

策略:博弈中个博弈方的决策内容称为“策略”,其通常是对行为的取舍,经济活动水平的选择。

战略(strategies),是参与人选择行动的规制,它告诉参与人应该在什么条件下选择什么样的行动,以保证自身利益最大化。

收益:又称支付,是指参与人从博弈中获得的利益水平,它是所有参与人策略或行为的函数,是每个参与人真正关心的东西,如消费者最终所获得的效用、厂商最终所获得的利润。

纳什均衡:通俗地说,给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。

即双方在给定的策略下不愿意调整自己的策略。

纳什均衡数学表述:对于一个战略组合),,(**2*1n s s s ,若iij n i ij i i n i i i i S s s s s s s u s s s s s u ∈∀≥+-+- ),...,,...()...,,...(**1**1*1**1**1*1称战略组合),,(**2*1n s s s 为纳什均衡。

子博弈纳什均衡及其理性要求:定义:如果在一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。

即:扩展式博弈的战略组合S*=(S1*,…,Si*,…,Sn*)是一个子博弈精炼纳什均理性要求:所有参与人是理性的”是所有参与人的共同知识。

即参与人知道其后续参与人是理性的;参与人知道其后续参与人知道其后续人是理性的,等等. 说明:1.子博弈精炼纳什均衡的战略组合肯定是纳什均衡:因为任何博弈都有它自身的一个子博弈。

2.如果某博弈的惟一子博弈就是其本身,那么子博弈精练纳什均衡和纳什均衡就是一样的。

3.子博弈精炼纳什均衡与纳什均衡的根本不同之处,就是子博弈精炼纳什均衡能够排除纳什均衡不可信的威胁或承诺,排除“不合理”、不稳定的纳什均衡,只留下真正稳定的纳什均衡.混合策略: 参与者采取的不是惟一的策略,而是其策略空间上的一种概率分布。

补充:博弈要素:博弈的参加者——博弈方:又称局中人,博弈方,是指博弈中选择行动以最大化自身利益的决策主体(可以是个人,也可以是团体,如厂商、政府、国家)。

各博弈方的策略或行为:同上博弈的次序:包括是否多次重复选择、行为。

规定一个博弈必须规定其中的次序,次序不同一般就是不同的博弈,即使博弈的其他方面都相同。

;博弈方的得益:同上2博弈分类方法主要类型:第一个角度:按照参与人之间是否合作进行分类合作博弈与非合作博弈:两者的区别主要在于参与人之间能否达成一个对各方具有约束力的协议 第二个角度是按照参与人行动的先后顺序进行分类静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动。

动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

第三个角度是按照参与人对其他参与人的了解程度进行分类 完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

不完全信息博弈:如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确。

或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息。

将博弈的信息特征和行为时间特征结合起来,可以把博弈细分为下面四种类型的非合作博弈:“囚徒困境”的内在根源:两个嫌疑犯作案后被警察抓住,分别被关 在不同房间审讯。

警察告诉他们:如果两人都 坦白,各判刑8年;如果两个都抵赖,各判1年(因证据不足);如果其中一人坦白另—人抵赖,坦白者放出去,不坦白的判刑10年(这有点“坦白从宽、抗拒从严”的味道)。

博弈收益(支付)见上表。

每个囚徒都有两种:坦白或抵赖。

表中每格的第一个数字是囚徒A 的支付,第二个数字为囚徒B 的支付。

在这个例子里,战略组合有四个:(坦白,坦白),(坦白,抵赖),(抵赖,坦白),(抵赖,抵赖)。

给定B 坦白的情况下,A 的最优战略是坦白;同样,给定A 坦白的情况下,B 的最优战略也是坦白。

各方最优战略的组合是(坦白、坦白)。

从博弈中两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,这就是所谓的囚徒困境。

该博弈揭示了个体理性与集体理性之间的矛盾(个体理性不等于集体理性,甚至二者互相矛盾 )。

颤抖手均衡:在这个博弈中 (D ,L)和(U ,R)都是纳什均衡。

如果考虑到博弈方的选择和行为可能出现偏差,情况就会发生一定的变化。

因为如果博弈方2有可能采用R ,不管这种可能性多么小,博弈方1的最佳选择就是U 而不是D 。

囚徒A 囚徒B-1, -1-10, 00, -10 -8,-8 坦白 抵赖坦白 抵赖而博弈方2考虑到博弈方l 的这种思路,就会选择R而不是L,因此(D,L)不再是一个具有稳定性的均衡。

反过来(U,R)的情况就不同。

因为从这个策略组合出发,不管博弈方2是否有偏离R 的可能,博弈方1都没有必要偏离U。

对博弈方2来说,虽然博弈方1从U偏离到D对他的利益有不利影响,但只要博弈方1偏离的可能性不超过2/3,那么自己改变策略并不合理,因此(U,R)对于概率较小的偶然偏差来说具有稳定性,我们称具有这种性质的策略组合为“颤抖手均衡”,很显然,(D,L)就不是一个颤抖手均衡。

注:对纳什均衡(U,R)来说,设博弈方1偏离U的的概率为p(即选D的概率为p,选U的概率为1-p),只有当:0•(1-p)+1•p>2•(1-p)+0•p ,即p>2/3时,博弈方2才有必要改变策略选L。

海萨尼转换子博弈纳什均衡与纳什均衡的关系:当在位者两种成本,进入者似乎是与两个不同的在位者博弈,(一高,一低) 。

如在位者有T种可能的C,进入者似乎是在与T个不同的在位者博弈。

在1967年以前,博弈34论专家认为这样的不完全信息博弈是没法分析的,因为当一个参与人并不知道他与谁博弈时,博弈的规则是没定义的。

海萨尼(Harsanyi ,1967-1968)提出了一种在前述将对支付的不了解转化为对类型的思路的基础上,进一步将不完全信息静态博弈转化为完全但不完美信息动态博弈进行分析的思路,被称为海萨尼转换。

引入一个虚拟的参与人“自然”自然首先行动决定参与人的特征,参与人知道自己的特征,其他参与人不知道,这样上述不完全信息博弈就转换为上图完全但不完美信息博弈。

计算分析战略式表述的静态博弈的纳什均衡(纯策略与混合策略); 各方最优战略的组合是(坦白、坦白),这就是一种均衡。

纯战略:参与人在每一个给定信息情况下选择一种特定 的行动(以概率1选择某一行动)混合战略:在给定信息情况下以某种概率分布随机地选择不同的行动 虽这模型没有PNE ,却有下述的MNE :参与人以一定的概率选择某种战略,然后计算相应于不同概率的期望效用。

设:政府救济的概率θ=1/2 ;不救济的概率1-θ=1/2。

流浪汉:寻找工作的期望效用:1/2×2+1/2 ×1=1.5 流浪的期望效用: 1/2×3+1/2 ×0=1.5流浪汉选择任何混合战略带来的期望效用是1.5,则流浪汉的任何一种战略(纯的γ=1或γ=0或混合的0<γ<1)都是政府所选择的混合战略的最优反应。

特别选 γ=0.2 1-γ=0.8 游荡 寻找工作囚徒A囚徒B-1, -1-10, 00, -10 -8,-8 坦白 抵赖坦白 抵赖例1、社会福利博弈3 , 2 -1 ,3-1 , 1 0 , 0救济 不救济政府寻找工作 游荡 流浪汉-0.20.800.21- 2.08.012.03 =⨯+⨯-=⨯-⨯不救济:救济:5同样,可以根据流浪汉的期望效用函数找到 政府的最优混合战略。

即:流浪汉以0.2的概率选择寻找工作, 0.8的概率选择游荡 对γ*= 0.2 的解释:如果流浪汉以找工作的概率小于0.2, 则政府选择不救济,如果大于0.2,政府选择救济 ,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略. 对 θ*= 0.5 的解释如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是寻找工作. γ*= 0.2 ,θ*= 0.5 是唯一的混合战略纳什均衡。

例2: 参与人1的混合战略为σ1=(q ,1-q)(分别以概率q 和1-q 选择正面和反面) ,参与人2的混合战略为σ2=(r ,1-r) (分别以概率r 和1-r 选择正面和反面)。

当给定参与人2选择混合战略σ1=(r, 1-r)时,参与人1的选取正面 的期望效用为 E1(正面)=(-1)× r + 1 ×(1-r) = 1-2 r参与人1选取反面的期望效用为E1(反面)=1× r + (-1)×(1-r) = 2 r-1 参与人1的期望效用为 E1= E1(正面)×q + E1(反面)×(1- q )=(1-2 r )(2 q-1) 类似地,得到参与人2的期望效用为E2= (1-2 q)(2 r-1) 参与人1和参与人2的期望效用分别为E1=(1-2 r )(2 q-1) E2=(1-2 q )(2 r-1) 由一阶条件:2.00151510111311*==-=∂∂--=-+--+--+=-=-=γγθγγθγγθγγθσσγγσθθσ故化的一阶条件:求微分,得到政府最优)())()(()))(((),(:政府的期望效用函数为)。

,(流浪汉的混合战略是);,(假定政府的混合战略是GL G L G v v 参与人1参与人2 -1, 11,-11,-1 -1, 1 r 正面 1-r 反面 q 正面 1-q 反面21,21021,02121===-=∂∂=-=∂∂q r q r E r q E 为猜币博弈的纳什均衡,混合纳什均衡战略,的和参与人分别是参与人和)( 21)21,21(*)21,21(*2*12*1σσ=σ=σ6例3:设博弈方1选A 的概率为pA ,选B 的概率为pB , 博弈方2选C 的概率为pC ,选D 的概率为pD ,那么博弈方1选A 和B 的概率pA 和pB ,一定要是博弈方2选C 的期望得益和选D 的期望得益相等,即 pA*3+pB*1=pA*2+pB*5 因此 pA=0.8 pB =0.2 同理可得pC=0.8 pD=0.2原则:1、不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性;2、他们选择每种策略的概率一定要恰好使对方无机可乘。

相关文档
最新文档