环境污染博弈论

环境污染博弈论
环境污染博弈论

经济博弈论题目: 环境污染博弈论

院系名称:瓯江学院专业班级: ********* 学生姓名: ** 学号:**

电话号码: ***************

电子邮箱: ***************

一、现象描述

假如市场经济中存在着污染,但政府并没有管制的环境,企业为了追求利润的最大化,宁愿以牺牲环境为代价,也绝不会主动增加环保设备投资。按照看不见的手的原理,所有企业都会从利己的目的出发,采取不顾环境的策略,从而进入“纳什均衡”状态。如果一个企业从利他的目的出发,投资治理污染,而其他企业仍然不顾环境污染,那么这个企业的生产成本就会增加,价格就要提高,它的产品就没有竞争力,甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期,中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时,企业才会采取低污染的策略组合。企业在这种情况下,获得与高污染同样的利润,但环境将更好。

二、政府监管与企业排污博弈模型

三、模型求解和结果分析

对矩阵分析可知,该博弈图不存在纯策略的纳什均衡,现从定义出发求混合策略的纳什均衡解。设企业排污的概率为x,不排污的概率为(1-x),政府监管的概率为y,不监管的概率为(1-y),x,分别y满足O

企业的期望效用函数为:

u(x,1-x)=[y(-d-m)+(1一y)(-m)]+(1-x)[y(-c)+(1-y)(-c)] 对X求偏导得,au/ax=-yd-m+c,令其偏导等于0。

得y=(c-m)/d;

当y<(c-m)/d时企业选择不排污,当y>(c—m)/d时,企业选择排污

当y=(c-m)/d时,企业对排污与否持无所谓态度。

对y分析,ay/ac>0,即政府的管制概率与企业的治理排污成本成正比,企业的治理污染费用越高,企业越倾向排污,而政府也越倾向于管制;ay/am<0;8y/8d<0,政府的管制概率与企业对自身形象的重视度和政府对其排污的罚金数

额成反比,即企业对自身形象越重视,政府的治污力度越大,企业越不倾向排污,政府的管制力度也会相应降低。这种情况在大企,业中较多,大排污者由于被查处排污所缴的税金与罚款较多,加上自己资金相对雄厚,受公众的关注较多,对自身的形象更重视,因此一般是污染在内部进行治理;而对于中小企业,由于资金有限加上税金低,企业注重的只是眼前的发展,公众对企业的舆论影响微乎其微,在这种情况下,小企业一般是把污染排放于环境,政府应通过对其税收集中治理。

政府的期望效用函数为:

v(y,1-y)=y[x(-h+d+n)+(1-x)(-n)]+(1-y)[x(-h)+(1-x)*0],对y求偏导,得av/ay=2xn+xd-h,令其偏导等于0,

得x=h/2n+d;

当x>h/2n+d时,政府选择监管;

当x

当x=h/2n+d时,政府对监管与否持无所谓态度。

对x分析,ax/Oh>0,即企业排污的概率与政府的管制费用成正比,即政府对企业的管制成本越大,企业越倾向于排污;ax/an<0,ax/ad<0,企业排污的概率同排污对政府造成的信誉影响和政府在企业排污时的处罚金额成反比,即政府对自身形象越重视,对企业排污处罚力度增大时,企业越倾向于不排污。如果政府的上级部门对政府的绩效考核的标准是绿色GDP,而不是简单的GDP的增长率,那么政府会增加对排污企业的监管力度;如果公众特别是媒体能充分发挥监督作用,在舆论压力下政府也会增加监管力度。

四、运营指导建议

上述博弈模型的仅仅是简单博弈条件下的理论分析,还有一些博弈条件没有考虑,现实情况中会更复杂。但这模型提供的一些启示,可以作为我国降低环境污染事故的政策建议。

首先,应完善环境保护的法律体系,加大中央政府对地方政府的环境监督力度。我国中央政府的监管力度与地方政府的监管力度在理论上还没有达到最优值,这种情况的主要原因是中央与地方二者之间的利益存在分歧,地方政府能够在其单独行动的范围内选择最有利于自身利益的策略,从而在一定程度上忽视了

中央政府的环境政策。为了减少环境污染事故的发生,中央政府必须进一步完善强化相关的环境法律法规,加强对地方政府的监督力度和处罚力度,同时还应该设立一些正面的激励措施,使中央政府与地方政府之间的利益一致性增强。最终使中央政府的监督力度与地方政府的监督力度达到最优状态。

其次,应打破地方政府与企业之间的利益关系,加强地方政府对污染企业的监督处罚力度。地方政府的监督力度不够,必然导致污染企业减少本应进行的环境保护投入,获得更多利润。利润增加后,企业对地方政府的寻租能力又获得提高,从而形成恶性循环。所以必须要求地方政府进一步完善地方环境法规制度,制定严格的污染物排放标准,提高对企业的环境安全监督力度,加大对超标排放企业的处罚力度,增加企业的排污成本,使企业在主观上控制排放。同时,当企业发现寻租无效以后,自然会把寻租成本转移到环保投入方面,不但能够直接降低环境污染事故发生率,还有利于减少地方政府的腐败行为。

最后,加强环境信息的公开化、透明化,引导社会公众参与环境监督。中央和地方政府应该发挥社会公众和媒体的监督作用,建立健全环境问题举报制度,对举报违规生产、违规排放、隐瞒事故的公众给予奖励。提高公众的环保意识,降低环境问题的诉讼成本,提高污染企业环境赔偿的额度。这种策略能够吸引社会公众积极参与,在一定程度上降低了政府部门的环境监督成本,实现了从外部约束污染企业排放,从而使污染企业达到自觉达标排放。

博弈论的基概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈论中的相关概念

新古典经济学前提: 理性选择——减少不确定; ——经济系统效用最大化。 理性——新古典经济学与博弈论的纽带 博弈论决策前提:理性的战略选择。 博弈论决策基础:最优反应,即带来最大收益的战略。 但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。 新古典经济学决策的背景: 理性的个体面临特定的制度环境(产权、货币、高度竞争的市场),在此基础上以获取利益最大化为目的。 隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。 弊端: ——限制了理论的使用范围,现实中竞争并不完全; ——无法解决货币经济以外的决策难题。 博弈论的优势: ——不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。 游戏规则: 两个选手,轮流取币; 每次至少取一枚硬币; 只能从一行中取任意数量的硬币,不许从两行中选取; 取走最后一枚硬币的为胜者 囚徒困境的启示: 囚徒困境仅仅是二人博弈,多人博弈在现实中更多; 如果囚犯可以交流,结果显著不同; 如果多轮博弈,结果也有不同; 导致困境结论的分析过程令人注目,但最后结论并非理性。 通常假设参与者将采取最优反应战略而理性行事,最大化利润、力争在游戏中获胜、达到主观收益最大化,或者惩罚最小化,皆属于理性行为。 最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战略。 博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。 依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来的最大收益的战略。 标准式——数字矩阵; 扩展式——树形图 不确定事件(contingency): 相机战略(contingent strategy):仅在不确定事件发生时才会采取的战略 信息集(information set):节点2包含了决策者掌握的所有信息,因此也称为信息集。 扩展式的优势: ——展示了每一阶段掌握的信息; ——展示了参与者掌握信息的不完全 所有博弈问题均可用标准式描述,即绘制一个表格,边缘列出参与者的战略,里面列出参与者的收益;

博弈论教学大纲

《博弈论》教学大纲 第一部分教学说明 1、课程的性质与任务 《博弈论》是经济学院本科生的限定选修课。 2、课程教学目标 课程教学目标是帮助学生获得必要的决策科学基本知识,了解学科发展前沿,掌握探索系统科学基本规律的一般方法;使学生学会应用博弈论的基本原理和方法分析政治、经济、军事、管理和社会生活等领域的博弈问题。 3、适用专业与学时数 本课程的教学大纲适用于经济学和非经济类的本科专业的本科生。为了让学生基本地掌握发展经济理论,我们计划用38个学时分五部分讲授知识,用4个学时进行经济实践活动,希望在教学与实践中,学生能够加强对发展经济学理论的理解和检验。 4、本课程与其他课程的关系 本课程以微观经济学为基础。 5、推荐教材与参考书 《博弈论与信息经济学》,张维迎著,上海三联书店、上海人民出版社; 《博弈论战略分析入门》,Roger A McCain著,原毅军等译,机械工业出版社; 《博弈论》施锡铨著,上海财经大学出版社,2002; 《Game Theory》,1991,D.Fudenberg& J.Tirole 中译本,中国人民大学出版社; 《经济博弈论》(第二版) 谢识予编著复旦大学出版社, 2002。 6、主要教学方法与媒体要求 本课程以老师课堂讲授为主,以学生课后实践为辅,同时鼓励学生参与经济实践与经济讨论的活动如举行经济散文竞赛和经济辩论等等。为适应科学教育的现代化、国际化和信息化,我们在教学媒体上逐步使用电脑、投影仪、幻灯片等硬件设备,与此相配套的就是使用诸如Powerpoint之类的电子讲稿,此外我们还将通过网络与学生多方面、多层次、多角度的交流,及时了解学生学习的动态和存在的问题。 7、开课与编写大纲单位:经济学教研室;课程负责人:卢燕平;审定单位:经济学院;

博弈论复习题及答案完整版

博弈论复习题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题?

博弈论复习题及答案

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另

外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代理人行动,造成信息不对称,从而出现代理人选择不利于委托人的行为的一种现象;解决道德风险的方法可以用签订合同、派人监督,以及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 F 2 B 2 F 1 B 1 答:根据上方的矩阵图,我们可得出其博弈中存在两种策略的纳什均衡:分别是H 选择F1和N 选择F2,以及H 选择B1和N 选择B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和“R ”的行动,其收益如下:当A 选左,B 选L 时,A 的收益为2 ,B 的收益为3;当A 选左,B 选R 时,A 的收益为1 ,B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1;当A 选右,B 选R 时,A 的收益为0 ,B 的收益为2。请画出该博弈的博弈树,并求出该博弈的均衡解。 N H

博弈论简明教材

博弈论 第一节博弈问题概述 一、博弈的基本概念 博弈论是近年经济学中发展得很快的一个分支。博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题的。换句话说,博弈论研究当某一经济主体的决策既受到其它经济主体决策的影响,而且该经济主体的相应决策又反过来影响到其它经济主体时的决策问题和均衡问题。 在前面几讲中,除了寡头市场外,消费者的效用或厂商的利润都只依赖于他自己的选择,而与其他人的选择无关。在这里,经济作为一个整体,各个经济主体的选择是相互影响的。但对于单个的消费者或厂商来说,所有其它经济主体的行为都被包括在一个参数里。这个参数就是价格。除此以外,经济主体在决策时,面临的似乎是一个非人格化的东西。经济主体既不需要考虑他人的选择对自己选择的影响,也何必需要考虑自己的选择对他人的影响。而在本讲所介绍的博弈论中,消费者的效用或厂商的利润不仅依赖于自己的选择,而且依赖于具体的某一个或某一些其它经济主体的选择。 在经济学中,博弈论通常是放在寡头市场的分析中,因为在寡头市场上,某一寡头企业在决策时,不得不考虑其他寡头企业的反应。但事实上,博弈行为是广泛存在的。 博弈分析的目的是使用博弈规则决定均衡。 博弈论的基本概念包括:参与人、行动、战略、博弈规则、信息、报偿、均衡。 参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。 行动是指参与人作的决策。 战略是指参与人选择行动的规则,它告诉参与人在什么情况下选择什么行动。 例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。这里,“犯”与“不犯”是两种不同的行动。战略规定了什么时候选择“犯”,什么时候选择“不犯”。 博弈规则是指参与人共同接受的不同情况下的最优战略。信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。 报偿是参与人从博弈中获得的结果,它取决于所有参与人的行动或战略。 把全体参与人可能采取的不同战略及其报偿都列出来,称为报偿矩阵。 均衡是所有参与人的最优战略或行动的组合。 二、博弈的分类 可以从不同的角度对博弈进行分类。 根据博弈者选择的战略,可以将博弈分成合作博弈 (cooperative games) 与非合作博弈 (non-cooperative games). 合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。如果有,就是合作博弈;反之,就是非合作博弈。例如,如果几家寡头通过订立并实行协议,限制产量,制定垄断高价,则称这种博弈为合作博弈。若寡头们在市场竞争中没有达成有约束里的协议,每个企业仅仅是在考虑到

博弈论复习题及答案

名词解释(每题7 分,共 2 8 分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10 分,共40 分) 1、博弈的基本要素有哪些? 基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡?答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。

3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能 猎到所 需猎物。 4、什么是道德风险?有什么办法可以解决道德风险问题? 答:道德风险是指委托-代理框架中,由于委托人无法直接观察代 理人行 动,造成信息不对称,从而出现代理人选择不利于委托人的行 为的一种现 象;解决道德风险的方法可以用签订合同、派人监督,以 及采用激励等方式来进行解决,约束和激励机制。 三、计算题(16分) 1、求解下列博弈中的纳什均衡(包括混合策略纳什均衡)。 H B i 答:根据上方的矩阵图, 我们可得出其博弈中存在两种策略的纳 什均衡:分别是 H 选择F1和N 选择F2,以及H 选择B1和N 选择 B2 2、A 、B 两者博弈:A 首先行动,可以选择“左”或者“右”的行动;B 后行动,有“L ”和R ”的行动,其收益如下:当 A 选左,B 选L 时,A 的收益为2,B 的收益为3 ;当A 选左,B 选R 时,A 的收益为1 , B 的收益为4;当A 选右,B 选L 时,A 的收益为3 ,B 的收益为1 ; 当A 选右,B 选R 时,A 的收益为0,B 的收益为2。请画出该博弈 的博弈树,并求出该博弈的均衡解。 四、论述题(16分) 1、请结合你的工作或生活,谈谈对行动的可信性的理解,有什么方 法可以建立可信的策略行动。 答:每一种策略性行动都面临着可信性的问题, 人们不一定相信 策略性行动的提出者会实施其行动。 因此提出者必须做一些辅助工作 F 2 B 2

博弈论知识点总结完整版

博弈论 (一):基本知识 1.1定义:博弈论,又称对策论,是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论,是研究竞争的逻辑和规律的数学分支。即,博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间的均衡。 1.2基本要素:参与人、各参与人的策略集、各参与人的收益函数,是博弈最重要的基本要素。 1.3博弈的分类:博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(binding agreement)。倘若不能,则称非合作博弈(Non-cooperative game)。 合作博弈强调的是集体主义,团体理性,是效率、公平、公正;而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益的最大化,最后达到力量均衡。 博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息,是否了解两个角度进行。把两个角度结合就得到了4种博弈: a、完全信息静态博弈,纳什均衡,Nash(1950) b、完全信息动态博弈,子博弈精炼纳什均衡,泽尔腾(1965) c、不完全信息静态博弈,贝叶斯纳什均衡,海萨尼(1967-1968) d、不完全信息动态博弈,精炼贝叶斯纳什均衡,泽尔腾(1975)Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容:完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式:策略式表述(Strategic form), 扩展式表述(Extensive form) 1.6占优均衡: a、占优策略:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。 对于所有的s-i,si*称为参与人 i的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡:一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡: a、“严劣”和“弱劣”的含义: 设s i’和s i’’是参与人i可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。 上面式子中,若将“<”改为“≤”,则说策略s i’弱劣于策略s i’’。 b、定义:重复剔除严格策略就是 各参与人在其各自策略集中, 不断剔除严劣策略…如果最终 各参与人仅剩下一个策略,则 该策略组合就被称为重复剔除 严劣策略均衡。 (二):纳什均衡(Nash Equilibrium) 2.1纳什均衡定义:对于一个策略式表述的博弈G={N,S i, u i,i∈N},称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡,如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i的最优策略(经济理性策略),即:u i(s i*, s-i*) ≥ u i(s i, s-i*), 对于任意的s i∈S i ,任意的i∈N均成立。

博弈论基本概念

(1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。 (2)对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。 (3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。 (4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (5)得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 (6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 (7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的收益将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的收益不会超过他采取原来的策略a*的收益。这一结果对局中人B亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策

博弈论部分内容

博弈论基础 本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。 重点:博弈论的基本思想,纳什均衡的概念,信息不对称。 难点:博弈的构成要素,纳什均衡的概念。 一、博弈的基本要素 1、博弈论与古典经济学的区别 古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。 博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。 两者的根本区别:是否考虑对方的行为。 古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。消费者A不会考虑消费者B的影响。 古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。厂商A不会考虑厂商B的影响。 古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。国家A不会考虑国家B的影响。 博弈论:每个人要考虑别人的行为怎样影响自己的选择。 扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。 下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。 高手与俗手的区别也就在此。高手往往能够考虑10步甚至20步以后的变化。 总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。 2、博弈论简史 博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯?诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and Economic Behavior)一书,最早提出了博弈论的概念。

对博弈论的认识

对博弈论的认识 博弈论( Game Theory) 研究的是, 各个理性 决策个体在其行为发生直接相互作用时的决策及 决策均衡问题。冯·诺伊曼(John Von Neumann) 与摩根斯坦恩(Oskar Morgenstern) 合作出版的 《博弈论与经济行为》(1944) 一书第一次系统地将博弈论引入经济学中。到20 世纪50 年代, 合作博 弈发展到鼎盛期, 非合作博弈也开始产生。纳什(Nash ,J . F. ) 的《N 人博弈的均衡点》(1950) 、《非合作博弈》(1951) 明确提出了“纳什均衡”(Nash Equilibrium) ,图克( Tucker) 则定义了“囚徒困境”( Prisoners’ Dilemma , 1950) 。两人的著作奠定了现代非合作博弈论的基石。泽尔滕(R. Seleten , 1965) 首次将动态分析引入博弈论, 提出了纳什均 衡的第一个重要改进概念———“子博弈精炼纳什均衡”(Subgame Perfect Nash Equilibrium) 和相应的求解方法———“逆向归纳法” (Bakeward Induction) 。豪尔绍尼(J . C. Harsanyi ,1967) 首次把信息不完全性引入博弈分析, 定义了“不完全信息静态博弈” (Static Games of Incomplete information) 的基本均衡概念———“贝叶斯- 纳什均衡”(Bayesian - Nash Equilibrium) ,构建了不

完全信息博弈的基本理论。之后,不完全信息动态 博弈(dynamic games of incomplete information) 得到迅速发展, 弗得伯格和泰勒尔( Furdenberg and Tirole , 1991) 定义了它的基本均衡概念———“精炼贝叶斯—纳什均衡” ( Perfect Bayesian - Nash Epuilibrium) 。70 年代以后,博弈论形成了一个完整的体系;大体从80 年代开始,博弈论逐渐成 为主流经济学的一部分,甚至可以说成为微观经济 学的基础。1994 年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔滕三人,以表彰他们在博弈论的发展 及应用中所作出的开创性贡献。 一经济博弈论的基本理论——— 基本博弈结构、纳什均衡及其改进 这里,我们以完全信息静态、完全信息动态、不 完全信息静态、不完全信息动态四种博弈结构为主线, 对纳什均衡及其改进进行概括, 以阐明经济博弈论的主要思想内涵。 (一) 完全信息静态博弈———纳什均衡 纳什均衡是完全信息静态博弈的基本均衡概 念。完全信息静态博弈(Static Games of Complete Information) 是指, 博弈的每个局中人(参与竞争的具有不同利益的行为主体或决策者) 对所有其他

一、博弈论的基本概念

博弈与决策复习资料 第一章博弈论的基本理论 一、博弈论 (一)、博弈论的基本概念 ?博弈 博弈论 (二)、博弈论的构成要素 ?博弈一般由以下几个要素组成,包括:参与人、行动、信息、策略、得益、结果、 均衡等。 ?(1)参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也 可以是团体); ?(2)行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策; ?(3)策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动 的预先安排; ?(4)得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或 行动的函数,这是每个参与人最关心的东西; ?(5)均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分 析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。 ?上述要素中,参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博 弈规则来决定均衡。 二、博弈论的发展简史 ?萌芽阶段 ?产生阶段1944 《博弈论与经济行为》 ?发展阶段纳什均衡 ?高潮阶段诺贝尔经济学奖 ?成熟阶段 三、博弈论的分类 ?参与人行动的先后顺序:静态和动态 ?参与人对其他参与人的了解程度:完全信息和不完全信息 ?参与人之间是否进行合作:合作和非合作 ?非合作博弈四种类型及对应的均衡: ?完全信息静态——纳什均衡、占优均衡 ?完全信息动态——子博弈精炼纳什均衡 ?不完全信息静态博弈——贝叶斯纳什均衡 ?不完全信息动态博弈——精炼贝叶斯纳什均衡

第二章简单博弈与博弈均衡 一、占优战略与占优战略均衡案例分析囚徒困境 二、纳什战略均衡案例分析性格大战纳什均衡的意义 占优战略均衡和纳什均衡的联系与区别: 第三章重复博弈与序列博弈 一、重复博弈 重复博弈中的“针锋相对”策略博弈 二、序列博弈 第四章博弈论在企业经济管理决策中的应用 一、扩大生产能力策略 二、保证最低价格策略 重点掌握保证最低价格策略 三、掠夺性定价策略 四、限制进入定价策略 红字部分内容参见教材 除红字部分外内容参见网上课堂课件、网上案例

博弈的构成要素

博弈 (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。 (2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 (3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 (4)对于博弈参与者来说,存在着一博弈结果 (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。 纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B 亦是如此。 这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*)≤偶对(a*,b*)≤偶对(a*,b)。 对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b (属于策略集B),总有:对局中人A的偶对(a, b*)≤偶对(a*,b*);对局中人B 的偶对(a*,b)≤偶对(a*,b*)。 有了上述定义,就立即得到纳什定理: 任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。 纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要

期末复习博弈论基本概念

1.博弈论: 研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 一些个人或组织,面对一定的环境条件,在一定的规则下,同时或先后、一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。本质为存在策略依存性的决策问题。 2.博弈与一般决策的区别: 决策论在技术分析上将对方(其他参与人)的情况列入自己的约束条件,作为一个环境因素对待,将对方的影响作为外生变量处理,未考虑对自己效用的直接的主动的影响。 3.博弈模型的要素 a)参与人(局中人、博弈方):博弈中的决策主体。他的目的是通过选择策略以最大 化自己的支付(效用)水平。虚拟参与人(自然):指决定外生的随机 变量的概率分布的机制。自然作为虚拟参与人没有自己的支付与目标函数,即所有 的结果对他来说都是无差异的。 b)策略:参与人在给定信息集(信息集包含了一个参与人有关其他参与人之前行动的 知识,可理解为参与人在特定时刻有关变量值的知识。一个参与人无法准确指导的 变量全体属于一个信息集)的情况下的行动规则。它规定参与人在什么时候选择什 么行动。(策略是可供局中人选择对付其他局中人的完整行动方案)各参与人 的策略选择范围称为策略空间(策略集)。每个博弈方各选一个策略构成一个 策略组合(局势) c)博弈过程:各博弈方行为的顺序及博弈的规则等。关键是自己选择时能否知道其他

博弈方的选择。 d)支付(得益)函数:各策略组合下各博弈方获得的数值结果(常为效用)。表示为 Ui=Ui(s1,…,si,…,sn)。可见其不仅取决于自己的策略,还取决于他人的策略。 e)信息结构:博弈方对得益和博弈过程信息的掌握情况和程度 f)理性基础:博弈方的行为选择时以个体理性还是集体理性为基础,有完美理性还是 有限理性 若设定博弈时不专门设定后两个方面,就隐含假定就是完全、完美信息、完全理性的非合作博弈 4.博弈的分类(类型) a)据是否具有有约束力的协议:非合作博弈、合作博弈。(非合作博弈无约束力、核 心是策略选择、追求个人优化、不注重效率;合作博弈有约束力、核心是利益分配、 追求公平公正和效率) b)据理性程度:完全理性博弈、有限理性博弈。(完全理性指有完全的计算能力,不 会犯错) c)据博弈过程的不同:静态博弈、动态博弈 d)据博弈方对得益信息的掌握情况:完全信息博弈、不完全信息博弈。(完全信息: 指每个参与人的特征/类型、策略空间、支付函数在所有参与人中是共同知识) e)据策略数量:有限博弈(参与人数有限且策略集均为有限集)、无限博弈 f)据得益特征:零和博弈(对抗性最强)、常和博弈(对抗性较强)、变和博弈(可能 出现双赢或多赢)

博弈论的理论精华及其现实意义

48 [收稿日期]2002-02-25 [作者简介] 胡希宁(1952-),男,安徽芜湖人,中共中央党校经济学教研部教授;贾小立(1970-),男,山西洪洞人,中共 中央党校研究生院硕士研究生。 博弈论的理论精华及其现实意义 胡希宁 1 贾小立 2 (1.中共中央党校经济学教研部,北京100091; 2.中共中央党校研究生院,北京100091) [摘要]经济博弈论以贴近现实的方式,揭示了现代经济活动的内在规律。它的发展过程是 纳什均衡从提出到改进的过程。无论在理论上还是在实践上,博弈论都具有重要的现实意义。 [关键词] 博弈论;纳什均衡;信息经济学 [中图分类号] F062.5 [文献标识码]A [文章编号]1007-5801(2002)02-0048-06 第6卷第2期 2002年5月 中共中央党校学报 Journal of the Part y School of the Central Committee of the C.P.C. Vol.6,No.2Ma y .,2002 博弈论(Game Theor y )研究的是,各个理性决策个体在其行为发生直接相互作用时的决策及决策均衡问题。冯?诺伊曼(John Von Neumann )与摩根斯坦恩(Oskar Mor g enstern )合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中。到20世纪50年代,合作博弈发展到鼎盛期,非合作博弈也开始产生。纳什 (Nash ,J.F.)的《N 人博弈的均衡点》(1950)、《非 合作博弈》(1951)明确提出了“纳什均衡”(Nash E q uilibrium ),图克(Tucker )则定义了“囚徒困境”(Prisoners’Dilemma ,1950)。两人的著作奠定了 现代非合作博弈论的基石。泽尔滕(R.Seleten , 1965)首次将动态分析引入博弈论,提出了纳什均 衡的第一个重要改进概念———“子博弈精炼纳什均衡”(Sub g ame Perfect Nash E q uilibrium )和相应 的求解方法———“逆向归纳法”(Bakeward Induction )。豪尔绍尼(J. C.Harsan y i ,1967)首次 把信息不完全性引入博弈分析,定义了“不完全信息静态博弈”(Static Games of Incom p lete information )的基本均衡概念———“贝叶斯-纳什 均衡” (Ba y esian -Nash E q uilibrium ),构建了不 完全信息博弈的基本理论。之后,不完全信息动态博弈(d y namic g ames of incom p lete information ) 得到迅速发展,弗得伯格和泰勒尔(Furdenber g and Tirole ,1991)定义了它的基本均衡概念——— “精炼贝叶斯—纳什均衡”(Perfect Ba y esian -Nash E p uilibrium )。70年代以后,博弈论形成了一个完整的体系;大体从80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。1994年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔滕三人,以表彰他们在博弈论的发展及应用中所作出的开创性贡献。 一经济博弈论的基本理论———基本博弈结构、纳什均衡及其改进 这里,我们以完全信息静态、完全信息动态、不完全信息静态、不完全信息动态四种博弈结构为主线,对纳什均衡及其改进进行概括,以阐明经济博弈论的主要思想内涵。 (一)完全信息静态博弈———纳什均衡 纳什均衡是完全信息静态博弈的基本均衡概念。完全信息静态博弈(Static Games of Com p lete Information )是指,博弈的每个局中人(参与竞争的具有不同利益的行为主体或决策者)对所有其他局中人的特征(策略空间、支付函数等,前者指可供局中人选择的策略组合,后者指决定局中人损益得失的函数)有完全的了解;所有局中人同时选择行

相关文档
最新文档