博弈论与信息经济学-非合作博弈理论

合集下载

非合作博弈经济管理学及财务知识分析理论

非合作博弈经济管理学及财务知识分析理论

(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡 概念没有规定参与人如何修正自己的信念。但是,如果进 入者可以任意修订自己有关在位者成本函数的信念,上述 不完全信息动态博弈可以有任意均衡。
假定参与人的类型是独立分布的,参与人i有K个类型, 有h个可能的行动,өk和ah分别代表一个特定的类型和 一个特定的行动。
如果我们观察到i选择了ah,i属于өk的后验概率是多少?
p(ahk)p(k) p(ahk)p(k)
Por{b kah}
(7,0) (5,-1) (9,0) (5,-1) (9,0) (5,-1) (9,0)
市场进入博弈-2阶段不完全信息动态博弈
基本思路-不完全信息动态博弈
精练贝叶斯均衡是贝叶斯均衡、子博弈精练均 衡和贝叶斯推断的结合。它要求:
✓ 1、在每个信息集上,决策者必须有一个定义 在属于该信息集的所有决策结上的一个概率分 布(信念);
第二个弟子……
第三个弟子……
贝叶斯法则
在日常生活中,当面临不确定时,我们对某事 件发生的可能性有一个判断,然后,会根据新 的信息来修正这个判断。
✓ 统计学上,修正之前的判断称为“先验概率”
✓ 修正后的判断称为“后验概率”
贝叶斯法则就是人们根据新的信息从先验概率 得到后验概率的基本方法。
贝叶斯法则
基本思路-不完全信息动态博弈
成语故事:黔之驴-驴虎博弈
老虎通过不断试探来修正对毛驴的看法, 每一步行动都是给定它的信念下最优的, 毛驴也是如此。最终老虎将毛驴吃掉。

博弈论与信息经济学

博弈论与信息经济学

博弈论与信息经济学一、引言博弈论与信息经济学是现代经济学中重要的研究领域之一。

博弈论研究的是决策者在互动中面临的策略选择问题,致力于解决各种冲突和合作关系中涉及的决策问题。

信息经济学则侧重于分析信息在经济活动中的作用,特别是信息不对称情况下的市场行为和结果。

本文将就博弈论与信息经济学的主要概念、方法和应用展开论述。

二、博弈论博弈论是一种数学工具,用于分析决策者在互动中的行为和选择。

博弈论中的“博弈”指的是参与者之间的相互作用,每个参与者都试图通过选择最优策略来达到个人利益最大化。

1.基本概念在博弈论中,最基本的概念是“博弈”,即参与者之间的互动行为。

每个参与者在博弈中都会考虑其他参与者的选择,以制定自己的策略。

博弈可以分为合作博弈和非合作博弈两种形式。

2.关键元素博弈论中的关键元素包括参与者、策略和支付。

参与者是指在博弈中做出决策的个体或组织,策略是指参与者的选择或行动,支付是参与者根据策略和其他参与者的选择所获得的利益或成本。

3.博弈模型博弈论通过建立数学模型来描述博弈中的参与者、策略和支付之间的关系。

常见的博弈模型包括正规博弈和扩展博弈。

正规博弈是指参与者同时或依次选择策略,而扩展博弈则考虑了时间因素,并将博弈过程分为不同阶段。

三、信息经济学信息经济学研究的是在市场经济中信息的获取、传递和利用。

在现实经济中,信息通常是不对称的,即买方和卖方在交易中拥有不同的信息水平。

信息经济学探讨了信息不对称对市场行为和经济结果的影响。

1.信息不对称信息经济学的核心概念是信息不对称,即市场参与者在交易中所拥有的信息水平不同。

信息不对称会导致市场效率下降,因为交易双方无法完全了解对方的信息,从而影响了市场的决策和结果。

2.逆向选择和道德风险逆向选择和道德风险是信息不对称的两个主要问题。

逆向选择指的是交易中买方无法获得完全信息,导致买方从卖方处选择低质量产品或服务。

道德风险则是指卖方在交易完成后可能会改变行为,损害买方的利益。

博弈论与信息经济学-中国科学院研究生院管理学院张玲玲

博弈论与信息经济学-中国科学院研究生院管理学院张玲玲


第一章 概述-人生处处皆博弈
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”

石匠的决策与拳击手的决策的区别
第一章 概述-人生处处皆博弈
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
博弈论与信息经济学
(Game Theory and Information Economics )
张玲玲
中国科学院研究生院管理学院 zhangll@
前言

本课程的教学安排 本课程的主要内容 博弈论概述 本课程的教学目的
讲课及考核方式

学科属性:公共选修课 学时/学分:30/1 预修课程:微观经济学
行动 有先后 对手特征、 支付函数、 战略空间 未知
主要内容简介
第一章 概述-人生处处皆博弈

第一篇 非合作博弈理论
第二章 第三章 第四章 第五章
完全信息静态信息博弈-纳什均衡 完全信息动态搏弈-子博弈精炼纳什均衡 不完全信息静态博弈-贝叶斯纳什均衡 不完全信息动态博弈-精练贝叶斯纳什均衡
囚徒困境
第一章 概述-人生处处皆博弈-囚徒困境
案例1-囚徒困境-纳什均衡
囚徒A
坦白
囚徒
-8大于-10 0大于-1
抵赖
-10,0
-1,-1
(坦白,坦白)是纳什均衡
第一章 概述-人生处处皆博弈-囚徒困境
设定: (1)每个局中人都知道博弈规则和博弈结 果的支付矩阵; (2)每个局中人都是理性的(个人理性和 个人最优决策); (3)不能“串通”

博弈论论文--非合作博弈论

博弈论论文--非合作博弈论

非合作博弈论博弈论也叫对策论,是现代微观经济学的基础领域之一,主要研究在彼此互动的情形下个人是如何做决策的。

近年来它已经被广泛地应用于商业、政治、社会学等其他社会科学的分析中。

博弈的分类根据不同的基准也有不同的分类。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。

他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡。

从而揭示了博弈均衡与经济均衡的内在联系。

纳什的研究奠定了现代非合作博弈论的基石,后来的博弈论研究基本上都沿着这条主线展开的。

1944年冯·诺依曼与奥斯卡·摩根斯特恩合著的巨作《博弈论与经济行为》出版,标志着现代系统博弈理论的的初步形成。

尽管对具有博弈性质的问题的研究可以追溯到19世纪甚至更早。

例如,1838年古诺(Cournot)简单双寡头垄断博弈;1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断;2000多年前中国著名军事家孙武的后代孙膑利用博弈论方法帮助田忌赛马取胜等等都属于早期博弈论的萌芽,其特点是零星的,片断的研究,带有很大的偶然性,很不系统。

冯·诺依曼和摩根斯特恩的《博弈论与经济行为》一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。

合作型博弈在20世纪50年代达到了巅峰期。

然而,诺依曼的博弈论的局限性也日益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间里,人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有限。

正是在这个时候,非合作博弈—“纳什均衡”应运而生了,它标志着博弈论的新时代的开始!纳什不是一个按部就班的学生,他经常旷课。

博弈论与信息经济学GameTheoryandInformationEconomics课件

博弈论与信息经济学GameTheoryandInformationEconomics课件
经济学家提炼出信息不对称的概念,挖 出一批“柠檬市场”,并解剖的是一大 贡献;
而提出改造世界的方案,设计出各种在 信息不对称情况下保障市场有效运转的 机制是另一大贡献,甚至认为是更大的 贡献。
一 博弈论与信息经济学
博弈论
给定信息结构,求均 衡结果 均衡理论 方法论导向 实证的
信息经济学
给定信息结构,求契 约安排 契约设计理论 问题导向 规范的
模型
隐藏行动的道德 风险
隐藏信息的道德 风险
逆向选择风险
信号传递和信息 甄别
委托人
地主 股东 住户 公民 社会 雇主 股东 原告/被告 雇主 保险公司
雇主 买方投资
代理人
佃农 经理 房东 政府官员 犯罪 雇员 经理 代理律师 雇员 投保人
工人 卖方
行动、类型或信号
耕作努力 工作努力 房屋修缮 廉洁或贪污 偷盗的次数 任务的难易/工作努力 市场需求/投资决策 赢的概率/办案努力 工作技能 感染爱滋病病毒
险模型

非对称发生在事前(签约前),逆向选择模型;

非对称发生在事后(签约后),道德风险模型。
研究不可观测行动的模型称为隐藏行动模型;
研究不可观测信息的模型称为隐藏信息(或知识)模型
隐藏行动的道德风险
签约时信息是对称的

接受
选择行动
提供合同
努力或不 自然
努力
代理人

委托人
代理人 不接受
某些可 观测的 结果
作为博弈者,最佳策略是最大限度地利 用游戏规则,最大化自己的利益;
作为社会最佳策略,是通过规则使社会 整体福利增加。
第六章 委托-代理理论(I)
一 博弈论与信息经济学 二 信息经济学的分类 三 委托-代理理论的分析思路和框架 四 对称信息下的最优合同

博弈论在经济学中的应用

博弈论在经济学中的应用

博弈论在经济学中的应用博弈论,作为现代数学的一个分支,已经被广泛应用于经济学中。

本文将探讨博弈论在经济学中的应用,并阐述其理论背景、方法论和实证结果。

一、理论背景博弈论是一种研究决策主体的数学理论,它通过研究决策主体之间的互动和决策行为,寻找最优策略。

在经济学中,博弈论的应用主要体现在以下几个方面:市场均衡、非合作博弈和合作博弈。

市场均衡研究的是市场供需之间的平衡,通过博弈论可以分析市场价格的形成机制;非合作博弈研究的是参与者在非协调机制下的决策过程,如囚徒困境、零和博弈等;而合作博弈则研究的是参与者之间的集体决策过程,如联盟、分赃等问题。

二、方法论博弈论在经济学中的应用需要运用一些基本的方法论原则,如描述博弈规则、选择策略、进行支付比较等。

其中,博弈规则的制定需要明确参与者、信息结构、决策时间和支付函数等要素;策略选择则需要考虑自身利益最大化和对手行为的最坏情况;而支付比较则是通过分析不同策略组合下的收益情况,为参与者提供决策依据。

此外,博弈论还需要借助数学工具进行定量分析,如概率论、微积分、线性代数等,以便更好地理解和预测参与者的行为。

三、实证结果博弈论在经济学中的应用已经取得了一些实证结果。

例如,在市场均衡方面,通过博弈论可以分析出市场价格的形成机制,解释一些市场现象,如价格波动、市场分割等问题。

在非合作博弈方面,囚徒困境、零和博弈等模型已经广泛应用于企业竞争、贸易政策等领域,为参与者提供了决策依据。

而在合作博弈方面,联盟、分赃等问题也得到了很好的解决,促进了合作共赢的实现。

然而,需要注意的是,博弈论的应用也存在一定的局限性。

首先,博弈论是基于数学模型的理论分析,其结果可能受到模型假设的限制;其次,参与者的行为往往受到心理、文化等因素的影响,而博弈论通常忽略了这些因素的影响;最后,博弈论的分析结果需要结合实际情况进行综合评估,才能更好地指导实践。

四、结论综上所述,博弈论在经济学中的应用已经取得了许多重要的成果。

博弈论与信息经济学讲义2012-2下+_2012[1].2.29晚_


纳什均衡与占优战略均衡及重复剔除的占优均 衡:
(1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡; (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
1,10 0,10 0,10
C3
1,12 0,11 0,13
剔除顺序:C2、R2、C1、R3,战略组合(R1,C3)
故一般使用严格劣战略剔除,可以看到,(R1,C3) (R1,C1)都是纳什均衡,但在这里是不可解的。

练习: 找出下列两队夫妻的纳什均衡
妻子 活着 恩爱夫妻 丈夫 活着 死了
2,2 0,-6

三 重复剔除的占优均衡
注意: 与占优战略均衡中的占优战略和劣战略不 同,这里的占优战略或劣战略可能只是相对于 另一个特定战略而言。
三 重复剔除的占优均衡
案例2-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 0,0 4大于1 0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
木村 北 北 肯尼 南 南

2,-2 1,-1
2,-2 3,-3
三 重复剔除的占优均衡

练习:在下列战略式表达中,找出重复剔除的 占优均衡
C1 R1 R2 R3
4,3 2,1 3,0
C2
5,1 8,4 9,6
C3
6,2 3,6 2,8
三 重复剔除的占优均衡

注意:
1、严格占优战略下,重复剔除的占优均衡结果 与劣战略的剔除顺序无关;弱占优战略下,重 复剔除的占优均衡结果与弱劣战略的剔除顺序 有关。 2、重复剔除的占优均衡要求每个参与人是理性 的,而且要求“理性”是参与人的共同知识。 即:所有参与人知道所有参与是理性的,所有 参与人知道所有参与人知道所有参与是理性的

博弈论与信息经济学

博弈论与信息经济学引言博弈论和信息经济学是现代经济学中重要的分支领域,它们研究人们在决策过程中的相互作用和信息交流。

本文将介绍博弈论和信息经济学的基本概念、模型和应用,并探讨它们对经济学的影响。

博弈论概念博弈论是一种研究决策者之间相互作用的数学理论。

它分析决策者在不同的策略下所面临的可能结果,并通过定义不同的利益和支付函数来量化这些结果。

博弈论主要有两个基本要素:博弈参与者和博弈策略。

•博弈参与者:博弈参与者是做出决策的个体或组织。

在博弈论中,通常将参与者简化为两个角色:玩家1和玩家2。

•博弈策略:博弈策略是玩家可选择的行动或决策方式。

玩家根据对其他玩家的行动和可能结果的预测来选择自己的策略。

基本模型博弈论中的基本模型包括零和博弈、合作博弈和非合作博弈。

•零和博弈:零和博弈是指博弈参与者的利益完全相反,一方的收益就是另一方的损失。

在零和博弈中,参与者的利益函数之和为零,如赌博游戏中的输赢。

•合作博弈:合作博弈是指博弈参与者可以通过合作来获得更高的收益。

合作博弈研究如何达成合作协议以最大化整体利益,如合作生产中的收益分配。

•非合作博弈:非合作博弈是指博弈参与者不能通过合作来获得更高的收益,需通过自己的决策来最大化自身利益。

非合作博弈分析参与者之间的策略选择和可能结果,如拍卖中的出价决策。

应用博弈论在经济学中有广泛的应用。

它可以用于研究市场竞争、决策制定和资源分配等方面的问题。

以下是一些博弈论在不同领域的应用案例:1.拍卖:博弈论可以用于分析拍卖中的竞价策略,并推导出最优的出价策略。

2.价格竞争:博弈论可以研究企业在价格决策中的最佳策略,以实现最大化利润或市场份额。

3.协调与合作:博弈论可以分析参与者如何通过合作与协调来实现整体收益的最大化。

信息经济学概念信息经济学是研究信息在经济决策中的作用和影响的学科。

在现实世界中,人们面临信息不对称的情况,即不同的决策者拥有不同的信息水平。

信息经济学通过分析信息交流和不完全信息条件下的决策行为,研究人们如何利用信息来做出最优决策。

《博弈论与信息经济学》纳什均衡

举例
情侣博弈中,如果双方都预见到对方的策略,并选择相同的策略 ,形成完美纳什均衡。
04
信息经济学与纳什均衡
信息经济学的基本概念
信息经济学是一门研究信息不对称条件下市场交易行为的学科。 它探讨了信息不对称如何影响市场交易,以及如何通过制度安排 来减少信息不对称对市场交易的影响。
信息经济学主要关注信息获取、信息传递、信息披露和信息甄别 的成本和效益,以及这些因素如何影响市场交易和资源配置。
纳什均衡的未来研究方向
放宽假设条件
未来的研究可以尝试放宽纳什均衡的假设条 件,使其更接近现实情况,提高理论的适用 性。
探索混合策略
混合策略是纳什均衡中的一个重要概念,但目前对 其研究还不够深入,未来可以进一步探索混合策略 的性质和应用。
博弈论与其他学科的交叉 研究
可以尝试将博弈论与其他学科(如心理学、 社会学等)进行交叉研究,以更全面地理解 人类行为和市场现象。
信息经济学还涉及到公共品、外部性、垄断等其他市场失灵问题,旨在通过合理的制度安排来解决这些 问题,促进市场的有效运行和社会福利的最大化。
05
纳什均衡的实例分析
囚徒困境的纳什均衡
总结词
在囚徒困境中,两个囚犯都有坦白和抵赖两种选择,最终的纳什均衡是两个囚犯都选择 坦白,即(坦白,坦白)。
详细描述
在囚徒困境中,两个囚犯都有坦白和抵赖两种选择。如果一个囚犯选择抵赖,而另一个 选择坦白,那么选择抵赖的囚犯将会被判刑更长时间。然而,如果两个囚犯都选择抵赖 ,他们都将被判刑较短时间。但由于囚犯之间无法建立信任,最终的纳什均衡是两个囚
纳什均衡在经济学中的影响与贡献
01
丰富了经济学理论
纳什均衡为经济学提供了一种重 要的分析工具,丰富了经济学理 论体系。

博弈论讲义2 非合作博弈理论


开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 开发商A
开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
一 、博弈的基本概念及战略表述
博弈论的基本概念包括: ✓ 参与人:博弈论中选择行动以最大化自己效用的决策主体; ✓ 行动:参与人的决策变量 ✓ 战略:参与人选择行动的规则 ✓ 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和
一 、博弈的基本概念及战略表述
需求大的情况
开发商B 开发 不开发
开发商A
开发 4000,4000 不开发 0,8000
8000,0 0,0
需求小的情况 Βιβλιοθήκη 发商A开发商B 开发 不开发
开发 -3000,-3000 1000,0
不开发 0,1000
0,0
博弈的战略式表述
不完全信息动态博弈-精练贝叶斯纳什均衡 泽尔腾(1965)
一 、博弈的基本概念及战略表述
博弈的战略式表述:
战略式表述给出: 1、博弈的参与人集合:i , (1,2, , n); 2、每个参与人的战略空间:Si,i 1,2, , n; 3、每个参与人的支付函数:ui (s1, , si , , sn ),i 1,2, , n)
用G S1, ,Sn;u1, , un代表战略式表述博弈。
✓ 完美信息:指一个参与人对其他参与人(包括“自然”)的 行动选择有准确了解的情况,即每一个信息集只包含一个值。
✓ 完全信息:指自然不首先行动或自然的行动的初始行动所有 参与人观察到的情况。
✓ 共同知识:指“所有参与人知道所有参与人知道所有参与人 知道….”的知识。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、这一方法对博弈结果的预测经常是不准确的.
例2.2 石头、剪刀、布的支付矩阵
乙 甲
石头 剪刀
石头
0,0 -1,1
剪刀
1,-1 0,0

-1,1 1,-1
布 1,-1 -1,1 0,0
利用重复剔除严格劣策略无法求解
例2.6 利用重复剔除严格劣策略无法求解
乙 甲 上 中 下

0,4 4,0 3,5
策 略:政 济
府:救济,不救
不找工作
下岗工人:找工作,
工人 政府
救济
找工作 不找 3,2 -1,3
不救济 -1,1 0,0
求出性别大战博弈的混合策略纳什均衡

足球

足球 3,2
芭蕾 1,1
芭蕾 -1,-1 2,3
第五节 纳什均衡的存在性
定理1:(Nash, 1950)每个有限策略型博弈至 少存在一个纳什均衡(纯策略的或混合策略的)。
上下中 1,-1 3,-3 1,-1 1,-1 1,-1 -1,1
中上下 1,-1 -1,1 3,-3 1,-1 1,-1 1,-1
中下上 -1,1 1,-1 1,-1 3,-3 1,-1 1,-1
下上中 1,-1 1,-1 1,-1 -1,1 3,-3 1,-1
下中上 1,-1 1,-1 -1,1 1,-1 1,-1 3,-3
例2.4 性别大战(battle of the sexes)
局中人:男,女 策 略:男:看足球,看芭蕾 女:看足球,看芭蕾 支付矩阵:见下一页
性别大战的支付矩阵
女 男
足球
足球 3,2
芭蕾 1,1
芭蕾
-1,-1
2,3
第二节 重复剔除严格劣策略均衡
一、基本思想:
如果一个局中人在任何情况下从某种策略中得到的 支付均小于从另一种策略中得到的支付,那么显然对他而言, 前一种策略劣于后一种策略。
“不坦白”策略都是一种严格劣策略,从而可以剔 除。博弈中局中人各自从自身利益出发的理性选择(博 弈均衡解)就是(坦白,坦白)。
例2.1 囚徒困境的支付矩阵
乙 甲
坦白
坦白 不坦白 -6,-6 -1,-8
不坦白 -8,-1 -2,-2
甲:“不坦白”相对于“坦白”是严格劣策略
乙:“不坦白”相对于“坦白”是严格劣策略
第四节 混合策略纳什均衡
一、举例说明混合策略纳什均衡
例2.8 猜左右手游戏
乙 甲
(p) 放左手
(q) 猜左手
-1, 1
(1-p) 放右手
1, -1
(1-q) 猜右手
1, -1
-1, 1
混合策略与期望效用
在甲选 这种策略时, 他们的期望效用分别为:
,乙选
混合策略纳什均衡
甲和乙的目标是:
最优化的一阶条件是:
坦白 -6,-6 -1,-8
不坦白 -8,-1 -2,-2
例2.7 智猪博弈(boxed pigs)
局中人:大猪,小猪 策 略:大猪:按,等待
小猪:按,等待 支付矩阵:见下一页 纳什均衡:(按,等待)
例2.7 智猪博弈的支付矩阵
小猪 大猪

等待

等待
5,1 4,4 9,-1 0,0
小猪 大猪

博弈论与信息经济学
Game Theory and Information Economics
非合作博弈理论
章 贝叶斯博弈 第五章 动态贝叶斯博弈
第二章 策略型博弈
——同时行动,如何决 策
第一节 策略型博弈的表示
第二节 重复剔除严格劣策略均衡
第三节 纳什均衡
消费者对厂商1和2生产产品的需求量分别为:
;
Bertrand(1883)模型及求解 支付(利润)函数:
最优化的一阶条件是:
Bertrand(1883)模型及求解 反应函数:
纳什均衡价格:
五、纳什均衡与重复剔除严格劣策略均衡
在n个局中人的策略型博弈中, 1、如果重复剔除严格劣策略剔除掉除策略组合s以 外的所有策略,则这一策略组合s为该博弈的唯一的纳什均衡。 2、如果策略组合s是一个纳什均衡,那么它就不会 被重复剔除严格劣策略所剔除。 纳什均衡是比重复剔除严格劣策略更强的解概念。
二、纳什均衡的意义
它是关于博弈结局的一致性预测 如果所有局中人预测一个特定的纳什均衡
会出现,那么这种均衡就会出现。 只有纳什均衡才能使每个局中人均认可这
种结局,而且他们均知道其他局中人也认可这种结 局。
三、纳什均衡的定义
1、博弈的纳什均衡是这样一种最优策 略组合,是一种你好、我好大家都好的理性结局, 其中每一个局中人均不能也不想单方面改变自己的 策略而增加收益,每个局中人选择的策略是对其他 局中人所选策略的最佳反应。
称为契约曲线
——
总利润为:
比较及含义:
图1 反应曲线、纳什均衡与契约曲线
Q1
厂商2的反应曲线
商1的反应曲线
O
契约曲线
纳什均衡 厂
Q2
例2.10 两寡头价格竞争Bertrand(1883)模型
局中人:厂商1,厂商2 策 略:厂商1选择价格 ;厂商2选择价格 假 设: 两寡头固定成本都为0,边际成本为常数c,
不坦白 -8,-1 -2,-2
例2.2 石头、剪刀、布的支付矩阵
乙 甲
石头
石头 0,0
剪刀

1,-1 -1,1
剪刀 -1,1 0,0 1,-1

1,-1 -1,1 0,1
例2.3 田忌赛马的支付矩阵
田忌 齐王
上中下 上下中 中上下 中下上 下上中 下中上
上中下 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1
·




上 1,0 1,2
下 0,3 0,1
乙:“左”相对于“中”是严格劣策略
·




上 1,0 1,2
重复剔除严格劣策略均衡是(上,中 )
·




1,2
五、重复剔除严格劣策略有两个缺陷
1、每一步剔除需要局中人间相互了解的更进一步假定, 如果我们把这一过程应用到任意多步,需要假定“局中人 是理性的”是共同知识。
例2.1 囚徒困境及其策略型表示 (Tucker,1950)
1、局中人:甲,乙
2、策 略:
{坦白,不坦白}
3、支付函数——支付矩阵(双人有限博弈)
每个位置上第一个数字表示局中人1在对应的策略组 合中得到的支付,第二个数字表示局中人2的相应所获支付。
囚徒困境的支付矩阵
乙 甲
坦白
坦白 不坦白 -6,-6 -1,-8
放右手 1,-1 -1,1
四、纳什均衡的求法
2、连续性博弈纳什均衡的求法 首先求出每个局中人对其他局中人策略组
合的反应函数——即在其他局中人策略组合给定时 极大化自己的支付,得到的最佳反应策略表现为其 他局中人策略组合的函数;
然后将这些反应函数联立求解即得到博弈 的纳什均衡解。
例2.9 两寡头产量竞争Cournot(1838)模型
中右
4,0 5,3 0,4 5,3 3,5 6,6
六、注意
大多数的博弈局势中使用剔除严格劣策略的 方法能够对博弈局势进行简化,但可能得不 到博弈的均衡解。
需要引入非合作博弈理论中的核心概念
——纳什均衡 (Nash Equilibrium)。
第三节 纳什均衡
一、纳什均衡的思想 “双赢” 或 “多赢”
例2.1 囚徒困境的纳什均衡
用双划线法可以求出纳什均衡: (坦白,坦白),(-6,-6)
意义:揭示个人理性与集体理性之间的矛盾。

坦白 不坦白

坦白 -6,-6 -1,-8
不坦白 -8,-1 -2,-2
乙 甲
坦白 不坦白
坦白 -6,-6 -1,-8
不坦白 -8,-1 -2,-2
乙 甲
坦白 不坦白
混合策略纳什均衡
混合策略纳什均衡为:
二、混合策略纳什均衡
1、混合策略(mixed Strategy)
局中人 i 的一个混合策略

在其纯策略空间
是 i 选择策略
上的一个概率分布,其中
的概率。局中人 i的混合策略空间 合策略构成的集合。
是他的所有混
纯策略可以理解为混合策略的特例。如
2、期望效用函数
局中人:厂商1,厂商2 策 略:厂商1:选择产量
厂商2:选择产量 假 设:价格 支付函数 (利润函数) :
Cournot 模型求解
Cournot 模型求解
反应函数:
纳什均衡:
两寡头产量串谋模型
假设两寡头可以串谋,共同确定产量Q使总利润最大化,
利润函数为:(Q)=Q(a-Q-c)
总利润最大的产量为:
在混合策略组合 期望效用函数为:
其中
下,局中人 i的
3、混合策略纳什均衡
在策略型博弈 如果对于每个局中人 i,存在
中, ,都有

则称 均衡。
是博弈G的一个混合策略纳什
4、奇数定理
奇数定理 (Wilson 1971) :几乎所有的有限 博弈都有奇数个纳什均衡。
三、应用举例
例2.11 社会保障博弈 局中人:政府和下岗工人
注:集值映射和上半连续
1、集值映射:对于集合X上的任何一个点x,如果f(x)给 出唯一的一个点yY,则f(x)称为从X到Y的映射;如果f(x)给 出一个集合f(x)Y,则f(x)称为从X到Y的集值映射。
例2.8 猜左右手游戏
局中人:甲,乙
策 略:甲:放左手,放右手
右手
乙:猜左手,猜
相关文档
最新文档