第五章博弈论初步

合集下载

博弈论初步

相同点
博弈论与经济学思想比较
1、利益最大化原则
2、均衡原则
不同点
1、人与人之间的关系：个体理性与集体非理性、设计协调机制、激励相容机制
2、信息不完全：委托-代理理论、信号传递机制、信息筛选模型
2、发展历程
博弈论可以分为合作博弈（cooperative game）和非合作博弈（non-cooperative game ）。
在一个博弈中，如果每个参与人都有一个占优策略，且每个参与人都采取占优策略，那么由所有参与人的（占优）策略组合所构成的均衡就是占优策略均衡。
1、完全信息静态博弈
纳什均衡:纳什均衡是一种策略组合，使得每个参与人的策略是对其他参与人策略的最优反应。
在一个纳什均衡里，如果其他参与人不改变策略，任何一个参与人都不会改变自己的策略。也就是说，此时对于任何一个参与人，如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。
纳什（Nash，1950）提出了“纳什均衡”概念，要求每个参与人的策略都是针对他所预言的对手策略的支付最大化反应，认为每个决策人的预言都是正确的，这正是古诺和波特兰研究的特定模型均衡的一个自然推广，是大多数经济分析的起点。
2、发展历程
纳什（Nash，1950）、夏普里（Shapley,1953）分别提出“讨价还价”模型；泽尔腾（Selten，1965）证明了参与人选择相机抉择计划的博弈中不是所有的纳什均衡都是合理的，一些均衡取决于参与人 “空洞威胁”的能力，并引入了“子博弈精炼纳什均衡的概念”排出依赖此类威胁的均衡；海萨尼（Harsanyi）提出一种使用标准博弈论技术来模型化不完全信息情形的方法，在标准的技术中假设所有参与人都知道的他人收益函数；克瑞普斯（Kreps）和威尔逊（Wilson）在 1982年合作发表了关于序贯均衡的博弈论文章。

博弈论入门(课堂PPT)

共同价值和赢者的诅咒
• 两家代理：1个积极估价，1个消极估价
prob(v/s)11//22
vs2 vs2
• v均匀分布
• 出价b=?（一家和两家出价时有不同吗）
• 考察b=s-1这样一个对称策略
• 德士古公司的例子
15
几种常见的拍卖形式
• 英式公开叫价拍卖 • 荷式公开叫价拍卖 • 一价密封拍卖 • 二价密封拍卖
• 通过改革，陪审团制度在美国得到了比英国更好的发展。
22
投票程序
23
• 每个陪审员在陪审之前已经有一个大体的判断
• 他们的类型 • 非专业性——从众行为
– 如果评判有罪的人数多于无罪，则投有罪 – 如果评判无罪的人数多于有罪，则投无罪 – 如果双方人数相等，则依照自己的评判结果
投票
24
• 陪1：假设投有罪 • 陪2：若评判有罪，则投有罪；若评判无
• 在被问及对最终的价格是否感到意外时，Frija抛下一个“不”字，随即离开了
11
简化的暗标拍卖
密封递交标书统一时间公正开标标价最高者以所报标价中标中标博弈方的得益不仅取决于标价，还取决于他对拍
卖标的物的带有很大主观性的估计每个博弈方的估价通常是自己的私人信息
12
0.6
0.4
• 考虑这样一个对称策略：给定其他两个委员采取相同策略，以及对于其他成员拥有哪个政策更好的知识的信念，不论这个参与者什么类型，采取这个策略都使他收益最大。
19
• 自然决定四项：哪个政策更好，以及三个委员的类型。
• 当一个委员了解新政策时：投票给自己认为更好的策略是一个弱占优策略。
– 当另外两位投票相同时 – 当另外两位投票分歧时

《博弈论入门》

实用文档
黑暗中的舞者
1. 慕尼黑协定 2. 贝叶斯均衡：三步转换 3. 当所有人都拥有私人信息时 4. 委员会和陪审团的投票 5. 信号传递 6. 说谎及说谎者的信息
实用文档
1. 慕尼黑协定
实用文档
实用文档
实用文档
60%
40%
实用文档
2. 贝叶斯均衡：三步转换
1. 在一个不完全信息博弈中，这个参与者是谁？
二手车市场Vs相亲大会
分手or悔婚
法律保障？钻石戒指？甜言蜜语？
实用文档
5.3 信号传递的实例
三类商品：
搜索产品体验商品信任商品
如何广告才能分离优劣？
实用文档
资本市场
Ross(1977)：在一定条件下，企业的负债水平越高，企业的盈利能力越强。
不同企业的破产可能
好企业
若估价50，出价40最优吗？出价60时的期望收益：
0.6*(100-60)+0.4*0.5*(10060)=32 若估价100，出价60最优吗？
40: 0.6*0.5*(100-40)+0.4*0=18 50: 0.6*(100-50)+0.4*0=30 70: 0.6*(100-70实)用+文0档.4隐*(藏1你00的-7出0)价=30
参与者所拥有的私人信息成为参与者的类型所有类型的集合成为类型空间不同类型对应不同的收益
2. 确定每个参与者的类型，引入“自然” 3. 定义策略集。策略和自然，哪个先？
实用文档
狂野西部枪战
1875年某个非同寻常的一天，警长马歇尔﹒怀特﹒厄普去维持秩序，突然一个陌生人拉住他的手，好像要开枪……
实用文档
若委员不知道哪个政策更好 …… （投票，弃权？）

博弈论初步(简介)

第八节第八节博弈论初步博弈论初步（（简介简介））*一、博弈论的基本概念博弈论的基本概念（一）什么是博弈论？博弈论（game theory），又译为对策论，就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

实际上，博弈是一种日常现象。

在经济学中，博弈论是研究当某一经济主体的决策受到其他经济主体决策的影响，同时，该经济主体的相应决策又反过来影响其他经济主体选择时的决策问题和均衡问题。

（二）博弈论的基本概念博弈论的基本概念包括：参与人、行为、信息、策略、收益、结果、均衡。

参与人（player），又称局中人，是指博弈中选择行动以自身利益最大化的决策主体（可以是个人，也可以是团体，如厂商、政府、国家）。

行为(action)是指参与人的决策变量，如消费者效用最大化决策中的各种商品的购买量；厂商利润最大化决策中的产量、价格等。

策略(strategies)又称战略，是指参与人选择其行为的规制，也就是指参与人应该在什么条件下选择什么样的行动，以保证自身利益最大化。

信息(information)是指参与人在博弈过程中的知识，特别是有关其他参与人（对手）的特征和行动的知识。

即该参与人所掌握的其他参与人的、对其决策有影响的所有知识。

收益(payoff)又称支付，是指参与人从博弈中获得的利益水平，它是所有参与人策略或行为的函数，是每个参与人真正关心的东西，如消费者最终所获得的效用、厂商最终所获得的利润。

结果（outcome）是指博弈分析者感兴趣的要素集合。

均衡(equilibrium)是指所有参与人的最优策略或行动的组合。

这里的“均衡”是特指博弈中的均衡，一般称之谓“纳什均衡（Nash equilibrium）”。

二、博弈论的产生与发展博弈论的产生与发展对具有博弈性质的决策问题的研究可以追溯到１８世纪甚至更早。

但一般认为，１９４４年冯·诺依曼（Von neumann）和摩根斯坦恩（Morgenstern）合作出版的《博弈论和经济行为》（The Theory of Games and Economic Behaviour）一书，标志着系统的博弈理论的形成。

《博弈论初步》课件

THANKS
感谢观看
02
纳什均衡是一种非合作博弈均衡，其中每个参与者都认为当前策略是最好的，不会受到其他参与者的欺骗或影响。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的策略，逐步逼近纳什均衡。这种方法适用于较简单的博弈模型，但对于复杂的博弈模型可能收敛速度较慢。
线性规划法
将纳什均衡问题转化为线性规划问题，通过求解线性规划来找到纳什均衡。这种方法适用于具有线性特征的博弈模型，但计算复杂度较高。
价格战与非价格战
博弈论分析了价格战和非价格战的利弊，为企业制定营销策略提供博弈论可以用来分析选民的投票行为和政治立场，预测选举结果。
02
候选人策略
博弈论为候选人提供了制定最优竞选策略的方法，帮助他们在选举中获
胜。
03
政治联盟与利益交换
博弈论中的合作博弈理论可以用来分析政治联盟的形成和利益交换机制
特征值法
利用特征值和特征向量的性质来求解纳什均衡。这种方法适用于具有矩阵特征的博弈模型，但需要一定的数学基础。
纳什均衡的应用实例
1 2
价格竞争
在寡头市场中，企业之间通过价格策略进行竞争，最终形成价格均衡，即纳什均衡。
劳资谈判
劳资双方在谈判中会提出自己的工资要求，最终达成工资协议，这也是一种纳什均衡。
博弈类型
合作博弈
定义
01
参与者通过合作达成共赢的博弈。
特点
02
存在合作协议，强调集体行动和收益分配。
应用场景
03
国际关系、商业合作、团队协作等。
非合作博弈
定义
应用场景
参与者追求各自利益最大化的博弈。
市场竞争、个人决策、资源分配等。

第五讲.博弈论

定义：博弈就是一些个人、队组或其他组织，面对一定的环定义境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions) 博弈的次序(Order) 博弈方的得益(Payoffs)
二、50年代中后期一直到70年代博弈论发展的青年期 1954-1955年提出了“微分博弈”（Differential games）的概念。奥曼则在1959年提出了“强均衡”（Strong equilibrium）的概念。 “重复博弈”（Repeated games）也是在50年代末开始研 Repeated games 50 究的，这自然引出了关于重复博弈的“民间定理”（Folk Folk theorem）。 1960年（Thomas C. Schelling）引进了“焦点”（Focal point）的概念。博弈论在进化生物学（Evolutionary Biology）中的公开应用也是在60年代初出现的。
一、基本模型
囚徒 2 坦白囚坦白徒 1 不坦白囚徒1：坦白囚徒2：坦白 -5， -5 不坦白 0， -8
-8， 0
-1， -1
两个罪犯的得益矩阵
二、双寡头削价竞争
寡头2 寡头高价寡头 1 高价低价 100，100 150，20 低价 20，105 70，70
双寡头的得益矩阵政府组织协调的必要性和重要性
重复博弈：同一个博弈反复进行所构成的博弈，重复博弈提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题有限次重复博弈无限次重复博弈
1.3.5 博弈的信息结构

五讲博弈论基础共72页

第一节博弈论导论
博弈的四要素： 1.博奕的参加者，即博奕方或参与人。
2.各博奕方可选择的全部策略或行为的集合。
3.进行博奕的次序。
4.博奕方的得益。例：囚徒困境
囚徒A
坦白抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为：A、B都选择坦白，各判8年刑
第一节博弈论导论
比如说：夜间唱歌
科斯定理图示
农场主的边际净损失
牧羊的边际利润
S
P
O
社会最优量
牧养人放牧的数量
说明
如果产权归农场主，农场主可以禁止放牧（点0），小于社会最优量S；但此时，增加放牧给牧羊人带来的边际利润大于给农场主造成的损失，牧羊人将有积极性贿赂农场主，直到放牧量达到S为止；
如果产权归牧羊人，牧羊人的利润最大点是P，大于社会最优量S；但此时，减少放牧量对牧羊人的边际利润损失小于给农场主节约的边际成本，所以，农场主将有积极性贿赂牧羊人，直到S；
博奕论前提假设：博弈的参与者都是理性人所谓理性人是指有一个很好定义的偏好，在面临给定的约束下最大化自己的偏好。理性人可能是利己主义者，也可能是利它主义者。
第一节博弈论导论
例：囚徒困境
囚徒A
坦白抵赖
囚徒B
坦白
-8,-8 -10,0
抵赖
0,-10 -1,-1
均衡结果为：A、B都选择坦白，各判8年刑
革命通常不是一个帕累托改进。
外部性与科斯定理
个人收益与社会收益：一项活动的社会收益等于决策者个人得到的收益加社会其他成员得到的收益，如养花；
个人成本与社会成本：社会成本等于决策者的个人承担的成本加社会其他成员承担的成本，如环境污染，交通堵塞；

博弈论初步

1996莫里斯（James A.Mirrlees）和维克瑞（William Vickrey）
这两位经济学家的贡献集中于运用博弈论对现实经济问题的解释。
企业、政府与商业环境
博弈论与竞争策略
博弈论导论—博弈论和诺贝尔经济学奖
• 2001：阿克洛夫（Akerlof）、斯宾塞（Spence）、斯蒂格利茨（Stiglitz）这三位作为不对称信息市场理论的奠基人被授予诺贝尔经济学奖，以表彰他们分别在柠檬品市场等不对称信息理论研究领域做出的基础性贡献。这些贡献发展了博弈论的方法体系，拓宽了其经济解释范围。 2002：弗农史密斯（Smith）贡献主要在于通过实验室实验来测试根据经济学理论而做出预测的未知或不确定性。是对以博弈论为基础构建的理论模型进行实证证伪工作的一大创举。 2005：奥曼（Aumann）、谢林（Schelling）他们通过博弈理论分析增加了世人对合作与冲突的理解。其理论模型应用在解释社会中不同性质的冲突、贸易纠纷、价格之争以及寻求长期合作的模式等经济学和其他社会科学领域。
乙甲石头剪刀布
石头 0，0 -1，1 1，-1
剪刀 1，-1 0，0 -1，1
布 -1，1 1，-1 0，0 ○ 完整博弈过程包括哪些要素？博弈如何分类？
→ 博弈过程的要素主要有：参与人、行动空间或策略空间、行动次序和博弈收益等。
→ 按收益可分为零和博弈和非零和博弈；按行动先后可分为静态博弈和动态（序贯）博弈；按参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。
了可置信的契约。
乙
甲拨打
等待
拨打
等待
乙
甲坦白
抵赖
坦白
抵赖

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Stackelberg寡头竞争模型
• 逆向归纳法求解
– 然后倒推到企业1，企业1是理性的，预测到企业2 将根据一阶条件选择产量，则企业1面临的问题为
max 1 ( q1 , s2 ( q1 )) q1 ( a q1 s( q1 ) c )
q1 0
由一阶条件可得
q1* 1 (a c) 2
Stackelberg寡头竞争模型
• 分析（逆向归纳法求解）
价格函数：P(Q ) a q1 q2 其中，q1 [0, )，为企业的产量， 1 q2 [0, )，为企业2的产量
支付（利润）函数为
i qi ( P(Q) c), i 1,2
Stackelberg寡头竞争模型
5.1博弈论概述——博弈论例子
• 囚徒困境
囚徒乙
坦白抵赖 0，-10 -1，-1
囚徒甲
坦白 -8，-8 抵赖 -10，0
囚徒困境反应了一个很深刻的问题，那就是个人理性集体理性的矛盾，它在经济学上有广泛的应用
5.1博弈论概述——博弈论例子
• 性别战
丈夫芭蕾妻子芭蕾 2，1 足球 0，0 足球 0，0 1，2
• 先动优势
1 * 纳什均衡q1* q2 ( a c ); 纳什均衡利润 3 1 * * 1 ( q1* , q2 ) 2 ( q1* , q2 ) ( a c ) 2 9
5.5不完全信息静态博弈
• 表达式： G={ A1，A2，…， An ； T1，T2，…， Tn ； P1， P2，…， Pn ； U1（· U2（· …， Un（· } ），），）， • 贝叶斯纳什均衡定义：
• 3.对k=1
L （2，0）
R （1，1）
• 参与者1，选L • 由此得出精炼的NE为（（L，L’’）,L’）
子博弈精炼纳什均衡例题
A 不仿仿
（0，10）打
（-2，5）
B
不打 A 不仿打仿 B 不打（10，4）
（5，5）
（2，2）
子博弈精炼纳什均衡例题
A 不仿仿子博弈精炼纳什均衡解为：（（不仿，仿），（打，不打））不打 A 不仿打仿 B 不打（10，4）
• 博弈的分类
行为顺序信息完全信息不完全信息静态完全信息静态博弈纳什均衡不完全信息静态博弈贝叶斯纳什均衡动态完全信息动态博弈子博弈精炼纳什均衡不完全信息动态博弈精炼贝叶斯纳什均衡
5.2完全信息静态博弈
• 纳什均衡的定义：
在一个n个参与者标准博弈G={ S1，S2，…， Sn ； U1（· U2（· …， Un（· }中，如果战），），），略组合（S1＊，S2＊，…， Sn＊）满足：对每个参与者i， Si＊是它针对其他参与者所选的战略S-i＊的最优反应战略。即Ui（si ＊，s-i ＊）≥ Ui（si ，s-i ＊）
社会福利博弈
•
政府
救济 w
流浪汉
找工作 r 游荡 1-r
3，2 不救济1-w -1，1
-1，3 0，0
政府以w的概率选择救济，以1-w的概率选择不救济；流浪汉以r的概率选择找工作，以1-r的概率选择游荡。
政府的期望收益为：[3r+(-1)(1-r)w+0(1-r)](1-w) 政府的最优战略为： 1 r>0.2 w= 0 r<0.2 0到1上的任何值 r=0.2 流浪汉的期望收益：[2w+(1-w)]r+[3w+0(1-w)](1-r) 流浪汉的最优战略为： 1 w<0.5 r= 0 w>0.5 0到1上的任何值 w=0.5
π2 （q1 ＊，q2 ＊） ≥ π2 （q1 ＊，q2 ）
q2 =（a-c）/3
5.3混合策略
• 混合策略的定义：在n个人参与的博弈G={ S1， S2，…， Sn ； U1（· U2（· …， Un（· }中,博弈），），），方i的纯策略空间记为Si={si1，si2 ， …， sin },则博弈方i的纯策略概率分布Pi ={pi1，pi2 ， …， pin }，称为一个混合策略。 • 混合策略组合及其期望支付：用（ p1，p2 ， …， pn ）表示混合策略组合；用σi （ p1，p2 ， …， pn ）表示参与者I的期望支付值； σi （ p1，p2 ， …， pn ） = p(s)ui (s)
• 逆向归纳法求解
– 从企业2开始分析，假定企业1已经选择了产量q1，则企业2选择时要以最大化自己的例如为目标，即，面临如下问题：
max 2 ( q1 , q2 ) q2 ( a q1 q2 c )
q2 0
由一阶条件可得
s2 ( q1 ) 1 ( a q1 c ) 2
5.2完全信息静态博弈——古诺模型
古诺寡头竞争模型是纳什均衡最早的版本，它是法国经济学家古诺1838年提出的。这一模型的基本结构是各企业生产同一产品，并都以产量为决策变量。假定所有厂商都是同时行动的，即他在选择自己的产量时并不知道其他厂商的选择。市场需求为P=a－Q
古诺模型
• 参与者：{企业1，企业2} • 策略集：A1：{q1|q1≥0} A2：{q2|q2≥0} • 支付函数：利润 π1 （q1 ，q2）= q1 [a－（ q1 +q2 ）]－c q1 π2 （q1 ，q2）= q2 [a－（ q1 +q2 ）]－c q2 • 求解：满足如下一阶条件 π1 （q1 ＊，q2 ＊） ≥ π1 （q1 ，q2 ＊） q1 =（a-c）/3
5.4完全信息动态博弈
• 定义：参与人行动有先后顺序，且后行方在自己行动之前能观察到先行方的行动。 • 博弈的扩展式 1.参与者集合 2.参与者行动的顺序 3.参与者行动集 4.参与者的信息集 5.参与者的支付函数
5.4完全信息动态博弈
• 博弈树
节点行动枝
信息集
（，）
（，）（，）
（，）
子博弈、子博弈精炼的纳什均衡
2 R’ 1 L’’ （3，0） R’’ （0，2）
（1，1）
反向递推算法的应用实例
• 解：用反向递推法 • 1.对k=3
L’’ （3，0） R’’ （0，2）
• 参与者1，选L’’
反向递推算法的应用实例
• 2.对k=2
L’ （1，1）
R’ （3，0）
• 参与者2，选L’
反向递推算法的应用实例
Stackelberg寡头竞争模型
• 描述的问题
– 垄断企业产量选择 – 参与人：企业1和企业2 – 行动顺序：企业1先行动，称为领头企业；企业2观测到企业1的选择，然后选择自己的产量，称为尾随企业 – 企业2的产量是企业1产量的函数 – 价格是总产量的函数 – 两个企业有相同的不变单位成本c
a i Ai , t i Ti
5.5不完全信息静态博弈——市场进入实例
一个行业有两个相关企业，一个是垄断者（局中人1），一个是潜在进入者，两者的决策局面如下：
局中人1
进入 0，-1
不进入 2，0
3，0
局中人2
决策论与对策论的联系与区别
• 单人与多人，多人中无相互影响的不是对策 • 集中与分散的决策模式，如计划经济就是集中的决策模式
博弈的构成要素：
1、参与人：做决策的个体 2、行动：所能做的某一选择，是参与人的决策变量 3、信息：参与人的特征，特别是有关其他参与人的特征和行动的知识 4、策略：参与人选择行动的规则 5、支付：参与人从博弈中获得的效用水平，是行动的函数 6、结果：博弈分析者感兴趣的要素的集合 7、均衡：所有参与人的最优战略或行动的组合
5.3混合策略——求解方法
• 最优反应函数法
• 等支付方法
5.3混合策略——应用实例
• 求解参与者甲与乙的混合策略纳什均衡解
乙 C 甲 A B 2，3 3，1 D 5，2 1，5
5.3混合策略——应用实例
• 参与者甲的混合策略记为（a,1-a） • 参与者乙的混合策略记为（b,1-b） • 对甲来说，取纯策略A的期望支付为：2b+5(1-b);取纯策略B的期望支付为：3b+(1-b) 等支付原则表示为：2b+5(1-b)=3b+(1-b) 可以解得：b=0.8 • 对乙来说，取纯策略C的期望支付为：3a+(1-a);取纯策略D的期望支付为：2a+5(1-a) 等支付原则表示为：3a+(1-a)=2a+5(1-a) 可以解得：a=0.8 因此，这个博弈的混合策略纳什均衡是：甲的混合策略为（0.8，0.2），乙的混合策略为（0.8，0.2）
• 纳什均衡解意义：
它是博弈结果的一致预测，这种结果具有内在的稳定性和可自动实施性。
求解纳什均衡——划线法
• 例：两人有限策略的博弈参与人：{甲，乙} 参与人的策略集：S甲={U，N，D} S乙={L，C，R}
乙 L U 甲 L M C R0，44ຫໍສະໝຸດ 05，34，0 3，5
0，4 3，5
5，3 6，6 ＊
在静态贝叶斯博弈G={ A1，A2，…， An ； T1， T2，…， Tn ； P1，P2，…， Pn ； U1（· U2（· …，），）， Un（· }中，战略组合（S1＊，S2＊，…， Sn＊）是一），个纯战略贝叶斯纳什均衡解，如果对每一个参与者i及 i的类型集Ti中的每一个类型tt，它满足：| ti ) MAX Ui (ai , a -i ( i -i )) P( t -i
• 子博弈定义：一个扩展式博弈的子博弈G是由一个决策结（X）和所有的该决策结的后续决策结（T （X））组成，它满足如下条件： 1. x是单结的信息集。 2. 后续结点的所有信息集上的结点都属于后续结集合。 • 子博弈精炼的纳什均衡的求法：反向递推算法

第五章博弈论初步

博弈论初步

博弈论入门(课堂PPT)

《博弈论入门》

博弈论初步(简介)

《博弈论初步》课件

第五讲.博弈论

五讲博弈论基础 共72页

博弈论初步

五讲博弈论基础共72页