博弈论讲义3(1) - 360文档中心

博弈论讲义完整版

第一章导论
注意两点： 1、是两个或两个以上参与者之间的对策论当鲁滨逊遇到了“星期五”

石匠的决策与拳击手的决策的区别
第一章导论
2、理性人假设理性人是指一个很好定义的偏好，在面临定的约束条件下最大化自己的偏好。博弈论说起来有些绕嘴，但理解起来很好理解，那就是每个对弈者在决定采取哪种行动时，不但要根据自身的利益的利益和目的行事，而且要考虑到他的决策行为对其他人可能的影响，通过选择最佳行动计划，来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡海萨尼（1967-1968）
你接受求爱博弈：品德优良者求爱求爱者求爱
100，100
不接受
-50，0 0，0
不求爱 0，0
100x+（-100）（1-x）=0 当x大于1/2时，接受求爱求爱博弈：品德恶劣者求爱求爱者接受求爱不求爱 0，0 你不接受
问题：什么叫“完全而不完美信息博弈”？
第二章完全信息静态博弈

一博弈的基本概念及战略表述二占优战略（上策）均衡

三重复剔除的占优均衡（严格下策反复消去法）
四划线法
五箭头法
六纳什均衡
完全信息静态博弈

完全信息：每个参与人对所有其他参与人的特征（包括战略空间、支付函数等）完全了解
同样的情形发生在：公共产品的供给美苏军备竞赛经济改革中小学生减负 ……
第一章导论-囚徒困境

囚徒困境的性质：
个人理性和集体理性的矛盾；个人的“最优策略”使整个“系统”处于不利的状态。

思考：为什么会造成囚徒困境是否由于“通讯”问题造成了囚徒困境？ “要害”是否在于“利己主义”即“个人理性”？

博弈论本科讲义

在中观经济研究中，劳动力经济学和金融理论都有关于企业要素投入品市场的博弈模型，即使在一个企业内部也存在博弈问题：工人之间会为同一个升迁机会勾心斗角，不同部门之间为争取公司的资金投入相互竞争；从宏观角度看，国际经济学中有关于国家间的相互竞争或相互串谋、选择关税或其他贸易政策的模型；至于产业组织理论更是大量应用博弈论的方法（见Jean Tirole的《产业组织理论》）。
如果n个参与人每人从自己的Si中选择一个策略 siategy profile),参与人i之外的其他参与人的策略组合可记为s-i=（ s1，s2，﹍，si-1 , si+1 ，﹍， sn）。
例如田忌的某个策略s田忌=上中下，或中下上，等等；S田忌={上中下，上下中，中上下，中下上，下上中，下中上}
贷市场的过高利息。此外，阿克尔洛夫还把信息不对称运用于解释各种社会问题，比如因为信息不对称，医疗保险市场上，老年人、个体劳动者的医疗保险利益得不到保障。
三、基本概念
1、参与人Players:一个博弈中的决策主体，他们各自的目的是通过选择行动（策略）以最大化自己的目标函数/效用水平/支付函数。他们可以是自然人或团体或法人，如企业、国家、地区、社团、欧盟、北约等。那些不作决策或虽做决策但不直接承担决策后果的被动主体不是参与人，而只能当做环境参数来处理。如指手划脚的看牌人、看棋人，企业的顾问等。对参与人的决策来说，最重要的是必须有
教材——P5 博弈论就是系统研究各种各样博弈中参与人的合理选择及其均衡的理论。
关于“经济博弈论”：
博弈论是研究人们在利益相互影响的格局中的策略选择问题、是研究多人决策问题的理论。而策略选择是人们经济行为的核心内容，此外，经济学和博弈论的研究模式是一样的：即强调个人理性，也就是在给定的约束条件下追求效用最大化。可见，经济学和博弈论具有内在的联系。在经济学和博弈论具有的这种天然联系的基础上产生了经济博弈论。

(最新经营)博弈理论知识讲义

第八章博弈论前面章节对经济人最优决策的讨论，是于简单环境下进行的，没有考虑经济人之间决策相互影响的问题。

本章讨论这个问题，建立复杂环境下的决策理论。

开展这种研究的的理论叫做博弈论，也称为对策论(GameTheory)。

最近十几年来，博弈论于经济学中得到了广泛应用，于揭示经济行为相互制约性质方面取得了重大进展。

大部分经济行为均可视作博弈的特殊情况，比如把经济系统看成是一种博弈，把竞争均衡看成是该博弈的古诺-纳什均衡。

博弈论的思想精髓与方法，已成为经济分析基础的必要组成部分。

第一节博弈事例博弈是一种日常现象，例如棋手下棋，双方均要根据对方的行动来决定自己的行动，双方的目的均是要战胜对方，互不相容，互相影响，互相制约。

一般来讲，博弈现象的特征表现为两个或两个之上具有利害冲突的当事人处于一种不相容的状态中，一方的行动取决于对方的行动，每个当事人的收益均取决于所有当事人的行动。

当所有当事人均拿定主意作出决策时，博弈的局势就暂时确定下来。

博弈论就是研究这种不相容现象的一种理论，且把当事人叫做局中人(player)。

博弈论推广了标准的一人决策理论。

于每个局中人的收益均依赖于其他局中人的选择的情况下，追求收益最大化的局中人应该如何采取行动？显然，为了确定出可行的策略，每个局中人均必须考虑其他局中人面临的问题。

下面来举例说明。

例1．便士匹配(MatchingPennies)(二人零和博弈)设博弈中有两个局中人甲和乙，每个局中人均有一块硬币，且且各自独立安排硬币是否正面朝上。

局中人的收益情况是这样的：如果两个局中人同时出示硬币正面或反面，那么甲赢得１元，乙输掉１元；如果一个局中人出示硬币正面，另一个局中人出示硬币反面，那么甲输掉１元，乙赢得１元。

对于这个博弈，正面朝上和反面朝上，即甲和乙的策略集合均是{正面，反面}。

当甲和乙均作出选择时，博弈的局势就确定了。

显然，该博弈的局势集合是{(正面,正面)，(正面,反面)，(反面,正面)，(反面,反面)}，即各种可能的局势的全体，也称为局势表，即表1。

博弈论第三讲

x1
x2
x4
x3
x5
x6
x7
an edge connecting nodes x1 and x5
x8
7
Game tree
A path is a sequence of distinct
nodes y1, y2, y3, ..., yn-1, yn such that yi and yi+1 are adjacent, for i=1, 2, ..., n-1. We say that this path is from y1 to yn. We can also use the sequence of edges induced by these nodes to denote the path.
13
Entry game
Challenger’s strategies
In Out Incumbent’s strategies Accommodate (if challenger plays In) Fight (if challenger plays In) Payoffs Normal-form representation
Dynamic Games of Complete Information
Entry game
An incumbent monopolist faces the possibility of entry by a
challenger. The challenger may choose to enter or stay out. If the challenger enters, the incumbent can choose either to accommodate or to fight. The payoffs are common knowledge.

博弈论算法讲义

博弈论算法一、博弈的战略式表述及纳什均衡的定义在博弈论里，一个博弈可以用两种不同的方式来表述：一种是战略式表述（strategic form representation ），另一种是扩展式表述（或译为“展开式表述”）（extensive form representation ）。

从分析的角度看，战略式表述更适合于静态博弈，而扩展式表述更适合于讨论动态博弈。

1.1博弈的战略式表述战略式表述又称为标准式表述（normal form representation ）。

在这种表述中，所参与人同时选择各自的战略，所有参与人选择的战略一起决定每个参与人的支付。

战略式表述给出：1.博弈的参与人集合：(),1,2,,i n ∈ΓΓ=。

2.每个参与人的战略空间：,1,2,,i S i n =。

3.每个参与人的支付函数：12(,,,),1,2,,i n u s s s i n =。

我们用()11,,;,,n n G S S u u =代表战略式表述博弈。

例如在两个寡头产量博弈里，企业是参与人，产量是战略空间，利润是支付;战略式表述博弈为：{}121122120, 0; (,), (,)G q q q q q q ππ=≥≥ (1.1)这里i q 、i π别表示第i 个企业的产量和利润。

1.2纳什均衡的定义有n 个参与人的战略式表述博弈()11,,;,,n n G S S u u =，战略组合{}1,,,,i n s s s s ****=是一个纳什均衡。

如果对于每一个i 、i s *是给定其他参与人选择{}111,,,,,i i i n s s s s s *****--+=的情况下第个参与人的最优战略，即(,)(,),,i i i i i i i i u s s u s s s S i***--≥∀∈∀ (1.2)或者用另一种表述方式，i s *是下述最大化问题的解:111argmax (,...,,,,...,),1,2,..., ;i i i i i n i i s u s s s s s i n s S *****-+∈=∈(1.3)我们用这个定义来检查一个特定的战略组合是否是一个纳什均衡。

博弈论讲义3-不完美信息静态博弈

随机变量ti在Ti的概率分布假定是已知的。
不完全信息博弈中，至少有一个参与者i有多个可能的类型，其他参与者虽然知道ti∈Ti，但都无法确知ti在 Ti中的具体取值。
如果只有虚拟参与人具有多个类型，则是不完全信息
如果有虚拟参与人以外的某些参与人有多个类型，则属于信息不对称。
版权所有余向华源自12信息问题与市场的建立
“柠檬”市场现象（Akerlof）：
由于信息问题引发逆向选择（劣币驱逐良币），
导致有效的市场可能建立不起来，或发展慢。
普遍存在于产品市场、劳动力市场（包括教师市场的问
题）、保险市场、信贷市场等上
“碟猫”市场现象：
本能不存在的市场，由于信息的不完全反给创
造出来了。比如赌石市场、彩票市场
第3篇不完全信息静态博弈
3.1 不完全信息静态博弈和贝叶斯纳什均衡
不完全信息博弈海萨尼转换不完全信息静态博弈的策略式表述和贝叶斯纳什均衡
3.2 贝叶斯纳什均衡与混合策略均衡的纯化 3.3 贝叶斯纳什均衡应用举例 3.4 非对称信息下的机制设计问题
版权所有
余向华
1
信息问题与现实生活
爱心困惑：面对一个个乞丐向你行乞，你会如何决定呢？佛心者：宁可被骗一千次，绝不放过一次帮助需要帮助者。人心者：宁可错过千次帮助需要帮助的人，绝不愿被骗一次？
不帮、或者收集信息再决定？
婚恋困惑：知人知面与知心问题食品安全中的信息问题信息与法律举证问题 …
版权所有
余向华
2
信息问题与市场运行
在信息不完美的情况下，博弈参与者的收益为期望收益：被求者
接受不接受
求爱博弈：
求爱 100，100
品德优良者求爱求爱者不求爱 0，0

《博弈论》精品讲义

指定n个局中人，以及他们各自的纯策略空间
Si,i1 ,2, ,n
和这些局中人各自的支付（盈利）函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为：
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明公正無私
7
➢长街上的超市（海滩占位模型）
＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然？
✓其它相似情形：旅行社的热门路线；黄金时间的电视节目；总统竞选。
博弈论20092009
正大光明公正無私
8
➢狩猎与投资狩猎：
两个猎人围住一头鹿，各卡住两个关口中的一个，齐心协力即可成功获得并平分猎物。此时有一群兔子跑过，任何一人去抓兔子必可成功，但鹿会跑掉。
博弈论20092009
正大光明公正無私
20
策略型表述：（两人有限博弈；Fra bibliotek阵形式）高需求情况
B
A
低需求情况？
博弈论20092009
正大光明公正無私
21
➢房地产博弈分析
假设：同时决策；市场需求双方已知
若市场需求大，双方开发，各得0.4万元。若市场需求小，依赖于对方行动。若市场不确定，依赖对市场的判断及对方行动。
博弈论20092009
正大光明公正無私
23
4.博弈练习
➢游戏一：心灵感应两个人一组，独立写出1至10之间的任
意5个数。如果不重复则得奖；否则受罚。获胜的秘诀是什么？
博弈论20092009

博弈论讲义

L(A)=2rc+1(1-r)(1-c) dL(A)/dr =3c-1=0 L(B)=rc+2(1-r)(1-c) dL(B)/dc =3r-2=0 r=2/3 c=1/3
A:(2/3,1/3),B:(1/3,2/3)是本博弈的混合策略纳什均衡
完全信息动态博弈
参与人先后行动每个参与人对每个参与人的得益具有完全信息博弈树参与人的行动顺序（when to move，谁在什么时候行动）参与人的信息集（what known，每次行动时参与人知道些什么）
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果A 选U,其期望收益为
1 L 0 (1 L ) L .
策略组合
策略组合：（s1，…，si，…，sn） ui＝ui（s1，…，si，…sn）一个参与人的支付不仅取决于自己的策略选择，而且取决于其他参与人的策略选择 Max ui＝ui（s1，…，si，…sn）
囚徒困境博弈的标准式表述
B
抵赖坦白
抵赖
－1，－1 0，－10
－10，0 －8，－8
ui ( s ,...,s ) 0 si
* 1 * n
囚徒困境的纳什均衡
(坦白,坦白)构成本博弈的纳什均衡
抵赖
B
坦白
抵赖
－1，－1 0，－10
－10，0 －8 －8
A

博弈论讲义3

你看过电影《美丽心灵》吗？（老梁说电影）
2015年1月28日星期三
博弈论与日常生活
1、纳什：天才还是疯子？

纳什（John Forbes Nash ）其人：
1928年出生于美国弗吉尼亚州，1948年同时被4所大学录取，包括普林斯顿、哈佛，最终纳什选择了普林斯顿。1950年，发表博士论文《非合作博弈》，同年又发表《n人博弈中的均衡》。 1957年，与艾丽西亚结婚，不幸的是，第二年，被送进精神病院。
甲
表白
乙
表白
不表白
（10，10）（10，10）
不表白
（10，10）（0，0）
2015年1月28日星期三
博弈论与日常生活
【案例二】
一对夫妻在屋子里休息，邻居敲门来借锤子，不情愿地借给了他。

第二天来借锯，丈夫说，我们下午正要用，邻居问，你们两个都要去吗？答，是的。那太好了，你们去剪树枝，肯定不打球了，把高尔夫球杆借我一用？

2015年1月28日星期三
博弈论与日常生活
4、纳什均衡

纳什均衡定义：假设有n个局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己效用最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。
博弈论与日常生活
占优均衡

以囚徒1为例，无论囚徒2采取什么策略…
囚徒2
坦
囚徒 1
白
不坦白 (0, -10) (-1, -1)

博弈论概要1-3完全版III

交通大学博弈论课程概要 (III)周林第四部分：不完全信息扩展式博弈1. 一般扩展式博弈的定义(F-T 3.3.1)一个一般扩展式博弈由(有向)博弈树表示。

博弈树由点和联结点的枝组成。

前点和后点。

起点无前点，终点无后点。

除起点外，每点有唯一的直接前访点。

除终点外的点代表决策点，每点x 只属于一个博弈者i (x )，从这点出发的枝代表i (x )在x 处的行动集A (x ) 。

博弈者i (x )在x 处拥有的信息由信息集h (x )表示。

h (x )包括了所有i (x )不能同x 区分开来的点。

对所有的h (x )中的点x ’，A (x ’) = A (x ) 。

因此我们可以将行动集记为A (h ) 。

对一个不完全信息的扩展式博弈来说，起点代表“自然”，从自然出发的枝代表外生随机事件，概率分布是给定的，不受博弈者选择的影响。

每一终点处给出所有博弈者的收益。

(当博弈进行无穷阶段时，所有博弈者的收益由博弈的历史决定。

)2. 一般扩展式博弈的策略式博弈表示(F-T3.4)每一个博弈者的一个策略罗列了他在他的每一信息集上的行动，是一个从信息集到行动的映射)()(,:i i i i h A h s A H s ∈→。

如果每一博弈者都选取一个特定的策略，我们可以用它们确定行动的历史，从而求出每人的收益。

这样我们就得到了一般扩展式博弈的策略式博弈表示。

3. 混合策略和行为策略。

混合策略在整个博弈尚未开始以前混合，行为策略在博弈开始后每一决策点处混合。

对具有完美记忆的博弈，混合策略和行为策略是等价的（Kuhn 定理）。

(F-T 3.4)4. 一般扩展式博弈的求解。

Nash 均衡和Nash 均衡的精细：逆向归纳法和子博弈完美。

(F-T 3.5)5. 重要例子：行动可观察无限重复博弈与无名氏定理：只要博弈者足够耐心，任何一个满足个人理性的可行的收益分配可以由一个无限重复博弈的Nash 均衡（或子博弈完美Nash 均衡）实现。