《博弈论基础》
博弈论基础PPT精品课程课件全册课件汇总

自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束?
我们必须知道参与人关心什么,才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。
在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
支付(payoff),或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈,两个厂商通过选择高价或者低价进行 竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个 参与人的博弈中,i=1,2,…,n。 在某些博弈中,一个参与人可以在无限多个行动中进行选择。
博弈论基础吉本斯课后答案

博弈论基础吉本斯课后答案
一、原题
1. 什么是博弈论?
答:博弈论是一门研究决策者之间的竞争性行为的学科,它研究的是如何在竞争性环境中获得最佳结果。
它涉及到决策者之间的博弈,以及如何利用策略来获得最佳结果。
2. 什么是吉本斯博弈论?
答:吉本斯博弈论是一种研究两个或多个决策者之间的博弈的学科,它研究的是如何在竞争性环境中获得最佳结果。
它是由美国经济学家约翰·吉本斯在20世纪50年代提出的,他提出了一种新的方法来研究博弈,即使用数学模型来分析博弈的结果。
3. 吉本斯博弈论的基本概念是什么?
答:吉本斯博弈论的基本概念是博弈矩阵,它是一个表格,用来描述两个或多个决策者之间的博弈。
它由行和列组成,每一行代表一个决策者,每一列代表另一个决策者,每个单元格中的数字代表每个决策者在每种可能的结果下的收益。
4. 吉本斯博弈论中的均衡点是什么?
答:吉本斯博弈论中的均衡点是指当两个或多个决策者之间的博弈结果达到一种平衡时,每个决策者都不会有更多的收益。
这种平衡可以是一个纳什均衡,也可以是一个非纳什均衡,具体取决于博弈的结构。
博弈论基础

博弈论基础第一节博弈问题概述一、博弈的基本概念博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。
参与人是指博弈中选择行动以最大化自身利益(效用、利润等)的决策主体(如个人、厂商、国家)。
行动是指参与人的决策变量。
战略是指参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。
例如,“人不犯我、我不犯人;人若犯我、我必犯人”是一种战略。
这里,“犯”与“不犯”是两种不同的行动。
战略规定了什么时候选择“犯”,什么时候选择“不犯”。
信息是指参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识。
支付函数是参与人从博弈中获得的效用水平,它是所有参与人战略或行动的函数,是每个参与人真正关心的东西。
结果是指博弈者感兴趣的要素的集合。
均衡是所有参与人的最优战略或行动的组合。
上述概念中,参与人、行动、结果统称为博弈规则。
博弈分析的目的是使用博弈规则决定均衡。
二、博弈的分类根据博弈者选择的战略,可以将博弈分成合作博弈(cooperative games)与非合作博弈(non-cooperative games).合作博弈与非合作博弈之间的区别,主要在于博弈的当事人之间能否达成一个有约束力的协议。
如果有,就是合作博弈;反之,就是非合作博弈。
根据参与人行动的先后顺序,可以将博弈分成静态博弈(static game)与动态博弈(dynamic game)。
静态博弈是指,博弈中参与人同时选择行动;或者虽非同时行动,但行动在后者并不知道行动在先者采取了什么具体行动。
动态博弈是指参与人的行动有先后顺序,而且行动在后者可以观察到行动在先者的选择,并据此作出相应的选择。
根据参与人对其他参与人的了解程度,可以将博弈分成完全信息博弈(games of complete information)和不完全信息博弈(games of incomplete information)。
完全信息博弈是指:在每个参与人对所有其他参与人(对手)的特征、战略和支付函数都有精确了解的情况下,所进行的博弈。
博弈论基础

其他参与人选择什么策略,某参与人的 最优策略是唯一的,这样的唯一的最优 战略被称为“占优策略”; � “博弈均衡”指博弈中的所有参与人都不想 改变自己的策略的这样一种状态。
(一)占优策略均衡
� 在一个博弈中,如果每个参与人都有一
个占优策略,且每个参与人都采取占优 策略,那么由所有参与人的(占优)策 略组合所构成的均衡就是占优策略均衡。 � 占优策略均衡的求解: 常用方法——划线法
“囚犯的困境”博弈中的“报酬矩阵” (Payoff Matris)
嫌犯B 坦白 不坦白 坦白 -10,-10 0,20 嫌犯A 不坦白 -20,0 -1,-1
三、占优策略均衡和纳什均衡
� (一)占优策略均衡 � (二)纳什均衡 � (三)占优策略均衡和纳什均衡比较
(一)占优策略均衡
� 占优策略(Dominant Strategies):不论
二、博弈的基本概念
� 1、参与人(players):一个博弈中独立决策、
独立承担结果的主体。 � 2、行动(actions or moves):参与人在博弈 的某个时点的决策变量。 � 3、策略(strategies):参与人在给定信息 集的情况下的行动规则 � 4、得益(pay off)(或支付、报酬):指在 一个特定的策略组合下参与人得到的确定效用 水平,或者是指参与人得到的期望效用水平。
(二)纳什均衡
� 在一个纳什均衡里,如果其他参与人不
改变策略,任何一个参与人都不会改变 自己的策略。
(二)纳什均衡
例:斗鸡博弈 B 进 A 退 0, 2 0,0 进 -3,-3 退 2,0
(三)占优策略均衡与纳什均衡比较
� 占优策略均衡要求任何一个参与人对于
其他参与人的任何策略选择来说,其最 优的策略都是唯一的。 � 纳什均衡只要求任何一个参与人在其他 参与人的策略选择给定的条件下,其选 择的策略是最优的。 � 占优策略均衡一定是纳什均衡,但纳什 均衡不一定就是占优策略均衡。
《博弈论基础》

2、博弈规则(续)
( 3) 行 动 的 先 后 顺 序 ● 静 态 ( S tatic 同 时 ) ● 动 态 ( D y nam ic 先 后 ) ( 4) 信 息 结 构 : 参 与 人 在 行 动 时 知 道 了 什 么 (5)战略(Strategy) S = ( s 1, s 2, … , s k) = ( s k, s -k)
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) ;s*2=(C,C)}为 NE 战略 ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
<The Theory of Games & Economic Behavior> ●John Harsanyi & John Nash & Reinhard Selten
01-3-2 1
3、应用阶段
(1)宏观经济学:●政策动态一致性(SPNE) ●劳动力市场 ●(金融)信贷市场 (2)微观经济学 ●外部性 ●公共产品的投资激励 ●工资(薪酬)决定
四、博弈的表示方式
1. 矩 阵 博 弈 例 : 囚 犯 困 境 囚 犯B C
囚 犯C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of Sexes)
● 新婚夫妇: Opera Opera Sandy Football ● 百年夫妻: Opera Opera Sandy Football
01-3-2
博弈论基础

博弈论基础本讲要点:博弈论的基本思想,博弈的构成要素,简单博弈的求解方法,纳什均衡的概念,博弈的分类,动态博弈与重复博弈,信息不对称,道德风险,逆向选择,信号传递。
重点:博弈论的基本思想,纳什均衡的概念,信息不对称。
难点:博弈的构成要素,纳什均衡的概念。
讲授时间:6学时一、博弈的基本要素1、博弈论与古典经济学的区别古典经济学的基本思路:给定约束条件,考虑行为主体的最优结果。
博弈论的基本思路:以行为主体之间的相互影响为前提,考虑行为主体的最优结果。
两者的根本区别:是否考虑对方的行为。
古典经济学中消费者行为理论:假定收入、商品价格以及效用函数给定,求最优消费组合。
消费者A不会考虑消费者B的影响。
古典经济学中的厂商理论:假定生产函数、成本函数、商品价格给定,求厂商的最优生产决策。
厂商A不会考虑厂商B的影响。
古典经济学中的宏观经济理论:假定一国的资源禀赋给定,考虑价格指数、利率等因素的变化对国民收入、就业等的影响。
国家A不会考虑国家B的影响。
博弈论:每个人要考虑别人的行为怎样影响自己的选择。
扑克牌游戏:一个人不可能只顾自己出牌,而不考虑别人怎么出牌。
下棋:无论中国象棋、国际象棋、围棋,一个人在走某一步之前,都要考虑对手是怎么走的,以及对手在我走了一步之后会怎么走,以及我又会在对手走了一步之后怎么走,以至无穷。
高手与俗手的区别也就在此。
高手往往能够考虑10步甚至20步以后的变化。
总之:你的输赢不仅取决于你的决策,而且取决于你对手的决策。
2、博弈论简史博弈论的思路在古诺(Cournot,Antoine Augustin,1801-1977)的双头垄断模型中最早提出,冯•诺伊曼(John von Neumann,1903-1957)和摩根斯坦恩(Oskar Margenstern, 1902-1977)在1944年出版了《博弈论与经济行为》(Theory of Games and EconomicBehavior)一书,最早提出了博弈论的概念。
吉本斯《博弈论基础》课后习题答案

1.14
证 明 : 在 混 合 战 略 纳 什 均 衡 中 , 参 与 人 i 的 混 合 战 略 为 pi* , 其 中 选 择 第 j 个 纯 战 略 sij 的 概
1.4 对 于 第 i个 厂 商 , 其 目 标 为 最 大 化 自 己 的 利 润 , 即 :
max πi
=
max( p qi ≥0
− c)qi
=
max qi ≥0
(
a
−
qi
−
q−*i
− c)qi
;
由 一 阶 条 件 ∂π i / ∂qi = 0 , 可 得 : qi* = (a − q−*i − c) / 2 … … ( 1)
率 为 pi*j 。 用 反 证 法 证 明 。
假 设 pi*j > 0 , 且 sij 是 第 一 个 被 重 复 剔 除 劣 战 略 所 剔 除 的 战 略 。 那 么 参 与 人 i 必 定 存 在 另 一
个 纯 战 略 Sik, 使 得 ui (sij , p−i ) < ui (sik , p−i ) , p−i 是 其 他 参 与 人 任 意 的 战 略 组 合 。 因 为 sij 第
经济学家-
经济学家-
Gibbons《博弈论基础》第二章习题解答(部分)
2.1 采用逆向归纳法,先最大化家长的收益:给定孩子的行动 A,来选择自己的行动 B,
MaxV B
(I
p
−
博弈论基础

博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。
目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。
博弈论主要研究公式化了的激励结构间的相互作用。
是研究具有斗争或竞争性质现象的数学理论和方法。
也是运筹学的一个重要学科。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
生物学家使用博弈理论来理解和预测进化论的某些结果。
参见:行为生态学(behavioral ecology)。
约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。
博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。
博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。
近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。
1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。
1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。
纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
01-3-2
30
求解的一般过程 ● Maxa2∈A2{U2(a1,a2)}→反应函数 a2=R2(a1) ● Maxa1∈A1{U1(a1,a2(a1) )}→反应函数 a*1 ● 得到:SPNE (a1;R2(a1); ) 均衡结果(Outcome)(a*1;R2(a*1) : ) 例:Stackelberg(1934) :Leader-Follower Model
01-3-2
流浪汉 游荡
1
0
0
21
●纯战略 NE 不存在 ●求混合战略 NE: 设政府的混合战略 σG=(θ,1-θ) 设流浪汉的混合战略 σL=(γ,1-γ) =θ[3γ+(-1) (1-γ)]+(1-θ)[-γ+0(1-γ)] =θ(5γ-1)-γ VL(σG,σL)=γVL(θ,1)+(1-γ)VL(θ,0) =γ[2θ+(1-θ)]+(1-γ)[3θ+0(1-θ)]
01-3-2
¥490
13 10 4 10
8 13
●百年夫妻:纯战略 NE 不存在
20
3、NE 战略存在性定理(Nash,1950) :
每个有限博弈至少存在一个 NE(纯战略或混合战略) ●混合战略(Mixed Strategy) :关于纯战略集的概率向量 σk=(σk,1,σk,2,…,σk,nk) ●例:社会福利博弈 寻找工作 救济 政府 不救济
01-3-2
17
2、NE的求解
例 1:囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证:{s*1=(C,C) 2=(C,C)}为 NE 战略 ;s* ●但 Pareto 改进(-2,-2)未能自发达到——外部性 ●个人理性与集体理性产生冲突
01-3-2 18
01-3-2
31
(贝叶斯纳什均衡)BNE
1.引例 t21 2 1 1 U D
01-3-2
t22 R 0 2 3 0 4 0 0 4
32
L
L 0
R 1 2 1
3 1 0
● 参与人 2 有两种类型:t21 与 t22,其战略为类型依存的, S2(t2) :从类型空间到战略空间的映照 ● 参与人 1 对参与人 2 的类型有先验概率 P 2)(1/2, (t : 1/2) ● 验证: 1*,S2*)为 NE,其中 S1*=U; (S S2*(t2)=L,若 t2=t21;S2*(t2)=R,若 t2=t22 证明:给定 S2*,求参与人 1 的期望效用: 若 S1=U,则п 1=1/2×3+1/2×2=5/2 若 S1=D,则п 1=1/2×0+1/2×2=2 所以,给定 S2*,S1*=U 为参与人 1 的最优战略
01-3-2
24
SPNE
1.引例:市场进入博弈 Entrant (E) Out I (Incumbent) (0,2) F (-3,-1)
01-3-2
A (2,1)
25
●2 个纯战略 NE: {Out;Fight If In};{In;Accommodate If In} ●NE{Out;F If In}在均衡路径上最优;但在非均衡路径上 (右枝)非最优:若 E 真的 In,I 的选择将是 A ●{Out;F If In}是不合理的;I 的威胁是不可臵信的(InCredible) ●那么,如何剔除基于不可臵信威胁的不合理的 NE? ●Selten(1975)引进 子博弈精练纳什均衡(SPNE)的概 念
四、博弈的表示方式
1.矩阵博弈 例:囚犯困境 囚犯 B C
囚 犯 C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例:性别战(Battle of
●新婚夫妇: Opera Opera Sandy Football ●百年夫妻: Opera Opera Sandy Football
01-3-2 23
●另解(支付最大法) : 一阶条件(FOC) : dVG/dθ=0;dVL/dγ=0 γ*=0.2;θ*=0.5 ●为什么 VG 对θ求偏导,却得到γ? ●流浪汉的混合战略如何直观理解?(HarSanyi)— 设有 100 个流浪汉,则大约 20 个在寻找工作;另 外的 80 个在游荡
例:囚犯两难(困境)矩阵博弈与博弈树的转换
(-5,-5) C B○ C A○ DC B○ DC (-2,-2) C (-10,0) DC (0,-10)
01-3-2
15
五、均衡(Equilibrium)
静态 完全信息 不完全信息
NE
动态
SPNE
BNE
PBNE
01-3-2
16
纳什均衡(NE)
1、定义: ●战略 S*=(s*1,s*2,…,s*n)为 NE 战略等价 于 对 k=1,2,…,n,有 s*k∈arg〃Max{Uk(s*k,s*-k)} ●也就是说, 在均衡战略下, 如果他人不改变战略, 任意参与人不会单方面改变战略
01-3-2
○1 2○ r a l 0 -1 7 b ○3 r -2 2 28 0 -1 3○ 5 l r 6 3 5 1 4 2 4
① L (-1,5,6) a (5,4,4) L 1○ R
01-3-2
R ② b (0,-1,7)
(-1,5,6)
(5,4,4)
29
● SPNE(s1,s2,s3) 1={R};s2:a If 1 Plays R; :s s3:=r,If 1 Plays L; =r,If L Plays R and 2 Plays a; =l,If L Plays R and2 Plays b ● 均衡结果: (R;a;r)
01-3-2
10
2、博弈规则(续)
●博弈:规定谁在什么时候行动;行动时知道了什么; 有什么可供选择;得到多少 ●有限博弈:参与人有限;行动集合有限 ●博弈规则为共同知识的博弈称为完全信息博弈 ●所有参与人在行动时均知道其他参与人之前的行动 的博弈称为完美信息博弈 ●完美→完全;不完全→不完美
01-3-2 11
01-3-2 2
应用阶段(续)
(3)市场营销 ●Sales Force Mgt. ● Channel Mgt. ● Pricing Startegy (4)产业组织理论 ● 市场竞争与 R&D 竞争 ● 市场进入与反进入 ● 广告方法选择
01-3-2
● 产业规制
3
二、合作博弈
● Cartel (OPEC) ● RJVs ● 合作讨价还价模型(Nash,1950) : Max{(X1-D1) 2-D2)} (X S.T. X1+X2≤1 其中, 1、 2 分别为 1 与 2 的初始禀赋, D D 成为威胁点 (Threat Point) ,产权配臵改变 D1、D2。 当 D1=D2,X1=X2=1/2
外部协调机制
●内部协调不能达到 Pareto 最优(如:Cartel 不能维 持) ●由外部协调机制来解决,如黑社会: 囚犯 B C C 囚犯 A
01-3-2
DC
-∞ -∞ -∞ -2 -10 -2
-∞ -10
DC
19
例 2:航空价格战 中 陆 ¥380 ¥380 8 法航 ¥490 4 NE: (8,8) 例 3:性别战 ●新婚夫妇: 2 个 NE: (Opera,Opera)(Football,Football) ;
01-3-2 33
反之,给定 S1*,S(t21)=L;S(t22)=R 分别是 t21 与 t22 类 型的参与人 2 的最优战略 2.Static B.G 的定义: {I;{Si};{ui(· )};Θ ;F(· )} ●Si 为 i 的战略空间,si∈Si 为 i 的战略(类型依存的) ●Θ =Θ 1×Θ 2×…×Θ I,而θ i∈Θ i 为 i 的类型 ●Ui(si;s-I;θ i) ●F(θ )=F(θ 1,θ 2,…,θ I)为联合分布函数;密度 函数 P(θ 1,θ 2,…,θ I)与条件概率 Pi(θ -i/θ i)为 共同知识(K.N)
01-3-2
Sexes)
Paul Football
1 0 0 1 0 2
2 0
Paul Football
0 1 0 1 2 0
2 0
13
2、博弈树
例:欧盟航空公司空中争夺战 中陆 ¥380 法航 380 490 380 ¥490 法航 490
(8,8) (13,4) (4,13) (10,10)
01-3-2 14
第六讲 博弈论基础
一.博弈论的发展阶段
1.传统阶段: ●Theory of Oligopoly: Cournot(1838) Betrand(1883) ●Theory of Bargaining: Edgeworth(1887) Hicks(1932) 2.现代阶段: ●Von Neumann & Morgenstern (1944)
01-3-2 34
3.BNE: {Si*(· iI=1 满足:对任意的θ i∈Θ i,有: )} Si*(θ i)∈ arg.Maxsi(θ i){∑ui(si,s-i;θ i)P(θ -i/θ i)} i=1,2,…,I
01-3-2
35
例 1:Duopoly Cournot Model 反需求函数:Pi=a-qi-qj,i、j=1,2 利润函数:п
01-3-2
则,VG(σG,σL)=θVG(1,γ)+(1-θ)VG(0,γ)
=-γ(2θ-1)+3θ
22
●由 VG(σG,σL)=θ[5γ-1]-γ 得到政府的反应对应: θ=0,当γ<0.2;θ∈[0,1],当γ=0.2;θ=1,当 γ>0.2 ●由 VL(σG,σ L)=-γ[2θ-1]+3θ 得到流浪汉的反应 对应:γ=1,当θ<0.5;γ∈[0,1],当θ=0.5;γ =0,当θ>0.5 ● NE: (σ*G,σL*) σ*G=(0.5,0.5) σL*=(0.2,0.8)