经济博弈论第二章a
合集下载
经济博弈论第二章a

以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
分析经营管理的实践案例
28
诚信之道
当一个社会缺乏信用、蔑视契约时,是难以建 立人与人之间的互信基础的。所以从建立对信 用和契约神圣的认知,并用强制措施加以保障。
29
诚信的选择
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果严格下
* * * * 以外的所有策略组合,则 策反复消去法排除了 (s1 (s1 ,..., sn ) ,..., sn ) 一定是G的唯一的纳什均衡。
命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果
2 博弈方2利润: u2 q2 P(Q) C2q2 q2 8 (q1 q2 ) 2q2 6q2 q1q2 q2
* * * * 在本博弈中, 的最 (q1 , q2 ) 的纳什均衡的充分必要条件是 q1 和 q2 大值问题: * 2 max(6q1 q1q2 q1 ) q1 * 2 * * q2 q1 q2 q2 ) q q 2, u=8 max(6 1 2 q2
关键点:
寻找占优策略
检查一下你是否存在占优策略,如果有,就选择占优策略
站在对手的位置上思考问题
如果你没有占优策略,那么从你对手角度考虑博弈。如果对手 有占优策略,预期他将按占优策略行动
纳什均衡
我所做的是:给定你所做的,我所做的是最好的; 你所做的是:给定我所做的,你所做的是最好的
同步,一次博弈的应用
道德乎? 策略乎?
经济博弈论第二章a 博弈论课件

2 q P ( Q ) C q q 8 ( q q ) 2 q 6 q q q q 博弈方2利润: u 2 2 2 2 2 1 2 2 2 1 2 2
* 在本博弈中, ( q 1* , q 2 ) 的纳什均衡的充分必要条件是 q 大值问题: * 2
* 1
和q
q2 (0,6)
R1(q2)
(2,2) 6 R2(q1)
(0,3)
0
(3,0)
(6,0)q1
从左图可以看出,当一方的 选择为0时,另一方的最佳反应 为3,这正是我们前面所说过的 实现总体最大利益的产量,因为 一家产量为零,意味着另一家垄 断市场。当一方的产量达到6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
2.3.2 应用
混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样 可应用于存在多个纯策略纳什均衡的博弈问题。 丈 夫 例 夫妻之争 时装 足球 该博弈与上一个博弈的不同之处在 0, 0 于每一方所希望对方知道自己的策略选 妻 时装 2,1 择以达到有利于自己的结果。现实中, 1, 3 子 足球 0,0 这类问题多通过协商解决以免两败俱伤。 在此我们假设夫妻双方不可协商,互不通消息。 令pw(时), pw(足)分别表示妻子选择时装表演和足球的概率; ph(时), ph(足)为丈夫选择时装表演和足球的概率。 同样的分析方法可得pw(时)=0.75, pw(足)=0.25; ph(时)=1/3, ph(足)=2/3.双方的期望得益分别为uwe=0.67, uhe=0.75。
d 2 b * 1 2 P ( a bc ) ( a b c ) 1 2 22 1 1 1 4 b b dd 4 b b dd 1 2 1 2 1 2 1 2 d 2 b * 2 1 P ( a b c ) ( a bc ) 2 1 11 2 22 4 b b dd 4 b b dd 12 1 2 12 1 2
* 在本博弈中, ( q 1* , q 2 ) 的纳什均衡的充分必要条件是 q 大值问题: * 2
* 1
和q
q2 (0,6)
R1(q2)
(2,2) 6 R2(q1)
(0,3)
0
(3,0)
(6,0)q1
从左图可以看出,当一方的 选择为0时,另一方的最佳反应 为3,这正是我们前面所说过的 实现总体最大利益的产量,因为 一家产量为零,意味着另一家垄 断市场。当一方的产量达到6时, 另一方则被迫选择0,因为实际 上坚持生产已无利可图。
2.3.2 应用
混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样 可应用于存在多个纯策略纳什均衡的博弈问题。 丈 夫 例 夫妻之争 时装 足球 该博弈与上一个博弈的不同之处在 0, 0 于每一方所希望对方知道自己的策略选 妻 时装 2,1 择以达到有利于自己的结果。现实中, 1, 3 子 足球 0,0 这类问题多通过协商解决以免两败俱伤。 在此我们假设夫妻双方不可协商,互不通消息。 令pw(时), pw(足)分别表示妻子选择时装表演和足球的概率; ph(时), ph(足)为丈夫选择时装表演和足球的概率。 同样的分析方法可得pw(时)=0.75, pw(足)=0.25; ph(时)=1/3, ph(足)=2/3.双方的期望得益分别为uwe=0.67, uhe=0.75。
d 2 b * 1 2 P ( a bc ) ( a b c ) 1 2 22 1 1 1 4 b b dd 4 b b dd 1 2 1 2 1 2 1 2 d 2 b * 2 1 P ( a b c ) ( a bc ) 2 1 11 2 22 4 b b dd 4 b b dd 12 1 2 12 1 2
复旦大学-谢识予-经济博弈论2

两寡头间的囚徒困境博弈
厂 不突破 商 1 突破
厂商2
不突破
突破
4.5,4.5
3.75,5
5,3.75
4,4
以自身最大利益为目标:各生产 2单位产量,各自得益为4
以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
2.3.2 反应函数
古诺模型的反应函数
max q1
u1
max(6q1
q1q2
2.4 混合策略和混合策略纳什均衡
2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数
2.4.1 严格竞争博弈和混合策略的引进
一、猜硬币博弈
盖 正面 硬 币 反面 方
猜硬币方
正面
反面
-1, 1
1, -1
-1, -1
之
境
争
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
2, 1 0, 0
0, 0 1, 3
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2.2.1 纳什均衡的定义
策略空间:S1 , S n
博弈方 i的第 j 个策略:si j Si 博弈方 i的得益:u i
博弈:G {S1,Sn;u1,un}
纳什均衡:在博弈G {S1,Sn;u1,un}中,如果由各个博弈方i
的各一个策略组成的某个策略组合(si*,sn* ) 中,任一博弈方 的策略,都是对其余博弈方策略的组合 (si*,si*1, si*1,...sn* ) 的最佳对策,也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,si*1, sij , si*1,...sn*)
经济博弈论第二讲

▪ 每个人的得益来自于各自对房间的干净程度的效用减去 他打扫花费的时间。
▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2
囚
0, 1
徒
困
2, 0
境
-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
夫 妻
2, 1
之
0, 0
争
0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。
▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2
囚
0, 1
徒
困
2, 0
境
-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
夫 妻
2, 1
之
0, 0
争
0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。
经济博弈论 02 完全信息静态博弈(Park)

ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?
经济博弈论_Chapter02

Slide 10
分类方法2:利益冲突和利益相容 Are the Players’ Interests in Total Conflict or Is There Some Commonality? 某些博弈中,一人所得即为他人所失。 In some games, one player’s gain is the other’s loss. 参与者的利益完全冲突,这就好比他们在分割 一个数量固定的收益。 The p players ’ interests are in complete y p conflict when they are dividing up any fixed amount of possible gain. 这样的博弈就是零和(或常和)博弈。 These games are zero-sum or constantsum games.
Slide 6
分类方法1:序贯博弈和同时博弈 Are the Moves in the Game Sequential or Simultaneous?
如果博弈的规则规定了一个严格的顺序,每一行动时 刻只允许 个参与者采取行动,而且他知道自己和其 刻只允许一个参与者采取行动,而且他知道自己和其 他人过去所采取的行动,则博弈中的出招是顺序的。 The moves in a game are sequential if the rules of the game specify a strict order such that at each action moment only one player takes action with knowledge of the actions taken action, (by others and himself) at previous moments.
分类方法2:利益冲突和利益相容 Are the Players’ Interests in Total Conflict or Is There Some Commonality? 某些博弈中,一人所得即为他人所失。 In some games, one player’s gain is the other’s loss. 参与者的利益完全冲突,这就好比他们在分割 一个数量固定的收益。 The p players ’ interests are in complete y p conflict when they are dividing up any fixed amount of possible gain. 这样的博弈就是零和(或常和)博弈。 These games are zero-sum or constantsum games.
Slide 6
分类方法1:序贯博弈和同时博弈 Are the Moves in the Game Sequential or Simultaneous?
如果博弈的规则规定了一个严格的顺序,每一行动时 刻只允许 个参与者采取行动,而且他知道自己和其 刻只允许一个参与者采取行动,而且他知道自己和其 他人过去所采取的行动,则博弈中的出招是顺序的。 The moves in a game are sequential if the rules of the game specify a strict order such that at each action moment only one player takes action with knowledge of the actions taken action, (by others and himself) at previous moments.
经济博弈论第2章(23) ppt课件

4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
uG 1, 4 1 uG 0,
0.2
PPT课件
18
• 解二: 支付等值法
如果一个混合策略是政府的最优选择,那一定意
味着流浪汉在寻找工作与游闲之间是无差异的,
即:
流浪汉
找工作
游荡
政府 救济 不救济
3,2 -1 , 1
-1 , 3 0,0
uL 1, 1 3 uL 0,
0.5
PPT课件
19
五、混合战略纳什均衡
• 对 * 0.2 的解释: • 如果流浪汉找工作的概率小于0.2, 则政府选择不
救济,如果大于0.2,政府选择救济 ,只有当概率等 于0.2时,政府才会选择混合战略或任何纯战略. • 对 * 0.5 的解释 • 如果政府救济的概率大于0.5,流浪汉的最优选择 是流浪,如果政府救济的概率小于0.5,流浪汉的最 优选择是寻找工作.
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
p 1
0, 当q 1/ 2
p [0,1],当q 1/ 2
1, 当q 1/ 2
PPT课件
0
1/2
1 q 27
第二章 完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 混合战略纳什均衡 六 纳什均衡存在性及相关讨论
PPT课件
经济博弈论ppt课件

• 例二:黔馿之技
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1,6
2,3 1,2
1, 4
5,4 3,3
4, 5
标准式博弈:均衡分析
如果参与者1认为参与者2选择 C… – 参与者1对“C”的最优反应是“a”.
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1,6
2,3 1,2
1, 4
5,4 3,3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
箭头法
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2.1.3 划线法
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “B”.
参与者 2 参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
标准式博弈:均衡分析
则参与者1应该选择 “a”. – 参与者1对 “B”的最优反应是 “a”.
第二章
完全信息静态博弈
所谓完全信息静态博弈即各博弈方同时决 策,且所有博弈方对博弈中的各种情况下的得 益都完全了解的博弈问题 纳什均衡 无限策略博弈的解和反应函数 混合策略 纳什均衡的存在性
2.1 纳什均衡
博弈的解和纳什均衡 严格下策反复消去法与纳什均衡
2.1.1博弈的解和纳什均衡
-8,0 -5,-5
囚 徒 1
不坦白
坦白
-1,-1 0,-8
箭头法
囚徒2
不坦白 囚 徒 1 不坦白
-1,-1
坦白
-8,0
坦白
0,-8
-5,-5
划线法
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2.1.2严格下策反复消去法与纳什均衡
严格下策:对于某一策略 (s1 ,...si ,..., sn ) ,若 ui (s1,...si ,..., sn ) ui (s1,...si* ,..., sn ) 则称 ui (s1 ,...si ,..., sn ) 为 ui (s1,...si* ,..., sn ) 的严格下策。
参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
– –
“a” 是参与者1对 “C”的最优反应. “C” 是参与者2对 “a”的最优反应. 此结果被称为纳什均衡: 在给定其他参与者策略情况下,没有一个参与者能通过单方 面改变自己的策略而使自己的得益提高,从而没有人有积极性打 破这种均衡
同步,一次博弈--标准式博弈
构成标准式博弈的要素有:
– –
–
参与者:参加博弈并做出决策的个体 策略:参与者可能采取的行动 得益:参与者采取不同策略带来的利益或损失 参与者 2
参与者 1
策略
A
B
C
a b
c
3,2 2,1
1, 6
2, 3 1, 2
1, 4
5,4 3,3
4, 5
标准式博弈:均衡分析
站到对手的立场上,想
参与者2会怎么做呢?
参与者2 没有占优策略! 但是参与者2应该能够推断出1会选择 “a” 因此参与者2会选择 “C”
参与者 2 参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
结果
参与者 2
32
矩阵分析
生产方
诚信 不诚信
交 易
-10 诚 10 销 信 15 10 售 方 0 不 15 诚 0 -10 信
33
案例研讨
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果严格下
* * * * 以外的所有策略组合,则 策反复消去法排除了 (s1 (s1 ,..., sn ) ,..., sn ) 一定是G的唯一的纳什均衡。
命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果
推销员
医生
2003年美国制药业推销员工与药物广告 花费(单位:亿美元)
120 100 80 60 40 20 0 推销员工花费 药物广告花费
27.6 120
专栏—制药公司的销售大战(摘自华尔街日报)(续)
尽管如此,没有任何一家制药商愿意第一个 单方面裁军。葛兰素史克公司( GlaxoSmithKline)的推销员队伍是如此壮大: 它只需要七天就可以联系到美国80%以上的医生 。“这有必要吗?”葛兰素史克的CEO加涅尔说 :“应该说是没有必要,但是如果我的竞争对手 能而我做不到,我们就处于劣势。这的确是以最 坏可能的方式进行的军备竞赛。” “拥有众多的推销员不是竞争优势的源泉” ,默克公司的主席和CEO吉尔马丁补充说。他说 制药商通过发现新药来获得优势。然而,默克公 司2001年起在美国已增加了1500名推销员,使得 总数达到约7000人。 既然谁都知道拥有众多的推销员并不是竞争 优势的源泉,那为什么各家制药公司的推销员仍 然在不断膨胀呢? ——引自周林,《商业战略决策:博弈论的应 用》
道德乎? 策略乎?
30
社会学家和经济学家的争辩
社会学家云:诚信是人在较低层次的需求得到 适当满足之后自然出现的一种较高层次的需求; 诚信带给人的满足感会超过逐利带来的满足 感 。 经济学家云:人们在重复博弈、反复切磋过程 中谋求长期的、稳定的物质利益的一种策略选 择。
31
诚信案例
假定A 是一名生产商,B 是一名销售商,AB 双方互 为博弈对手,会出现以下4种博弈的可能性: 双方都讲诚信,A 按约交货,B 按约付款,各得 其所,每人都得到的效用都是10; A 诚信而B不诚信,A 交了货而B 不付款,那麽B 可以获得自己最大的利益,得15,而A 吃亏了, 得-10; A 不诚信而B诚信,即A 收了钱而不发货,则A 的 利益实现了最大化,得15,而B 得-10; A B 双方互不信任,也互不守信,生意泡汤了, 各自的效用都为0。
2 博弈方2利润: u2 q2 P(Q) C2q2 q2 8 (q1 q2 ) 2q2 6q2 q1q2 q2
* * * * 在本博弈中, 的最 (q1 , q2 ) 的纳什均衡的充分必要条件是 q1 和 q2 大值问题: * 2 max(6q1 q1q2 q1 ) q1 * 2 * * q2 q1 q2 q2 ) q q 2, u=8 max(6 1 2 q2
* * (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去法一定不会将它
消去。
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左 上
下 1, 0 0, 4
中
1, 3 0, 2
右
4, 5
占优策略
不管参与者2是选择A、B还是C, 参与者1都会选择“a”! “a” 是参与者1的占优策略! 占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1, 6
2,3 1,2
1, 4
5,4 3,3
4, 5
–
–
如何均衡稳定与收益?
2.2 无限策略的解和反应函数
古诺的寡头模型 反应函数 伯特兰德的寡头模型 公共资源问题
2.2.1古诺的寡头模型
2 博弈方1利润: u1 q1P(Q) C1q1 q1 8 (q1 q2 ) 2q1 6q1 q1q2 q1
定义 在博弈 G S1,..., Sn ; u1,..., un 中,如果策略 * * 组合 ( s1 ,...sn )中任一博弈方i的策略 si* 都是对 * * 其余博弈方的策略组合 (s1 ,..., si*1, si*1,..., sn ) 的最佳 对策,也即
* * ui (s1*,..., si*1, si*1,..., sn ) ui (s1*,..., si*1, sij , si*1,..., sn )
以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
分析经营管理的实践案例
28
诚信之道
当一个社会缺乏信用、蔑视契约时,是难以建 立人与人之间的互信基础的。所以从建立对信 用和契约神圣的认知,并用强制措施加以保障。
29
诚信的选择
0, 1 2, 0
策略 A B C
a b
c
3,2 2,1
1,6
2,3 1,2
1, 4
5,4 3,3
4, 5
标准式博弈:均衡分析
如果参与者1认为参与者2选择 C… – 参与者1对“C”的最优反应是“a”.
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1,6
2,3 1,2
1, 4
5,4 3,3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
箭头法
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2.1.3 划线法
标准式博弈:均衡分析
假设参与者1认为参与者2选择 “B”.
参与者 2 参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
标准式博弈:均衡分析
则参与者1应该选择 “a”. – 参与者1对 “B”的最优反应是 “a”.
第二章
完全信息静态博弈
所谓完全信息静态博弈即各博弈方同时决 策,且所有博弈方对博弈中的各种情况下的得 益都完全了解的博弈问题 纳什均衡 无限策略博弈的解和反应函数 混合策略 纳什均衡的存在性
2.1 纳什均衡
博弈的解和纳什均衡 严格下策反复消去法与纳什均衡
2.1.1博弈的解和纳什均衡
-8,0 -5,-5
囚 徒 1
不坦白
坦白
-1,-1 0,-8
箭头法
囚徒2
不坦白 囚 徒 1 不坦白
-1,-1
坦白
-8,0
坦白
0,-8
-5,-5
划线法
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
1, 0 1, 3 0, 1
0, 4
0, 2
2, 0
囚 徒 困 境
-5, -5 -8, 0
0, -8 -1, -1
夫 妻 之 争
2, 1 0, 0
0, 0 1, 3
猜 硬 币
-1, 1 1, -1
1, -1 -1, 1
2.1.2严格下策反复消去法与纳什均衡
严格下策:对于某一策略 (s1 ,...si ,..., sn ) ,若 ui (s1,...si ,..., sn ) ui (s1,...si* ,..., sn ) 则称 ui (s1 ,...si ,..., sn ) 为 ui (s1,...si* ,..., sn ) 的严格下策。
参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
– –
“a” 是参与者1对 “C”的最优反应. “C” 是参与者2对 “a”的最优反应. 此结果被称为纳什均衡: 在给定其他参与者策略情况下,没有一个参与者能通过单方 面改变自己的策略而使自己的得益提高,从而没有人有积极性打 破这种均衡
同步,一次博弈--标准式博弈
构成标准式博弈的要素有:
– –
–
参与者:参加博弈并做出决策的个体 策略:参与者可能采取的行动 得益:参与者采取不同策略带来的利益或损失 参与者 2
参与者 1
策略
A
B
C
a b
c
3,2 2,1
1, 6
2, 3 1, 2
1, 4
5,4 3,3
4, 5
标准式博弈:均衡分析
站到对手的立场上,想
参与者2会怎么做呢?
参与者2 没有占优策略! 但是参与者2应该能够推断出1会选择 “a” 因此参与者2会选择 “C”
参与者 2 参与者 1
策略 a b c A 3, 2 2, 1 1, 6 B 2, 3 1, 2 1, 4 C 5, 4 3, 3 4, 5
结果
参与者 2
32
矩阵分析
生产方
诚信 不诚信
交 易
-10 诚 10 销 信 15 10 售 方 0 不 15 诚 0 -10 信
33
案例研讨
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果严格下
* * * * 以外的所有策略组合,则 策反复消去法排除了 (s1 (s1 ,..., sn ) ,..., sn ) 一定是G的唯一的纳什均衡。
命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如果
推销员
医生
2003年美国制药业推销员工与药物广告 花费(单位:亿美元)
120 100 80 60 40 20 0 推销员工花费 药物广告花费
27.6 120
专栏—制药公司的销售大战(摘自华尔街日报)(续)
尽管如此,没有任何一家制药商愿意第一个 单方面裁军。葛兰素史克公司( GlaxoSmithKline)的推销员队伍是如此壮大: 它只需要七天就可以联系到美国80%以上的医生 。“这有必要吗?”葛兰素史克的CEO加涅尔说 :“应该说是没有必要,但是如果我的竞争对手 能而我做不到,我们就处于劣势。这的确是以最 坏可能的方式进行的军备竞赛。” “拥有众多的推销员不是竞争优势的源泉” ,默克公司的主席和CEO吉尔马丁补充说。他说 制药商通过发现新药来获得优势。然而,默克公 司2001年起在美国已增加了1500名推销员,使得 总数达到约7000人。 既然谁都知道拥有众多的推销员并不是竞争 优势的源泉,那为什么各家制药公司的推销员仍 然在不断膨胀呢? ——引自周林,《商业战略决策:博弈论的应 用》
道德乎? 策略乎?
30
社会学家和经济学家的争辩
社会学家云:诚信是人在较低层次的需求得到 适当满足之后自然出现的一种较高层次的需求; 诚信带给人的满足感会超过逐利带来的满足 感 。 经济学家云:人们在重复博弈、反复切磋过程 中谋求长期的、稳定的物质利益的一种策略选 择。
31
诚信案例
假定A 是一名生产商,B 是一名销售商,AB 双方互 为博弈对手,会出现以下4种博弈的可能性: 双方都讲诚信,A 按约交货,B 按约付款,各得 其所,每人都得到的效用都是10; A 诚信而B不诚信,A 交了货而B 不付款,那麽B 可以获得自己最大的利益,得15,而A 吃亏了, 得-10; A 不诚信而B诚信,即A 收了钱而不发货,则A 的 利益实现了最大化,得15,而B 得-10; A B 双方互不信任,也互不守信,生意泡汤了, 各自的效用都为0。
2 博弈方2利润: u2 q2 P(Q) C2q2 q2 8 (q1 q2 ) 2q2 6q2 q1q2 q2
* * * * 在本博弈中, 的最 (q1 , q2 ) 的纳什均衡的充分必要条件是 q1 和 q2 大值问题: * 2 max(6q1 q1q2 q1 ) q1 * 2 * * q2 q1 q2 q2 ) q q 2, u=8 max(6 1 2 q2
* * (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去法一定不会将它
消去。
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
严格下策反复消去:
左 上
下 1, 0 0, 4
中
1, 3 0, 2
右
4, 5
占优策略
不管参与者2是选择A、B还是C, 参与者1都会选择“a”! “a” 是参与者1的占优策略! 占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略
参与者 2 参与者 1
策略 A B C
a b
c
3,2 2,1
1, 6
2,3 1,2
1, 4
5,4 3,3
4, 5
–
–
如何均衡稳定与收益?
2.2 无限策略的解和反应函数
古诺的寡头模型 反应函数 伯特兰德的寡头模型 公共资源问题
2.2.1古诺的寡头模型
2 博弈方1利润: u1 q1P(Q) C1q1 q1 8 (q1 q2 ) 2q1 6q1 q1q2 q1
定义 在博弈 G S1,..., Sn ; u1,..., un 中,如果策略 * * 组合 ( s1 ,...sn )中任一博弈方i的策略 si* 都是对 * * 其余博弈方的策略组合 (s1 ,..., si*1, si*1,..., sn ) 的最佳 对策,也即
* * ui (s1*,..., si*1, si*1,..., sn ) ui (s1*,..., si*1, sij , si*1,..., sn )
以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
分析经营管理的实践案例
28
诚信之道
当一个社会缺乏信用、蔑视契约时,是难以建 立人与人之间的互信基础的。所以从建立对信 用和契约神圣的认知,并用强制措施加以保障。
29
诚信的选择
0, 1 2, 0