博弈论基础讲义-第四章

合集下载

经典博弈论普及课件

经典博弈论普及课件

Q
1
我们通过记 b 和 式;即,从这个观点出发我们将使用的逆需求函数为 P=a–bQ
a
来简化这个(逆)需求曲线的表达
假设每家公司的成本函数相同,并且每单元成本不随生产 的单元数变化。更正规一些,每家公司具有常数边际成本 函数;生产数量Qi的成本为cQi,其中c > 0是常数边际成本, i = 1,2。
每家公司的 生产数量
价格
每家公司的 利润
(a c) 8b
2
ac 4b
ac 2
注意到如果公司如卡特尔那样经营,它们比起 在纳什均衡里的产量生产得少一些;卡特尔 的产量是古诺特-纳什均衡产量水平的75%。 在纳什均衡中,两家公司比起它们象卡特尔 那样经营来利润较低(因为在纳什均衡里, 它们过度地生产)。
卡特尔解
作为对比,如果两个公司如卡特尔那样地 运作,即,如果它们对于它们的生产决 策进行协调,我们来计算它们将生产的 产量,如果公司经营为卡特尔,可以合 理地假设它们以最大化它们的联合利 润——或总利润这样的方式来设置生产 目标。预先指定生产“配额”为Q1与Q2; 它们的选择是使得总利润最大化:
MaxQ1 ,Q2 [a b(Q1 Q2 ) c][Q1 Q2 ]
0,8 0,8
低(L)
8,0
8,0
4,4
案例研究:动物王国中的纳什均衡
荒漠蜘蛛的故事,雌蜘蛛在网里产卵,由于这样的网很 难搭建,因此,网是稀少的。生物学家看到雌蜘蛛经 常为已有的蜘蛛网争斗——或者几乎是争斗;两只雌 性并排在网前,并且作出诸如猛烈地摇晃网这样的威 胁姿态(虽然它们很少有真正的肉体接触),当一只 蜘蛛撤退而留下另一只单独地占有蜘蛛网时,冲突就 得到了解决。 生物学家试图解释有关动物争斗的两个特定程式的事实: 1. 多数冲突无需战斗而得到解决。此外,冲突的胜利者 常常从失败者那儿“以不同的方式获得”某种维持生 命必需的东西。。

博弈论课件第四章

博弈论课件第四章

3
合作博弈
参与者之间可以合作并制定共同策略,追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念,指的是当参与者根据对手的选择来选 择自己的策略时,不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等 概率性决策中,以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零,一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作,每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科,第四章将介绍博弈论的基本概念、 应用领域、主要模型以及纳什均衡理论和混合策略的应用,同时提供实际应 用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多 次对局中,通过随机选择策略以 增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注 决策,以提高筹码的价值和战略 性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略

博弈论第四章

博弈论第四章

(1)起始结是一个单结的信息结;
(2)子博弈保留了原博弈的所有结构。 则称它为原博弈的一个子博弈(子博弈)。
按照博弈树的延伸的时序,或者按照博弈 树生长的时序,我们用一个扁椭圆形的虚 线的圈,把所论局中人在同一个时点的若
干决策节点罩起来,成为他的一个信息集。
(1)起始结是一个单结的信息结
x1
L L 1 2 S L 2 S (1,1) (2,2) 1 (-1,-1) (-1,-1) S 2 L L S (2,2)
镇上能卖6000元;但如果另一家商铺同时在小镇上卖
鞭炮,价格下跌使得这批鞭炮只能卖4000元。纳什均
衡是什么?
• 假设甲先行动,商铺乙看到对方的选择后再决定是否
进货,子博弈精炼纳什均衡是什么?
如果甲先行动,但在博弈开始前商铺主乙有一次行动A 的机会,利用子博弈精炼均衡概念分析下述两种情况下
的博弈结果: 何行动他都不会改变这个决定;
一颗大树表示一个博弈,一颗小树同样可以表示
一个博弈。如果小树是大树的一颗子树,并且
小树表示的博弈不破坏大树表示的博弈的结构,
那么小树表示的博弈,就叫做大树表示的博弈
的子博弈。
一、子博弈(sub-game)
子博弈定义:在一个扩展型博弈中,如果一 个博弈由它的一个决策结及其所有后续结 构成,并满足:
信息集的时候,面临决策的局中人对于博弈迄今的历史是
不清楚的,他不清楚博弈具体走到了他的这个信息集里面 的哪个决策节点。
在市场进入博弈中,包含3个子博弈(包括原博 弈)。而在囚徒博弈中,只有一个子博弈(?)
收益: A
B 容忍
进入 抵抗 A 不进入 B
B
抵赖
B 抵赖
-1 ,-1 -9 ,0 0 ,-9

博弈论讲义完整PPT课件

博弈论讲义完整PPT课件
• 两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页

博弈论讲义004

博弈论讲义004

重复博弈的策略、子博弈和均衡路径
(1) 重复博弈的策略。 在动态博弈中,博弈方的一个策略是指每一次轮 到其选择时针对每种可能情况如何选择的计划。由于 重复博弈中每个博弈方在每个阶段都必须进行策略选 择,因此博弈方的一个策略就是在每次重复时, 针对 其前面阶段所有可能的情况如何进行行动的计划。
(2) 重复博弈的子博弈 重复博弈是动态博弈,因此也有阶段子博弈的概念。我 们已经知道子博弈是全部博弈的一部分,当全部博弈进行到 任何一个阶段,到此为止的进行过程已成为各博弈方的共同 知识,其后尚未开始的博弈部分就是一个子博弈。重复博弈 的子博弈就是从某个阶段(除第一阶段以外)开始,包括此 后所有阶段的重复博弈部分。重复博弈的子博弈要么仍然是 重复博弈,只是重复的次数较少,要么就是原博弈。 定义:在有限次重复博弈G(T)中,由第t+1阶段开始 的一个子博弈为G进行T-t次的重复博弈。在无限重复博弈G (∞,δ)中,由第t+1阶段开始每个子博弈都等同于初始博 弈G(∞,δ)。
2
终于有一天,有一位女士问他:难道你不知道 10块钱比1块钱更多一些钱吗? 他如此回答道:如果我有一次选择了10块钱, 就不会有人来找我让我在1块钱与10块钱之间选择了, 我也讨不到钱了。
3
第一节 重复博弈基本概念
一次动态博弈也称为“序贯博弈”。 重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段 博弈”。如囚徒困境。 重复博弈的特征: 1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变 后一阶段的结构 ; 2、所有参与人都观测到博弈过去的历史; 3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均 值。贴现因子: 下一期的一单位支付在这一期的价值。 注意:在每个阶段,参与人可同时行动,也可不同时行动。

经济博弈论4

经济博弈论4

现值为:
4.51 2 4.5
1
如果厂商2偏离上述触发策略,则他在第一阶段
所选产量应为给定厂商1产量为1.5时,自己的最大利
润产量,即满足:
max8 1.5 q q 2q max4.5 q q
q2
2
2
2
q2
2
2
解得 q 2.25 ,此时利润为5.0625,高于触 2
发策略第一阶段得益4.5。
对任意博弈方i都成立,而 足够接近1,那么无限
厂商2
次重复博弈G(, )中一定存在一个子博弈完美纳
得益
(5,0) 什均衡,各博弈方的平均得益为(x1 , (1,4)
, xn )
(3,3)
(1,1)
(4,1) (5,0)
厂商1得益
4.3.3 无限次重复古诺模型
假定:P 8 Q,其中Q q q ,边际成本都为2。
1
2
在无限次重复古诺模型中,当贴现率 满足一
定条件时,两厂商采用下列触发策略构成一个子博弈
完美纳什均衡:
在第一阶段生产垄断产量的一半1.5;在第 t 阶 段,如果前 t-1 阶段结果都是(1.5,1.5),则继续生 产1.5,否则生产古诺产量2。
设厂商1已采用该触发策略,若厂商2也采用该触
发策略,则每期得益4.5,无限次重复博弈总得益的
4.2.4 有限次重复博弈的民间定理
个体理性得益:不管其它博弈方的行为如何,一博弈方在 某个博弈中只要自己采取某种特定的策略,最低限度保证 能获得的得益
可实现得益:博弈中所有纯策略组合得益的加权平均数组 定理:设原博弈的一次性博弈有均衡得益数组优于w,那么
在该博弈的多次重复中所有不小于个体理性得益的可实现 得益,都至少有一个子博弈完美纳什均衡的极限的平均得 益来实现它们

博弈论前四章笔记整理

博弈论前四章笔记整理

博弈论前四章笔记整理第一章:博弈论基础概念。

- 博弈的定义与要素。

- 博弈是指在一定的规则下,多个参与者(至少两个)进行策略选择并得到相应结果(收益)的过程。

- 要素包括参与者(局中人)、策略(每个参与者可选择的行动方案)、收益(每个参与者在不同策略组合下的所得)。

例如在“囚徒困境”中,两个囚犯是参与者,坦白或不坦白是他们的策略,不同策略组合下的刑期长短就是收益。

- 博弈的分类。

- 按参与者数量可分为两人博弈和多人博弈。

- 按策略空间是否有限分为有限博弈和无限博弈。

如猜硬币是有限博弈(正面或反面两种策略),企业的产量竞争(产量可在一定范围内连续取值)可能是无限博弈。

- 按收益情况分为零和博弈(一方的收益就是另一方的损失,总和为零,如赌博)、常和博弈(收益总和为常数)和非零和博弈(收益总和不为零,如企业合作共同开拓市场,双方都可能获利)。

第二章:完全信息静态博弈。

- 策略式表述(标准式表述)- 通常用一个矩阵来表示,行代表一个参与者的策略,列代表另一个参与者的策略,矩阵中的元素是对应的收益组合。

以“性别战”为例,丈夫和妻子选择看电影或看球赛,就可以构建一个2×2的收益矩阵。

- 占优策略均衡。

- 占优策略是指无论其他参与者选择什么策略,该策略都是某个参与者的最优策略。

如果每个参与者都有占优策略,那么由这些占优策略组成的策略组合就是占优策略均衡。

例如在“囚徒困境”中,每个囚徒的占优策略都是坦白,所以(坦白,坦白)是占优策略均衡。

- 纳什均衡。

- 纳什均衡是指在一个策略组合中,每个参与者的策略都是对其他参与者策略的最优反应。

即给定其他参与者的策略,没有参与者有动机单方面改变自己的策略。

与占优策略均衡不同,纳什均衡并不要求每个参与者都有占优策略。

例如在“性别战”中,(看电影,看电影)和(看球赛,看球赛)都是纳什均衡。

第三章:完全信息动态博弈。

- 扩展式表述。

- 包括博弈树的构建,节点表示参与者的决策点,树枝表示可选择的策略,终端节点表示博弈的结果并标有相应的收益。

博弈论课件4重复博弈

博弈论课件4重复博弈

5 1 1 2 5
如果博弈方2采用H,总得益现值为:
1
V 4 V
因此当 1/ 4时,此触发策略纳什均衡策略。
4.3.2 惟一纯策略纳什均衡的无限次重复博弈
无限次重复博弈民间定理(弗里德曼,1971)
设G是一个完全信息的静态博弈,用(e1, , en )记G的纳什均衡得益,
用(x , 1
重复囚徒困境悖论和连锁 店悖论
☻理论和实践的直觉矛盾,现实 中寡头之间的价格战问题并 不十分普遍,重复次数较大 的实验研究的结果(重复200 次的囚徒困境)
☻泽尔腾(1978),“连锁店悖论” (导论中的先来后到博弈), 实际中对开头几个市场的进 入者不计代价的打击
☻问题的症结与蜈蚣博弈类似, 在于在较多阶段的动态博弈 中逆推归纳法的适用性T t1t 1t1 2 23
t1
t 1
t
4.1.2 基本概念
平均得益:如果一常数作为重复博弈(有限次重复博弈或
无限次重复博弈)各个阶段的得益,能产生与得益序列
1, 2,相同的现在值,则称为1, 2,的平均得益
无限次重复博弈时
2 (1 )
1 2 23
4.2.3 多个纯策略纳什均衡的有限次重复博弈
三价博弈的两次重复博弈
+1
厂H 商M
1L
H
5,5 6,0 2,0
厂商2
M 0,6 3,3 2,0
L
0,2 0,2 1,1
+3
厂H 商M 1L
H
8,8 7,1 3,1
厂商2 M
1,7 4,4 3,1
L
1,3 1,3 2,2
三价博弈
两次重复三价博弈的等价博弈
有限次重复博弈民间定理
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章动态不完全信息博弈第一节. 序贯均衡的内涵一.问题的提出1.序贯理性2.一致信念二.序贯均衡的内涵1.例子2.定义a.行为战略b.序贯理性c.一致信念3.存在性三.序贯均衡的计算1.例子:一般计算2.例子:分析应用第二节. 序贯均衡的应用一.教育和信号传递1.假设2.分析二.垄断限价模型1.假设2.分析三.声誉模型1.假设2.分析四.序贯均衡之再精炼1.剔除劣弱战略2.直观标准3.垄断限价模型第四章不完全信息动态博弈第一节.序贯均衡的内涵一.问题的提出1.序贯理性——参与人在所有情况决策都是理性的,即在给定信念的条件下,以及其他参与人的选择条件下,自身选择是最优的例1:子博弈最优——纳什均衡(,)L l是否合理?——如果参与人2有机会选择,肯定选r而不是l;——(,)L l不是子博弈精炼纳什均衡。

例2:单点信息集最优——纳什均衡(,,)D a l是子博弈纳什均衡;——但如果参与人2有机会选择,但肯定选择d;——(,,)D a l不满足单点信息集理性。

例3:多点信息集最优——纳什均衡(,)A r是子博弈精炼纳什均衡;——(,)A r不满足多点信息集理性。

2.一致信念例1:与客观事实一致u=是否合理?——参与人2的信念2/3——2/3u=是不合理的,因为任何到达参与人2信息集都不可能产生此后验概率;——后验信念必须与先念信念保持一致。

例2:前后信念一致——参与人2的第2个信息集上的信念,是否合理?——不合理,给定参与人战略和第1个信息集的信念,利用贝叶斯法则计算信念与此不一致;——参与人前后信念保持一致。

例3:独立偏离——参与人3的信念0.9u =是否合理?——参与人1和参与人3的偏离是独立的,所以参与人3的合理信念为0.1u =;——不同参与人之间的偏离是独立的总结,一致信念要求:参与人偏离最小化,,参与人之间偏离是独立的;二.序贯均衡的定义1.例子——定义参与人1在信息集1.1和1.3以及参与人2在2.2上的序贯理性;——定义信息集1.3和2.2的信念?2.定义a.行为战略:参与人在某个信息集到行动集映射,——如果某个状态真正发生,参与人如何决策;——序贯理性是否满足?b.序贯理性:在任何信息集上,参与人在给定信念和所有后续行为战略,选择自身行为战略最大化预期效用。

在单结信息集上,参与人i 的行动满足:max [,] is i is s arg U x σσρ-∈ (1)在多结信息集上,参与人i 的行动满足:max ()[,] is is i is s arg x U x σπσρ-∈∑ (2)——含义,在任何信息集上行动总是最优。

c.信念一致性:在任何信息集上参与人的信念必须和行动保持一致。

如果参与人i 信念集有正概率到达,则:()()()is y sP x x P y σπσ∈=∑ (3)如果参与人i 的信息集是零概率到达,则:lim () ()lim ()k is k P x x P y σπσ=∑ (4) ——k σ是让所有信息集都到达的行为战略;——k σσ→,收敛于现有行为战略;——仅仅需求存在一个序列满足以上条件。

d.满足(1)(2)(3)和(4),则称行为战略和信念系统(,)σπ是序贯均衡。

仅满足(1)(2)和(3),则称为弱序贯均衡,但弱序贯均衡不一定是纳什均衡。

如例子中121(,,)b w z 是弱序贯均衡,但不是纳什均衡,关键在于参与人1在1.1和1.3行为没有协调一致。

标准4是非常关键的,正式把定义非均衡路径上的信念,从而定义非均衡路径上参与人的合理行为。

3.存在性a.存在性定理——任何博弈都存在代理人标准式的颤抖手均衡;——任何代理人标准式的颤抖手均衡一定是序贯均衡。

b.和纳什均衡的关系——是纳什均衡;——可利用反证法和库恩等价定理证明。

三.计算 1.例子——在信息集2.2时,参与人2的最优行为战略为'L;——给定参与人2的最优选择,参与人1在信息集1.1的最优行为战略为L。

2.例子:考虑下图扩展式博弈,求解所有的序贯均衡3,8 2,61,0 -2,7 -1,9 -1,7——首先考虑在信息集2.3时最优行动:333: 80(1)8: 77(1)7: 69(1)93e f g αααααααα⋅+⋅-=⋅+-=⋅+-=-由此可得结论:3337/8 ;2/37/8;2/3 ;e f g ααα≥⇒≤≤⇒≤⇒最优选择最优选择最优选择——分析纯战略序贯均衡3. 7/8A e α≥⇒最优选择此时参与人1最优行为战略为121.1 1.2x x →→,则这与7/8α≥矛盾。

3. 2/37/8B f α≤≤⇒最优选择为此时参与人1的最优行为战略为121.1, 1.2y y →→。

所以,根据标准4扰动行为战略满足:12121227εαεεεεε=⇒≤≤+序贯均衡:[]123,, 2/37/8y y f α≤≤3. 2/3C g α≤⇒最优选择为此时参与人1最优行为战略121.1 1.2,2/3x y α→→≤则与矛盾。

——分析混合行为战略序贯均衡33. 7/8A e f α=⇒和混合.. 7/8α=的唯一可能就是1x 和2x 的使用概率为0,或参与人1在信息集1.2上选择2x 和2y 无差异。

由此可以得到参与人2的最优行为战略:3(1)0 x 1/42(1)0 x=2/3x x x x --≤⇒≤--=⇒7/8α=时考虑参与人1的最优行为战略: 1/4x ≤,构造扰动战略11212778εαεεεε==⇒=+ 2/3x =,此时在信息集1.1最优选择为1x ,1.2的最优选择:171 y=187y α==⇒+ …序贯均衡:12337[, , (1)] x 1/48y y x e x f α=⋅+-≤ 1223371621 [, , ]87733x x y e f α=++ 33. 2/3B f g α=⇒和的混合2/3α=的唯一可能就是1x 和2x 选择概率都为0,此时要求3f 使用概率大于等于2/3。

所以,扰动的行为战略满足:11212223εαεεεε==⇒=+ …序贯均衡:12332[, , x (1)] x 2/33y y f x g α=⋅+-⋅≥3.例子:问在什么条件下(c,eg)是一个序贯均衡——构造扰动行为战略[1212,,1εεεε--]——在信息2.2最优行为是e 的条件:33(1)1/2ααα⋅≤-⇒≤,也就是:1211221/222εαεεεε=≤⇒≥+——参与人在2.3时信息集β满足:211211240.824εεβεεεε=≥=++——所以g 要成为最优选择的条件:0.20.82 x 8x ⨯≥⨯⇒≥第二节.序贯均衡的应用一.信号传递模型1.假设——存在两个参与人,信号发送者和信号接受者;——信号接受者没有私人信息,信号发送者有两种类型,t和2t;1——信号发送者首先发送信号,信号接受者在观察到发送者信号再决定自己的行动。

2.分析求解分离均衡:不同类型参与人发送不同的信号12, t H t T →→——此时参与人2的后验信念为1, q=0p =——此时参与人2的最优选择为(,)H T——显然类型为2t 的参与人肯定不是最优选择12, t T t H →→——此时参与人2的后验信念为0, q=1p =——此时参与人2的最优选择为(,)T H——此时类型为2t 的参与人肯定不是最优选择。

混同均衡:不同类型参与人发送相同的信号12, t H t H →→——此时参与人2的后验信念为0.8, 0q 1p =≤≤——此时参与人2在信息集2.2最优选择为H ;——如果参与人类型为2t 没有积极性偏离,则参与人2在2.3信息集应该选择T ,由此要求1/2q ≤——所以混同均衡为(,,) p=0.8 q 0.5H H T ≤12, t T t T →→——此时参与人2的后验信念为0.8 0p 1q =≤≤——此时参与人2在信息集2.3最优选择为H ;——如果参与人1类型为1t 的没有积极性偏离,则参与人2在2.2选择为T ,也就是要求0.5p ≤——所以混同均衡为(,,) p 0.5 q=0.8T H T ≤教育学历和信号发送的关系二.动态非对称息讨价还价1.假设——工会和企业老板就员工工资进行讨价还价;——员工的保留效用0,企业利润π服从[]0,H π上的均匀分布,企业利润是老板的私人信息;——在第一阶段,工会提出工资要求1w ,如果企业老板接受,则博弈结束,老板支付为1w π-,工会为1w ;如果拒绝,则博弈进入第二阶段;——在第二阶段,工会同样提出工资要求2w ,如果老板接受,则企业老板得到2w π-,工会得到2w ;如果拒绝,则双方各得到0; ——现在假定双方的贴现因子都为δ。

2.分析和求解——假定只有一个阶段博弈,则工会最优工资w :0H H H www πππ-⨯+⨯ 所以*/2H w π=——给定工会最优战略12(,)w w ,企业在第一阶段最优决定为:如果1ππ>,则接受工资1w ;反之则拒绝,1π满足:1211121[] 1w w w w δπδππδ-⋅-=⋅-=-即:——给定企业老板的第一阶段的最优决策,工会的后验信念为企业利润服从1[0,]π上的均匀分布,所以工会最优工资*21/2w π= ——由此可以得到:1122w πδ=-——工会第一阶段的最优决策为:11111max /2H H Hw arg w πππδπππ-∈⨯+⨯⨯ ——最优一阶条件为:11122*1222022(2)(2)2(43)H H w w w w πδδδδδπδ--+⨯=----=⨯-——所以序贯均衡为:工会第一阶段提出工资*1w ,第二阶段为*1/2;π企业在第一阶段如果*1ππ>则接受*1w ,反之则拒绝,在第二阶段如果*2w π>则接受,反之则拒绝。

三.声誉模型1.囚徒困境S2S1坦白抗拒坦白+2,+2 8,+0 抗拒+0,8 +7,+72.假设——假定囚徒有α类型为合作类型,1α-类型为自私类型——合作类型坚持冷酷战略,一开始抗拒,一旦发现对手选择坦白,则坦白到永远——自私类型的支付矩降如上图所示——以上博弈重复有限次T,并且每一阶段都能被下一阶段所观察δ=到,假定贴现因子13.分析——如以上博弈重复3次,合作是否会出现?..自私类型选择合作的最小收益:[778](1)[022]αα⨯+++-⨯++..自私类型选择不合作的最大收益:[822](1)[822]αα⨯+++-⨯++所以如果满足:4/9α≥显然在第一阶段合作是自私类型的最优选择。

——无论α多么小,只要重复次数足够大,合作肯定会出现 ..合作的最小收益:[77...8](1)[02...2]αα⨯++++-⨯+++..不合作的最大收益:[82...2](1)[82...2]αα⨯++++-⨯+++..自私类型人在第一阶段合作的条件:5(1)8(1)08/(53)T T ααα-⨯--≥⇒≥+..更加一般地,只要重复次数足够大,则所有0t T ≤,自私参与人总选择合作..机制分析…合作收益 5(1)T α-⨯…不合作收益 (1)α-…合作收益是长远收益,随着时间增加而增加,而不合作收益是眼前的利益..如果考虑贴现因子,则合作收益随着贴现因子与δ增加而增加 …合作的最小收益11[77...78](1)[02...22]T T T Tαδδδαδδδ--⨯++++-⨯+++ …不合作的最小收益11[82...22](1)[82...22]T T T T αδδδαδδδ--⨯++++-⨯+++…两者差距随着贴现因子增加而增加 1158(1)1Tδαδαδ⎡⎤--+⨯--⎢⎥-⎣⎦四.序贯均衡之再炼1.剔除劣战略标准——如果对于某一类型参与人i t ,满足以下条件,则我们称m 为i t 类型严格劣信号,[,,][,,]S i i a aMaxU m a t Min m a t < ——如果可能,i t 类参与人发送信号m 的概率为0,即信号接受者后验信()0i P t m =——以上信号传递模型存在两个信号混同均衡:(,,), 0.8, 1/2H H T p q =≤(,,), 0.5 0.8T H T P q ≤= ——利用以上标准检验: ..检验混同均衡1 对于类型1t 存在以下关系:11[,,]3[,,]0S a a MaxU H a t Min T a t =>= 11[,,]2[,,]1S a a MaxU T a t Min H a t =>=对于类型2t 存在以下关系:1111[,,]2[,,]1[,,]3[,,]0S a a S a a MaxU H a t Min T a t MaxU T a t Min H a t =>==>=T H 和都不是1t 和2t 类型的严格劣信号,因此,0.5q ≤是合理后验信念。

相关文档
最新文档