博弈论9 信号博弈和声誉模型共80页

合集下载

两阶段基于信号博弈的声誉模型

两阶段基于信号博弈的声誉模型

1 模型的基本描述
有两个参与人 , 进行两时期博弈 . 在第一时 期 , 参与人 1 拥有私人信息 , 有两种类型 t = L , H; L 可理解为低能力类型 , H 可理解为高能力类 型 , 在不同的具体模型中 , 有不同的含义 . 在第一 时期 , 参与人 2 不知道参与人 1 的类型. 参与人 1 先行动 , 发送信号 λ 1 ≥0 , 发送信号前预测到参与 人 2 将采取什么样的行动 , 参与人 2 接收到信号 后 , 推断参与人 1 的类型 , 根据类型采取行动 q1 ≥
> 0 , 等式右侧第 1 项表示参与人 2 采取行
基金项目 : 国家自然科学基金资助项目 (70171028 , 70071049 , 79830010) . ) ,男 ,湖南隆回人 ,博士后 . 作者简介 : 肖条军 (1973 —
— 28

管 理 科 学 学 报 2003 年 2 月
第 1 期 肖条军等 : 两阶段基于信号博弈的声誉模型
— 29

可以证明 , 对于 H 类型参与人 1 , 也类似地成 立假设 2 . 解得式 ( 8) 后 , 根据信号博弈均衡结果 的唯一性定理
[ 9 , 10 ]
32 b1 ( L ) λ 1 ( L) 3 3 3 记λ 1 ( H) = m x{λ 1 ( H) ,λ 1 + } , 在不完全信 息下 , 省略后验推断 , 则 H 类参与人 1 对应的 1 3 3 ISGPBE 是 λ c ( H) d - 1λ 1 ( H) , 1 ( H) . 2
Stackelberg 博弈 , 需采用逆向归纳法求解
[ 8]
2 . , 信息是不对称的 , 参与人 1 拥有 信息优势 , 两者之间进行信号博弈 . 由于参与人 1 第 1 时期的信号大小影响他第二时期的效用大小 , 因此 , 从长远角度考虑 , 他必须注意到这些影响 , 记 时期贴现因子为δ, 0 < δ ≤1 , 则参与人 1 第一时期 的决策目标是极大化他的两时期贴现效用 U ( t ,λ U2 ( t ,λ 1 , q1 ) = U1 ( t ,λ 1 , q1 ) + δ 1,

博弈论讲义9

博弈论讲义9

信号博弈:(一)什么是信号博弈?
模型
(1)参与人:两个,信号发送者S和信号接收者R;S的 类型是私人信息,R的类型是公共信息(即只有一个类 型)。 (2)博弈顺序: 1、“自然”N首先选择S的类型ti,S知道,但R不知道。 只知道S属于类型ti的先验概率p(ti)。 2、S观测到类型ti后发出信号mj 3、R观测到S发出的信号mj,使用贝叶斯法则从先验概 率得到后验概率,然后选择行动ak。 4、R和S的收益都是ti ,ak, mj 的函数。
不同类型声明方偏好相同
2X2 声明博弈3:独裁声明博弈
独裁者行为 枪毙 谋反者 无辜者 释放 行为方
声明方
嫌疑犯类型
(-1,2) -1 2 (-1,1)
(-2,-1) -2 -1 (1,0)
行为方对声明方类型无差异
2X2 声明博弈4:猜子声明博弈
声明方 猜单 单数 双数
猜子方行为 猜双
行为方
握子方类型
0.4
a1 m1 R a2
(3,1)
(4,7)
试给出以上信号博弈的所有纯战略分离均衡和混同均衡
声明博弈:(一)什么是声明博弈?
模型 (1)参与人 )
声明方和行为方。声明方是发出声明的一方。声明方有 多种类型,声明方知道自己的类型,而行为方不清楚, 因此声明方的类型是声明方的私人信息。行为方是根据 声明方的声明作出行为选择的另一方。行为方有多种行 为可以选择,但只有一种类型。 为了便于分析,我们还引入了虚拟的参与人“自然”。
声明博弈的分离均衡(2)
实话反说,即声明方t1声明:t2,t2声明:t1也构成一个精炼贝叶斯纳什均衡。
给定先验概率p (t1)=p,声明方t1声明:t2,t2声明:t1,行为方看到:t1,后验概率p (t2| :t1)=1,选择最优行动a2(1>-1),行为方看到:t2,后验概率p (t1| :t2)=1, 选择最优行动a1(1>-1)。给定行为方的后验概率和行动,声明方的最优战略是t1声 明:t2(2>-2),t2声明:t1(2>-2)。这反过来又与行为方的信念吻合。因此构成精炼贝 叶斯纳什均衡。

博弈论的几个经典模型ppt课件

博弈论的几个经典模型ppt课件

博弈论的几个经典模型
22
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作 为个人 ) 他自己的最好策略,还是采用 ( 作为集 体的一员)他们共同的最好策略?前者导致均衡 策略 ( 坦白,坦白 ) ,支付为 (-8 , -8) ;后者的最 好策略是 ( 抵赖,抵赖 ) ,支付为 (-1 , -1) 。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
第四章 博弈论的几个经典模型
1
引言
博弈论又被称为对策论(Game Theory), 按照2005年因对博弈论的贡献而获得诺贝尔经 济学奖的Robert Aumann教授的说法,博弈论 就是研究互动决策的理论。所谓互动决策, 即各行动方(即局中人[player])的决策是相互 影响的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也需要 把别人对于自己的考虑也要纳入考虑之 中……在如此迭代考虑情形进行决策,选择 最有利于自己的战略(strategy)。
此外此外还与会计学还与会计学统计学统计学数学基础数学基础社会心理学社会心理学以及诸如认识论与伦理学等哲学分支有重要联以及诸如认识论与伦理学等哲学分支有重要联博弈论的几个经典模型按照按照aumannaumann所撰写的所撰写的新帕尔格雷夫经新帕尔格雷夫经济学大辞典济学大辞典博弈论博弈论辞条的看法辞条的看法标准的标准的博弈论分析出发点是理性的博弈论分析出发点是理性的而不是心理的而不是心理的或社会的角度或社会的角度

《博弈论与信息经济学讲义》第9章 信号传递与机制设计

《博弈论与信息经济学讲义》第9章 信号传递与机制设计
本必须大于价值; • 送礼物,不送现金;(依赖送礼的原因) • 送别人自己不会买的东西最合适。
解释中国人送礼习惯
• 月饼的流通,不是为了吃; • 名烟名酒的价格为什么如此高? • 请客吃饭不在吃的是否舒服,而是请客
的人花了多少钱。所以饭馆的档次越来 越高。 • “谁送礼不知道,谁不送礼都知道”。
婚姻习惯
举例
• 人们对婚前性行为和婚外性行为态度的 变化:在封闭的社会,婚前和婚外性行 为都很容易观察;在流动的社会,有些 能观察到,有些不能;如果被观察到的 只是其中的一小部分,被观察到压力将 会减少;
• 官员腐败问题。
• 有熟人在场,陌生人面前表现也不同。
信息不完全导致社会规范变迁
• 如果是完全分离均衡,每类人的行为都是特定 的;
• 如果是混同均衡,所有人的行为不是一样的; • 如果是准分离(混同)均衡,有些行为传递信
息,有些行为不传递信息; • 如果外部因素导致社会由分离均衡转向混同均
衡或准分离均衡,社会规范就会发生变化。
售股票会引起股价下降); • 融资选择;
资本雇佣劳动理论
0.8
临界能力
0.2。 0
100
个人财富
风险投资问题
• 风险资本投资是“选人”,信息不对称 最为严重;
• 创业者自己的“抵押投资”很重要;
好人好事
• “人上一千,样样居全”; • “坏人”想浑水摸鱼,“好人”如何把
自己与“坏人”区别开来? • 办法是做更多的“好事”。
第9章 信号传递与社会规范
信号传递
• 信息不对称可能导致潜在的交易不能进 行;
• 但在许多情况下,为了获得交易带来的 收益,拥有私人信息的一方会主动揭示 自己的私人信息;

博弈论完整版PPT课件

博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战

博弈论PPT资料整理

博弈论PPT资料整理

博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。

1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。

2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。

博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。

于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。

中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。

博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。

生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。

而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。

特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。

由此可见,博弈论是适合所有人的科学。

在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。

博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。

可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。

从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。

9博弈论方法及其模型


江西财经大学 信息学院 2007-2008
3
经济数学模型与计算机仿真
囚徒的困境(Prisoners’ Dilemma) 博弈论中最著名的模型,1950年图克(Tuker)提出 囚徒A的战略: 坦白或抵赖 囚徒B的战略: 坦白或抵赖
囚徒B 坦白 囚徒A 坦白 抵赖
(8,8) (10,0)
(0,10) (1,1)
江西财经大学 信息学院 2007-2008
6
经济数学模型与计算机仿真
完美信息动态博弈和不完美信息动态博弈 “完全信息”指的是每一个参与人都对其他所有参与人 的特征、战略空间及支付组合(主要是支付组合)有准 确的知识;否则,称为“不完全信息”. “完美信息”指动态博弈中轮到行动的参与人对之前的 博弈进程完全了解的知识.
画线法:针对对手的每一
战略,找到自己的最优战略, 并在其支付值下面画线,最 后,双方同时画线的战略组 合就是纳什均衡
U 参与人A C D
L
参与人B M
R
(2,12)
(0,12) (0,12)
(1,10)
(0,10) (0,10)
(1,12)
(0,11) (0,13)
江西财经大学 信息学院 2007-2008小猪源自稳定的结果: 大猪按,小猪不按
大猪 按 不按

不按
(5,1) (9,1)
(4,4) (0,0)
江西财经大学 信息学院 2007-2008
5
经济数学模型与计算机仿真
静态博弈、动态博弈和重复博弈 博弈的次序也是博弈很重要的因素,有些博弈中的所有参 与人是同时选择战略的,但更多博弈中的参与人是先后选择战 略的,也有的博弈是反复或重复进行的. 静态博弈是指在博弈中所有的参与人同时选择战略,或者 虽然不是同时选择战略,但是后选择的参与人不知道先选择的 参与人的战略的博弈. 动态博弈是指在博弈中各参与人是按某种规则分先后行 动,并且后行动者知道先行动者的战略的博弈.

声誉模型

假设公众认为政府有两种类型:强政府(从不制 造通货膨胀);弱政府(有可能制造通货膨胀)
公众推断强弱政府的方法:一旦制造通货膨胀就 认定为 政府为弱政府

Company Logo
政府的效用函数
政府在有限期内选择何时不制造通货膨胀?
假定政府的单阶段效用函数:
W 1 2 b( e )
T阶段(最后阶段)建立不制造通货膨胀的声誉
已没有意义,弱政府的最优选择是
公众的通货膨胀预期为
政府的效用水
平是:
弱政府的效用是P的增函数,这就是弱政府为什 么有积极性建立强声誉的原因

Company Logo
令 为政府的贴现因子。如果弱政府在T-1选
择不制造通货膨胀,弱政府的总效用为:
Company Logo

代入贝叶斯法则并重新安排得到:
即公众越是认为政府是强政府,弱政府选择不制 造通货膨胀的概率就越高

Company Logo
如果政府在T-1阶段选择零通货膨胀率政策是 最优的,那么,在所有的t<T-1阶段选择零 通货膨胀率都是最优的.因此,如果 ,我们有如下精炼贝叶斯均衡(混同均衡):
针锋相对表示的是重信用讲义气,冷酷战略代表 的是绝不原谅对方的任何背信弃义的行为

Company Logo
双方非对称信息
考虑囚徒1.如果他在t=1(第一阶段)首选选择 C,暴露自己是理性的(因为非理性的囚徒绝不 首先选择C),从t=2阶段开始,两个囚徒都将 选择C,直到T(最后阶段),这是一个均衡
这个结果意味着即使小小的不确定性也会导致合 作行为,如果博弈重复的次数足够大
从上容易验证不论p多小总存在一个T*使得对所 有的T〉T*在T=1时对理性囚徒1不是最优的, 类似结论对理性囚徒2也成立

博弈论最全完整ppt 讲解


完全信息
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
不完全信息
贝氏纳什均衡 (BNE)
完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈;
相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈

博弈论(第八、九章)


类型:自然首先选择参与人的类型,参与人自己知道,其他参与人不 -不完全信息 知道。 知道。---不完全信息 行动:行动有先有后,后行动者能观测到先行动者的行动,但不能观 -动态博弈 测到其类型。 测到其类型。---动态博弈 但是,参与人是类型依存型的,每个参与人的行动都传递有关 自己类型的信息,后行动者可以通过观察先行动者的行动来推断自 己的最优行动。先行动者预测到自己的行动被后行动者利用,就会 设法传递对自己最有利的信息。 不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与 人不断修正信念的过程。
行为方(城管)行为 偷懒 认真 1 1 小贩 2 0 声明方 类型 2 0 非小贩 1 1
声明方和行为方对对方不同类型存在不同偏好,但这种偏好 正好是相反的。这时候,声明方说实话对自己显然是不利的,因 此他不愿意说实话。而且,行为方对声明方的声明也不会轻易相 信。所以,此时信息的传递机制不存在。
第二节典型不完全信息动态博弈模型 声明博弈
声明博弈有效传递信息的几个必要条件: (1)不同类型的声明方必须偏好行为方的不同行为。 (2)对应声明方的不同类型,行为方必须偏好不同的行为。 (3)行为方的偏好必须与声明方的偏好具有一致性。
第二节典型不完全信息动态博弈模型 离散型声明博弈的一般模型
设声明方有I种可能的类型,行为方有K种可能的行为,这种博弈模 型可用如下方式表述: A.“自然”从声明方类型集T={t1,…,t2}中以概率分布p(t1),…,p(ti)随 机抽取声明方的类型ti,p(ti)>0。 B. 声明方观察到ti后,从T中选择tj作为自己声明的类型。tj可以与ti 相同,也可以不相同。 C. 行为方在了解声明方的声明tj后,在自己的行为空间A= {a1,…,ak}中选择自己的行为ak。 D.声明方的得益为Us(ti,ak),行为方的得益为Ur(ti,ak)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档