第七章-博弈论实验讲解学习

合集下载

《博弈论:原理、模型与教程》第07章 子博弈精炼Nash均衡 第02节 子博弈精炼Nash均衡的求解

《博弈论:原理、模型与教程》第07章  子博弈精炼Nash均衡  第02节  子博弈精炼Nash均衡的求解

《博弈论:原理、模型与教程》第二部分完全信息动态博弈第7章子博弈精炼Nash均衡7.2 子博弈精炼Nash均衡的求解(重点!)(已精细订正!)定义7-1虽然给出了子博弈精炼Nash的定义,但没有说明如何求解子博弈精炼均Nash衡。

下面以图6-8 中扩展式博弈为例,介绍一种最常用的求解子博弈精炼Nash均衡的方法—逆向归纳法。

(讲!)考察图6-8中的博弈。

参与人1在博弈开始时(即在信息集}{)(11x I 上面临两种选择—行动A和行动B 。

参与人1此时选择哪种行动呢?对于理性的参与人1来讲,只会选择使自己支付最大化的行动。

从图6-8很容易知道参与人1选择行动B 时所得到的支付为2;但是,如果参与人1选择行动A ,则所得支付就要取决于参与人2在信息集}{)(22x I 上的选择,以及博弈达到决策结3x 时参与人1在信息集}{)(31x I 上的选择。

也就是说,参与人1选择行动A 所得支付,取决于子博弈)(2x Γ的结果。

因此,为了确定参与人1在博弈开始时的选择,就必须确定参与人1选择行动A 的所得支付,而为了确定参与人1选择行动A 的所得支付,就必须先求解子博弈)(2x Γ。

如何求解博弈)(2x Γ呢?可以采用同样的方法来求解子博弈)(2x Γ,即在求解子博弈)(3x Γ的基础上,确定参与人2在信息集}{)(22x I 上的选择,从而求解子博弈)(2x Γ。

由以上分析可以得到图6-8中博弈的求解过程:首先求解博弈树中最底层的子博弈)(3x Γ得到子博弈)(3x Γ的结果为(3,0)(即参与人1选择E );再求解博弈)(2x Γ,容易得到博弈的结果(1,1)(即参与人2选择D ); 最后求解原博弈,即子博弈)(1x Γ,得到博弈的结果为(2,1)(即参与人1选择B )。

(讲!)考察更一般的情形。

对于图7-6中的博弈树,参与人i 在信息集})({i i x I 选择行动L 还是行动R ,取决于选择行动L 和行动R 所带来的后果。

第七章 博奕论(Game Theory教材课程

第七章  博奕论(Game Theory教材课程

max

u1
即该博奕的纳什均衡解
max u 2
maxu1 maxu2
U1 Uq12
q2
6q2 6q1
2q1 2q2
0 0
的解,
求解上述方程组:
q 1 * q 2 * 2 , Q 4 u 1 1 , u 2 4 , u 1 u 2 8
标志着博奕论的初步形成。 50年代,合作博奕发展到鼎盛阶段,非合作博奕开始出现 纳什和夏普里的讨价还价模型, 塔克的“囚徒困境” 60年代以后,selten,Haysany,Krops,Wilseen
“信誉问题模型” (动态不完全信息博弈) 最近十多年,博弈论几乎贯穿了整个微观经济学,产业组
织理论和企业制度理论,并扩展到宏观经济学,环境、劳动、 福利经济学等领域。
新厂商的市场进入问题
B
打入
A
打击
(0,10)
和平共处
(-2,3)
(5,5)
6.博奕进程的信息
完美信息博奕:在动态博奕中,博弈方对博弈的进程, 即次此行为前各博奕方的行为完全了解
非完美信息博弈:
完全信息博弈:博奕各方完全了解所有博奕方各种策 略组合下得益情况 非完全信息博弈:
7.2.2博弈的主要分类
1 3、赢得(利益):参加博奕各方从博奕中所获得的 利
益 支付矩阵,博弈树
零和博奕:各博奕方赢得的代数和为零 非零和博奕:各博奕方赢得的代数和不为零
4.均衡:所有博奕方的最优策略的组合
博奕分析的目的是使用博奕规则决定均衡
5.得益的信息
完全信息博奕:博奕各方完全了解所有博奕方各种策略 组合下得益情况的博奕,如囚徒困境和田忌赛马。
7。3 完全信息静态博奕——纳什均衡

浙大微观经济学ch7博弈论

浙大微观经济学ch7博弈论
第七章 博弈论与决策行为

博弈论:又称对策论,是研究理性的决策主体 之间的行为相互作用时的决策以及这种决策的 均衡问题。 博弈论的应用是微观经济学的重要发展。

2013/6/13
2
博弈论
1944 年美藉匈牙利数学家冯 · 诺依曼( John Von Neuman )和美藉奥地利经济学家摩根斯顿 ( Morgenstern )出版经典著作《博弈论与经济行 为》,为现代博弈论的发展奠定了基础。 纳什 美国的数学家、经济学家纳什(John Nash),美籍匈牙利经济学家海萨尼 (John C. Harsanyi)和德国经济学 家泽尔滕(R.Selten)因对博弈论的卓越贡 献而获得1994年度的诺贝尔经济学奖。 海萨尼 泽尔滕
可信的威胁
2013/6/13 11
思考题

赌徒分钱?
2013/6/13
12
囚徒B 不招供 不招供 囚徒A 招供 (0,-8) (-5,-5) 招供 揿 大猪 等待 (9,-1) (0,0) 揿 (5,1) 小猪 等待 (4,4)
(-1,-1) (-8,0)
囚徒困境
智猪博弈
2013/6/13
7
博弈论相关概念

重复博弈:一个结构相同的博弈被重复多次。



在一次性静态博弈的情况下,结成共谋的每个寡头面临着 “囚徒困境”,但在重复博弈中,情况会有所不同。 若是无限次重复博弈,通过“以牙还牙”策略,寡头厂商有望 走出“囚徒困境”,取得合作解。 若是有限次重复博弈,则取得非合作均衡解。但在不能确定 终止期的有限次重复博弈中,合作解是可以存在的。 当且仅当局中人的策略组合在每个子博弈都构成纳什均衡 时,才会形成子博弈精练纳什均衡。
2013/6/13 3

《西方经济学》第七章 博弈论

《西方经济学》第七章 博弈论

21
第五节
不完全信息动态博弈
对应于不完全信息动态博弈的均衡概念是精炼 精炼 贝叶斯均衡(perfect Bayesian equilibrium). 贝叶斯均衡 这个概念是完全信息动态博弈的子博弈精炼纳 什均衡与不完全信息静态均衡的贝叶斯纳什均 衡的结合.具体来说,精炼贝叶斯均衡是所有 参与人战略和信念的一种结合.它满足如下条 件:第一,在给定每个参与人有关其他参与人 类型的信念的条件下,该参与人的战略选择是 最优的.第二,每个参与人关于其他参与人所 属类型的信念,都是使用贝叶斯法则从所观察 到的行为中获得的.
22
贝叶斯法则 贝叶斯法则是概率统计中的应用所观察 到的现象对有关概率分布的主观判断 (即先验概率)进行修正的标准方法.
23


1. 什么是占优策略均衡?什么是重复剔除的占优策 略均衡?什么是纳什均衡? 2. 什么是子博弈精炼纳什均衡?重复博弈与一次性 博弈有何不同? 3. 假定两寡头生产同质产品,两寡头的边际成本为 0.两寡头所进行的是产量竞争.对于寡头产品 的市场需求曲线为P=30-Q,其中Q=Q1+ Q2.Q1是寡头1的产量,Q2是寡头2的产量. (1)假定两个寡头所进行的是一次性博弈. 如果两寡头同时进行产量决策,两个寡头各生产 多少产量?各获得多少利润?
25

第七章
第一节 第三节 第四节 第五节
博弈论
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
第一节 博弈问题概述
一,博弈的基本概念 二,博弈的分类
2
一,博弈的基本概念
博弈论 博弈论(game theory)是研究决策主体的 行为发生直接相互作用时候的决策以及这 种决策的均衡问题的. 博弈论的基本概念包括:参与人 行动 参与人,行动 参与人 行动, 战略,信息 支付函数,结果 均衡. 信息,支付函数 结果,均衡 战略 信息 支付函数 结果 均衡

第七章 零和博弈(博弈论教程-石家庄经济学院,于振英)

第七章   零和博弈(博弈论教程-石家庄经济学院,于振英)
2014-1-9
第七章零和博弈 最小最大方法
20
第二节 零和博弈的研究方法
一、最小最大方法 (四)纳什均衡 Maximin=minimax=3 Maximin值与minimax值形成的策略 组合:(中,右)
2014-1-9
第七章零和博弈 最小最大方法
21
用最小最大方法寻找纳什均衡
甲的支付单矩阵 乙 不可行! 原因: 石头 剪刀 Maximin≠minimax 其他方法? 1 0 石头 -1 0 甲 剪刀 1 -1 布
2014-1-9
博弈论 第七章零和博弈
11
第一节
基本概念
四、零和博弈的表示方法:单矩阵 1.猜硬币者的支付单矩阵 抛硬币者 正面 反面 正面 1 -1 猜硬币者 -1 1 反面
2014-1-9
博弈论 第七章零和博弈
12
第一节
基本概念
四、零和博弈的表示方法:单矩阵 2.抛硬币者的支付单矩阵 抛硬币者 正面 反面 正面 -1 1 猜硬币者 1 -1 反面
2014-1-9
第七章零和博弈 最小最大方法
19
第二节 零和博弈的研究方法
一、最小最大方法 (三)乙(列参与人)的思想与行动 2.乙的行动:追求自身利益最大 从每列max值中寻找min值(甲的min 值,对乙有利)→ 从最大中寻找最小,minimax→ 结果:“右”列, minimax =3
2014-1-9
第七章零和博弈 最小最大方法
24
若John的期望支付相等?
p-(1-p) = -p+(1-p)→ p*=0.5 若p<0.5 John翻黑牌→预期Candy翻红牌 若p>0.5 John翻红牌→预期Candy翻黑牌

博弈论PPT课件

博弈论PPT课件

第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······

第七章、非对称信息博弈 《经济博弈论基础》PPT课件

第七章、非对称信息博弈 《经济博弈论基础》PPT课件

2.信贷配给的传统解释
经济学家或者将信贷配给解释为由外部振动引 起的一种暂时的非均衡现象,或者将其解释为政府 干预的结果(如政府人为地规定利率上限导致需求 大于供给)。
3. Stiglitz & Weiss 的解释
银行(放款人)的期望收益取决于贷款利率和 贷款人还款的概率两个方面,因此,银行不仅关心 利率水平,而且关心贷款人的风险。如果贷款风险 独立于利率水平,在资金的需求大于供给时,通过 提高利率,银行可以增加自己的收益,不会出现信 贷配给问题。
Stiglitz & Weiss 的解释
问题是:当银行不能观察借款人的投资风险时, 提高利率将使低风险的借款人退出市场(逆向选择 行为),或者诱使借款人选择更高风险的项目(道 德风险行为),从而使得银行放款的平均风险上升。
Stiglitz & Weiss 的解释
原因是:那些愿意支付较高利息的借款人正是那 些预期还款可能性低的 人。结果,利率的提高可能降 低而不是增加银行的预期收益,银行宁愿选择在相对 低的利率水平上拒绝一部分贷款要求,而不愿意选择 在高利率水平上满足所有贷款人的申请,信贷配给就 出现了。
三、激励机制设计模型
2、 分布函数的参数化方法:
max v( s(x)) f (x, , a)dx
a,s(x)
s.t.(IR) u(s(x)) f (x, , a)dx c(a) u (IC) u(s(x)) f (x, , a)dx c(a) u(s(x)) f (x, , a)dx c(a),a A
二.信号传递:Spence(1974)劳动力市场模型
雇员的教育程度可以作为信号向雇主传递有关 雇员能力的信息,因为接受教育的成本与能力成反 比,不同能力的人的最优教育程度是不同的。

博弈论实验报告

博弈论实验报告

实验名称:最后通牒博弈实验目的:通过参与博弈实验进一步认识经济学关于“理性人”假设和竞争的关系,发现经济学中理性人假设、效用函数理论等存在的缺陷和不足之处,加深对竞争及经济人假设等经济思想的认知,检验社会偏好对博弈均衡的影响。

实验准备:在本实验中需要实验者收益记录表、实验者数据汇总表、实验数据统计总表等实验表格若干份。

实验内容:从参加实验的人当中,随机地选出两个人,配对进行博弈。

随机地指定A组一个人先行动,即A有权先选择行动策略,然后B再回应。

这个博弈中,A和B两人共同分配100元,这个100元是无条件地送给两人,但条件是他们必须对分配方案达成一致。

由A提出分配方案,比如说A占百分之60,B占百分之40。

这样的一个方案,B可以接受,也可以不接受,当B 接受了以后,实验者就把这100元按A的方案分配给他们两个人(模拟,最后据得益计算实验成绩,得益高者成绩也高):如果B不接受A提出的方案,AB两个就都什么也得不到。

所以,这里面有一个博弈的过程,因为B可以否决,如果觉得自己分得的太少了,不公平,可以否决A的方案,但否决的结果是自己也什么也得不到。

就是说B惩罚了A,自己也付出了成本,失去了本来可以得到的部分,最后双方都是0了。

实验过程:1.实验人员的选择和分组(1)实验人员的选择。

采用随机数或抽奖软件随机抽取若干名同学作为实验参与者,选取2名同学作为实验工作人员,负责发放相关表格和统计数据。

(2)分组。

将选定的实验参与者分成A、B两组,A组实验者为提议者,其编号为A1,A2,A3,...;B组实验者为响应者,其编号为B1,B2,B3,...(3)座位调整。

为了避免个人关系等因素的干扰,在实验过程中不能让两组实验参与者坐在一起,应让他们隔离相向坐于教室的左右两端。

2.发放实验材料向A组实验者发放写好编号的实验卡片,向所有实验参与者发放实验收益记录表。

向A组每位实验者发放100元虚拟货币。

3.宣读展示实验说明(1)每一位实验参与者都应收益的最大化为目标。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验结果:百分比从第一组5个人匹配的43% 下降到最后5个人匹配的20%。可以看出, 参与人有合作的倾向,但当被试着获得经 验后,结验
C1(参与人 C2(参与人2) 2)
有两个纯策略纳什均衡
(R1,C2)和(R2,C1)。
还存在一个混合策略纳什 均衡,纳什理论预测选择 R2或C2的可能性是75%。
2(zz) 1/2,1 1,-1
7.2.2.2 囚徒困境博弈实 验
假定有两个潜在的进入新 市场者,决定进入(E) 或者不进入(N)。策略 组合如图所示:
N (参与人2) E (参与人2)
N(参与人1) 800,800
0,1000
E (参与人1) 1000,0
350,350
Cooper对此博弈进行了实验,实验中被试者 成对搭配,每个被试者仅碰到其他被试着 一次,被试者之间不能讨论问题和签订协 议。
支付矩阵如表所示:
纳什均衡策略为(2,1)
如果允许单边支付,冯.诺依 曼-摩根斯坦的非零和博弈 解是策略(1,2)。
Merrill报告了100次实验的结 果,pp得到0.4美元,zz得 到0.65美元。如此看来, 在现实的讨价还价中并没 有达到纳什均衡。
1(pp) 2(pp)
1(zz) -1,2 0,1/2
7.3.2埃克斯罗德重复博弈实验
支付矩阵如图。
合作B 背叛B 合作A 3,3 0,5 背叛A 5,0 1,1
第一次实验:共有15个策略。将每一策略分别和所有策略对 弈,每对策略对弈5次,每次200步,但对于参赛者而言, 什么时候结束博弈是未知的。参与人可以选择一下策略: ①“一报还一报”:第一回合合作,以后各回合均重复对 方在上一个回合中的策略:对方背叛,自己也背叛,对方 合作,自己也合作。②“弗里德曼策略”:这是一个缺乏 宽容的策略。他不首先背叛,但一旦对方背叛,就永远选 择背叛。③“道宁策略”:第一步背叛,然后每走一步, 估计自己合作或背叛之后对方合作的概率,如果对方似乎 仍然倾向于合作,则选择背叛,反之,则合作。④“乔斯 策略”:试图偶尔背叛而不受惩罚。若对方背叛则马上背 叛,但十次有一次是对方合作之后而背叛。
7.2.2实验研究
7.2.2.1纳什均衡与冯.诺依曼-摩根斯坦博弈解
实验假设:开始的阶段,人们的行为接近均衡点, 然后继续寻找更好的均衡点,最后阶段,参与人 的选择接近冯.诺依曼-摩根斯坦合作博弈解。参与 人之间的社会关系是影响博弈结果的重要因素。
假设有两个被试者PP和ZZ,他们已掌握零和博弈论, 同时知道冯.诺依曼-摩根斯坦非零和博弈论,但他 们不清楚纳什均衡理论。
7.2.2.4 n人博弈的实验
n人博弈实验的目的是为了观察同一批参与人反复进 行同一博弈的结果。这样可以使得谈判博弈具有 合作性。
G.Kalisch等做了一组n人博弈实验。在3人博弈中, 被试者被蒙住了眼睛,只能通过手势向仲裁人示 意他们的行动。在4人博弈中,每个被试人都坐在 其他人看不到的地方,他将自己的行动写在纸上。 3人博弈规则如下:
dB,C得到-(dA+ dB)。若 dA+ dB>15,3个人都得到0.若
形成一个联盟,这次博弈结束,3个人都得0.
若某个被试者(比如说A)第一步选择等待,且另一个被试 者向他提出了一个联盟叫价,则他就进行第二步,他要么 接受要么拒绝。两种情况下,这一次博弈都结束。第一种
情况下的支付是: A得到 d 15- B, B得到 dB, C得到-15.第
第七章-博弈论实验
7.2完全信息静态博弈实验
7.2.1基础理论 占优策略:是指不管竞争对手做什么,参与
人都是最优的策略。
纳什均衡:给定对手的行为,参与人自身的 最优选择。此时,参与人的策略是其他策 略的最优反映。
混合策略纳什均衡:参与人根据一组选定的 概率,在两种或两种以上可能的行动中随 机选择中得到纳什均衡。
• 重复博弈:同样结构的博弈重复多次,或者无数 次,其中的每次博弈称为“阶段博弈”。
• 特征:A、重复博弈的阶段,博弈之间没有“物 质”上的联系,即前一个阶段博弈并不改变后一 个阶段的博弈的结构;
• B、在重复博弈的每一个阶段,所有参与人都观 测到该博弈过去的历史;
• C、参与人的总收益是所有阶段博弈的收益的贴 现值之和或加权平均数。
R1(参与人 1)
R2(参与人 1)
0, 0 600,200
200,600 0,0
Cooper等的试验程序与囚徒困境博弈相同: 20个单期博弈中不同参与人相互被匹配, 使用策略2的被试者所占比重小于混合策略 预测的百分比。
Cooper等调查了允许无约束事前交流来解决 协助问题的可能性。在允许交流的情况下, 选择策略2的百分比变为80%,而被试者中 申明未协调选择的比重只有71%。
实验结果,得分最高的是“一报还一报”策 略。“弗里德曼”策略得分最低。埃克斯 罗德总结了排名靠前的策略的特点: ① 善
良性,即不做首先的背叛者。②可激怒性, 即针对对方的背叛行为给与报复 ③宽容性, 即不能没完没了的报复。
第二次实验:第二次实验规模更大,共有来 自6个国家63位参赛者,其中包括第一次实 验的所有参赛者。赛前,埃克斯罗德给每 位参赛者寄去了关于第一次比赛的分析报 告。每对策略仍对弈5次。
1、被试者A要么等待,要么提出一个叫价与被试者B或C其
中的一个结成联盟,这一叫价要列明A想得到的在将来联
盟中的份额dA(整数),参与人B和C也进行同样的第一
步——而且三个人要同时和独立地完成自己的选择。
若两个被试者(比如说A和B)彼此提出了叫价,且dA+
dB≤15,则博弈结束,并且支付如下: A得到 dA, B得到
二种情况下,3个参与人都得0.
实验结果表明,被试者选择等待策略的比 重只占了33%,而由一个被试者叫价另一 个接受而形成联盟的策略出现的比例较高。 实验结果说明同一批人反复进行同一个博 弈有利于形成合作博弈。
7.3完全信息动态博弈实验
7.3.1基础知识 逆向归纳法:该方法适用于有限次博弈, 并且参与人都是理性的,都清楚的知道博 弈树结构,参与人首先从博弈树的末端开 始,求解末端的子博弈均衡,然后继续向 前求解,直至起点。
相关文档
最新文档