西方经济学-完全信息静态博弈实验

合集下载

第二章 完全信息静态博弈

第二章 完全信息静态博弈

两寡头间的囚徒困境博弈
厂商2
不突破
厂 不突破 商 1 突破
突破
4.5,4.5
5,3.75
3.75,5
4,4
以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5
2.3.2 反应函数(划线法)
古诺模型的反应函数
(0,6) R1(q2)
Cont…

反应函数: *
P
* 2
P 1
1 * ( a1 d1 P 2 ) 2b 1
2.3 无限策略分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 豪泰琳模型
2.3.1 古诺的寡头模型
企业Cournot模型 (无限策略博弈) 古诺( Cournot ,1838)比纳什(1950)定义早100年 假设条件: 1. 在一个寡头市场上两企业生产销售同质产品,市场 总产量Q = q1+q2 (两寡头企业就是指这两家企业 垄断了某一行业的市场) 2. 市场出清价格 P = 8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 两企业同时独立地决定各自的生产产量(q1, q2) 问题:两家企业应如何决策?
2.2.2

纳什均衡与一致预期
一致预期:基于信念的选择是合理的;支持选择的 信念是正确的; 预期的自我实现:如何所有人认为这个结果会出现, 这个结果就会出现。预期是自我实现的,预期不会 错误。如果你认为我预期你将选择X,你就真的会 选择X。

2.2.3 纳什均衡与严格下策反复消去法
上策均衡定是纳什均衡,但纳什均衡不一定是上策均衡 命题2.1:在n个博弈方的博弈 G {S1 ,Sn ; u1 ,un } 中,如 * * 果严格下策反复消去法排除了除 (s1 , sn ) 之外的所有策 * * 略组合,那么 (s1 , sn ) 一定是该博弈的唯一的纳什均衡 命题2.2:在n个博弈方的博弈中G {S1,Sn ; u1,un } 中,如 * * , sn )是 果 (s1 G 的 一个纳什均衡,那么严格下策 反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严 格下策反复消去法简化博弈是可行的

西经第八讲.完全信息静态博弈.ppt

西经第八讲.完全信息静态博弈.ppt

重复剔除劣策略
• 在海战博弈中,将军K认为将军I会选择北, 因为这是弱占优策略,因此,将军K在考虑 中就放弃了I会选择南这个想法。从而博弈 成为:
将军I

K将军

2,-2

1,-1
重复剔除劣策略
• 此时,将军K就有了一个强占优策略-北。 • 因此,策略组合(北,北)就是重复占优
均衡。
重复剔除劣策略
• 剔除严格劣策略与剔除弱被占优策略之间 存在两个区别。
– 其次,剔除弱被占优策略存在多均衡问题。如 果存在占优策略均衡,那么就一定是唯一的。 如果是重复剔除严格劣策略,均衡存在的时候 也一定是唯一的。剔除弱被占优策略就可能存 在多均衡,因为剔除的顺序就很重要。考虑下 面的博弈:
重复剔除劣策略

c1
博弈规则
• 参与人 • 行动 • 支付 • 信息
– 知道对手的支付,但是不知道对手的行动
博弈的标准型表示
• 例如双变量矩阵
囚徒2
沉默 招认
囚徒1 沉默 -1,-1 -9,0
招认 0,-9 -6,-6
求解博弈
• 策略
– 策略与行动不可区分
• 均衡概念
– 占优策略 – 重复剔除严格劣策略 – 纳什均衡
纳什均衡
建模者困境

抵赖
坦白
抵赖 0,0
-10,0

坦白 0,-10
-8,-8
纳什均衡
• (坦白、坦白)是弱占优均衡,也是重复 剔除均衡,也是强纳什均衡。
• 不过,(抵赖、抵赖)是另一个纳什均衡。 这个结果没有上面的均衡强,但是是帕累 托最优。
• 均衡精炼:向基本的均衡概念增加限制, 直到仅仅剩下一个均衡为止。Fra bibliotek纳什均衡

完全信息静态博弈

完全信息静态博弈

三 纳什均衡
n 纳什均衡与占优战略均衡及重复剔除的占优均 衡:
n (1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡;
n (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
第二章 完全信息静态信息博弈-纳什均衡
n 一 占优战略均衡 n 二 重复剔除的占优均衡 n 三 纳什均衡 n 四 混合战略纳什均衡 n 五 纳什均衡存在性及相关讨论 n 六 纳什均衡应用举例
一 占优战略均衡
n 完全信息静态博弈 ü 完全信息:每个参与人对所有其他参与人的特
征(包括战略空间、支付函数等)完全了解 ü 静态:所有参与人同时选择行动且只选择一次。 ü 同时:只要每个参与人在选择自己的行动时不
四 混合战略纳什均衡
n 社会福利博弈
政府
流浪汉
寻找工作 流浪
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
猜谜游戏
v两个儿童各 拿一枚硬币,
v若同时正面 朝上或朝下, A给B 1分钱,
v若只有一面 朝上,B给A 1分钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。
正面 反面
正面
反面
1 -1,
-1 1,
-1 1,
1 -1,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
n 警察与小偷
1万元
酒馆 东边
小偷
警察
警察与小偷的最优策略各是什么?

博弈论_完全信息静态博弈

博弈论_完全信息静态博弈
– 策略式表述 (Strategic form), and – Extensive form
——
本章主要介绍博弈的策略式表述
博弈的策略式表述
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
参与人集合
– N人博弈的参与人集合,往往也记为N。参与人 则记为i, i∈ N – 参与人i的策略集,记为Si ,其中的一个特定策 略,可记为si.有si ∈ Si.
——
v(a)=0, v(b)=100, v ©=101
In a word, any other function w for which w(a) < w(b) < w(c)
博 弈 论• 讲 义 完 全 信 息 静 态 博 弈
预备知识:理性选择理论 (Theory of Rational Choice)
——
博弈的策略式表述
博 弈 论 讲 义 完 全 信 息 静 态 博 弈
– Si中的元素 si 表示参与人i的一个具体策略
– 一旦确定了所有参与人的策略,便形成了一个 博弈局势,表示为s=(s1, s2, … sN),s∈S。
——
博弈的策略式表述
博 弈 论 • 参与人i的支付函数 讲 – 参与人 i的支付函数,是从博弈局势集 义 S=S1×S2 …× SN 到实数集R的一个映射,记为 ui(s1, s2, … s N),表示参与人i对局势s = (s1, s2, … sn) 完 的偏好。 全 信 • 一个博弈可以表示为 息 G = {S1, … ,SN; u1, … ,uN, i ∈N} 静 态 • 这就是博弈的策略式表述 博 弈
偏好关系 (preference relation)
– 假定
• 决策者可以比较对任意一对行动的偏好(优于、等 价、劣于)。称满足上述条件的行动集的偏好关系 为完全的(complete) • 对于决策者来说,若行动a优于行动b,则可记为

第2章完全信息静态博弈

第2章完全信息静态博弈

存在问题
▪ 伯特兰德模型之所以会得出这样的结论,与它的前提假 定有关。从模型的假定看至少在以下两方面的问题:
▪ ①假定企业没有生产能力的限制。如果企业的生产能力 是有限的,它就无法供应整个市场,价格也不会降到边 际成本的水平上。
▪ ②假定企业生产的产品是完全替代品。如果企业生产的 产品不完全相同,就可以避免直接的价格竞争。
演唱会
李 亚
足球
2,1

演唱会 -1,-1
0,0 1,2
某策略组合只有指向的箭头,没有 指离的箭头,则为稳定性的策略组合
猜硬币方

硬 币
正面
方 反面
正面
方面
-1,1 1,-1
1,-1 -1,1

弈上 方
1

博弈方2



1,0 1,3 0,1
0,4 0,2 2,0
1.3 画线法
由于决策的原则是使自己的得益尽可能的 大。同时由于一方的得益取决于其他方的策 略。
s
令p 为商店i的价格,D (p ,p ) 为需求函数, i=1,2。
i
i 12
如果住在x左边的将都在商店1购买,而住在xs右边的将在商店 s 2购买,需求分别为:
D =x,D =1-x,
1
2
这里x满足 p1+tx=p2+t(1-x)
解上式,得需求函数分别为: D1(p1,p2)=x=(p2-p1+t)/2t D2(p1,p2)=1-x=(p1-p2+t)/2t
第二章
博弈论——完全信息静态博弈
static games of complete formation
完全信息静态博弈

完全信息静态博弈实验

完全信息静态博弈实验
己的收益
在实验中,通常会设定每个策略都 有一个相应的收益值,这些收益值 可以是正面的,也可以是负面的。 参与人的目标是在给定其他参与人 策略选择的情况下,选择一个最佳
的策略,以最大化自己的收益
2
实验步骤
设定参与人数和策略 数量
确定每个参与人的策 略选择
分析博弈结果:包括 最佳策略选择、博弈 均衡以及影响因素等
的策略来增加自己的收益
除了得出最优策略组合外,实验结果还 可以分析不同因素对博弈结果的影响。 例如,参与人的风险偏好、信息不完全 程度、时间限制等因素都可能对博弈结
果产生影响
4
完全信息静态博弈实验是一种经 典的博弈模型,常用于分析策略 选择和决策行为。通过实验可以 得出最优策略组合以及不同因素 对博弈结果的影响。在实际应用 中,完全信息静态博弈也可以用 于研究各种不同领域的问题,例 如经济学、政治学、社会学等。 通过分析不同因素对博弈结果的 影响,可以更好地理解各种问题 的本质和规律,为决策提供参考
完全信息静态博弈实验还可以用 于研究人类的决策行为和心理。 例如,通过实验可以观察到人们 在面对风险和不确定性时的决策 偏好和行为特点。此外,完全信 息静态博弈实验还可以用于研究 人类的合作和竞争行为,以及如 何通过合作和竞争来实现共赢
结论
-
XXXX
感谢观看
汇报人:xxxx
时间:20XX.XX.XX
-
完全信息静态博弈实验
完全信息静态博弈实验
67 LOREM
完全信息静态博弈是一种经典的博弈 模型,其特点是参与人在进行决策时, 对于其他参与人的策略选择和收益情 况都有完全的了解。这种博弈模型常 用于分析策略选择和决策行为,以及
研究不同因素对博弈结果的影响

完全信息静态博弈:纯策略均衡——学经济

完全信息静态博弈:纯策略均衡——学经济

完全信息静态博弈:纯策略均衡——学经济
我们从熟悉的寡头博弈的例子开始。

假定在某个寡头市场上,只有甲、乙两个厂商每个厂商都有合作和不合作两个可供选择的策略。

如果两个厂商都采取台作的策略(例如,组成卡特尔,且均按照卡特尔的协议行事),则分别可得到5和6个单位的支付:如两个厂商都采取不合作的策略(例如,像古诺模型中假定的那样),则分别只得到2和3个单位的支付;如果甲厂商采取合作的策略而乙厂商采取不合作的策略(如前者遵守卡特尔的协议价格,后者违背卡特尔的协议价格,秘密地降价),则采取合作策略的甲厂商得到1个单位的支付,采取不合作策略的乙厂商得到5个单位的支付:最后,如果甲厂商采取不合作的策略而乙厂商采取合作的策略,则采取不合作策略的甲厂商得到7个单位的支付,采取合作策略的乙厂商得到1个单位的支付。

第二讲、完全信息静态博弈

第二讲、完全信息静态博弈

由表2-2可以看出,无论大猪选择什么策略, 小猪选择按按钮,对小猪是一个严格劣策略, 我们首先加以剔除。在剔除小猪按按钮这一 选择后的新博弈中,小猪只有等待一个选择, 而大猪则有两个可供选择的策略。在大猪这 两个可供选择的策略中,选择等待对大猪是 一个严格劣策略,我们再剔除新博弈中大猪 的严格劣策略等待。剩下的新博弈中只有小 猪等待、大猪按按钮这一个可供选择的策略, 就是智猪博弈的最后均衡解,从而达到重复 剔除的占优策略均衡。
一、占优策略均衡
占优策略(dominant strategies)是指这 样一种特殊的博弈:某一参与人的策略可 能并不依赖于其他参与人的策略选择。换 句话说,无论其他参与人如何选择自己的 策略,该参与人的最优策略选择是惟一的。 (一)囚徒困境
以博弈论中最为著名的囚犯困境(prisoner’s dilemma)为例,说明占优策略均衡原理。两个合伙 作案的犯罪嫌疑人被警方抓获。警方怀疑他们作案, 但警方手中并没有掌握他们作案的确凿证据。因而, 对两个犯罪嫌疑人犯罪事实的认定及相应的量刑完 全取决于他们自己的供认。假定警方对两名犯罪嫌 疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都 无法观察到对方的选择。同时,警方明确地分别告 知两名犯罪嫌疑人,他们面临着以下几种后果可以 用表2-1表示。该表又称为“收益矩阵或得益矩 阵”。从表2-1中可以看出,每个犯罪嫌疑人都有 两种可供选择的策略:供认或不供认。而且,每个 犯罪嫌疑人选择的最优策略不依赖于其同伙的策略 选择,
第二种情况也不会发生,就像囚徒不能指望 别人不坦白而自己坦白一样。没有人天真到 会相信别人能替自己赔钱。在金融信息快到 几分钟甚至几秒钟就可以从世界一端传递到 另一端的情况下,各国中央银行不可能悄悄 地将他们的美元储备抛出又不惊动他人。国 际间的货币兑换其实都是透明的,一个国家 的外汇储备从一种货币换作另一种货币的交 易不可能隐藏到不被披露出来。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
15
Problem
实验中存在的问题:1、大家相互商量窜通的现象并未完全杜绝,依然存在。2、试验进程有
些缓慢。由于试验秩序并未达到预期的有序,导致工作人员记录试验数据与试验进程并不同

改进方法:1多组同时进行,试验数据先在纸上记录,等全部进行完后再填制电子版,可加
快实验进程。
2抽取博弈双方时应该有时间差,应该先使一方选取牌后,再进行抽取对手,让
静态博弈:指参与者同时采取行动, 或者尽管有先后顺序,但后行动者不知 道先行动者的策略。
The Game Theory
博弈论
03
纳什均衡
Company name-Presentation
假设有n个局中人参与博弈,如果 某情况下无一参与者可以独自行动而 增加收益(既为了自身利益的最大 化,没有任何但都的一方愿意改变其 策略的),则此策略组合被称为纳什 均衡。所有局中人策略构成的一个策 略组合。纳什均衡从实质上说是一种 非合作博弈状态。
相冲突的
14
Strengths
Company
优点:在进行决策之前双方的机会 都是均等的,并且在自己决策之前 不知道对方的决定,在没有外界特 殊因素的影响下,实验是公平的。 无论对方选择先出牌,还是后出 牌,都不会影响游戏的公平性,因 此,出牌的先后顺序都不会影响博 弈的最终受益,达到了静态博弈 缺点:实验室一组一组进行的,进 程缓慢
(1)两人同时出红牌,则两人都将获得7元收益; (2)两人同时出黑牌,则两人都将获得11元收益; (3)两人出牌颜色不同时,出红牌的同学获得16元收 益,出黑牌的同学获得0元收益。
06
About Experiment
通过参加完全静态博弈实验让我们明白:个人理性可能会导 致集体的不理性(每个人都追求自身利益的最大化,所以 博弈双方都选择对于自己最理性的方案——出红牌,但与
应根据自己和对方பைடு நூலகம்牌的颜色确定并记录自己的
实验收益。
05
About us
二)实验规则
3、前4轮(第1-4轮)的博弈收益组合如下:
(1)两人同时出红牌,则两人都将获得5元收益; (2)两人同时出黑牌,则两人都将获得6元收益; (3)两人出牌颜色不同时,出红牌的同学获得11元收 益,出黑牌的同学获得0元收益。 4、后4轮(第5-8轮)的博弈收益组合如下:
收益 最重 要。 即汝 欲得 之, 必先
策略 分析 的核 心是 学会 换位 思考
班里 的学 生套 路多
知之
18
现实生活中类似“囚徒困境”的例子
全球环境问题::发达国家为了维持自己的强势地位不肯放弃 高消耗高消费的生产生活方式,甚至出口不合格的商品,转嫁 危机,发展中国家既要解决温饱,又在缺乏资金和技术的条件 下走粗放的工业化道路,即使牺牲环境也在所不惜。 价格战:厂家价格大战的结局是“纳什均衡”,结果是谁都没 有钱赚。因为博弈双方的利润正好是零,竞争的结果是稳定 的,达到了“纳什均衡”。这个结果可能对消费者是有利的, 但对厂商而言是灾难性的,因为它无疑是一种自杀。 宿舍卫生:面临打扫与不打扫,不想打扫的人认为宿舍总会有 人打扫,因此,最后的结果是,都想着会有人打扫,而最终没 人打扫。
Company name-Presentation
囚徒困境
02
/The Game Theory
博弈论又被称为对策论,既是现代数 学的一个新分支,也是运筹学的一个重 要学科。博弈论是二人在平等的对局中 各自利用对方的策略变换自己的对抗策 略
基本概念中包括局中人、行动、信 息、策略、收益、均衡和结果等。其中 局中人、策略和收益是最基本要素。局 中人、行动和结果被统称为博弈规则。
一)实验说明
1、每位实验者的角色均为电器销售商,应在每 轮实验者
做出是否降价的策略选择,在实验过程中实验教 师(工作人
员)将向每名同学发放一张红色和黑色扑克牌, 其中红色扑
克牌代表“降价”,黑色扑克牌代表“不降价”。
2、每位实验参与者均以追求收益最大化为目标, 在每轮
实验中实验者只能出两张中的一张扑克牌,每个 实验参与者
其选择出牌策略,这样可以有效避免两者窜通。
16
前四轮收益矩阵
红桃 β
黑桃
α
红桃
黑桃
5,5
11,0
0,11
6,6
后四轮收益矩阵
α
红桃
黑桃
红桃
7,7
14,0
β
黑桃
0,14
11,11
0197
5 Golden Rules
1
不要 选择 严格 劣势 策略
2
3
4
5
理性 人的 理性 理性 选择 造成 了次 优的
Company name-Presentation
07
Pie Chart
各轮红牌比例饼状图
第六轮, 48.21 第五轮, 44.64
第一轮 98.21
第四轮, 64.29
第二轮, 73.21
第三轮, 73.21
Company information
12
The Line Chart
各轮红牌比例变化折线图
纳什均衡达成时,并不意味着博 弈双方都处于不动的状态,在顺序博 弈中这个均衡是在博弈者连续的动作 与反应中达成的。纳什均衡也不意味 着博弈双方达到了一个整体的最优状 态,需要注意的是,只有最优策略才 可以达成纳什均衡,严格劣势策略不 可能成为最佳对策,而弱优势和弱劣
势策略是有可能达成纳什均衡的0。4
第一轮
第二轮
第三轮
第四轮 系列1
第五轮
第六轮
13
The Result From
Experiment
从实验数据统计
中可以看出红牌
数量呈下降趋
势,而黑牌数量
呈上涨趋势,从
这种态势可以看
出我们的实验结
果与实验最终目
的是背离的,但
是总体来说,此
实验还是最终证
明了在非零合博
弈中帕累托最优
与纳什均衡是互
Company name-Presentation
完全信息静态博弈实验
01
Story
警察抓住了两个作案后的嫌疑犯,关在不同 的屋子里面接受审讯。虽知其有罪,但缺乏 证据,警察告诉两人:若果两人都抵赖,各判 刑一年;若果两人都坦白,各判八年;若果 其中一人坦白,另一人抵赖,坦白的一方无 罪,抵赖的判十年。于是,每个囚徒都有两 种选择:坦白和抵赖,然而,不管同伙选择 的是什么,每个囚徒的最优选择是坦白。若 果同伙坦白,自己也坦白的话,判八年。比 起抵赖的判十年,坦白还是比抵赖的好。结 果,两个嫌烦都选择坦白,都判刑八年。若 果两个都抵赖,各判一年,显然这个结果 好,但他们双方无法窜通,所以不能确定对 方是否会选择抵赖,所以才导致两个嫌疑犯
此同时双方利益却不能实现最大)。
红,红
RESULT
前四轮各得5元, 后四轮各得7 元。
红,黑
RESULT
前四轮红方得11 元,黑方不得。 后四轮红方得16 元,黑方不得。
黑,黑
RESULT
前四轮各得6 元,后四轮各得
11元。
黑,红
RESULT
前四轮黑方不得, 红方得11元。后 四轮黑方不得,
红方得16元。
相关文档
最新文档