第二讲:完全信息静态博弈

合集下载

第2章_完全信息静态博弈

第2章_完全信息静态博弈


前行
退让
前行
(-10,-10) (20,-2)

退让
(-2,20) (0,0)
❖ (甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈” 的纳什均衡。
3.“市场争夺战”博弈
❖ 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”, 另一个是企图进入市场的“潜在进入者”。
❖ 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个 可以选择的策略:斗争、默许。
(10,1) (2,2)
❖ 如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? ❖ 理性的嫌疑人甲会选择坦白。 ❖ 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 ❖ 类似可分析其他情况
❖ 2.通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关 等待
小猪
按开关
等待
(5,-1)
(4,2)
(10,-2) (0,0)
❖ 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈 另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会 比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按 压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。
❖ 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下 开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花 一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强 力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况 下,大猪得到的收益是 4,小猪得到的收益是 2。
❖ 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付 矩阵上方 。
❖ 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人 甲可能的策略纵向排列在博弈支付矩阵左侧。

第二章完全信息静态博弈

第二章完全信息静态博弈

第二章完全信息静态博弈2在完全信息静态博弈中,各博弈方同时决策,且所有博弈方对各方得益都完全了解。

完全信息静态博弈属于非合作博弈最基本类型。

本章介绍该类博弈的一般分析方法、纳什均衡概念及分析方法的扩展。

2.1 基本分析方法3上策均衡严格下策反复消去法划线法箭头法上策均衡4 (Dominant-strategy Equilibrium)上策(Dominant-strategy) :不管其它博弈方选择什么策略,一个博弈方的某个策略给他带来的得益至少不低于其他策略。

例:囚徒困境Idea..?5上策均衡与均衡结果:上策均衡(坦白,坦白)均衡得益(-5,-5)“坦白”相对于“抵赖”是每个囚徒的上策(优势策略)-5,-50,-8-8,0-1,-1坦白抵赖坦白抵赖囚徒B囚徒A上策均衡6 (Dominant-strategy Equilibrium)上策均衡:由每个博弈方的上策所组成的策略组合。

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。

博弈方2博弈方1A B C a3,22,35,4 b2,11,23,3 c1,61,44,5例寻找上策(优势策略)检查一下你是否存在上策,如果有,就选择它。

站在其他方的位置上思考问题如果你没有上策,那么从其他博弈方角度考虑。

如果其他博弈方有上策,预期他将选择自己的上策。

严格下策:不管其它博弈方的策略如何变化,某种策略给一个博弈方带来的得益总比另一种策略小,称前一种策略为相对于后一种策略的“严格下策”。

1,01,30,40,2左中1,01,3左中1,01,30,10,40,22,0左中右上下211,3中上例:巡逻6,24,48,00,0巡逻不巡逻穷人不巡逻富人WELCOME富人与穷人1112处于强势的博弈方为维护自己利益采取某种决策时,为其他弱势博弈方提供了搭便车的机会公司里的大股东与小股东每一个博弈方针对其他方的每一种策略,在自己的最大可能得益下划线2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争划线法13划线法:通过在最佳对策得益下划线分析博弈的方法。

博弈论2 完全信息静态博弈

博弈论2 完全信息静态博弈

上策(Dominant-strategy):
如果不管其它博弈方选择什么策略,一博 弈方的某个策略给他带来的得益始终高于 其他策略,至少不低于其他策略。
进一步,如果一个博弈的某个策略组合中 的所有策略都是各个博弈方各自的上策, 那么这个策略组合肯定是所有博弈方都愿 意选择的,必然是该博弈比较稳定的结果。 称这样的策略组合为该博弈的一个“上策 均衡”( Dominant-strategy Equilibrium)。
0,0
1,1 0,0
R2
R3
纳什均衡:举例

广告博弈
战略 做广告
企业2
做广告 不做广告 4,4 15,1 10,10
企业1
不做广告 1,15

纳什均衡:(做广告,做广告)

考虑团队生产:
工作 工作 偷懒 偷懒
6,6
8,0
0,8
2,2
2.2 纳什均衡
2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致预测性质 2.2.3 纳什均衡与严格下策反复消去法
2.1.1 上策均衡——应用
上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来 的得益始终高于其它的策略,至少不低于其他策略的策略。 囚徒的困境 中的“坦白”;双寡头削价中“低价”。
囚徒 2 坦 白 囚 徒 1 坦 白 不坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
两个罪犯的得益矩阵
纳什均衡de具体表述
寡头2 高 价 低 价 寡 头 1 高 价 低 价 100,100 20,105
150,20
70,70
双寡头的得益矩阵

(低价,低价)是纳什均衡
* * u1 (低价1 , 低价* ) u ( 高价 , 低价 2 1 1 2) * * u2 (低价1 , 低价* 2 ) u2 (低价 1 , 高价2 )

应用博弈论第二讲完全信息静态博弈

应用博弈论第二讲完全信息静态博弈
生活中其实有很多相关的例子。

生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。

例2
为什么中小企业不会花钱去开发新产品 ?

完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。

生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。

例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

第二讲完全信息静态博弈一、博弈的战略式表述strategic form representation(一)战略式表述又称为标准式表述normal form representation,在这种表述中,所有参与人同时选择自己的战略,所有参与人选择的战略一起决定每个参与人的支付。

注意:参与人“同时选择”的是战略,是参与人行动的全面计划和准则,而不是行动。

因此,战略式表述也可以用来描述动态博弈。

(二)战略式表述的组成及表示1.博弈的参与人集合:i∈Ø;Ø=(1,2,…,n)2.每个参与人的战略空间:Si,i=1,2,…,n;3.每个参与人的支付函数:ui (s1,…,si,…,sn),i=1,2,…,n。

所以,G={S1,…,Sn;u1,…,un}代表战略式表述博弈。

(三)两人有限博弈的战略式表述的矩阵表述例:囚犯困境prisoners’ dilemma囚犯B坦白抵赖囚犯A 坦白抵赖二、占优战略均衡(一)占优战略dominant strategy1.占优战略的含义:无论其他参与人选择什么战略,该参与人的最优战略是唯一的,这样的最优战略被称为“占优战略”。

2.例子:在上例“囚犯困境”中,“坦白”是囚犯A的占优战略,“坦白”也是囚犯B的占优战略。

(二)占优战略均衡dominant-strategy equilibrium1.占优战略均衡的含义:在一个博弈里,如果所有参与人都有占优战略存在,则所有参与人占优战略所组成的战略组合称为“占优战略均衡”。

2.例子:在上例“囚犯困境”中,(坦白,坦白)就是占优战略均衡。

这时,个人理性与集体理性产生了冲突。

3.注意:占优战略均衡只要求每个参与人是理性的,不要求“每个参与人是理性的”是共同知识。

三、重复剔除的占优均衡(一)例子:“智猪博弈”在绝大多数博弈中,占优战略均衡是不存在的。

在“智猪博弈”中,按下按钮可有8个单位食物,但要支付2单位成本。

若大猪先到,大猪吃7个单位,小猪吃1个单位;小猪先到,各吃4个单位;同时到,大猪吃5个单位,小猪吃3个单位。

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

第二讲完全信息静

第二讲完全信息静

第一个重要的均衡概念就是优势策略均衡 (dominant strategy equilibrium)。如果 如果 无论其他参与人选择什么策略,策略s 无论其他参与人选择什么策略,策略 i*都 是参与人i的强最佳应对 那么s 的强最佳应对, 是参与人 的强最佳应对,那么 i*就称为优 势策略。这意味着无论别人选择什么策略, 势策略。这意味着无论别人选择什么策略, si*都使参与人 的支付最大化。从数学上讲 都使参与人i的支付最大化 的支付最大化。 ui(si*, s-i) ≥ ui(si′, s-i) 对于任何 i′≠ si* 对于任何s
斗鸡博弈
妻子 进 丈夫 退 0,2 0,0 进 -3,-3 退 2,0
市场进入阻挠
在位者 默许 斗争 40,50 -10,0 0,300 0,300
进入 进入者 不进入
恩爱夫妻博弈
妻子 活着 丈夫 死了 0,-6 0,0 活着 2,2 死了 -6,0
仇恨夫妻博弈
上 甲 中 下

乙 中

0,4 4,0 3,5
4,0 0,4 3,5
5,3 5,3 6,6
性别大战
妻子 韩剧 球赛 2,1 0,0 0,0 1,2
韩剧 丈夫 球赛
不存在重复剔除优势均衡。看球赛和看韩 剧都是纳什均衡,但分别是针对不同均衡 而言。若这对恋人事先不通气,则可能出 现误会。性别战中,任一纳什均衡都是帕 累托有效的,其他任一策略都不可能在不 降低其他参与人支付的条件下提高另一参 与人的支付,即不存在帕累托改进。 但囚徒困境博弈中纳什均衡并不是帕累托 最优的。
优势策略均衡和重复剔除策略均衡对参与者的理 性要求是不同的。前者只要每个参与者自己是理 性的就可以了,而后者要求理性是参与者的共同 知识,即,参与者不仅自己是理性的,还需要其 他参与者也是理性的,并且还假定所有参与者都 知道其他参与者是理性的。 重复剔除策略均衡是建立在理性参与者不会选择 严格劣策略这一合情推理之上的,但这一方法和 严格占优策略均衡一样,有时候找不到严格劣策 略。所以,这两种解法虽然简单,但有时不奏效。

完全信息静态博弈

完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。

R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)

F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

囚徒困境博弈的标准式表述
B
抵赖 抵赖
A
坦白 -10,0 -8,-8
-1,-1 0,-10
坦白
参与人:A和B A和B各自的战略空间:(抵赖,坦白) A和B选择不同的战略组合所对应的支付 组合:(-1,-1),(-10,0), (0,-10)和(-8,-8) 其中,支付组合(和战略组合)中,前 一个元素表示A的支付,后一个元素表示 B的支付
重复剔除严格劣战略的程序: 找出并剔除某个参与人对于其他参与人选 择的任何战略的劣战略 重新构造一个不包含已剔除战略的新博弈 在新博弈中重复上述过程,直到只剩下唯 一的一组战略组合
唯一剩下的一组战略组合构成“重复剔除 的占优均衡” 重复剔除的占优均衡(iterated dominance equilibrium,IDE): 通过重复剔除严格劣战略的方式所确定 的博弈的均衡概念 完全信息静态博弈的解概念之一
博弈分析的前提:一致信念 (consistently aligned belief,CAB) 每一位犯罪嫌疑人对其他犯罪嫌疑人的 信念是一致的 每一位会对其他行为感到惊讶 一致信念的基础:理性共识
“将计就计” “将错就错” A以为B不知道A已经知道B的计划或计谋 不满足“共同知识”的假设
博弈论的基本假设之二: 犯罪嫌疑人A和B都将知道博弈的规则 (the rules of games) 或者说,博弈规则是共同知识 例如,每位犯罪嫌疑人将了解给定对方 的策略,采取不同策略可能受到的不同 惩罚
理性共识(CKR)(Aumann,1976) “囚徒困境”博弈 每个犯罪嫌疑人是理性的,每个犯罪嫌 疑人知道每个(其他)犯罪嫌疑人是理 性的,每个犯罪嫌疑人知道每个犯罪嫌 疑人知道每个犯罪嫌疑人是理性的,…
“犯罪嫌疑人A知道B是理性的” “B知道A是理性的” “A知道B知道A是理性的” “B知道A知道B是理性的” “……..”
注意:均衡和均衡结果(equilibrium outcome)不同 均衡:最优战略的组合,强调的是战略 本身 均衡结果:均衡战略所对应的支付
以“囚徒困境”博弈为例 博弈的均衡:(坦白,坦白)(为A和B 在给定对方的最优策略时最优战略的组 合) 博弈的均衡结果: (-8,-8)(为A 和B分别选择最优战略(均衡战略)时所 获得的支付组合)
(四)完全信息静态博弈的均衡概念 一个博弈为: G=(S1,…,Sn;u1,…un),其中, Si表示第i个参与人可以选择的战略空 间,ui为第i个参与人的支付 博弈分析的目的:预测博弈的均衡(结 果和均衡战略)
均衡(equilibrium):所有参与人最优 战略组合 均衡表示为s*=(s1*,…,sn*) 其中si*表示第i个参与人(给定其他参与 人的战略)的最优战略(在i的所有战略 中使i的支付最大的战略)
行动(action或moves):参与人在某个 特定时点的决策变量 ai表示第i个参与人的一个特定行动 Ai=(ai)表示可共i选择的所有行动的 集合(action set) 参与人的行动可以是离散的,也可以是 连续的
离散(变量)行动: 囚徒困境 犯罪嫌疑人i,i=A,B i的行动集合Ai=(坦白,抵赖) 连续(变量)行动: Cournot博弈
现在进一步考虑B的战略选择(最优战略反应) 对于A选择抵赖,B选择坦白的支付0大于选择 抵赖的支付-1,坦白成为给定A选择抵赖的B 的最优反应战略 对于A选择坦白,B选择坦白的支付-8大于选 择抵赖的支付-10,坦白成为给定A选择坦白 的B的最优反应战略 “博弈的对称性”
第二讲:完全信息静态博弈 和纯战略Nash均衡
中国人民大学财政金融学院 郑志刚
主要内容 博弈论的基本假设 博弈的构成要素 博弈的标准式表述 完全信息静态博弈的均衡概念 完全信息静态博弈应用举例
(一)博弈的基本假设 “囚徒困境”博弈(prisoner’s dilemma) Tucker(1950) 犯罪嫌疑人:A和B 分别监禁和审讯 从涉嫌犯罪到罪名成立:取证
B
抵赖
A
坦白 -8,-8
坦白
0,-10
对于A只能选择坦白,考虑B的战略选择: B选择抵赖的支付-10小于选择坦白的支 付-8 抵赖构成B的严格劣战略(由定义)
在剔除了B的劣战略之后剩下的唯一的战 略组合为(坦白,坦白)
B 坦白 A 坦白 -8,-8
(坦白,坦白)构成“囚徒困境”博弈的 重sh)均衡本身 是参与人战略的组合 战略组合(profile):在一个n人博弈 中,n个参与人每人选择一个战略,n维 向量s=(s1,…,si,…,sn)构成一 个战略组合 其中si是第i个参与人选择的战略
注意:战略与行动是不同的概念 战略是行动的规则,而不是行动本身 由于战略是已知其他参与人行动所做出 的“相机行动方案”,而这一特点在静态 博弈中的表现并不突出 在静态博弈中,战略和行动的区分并不 明显
一种刻画博弈的方法: 标准式表述(normal form representation) 又称为“战略式表述”(strategic form representation) (特别)适用条件: 完全信息静态博弈 博弈参与人有限(两人)
博弈的标准式表述 一个双变量矩阵表 博弈的参与人 每一个参与人可供选择的战略空间 参与人同时选择各自的战略所组成的战略组合 参与人选择的战略组合所对应的支付组合 从建模者的视角出发
“囚徒困境”博弈的“重复剔除的占优均衡 (IDE)” 考虑A的战略选择: 对于B选择抵赖,A选择抵赖的支付-1 要小于选择坦白的支付0 对于B选择坦白,A选择抵赖的支付-10 同样小于选择坦白的支付-8 抵赖构成A的严格劣战略(由定义)
理性的参与人A将不会选择劣战略“抵赖” 剔除A的劣战略“抵赖”之后新的博弈
(二)博弈的构成要素 博弈的构成要素: 参与人、行动、信息、战略、支付、结 果和均衡等 以“囚徒困境”博弈为例
参与人(player):博弈中的决策主体 两个犯罪嫌疑人A和B(两人或以上) 在理性共识的假设下,每个参与人的决 策目标是使自己的利益最大化 参与人可以是自然人,也可以是组织 (如企业和国家等) 参与人用i=1,2,…,n表示
博弈双方的相互影响(interaction) 从博弈建模者的视角:双方共同行动导 致的结果 博弈参与人共同行动所实现的行动组合 行动组合(action profile):在n人博弈 中,n个参与人的行动的有序集a= (a1,…,ai,…,an) ai为第i个参与人的行动
囚徒困境博弈 犯罪嫌疑人A和B每人有两种行动:或者 坦白,或者抵赖 可以形成四个行动组合: (A坦白,B坦白)(A坦白,B抵赖)(A 抵赖,B坦白)(A抵赖,B抵赖) 四个行动组合导致的结果不同
以“囚徒困境”博弈为例 犯罪嫌疑人A获得判刑一年的处罚(支 付,-1),不仅取决于自身选择抵赖, 而且取决于B是否同样选择抵赖 如果只有A选择抵赖,而B选择坦白,A将 获得的支付不是判刑一年,而是十年
结果(outcome):博弈的不同行动组合 所对应的不同支付组合 例如,犯罪嫌疑人A和B同时选择抵赖 (将构成一个行动组合)时,A和B对应 的支付组合(结果)为(-1,-1) 从建模者的视角出发
博弈的规则(rules of the game) 博弈参与人、行动和结果 博弈的规则为参与人的共同知识 扑克游戏 和谁在玩? 哪些行动在游戏中允许? 这些行动将带来什么后果?
(三)博弈的标准式表述
“囚徒困境”博弈 完全信息(complete information):犯罪嫌 疑人A和B对于对手的特征(理性)、战略空间、 支付函数有准确的知识 静态博弈(static game):A和B在行动顺序 上并无先后之分(A在做出行动选择时并没有 获得关于B确切行动选择的任何信息) “完全信息静态博弈”
重复剔除严格劣战略的缺陷之一: 剔除的顺序将影响最终结果 对于同一博弈,但重复剔除占优均衡不 一定是唯一的 为博弈分析预测博弈的均衡结果带来了 困难
重复剔除严格劣战略的缺陷之二: 对于很多博弈无法使用重复剔除劣战略 的方法找到均衡 结论:有必要发展新的均衡概念
(五)Nash均衡及其特征 Nash均衡(1950,1951): 在一个博弈G=(S1,…,Sn;u1,…un) 中,如果战略组合(s1*,…,si*,…sn*) 满足对每一个参与人i, si*是对于其他参 与人所选择战略(s1*,…,si-1*, si+ *, …s *)的最优反应战略,则称战略 n 1 组合(s1*,…,si*,…sn*)为该博弈的 一个Nash均衡(NE)
上述定义可以表述为: 对于任意i, Ui(s1*,…, si-1* , si* , si+1* ,…sn*)≧ Ui(s1*,…, si-1* ,si, si+1*, …sn*) 或者说, si* 为以下优化问题的解
Maxui s ,...,s , si , s ,...,s
si
{
* 1
* i−1
* i+1
* n
}
“囚徒困境”博弈的Nash均衡 首先考虑A的战略选择(最优战略反应) 对于B选择抵赖,A选择坦白的支付0大 于选择抵赖的支付-1 给定B选择抵赖,A最优反应战略是坦白 在A选择坦白对应的支付0下划一短线, 表示给定B选择抵赖,A的最优反应
对于B选择坦白,A选择坦白的支付-8 将大于选择抵赖的支付-10 给定B选择坦白,A的最优反应战略同样 是坦白 在坦白对应的支付-8下做出相同的表示
支付(payoff):博弈参与人在某一特 定战略组合下所得到的(期望)效用水 平 参与人的决策问题从而变成: 给定其他参与人的(最优)战略,选择 最优的战略以使自己的支付最大化 ui表示第i个参与人的支付 u=(u1,…,un)表示支付组合
注意:支付函数的形式 新古典经济学:非人格的价格制度,外 生给定的变量 博弈分析框架:一个参与人的支付不仅 取决于自己的战略选择,而且取决于其 他参与人的战略选择 ui是所有参与人战略选择的函数 ui=ui(s1,…,si,…sn)
相关文档
最新文档