博弈论基础

合集下载

博弈论—基本知识

博弈论—基本知识

莫里斯
维克瑞
阿克洛夫
斯宾塞
斯蒂格利茨
以色列希伯莱大学的罗伯特· 奥曼(Robert J· Aumann) 和美国马里兰大学的托马斯· 谢林(Thomas C· Schelling)“通过博弈论分析,促进了人们对冲突 和合作的理解”,以此获得了2005年诺贝尔经济学奖。
奥曼
谢林
二、什么是博弈论
• 从“齐威王田忌赛马”说起 春秋战国时期,齐威王常与旗下大将田忌赛马。 规则是:每次赛三局,每一局齐威王与田忌各出一 匹马比赛奔跑速度。每一局中的胜者赢败者一千斤 铜。田忌有上、中、下三匹马,齐威王也有上、中、 下三匹马。每次比赛,第一局田忌出上马,齐威王 也出上马;第二局田忌出中马,齐威王也出中马; 第三局,田忌出下马,齐威王也出下马。齐威王的 上马比田忌的上马好,齐威王的中马也比田忌的中 马好,齐威王的下马还是比田忌的下马好。于是, 每次比赛的结果都是田忌连输三局。
• 1944年 冯· 诺伊曼、摩根斯坦 《博弈论和经济行为》
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽 尔腾和海萨尼,这是对博弈论在经济学发展中的贡献和 作用的充分肯定,确立了博弈论在现代主流经济学中的 地位。
纳什
海萨尼
泽尔腾
1996年,两位将博弈论应用于不对称信息下机制设计的经济学 家莫里斯(Mirrlees)和维克瑞(Vickrey)、以及2001年三位经 济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞 (Spence)因运用博弈论研究信息经济学所取得的成就而成为这 两个年度的诺贝尔经济学奖得主。
田忌 上 中 下 上中下 上 下 中 中 上 下 中 下 上 下 上 中 下 中 上
3 1,-1
1,-1 1,-1 3,-3 1,-1

博弈论-入门

博弈论-入门

人接受了这五十万,其中的一个人说:“自己没有钱
,父母苦了一辈子了,临老了生病没钱医治,为了父
母,放弃了爱情吧。” ­

男人接着开出了第三个价格“500万!” ­

现场更静了,男人的第一个动作都是看身边的女
人,也许是在权衡什么。一半的男人沉默了,另一半
的男人怯生生的说:“我要爱情。”身边的女友也有
点呆住了,一个女孩子站起来说:“如果一个男人肯
去年七八月间,陈某儿子与赖某离婚;同年9月17日,陈某也 与王某办理了事实婚姻的离婚手续。仅仅四天后,陈某就与原 儿媳赖某登记结婚。结婚当天,他就向高新区公安分局户籍管 理部门申请办理儿媳、孙女的户籍迁移,欲将她们的户口迁到 上王村。工作人员将陈某的申请材料退了回来,口头告知他说 ,要迁户口,需先取得所在村委会的同意,并开具证明。
博弈 game—— “下棋”、“玩牌”,赌博和其他许 多智力游戏在内的对抗性游戏、对抗性体育竞 赛。博弈就是策略性的互动决策,通俗的说就 基于交叉效应的有意识的行为互动 交叉效应 参与人意识到交叉效应
博弈论,英文为Game theory,是研究相互依 赖、相互影响的决策主体的理性决策行为以及 这些决策的均衡结果的理论。
以利交者,利尽则散!以色交者,色衰则疏! 以貌交者,久之则腻!唯有以心交者,方能永恒!
理性
每个参与人均以获取最大支付为目标 理性内涵:对自己利益完全了解并能完美计算出何种
行动可最大化其利益 理性不意味着:
参与人自私 着眼于短期利益 与其他参与人有相同价值体系
男人无所谓忠诚,忠诚是因为背叛的砝码太低; 女人无所谓忠贞,忠贞是因为受到的引诱不够.
2
田忌策略:
结 果:
谋士孙膑 策略: 结 果:

浙大《博弈论基础》蒋文华 第七讲 最后通牒和讨价还价

浙大《博弈论基础》蒋文华 第七讲 最后通牒和讨价还价

眼光的高度
请问:您最大的人 视野的宽度
生目标是什么? 5年后,10年后,
思维的深度
目标
20年后,30年后?
与时俱进


目 标

方法
踩空
现实
时间
抬头看山、低头走路
浙江大学校训
诸位来到这里,有两个问题需 要好好回答:一个是你到这里来 干什么?另一个是将来你将到哪 里去?
——竺可桢
特别提示:
“磨刀不误砍柴功”,误与不误, 取决于你想要砍多少柴!
三个道理:
第一,人们在决定其行动时,并不会仅仅 考虑到其经济利益,虽然这可能是最主 要的一个考量,他们也会考虑一些道德 和社会规范,比如公平原则,“己所不 欲,勿施于人”。
三个道理:
第二,一个社会如果在制度安排上能够 给人民更多可以拒绝(可以说“不”) 的权利,那么这个社会就会产生更多的 公平性,甚至会带来更多的效率改善。
提出分配方案
出价 X%
接受
(1-X,X) 拒绝 (0,0)
如果总金额是10万元,你的分配方案是多少?
第二节 最后通牒的实验结果
实验表明,大多数A分配给B的钱在40-50 元之间,给50元以上的情况极少见,如果 分配数量小于20元,方案被拒绝的概率很 高(约40%-50%),拒绝的可能性随着钱 数的减少而不断增大。
第三节 独裁者博弈
一、独裁博弈的设计
两人一组分100元,提议者提出分配方案,分 给响应者X元,留给自己100-X元;而无论响应 者同意与否,提议者都将得到自己的100-X元。 显然,此时提议者不会遭遇响应者的任何威胁。 基于纯粹利己的标准的博弈理论所得到的结果 将是提议者分给响应者0元(X=0)。
第二节 贴现因子

《博弈论基础》读书笔记(一)博弈标准式与纳什均衡

《博弈论基础》读书笔记(一)博弈标准式与纳什均衡

《博弈论基础》读书笔记(⼀)博弈标准式与纳什均衡在之前⼀个⽼师的安利下,还是开了这个博弈论的坑。

书是:这本书本⾝写的⾮常棒,⽽且很易懂,强烈安利。

顺便⾃⼰记录下读书的笔记和⼀些想法,同时也把书中⽐较难理解的地⽅⽤⾃⼰的理解说⼀下,希望能帮到⼤家。

第⼀章 1完全信息静态博弈在本章,我们来讨论如下简单形式的博弈(包含如下特点):1. 静态博弈:所有游戏的参与者同时选择⾏动,然后根据⾏动每个参与者得到各⾃的结果2. 完全信息博弈:即每⼀个参与者的收益函数在所有参与者之间是共同知识,即不存在信息的不对称性,也就是说每个参与者对游戏规则以及游戏演化机理完全明⽩。

关于本章的结构:在1.1节中我们先会介绍两个问题:1. 如何描述⼀个博弈问题2. 如何求得博弈问题的解在1问题中我们定义了博弈的标准式表述和严格劣战略的概念,在2问题中我们根据前⾯的介绍引出了纳什均衡的概念。

在1.2节中我们会运⽤前⾯的⼯具来分析古诺(Cournot,1838)的不完全竞争模型,使⽤纳什均衡的⽅式对之进⾏求解,之后我们将重回理论知识,我们将会定义混合战略,它可以理解为⼀个参与者并不能确定其他参与者会如何⾏动时应该选的战略,之后会引出纳什定理。

1.1节博弈的标准式和纳什均衡1.1.A 博弈的标准式表述⾸先举⼀个⼤家都⽐较熟悉的、很经典的例⼦:囚徒困境警⽅逮捕甲、⼄两名嫌疑犯,但没有⾜够证据指控⼆⼈⼊罪。

于是警⽅分开囚禁嫌疑犯,分别和⼆⼈见⾯,并向双⽅提供以下相同的选择:若⼀⼈认罪并作证检控对⽅(相关术语称“背叛”对⽅),⽽对⽅保持沉默,此⼈将即时获释,沉默者将判监10年。

若⼆⼈都保持沉默(相关术语称互相“合作”),则⼆⼈同样判监1年。

若⼆⼈都互相检举(相关术语称互相“背叛”),则⼆⼈同样判监8年。

对于这个博弈我们可以来使⽤如下矩阵来进⾏描述对于这个矩阵,其横纵轴分别为囚徒1、2所对应的选择。

⽅框⾥的值第⼀项代表在此选择下,囚徒1 的收益情况,第⼆项代表囚徒2的收益情况。

浙大《博弈论基础》蒋文华 第六讲 混合策略和监督博弈

浙大《博弈论基础》蒋文华 第六讲 混合策略和监督博弈
11????????????????wvwtcwvfct不检查检查不偷懒偷懒不偷懒偷懒tthwhwtwft??????????11????混合策略均衡解
第六讲 混合策略与监督博弈 第十三章 混合策略 第十四章 监督博弈
第十三章 混合策略
第一节 概念及说明
纯策略和混合策略 纯策略:如果一个策略要求参与者在每一个给定 信息情况下只选择一种特定的行动。 混合策略:如果一个策略要求参与者在给定信息 情况下以某种概率分布随机地选择不同的行动。
运用均衡的理念(P154)
当达到纳什均衡的时候,任何一方都不愿意改 变自己的策略。
即对于雇主来说: T检查 (C F) (V W C)(1 ) T不检查 (W) (V W)(1 )
当T检查=T不检查的时候达到均衡。
同理,对于雇员来说:T偷懒 (F ) (W )(1 ) T不偷懒 (W H ) (W H )(1 )
T总=V-H- CV
二、抵押金
V代表雇员创造的 价值,t代表雇员 为公司服务的时间, W代表薪水。
课堂讨论:
A企业起薪高,涨薪慢;B企业起 薪低,涨薪快。你会选哪一个?
特别提示: 选一些难学的专业,成功的路并 没有你想象的那么拥挤!
谢谢
THANK YOU
浙江大学、浙江工商大学和中科院理论物理研究 所的研究人员通过实验发现了石头剪刀布的一个 制胜策略。研究人员招募了360名学生,将他们 分成六组,随机配对玩300轮石头剪刀布游戏, 在每一轮中获胜的学生将会获得少量人民币奖励 。通过观察学生使用的策略,他们发现了获胜者 或失利者习惯使用的游戏策略。
简单说,如果你的剪刀输给了对手的石头,那么下一 轮你更有可能出能战胜石头的布;而如果你是获胜者 ,那么下一轮你更有可能沿用相同的出手。赢家保持 现状输家做出改变的策略(胜留败走)。 石头剪刀布的制胜策略:如果你是输家,下一轮换用 能打败对手的出手;如果你是赢家,下一轮不要再使 用原来的出手。也就是说,你用石头打败了对手的剪 刀,那么下一轮你不能再出石头,而应该出剪刀,因 为对方很有可能会出布。

博弈论基础 (罗伯特.吉本斯 著) 中国社会科学出版社 课后答案

博弈论基础 (罗伯特.吉本斯 著) 中国社会科学出版社 课后答案

+
B)i V
′′(I
p
V ′′(I p − B)

B)
+
kU
′′
2
(S
*
+
B)
+
U

2
(S
*
+
B)i V
′′(I
p
kU
′′
2
(S
*
+
B)

B
)
+
kU
′′
2
(
S
*
+
B)
hda =
U

2
(S
*
+
B)i V
′′(I
p
kU
′′
2
(S
*
+
B)

B)
+
kU
′′
2
(
S
*
+
B)
.k > 0 = f (S′)
www So S* < S′ . If child save more, i.e. S′ , both the parent’s and child’s payoffs could be
)2
+
(1 −
π
)
1 i( 2
aL − 2
c
)2
)
.
22
1−δ
In
period
with
demand aH , payoff from deviating is
(aH − c)2 ; 2
in period with
demand

第六章、合作博弈 《经济博弈论基础》PPT课件

与摩根斯特恩提出来的概念,有时被 记为VN-M解。记所有可能分配组成的集合为E(V),则稳定 集定义如下:
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。

博弈论基础知识汇总

博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支, 目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。

一种是“进化博弈论方法”。

它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。

另一种新方法是“重复博弈论方法”,它运用更精细的均衡概念,如“子博弈精炼均衡”来分析历史与现实中的制度选择与变迁过程。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。

其中局中人、策略和收益是最基本要素。

局中人、行动和结果被统称为博弈规则。

博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈、从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

博弈论看法博弈论的基本假设:参与人追求利润最大化。

博弈论 基础 数学

博弈论是一门研究决策问题的学科,它主要关注如何在有限的资源和信息条件下进行决策,以及不同决策对于结果的影响。

在博弈论中,人们通常会将所有可能的决策结果,以及不同决策结果的概率、收益等因素进行抽象和计算,从而得到最优决策方案。

博弈论的基础数学包括以下几个方面:
1. 集合论和命题逻辑:
-博弈论中的集合是指由一组元素组成的对象,在集合论中,可以用各种符号和运算来描述和计算不同集合之间的关系。

-命题逻辑是一种处理命题(或陈述)之间关系的方法,其中包括真值表、命题符号、蕴含关系等概念。

2. 概率论与统计学:
-在博弈论中,概率论用于计算不同决策结果的概率和期望收益,从而帮助人们进行决策。

-统计学则用于对已有数据进行分析和推断,从中发现规律、总结经验以及预测未来的趋势。

3. 线性代数:
-线性代数是一门研究向量空间和线性变换的学科,它在博弈论中被广泛应用于处理矩阵、向量、线性方程组等问题。

4. 最优化理论:
-最优化理论是一种研究如何在限制条件下找到最优解的方法,它在博弈论中被用来寻找最优决策方案。

5. 数理逻辑:
-数理逻辑是研究符号语言和推理的学科,它在博弈论中主要用于形式化建模和证明博弈论中的结论。

综上所述,博弈论的基础数学包括集合论、命题逻辑、概率论与统计学、线性代数、最优化理论和数理逻辑等多个方面。

掌握这些数学知识对于理解和应用博弈论具有重要的意义。

经济博弈论基础-第五章、动态贝叶斯博弈


2、博弈顺序
(1)自然首先选择囚徒1的类型,囚徒1知道自己的类型, 囚徒2只知道囚徒1属于理性的概率是1-p,非理性的概率是p;
(2)2个囚徒进行第一阶段的博弈;
(3)观察到第一阶段博弈结果后,进行第二阶段博弈; 观察到第二阶段博弈结果后,进行第三阶段博弈;如此等等。
(4)理性囚徒1和囚徒2的支付是阶段博弈的支付的贴现 值之和(假定贴现因子δ=1)。
2、Ross (1977) 模型:用负债比例显示企业质量
问题:什么因素决定企业的资本结构? Ross (1977) 模型:资本结构的信号传递理论
如果内部经理和外部投资者之间存在信息不对称,资本结 构就可以通过传递内部信息对企业的市场价值发生影响。经理 使用企业的负债比例(负债占总资产的比重)向投资者传递企 业利润分布的信息,投资者把较高的负债率看作是企业高质量 的表现,因为低质量的企业不敢用过度举债的办法模仿高质量 的企业。 越是好的企业,负债率越高。
s i
i
(B)Pi ( i
a
h i
)
是局中人
i观测到
a
h
和最优策略
i
s
*
i
(

)
后,使
用贝叶斯法则从先验概P率i (i i ) 得到的。
六、不完美信息博弈的完美贝叶斯纳什均衡
例1:完美贝叶斯纳什均衡是{M, U; p=1}
1
L (1, 3)
U
M [p] R [1-p]
2
B
U
B
(2,1) (0,0) (0,2)
(0,1)
第三节 信号传递博弈
一、信号传递博弈 两个局中人: 1是信号发送者;2是信号接受者
不完全信息: 局中人 1的类型是私人信息; 局中人 2 的类型是公共信息(只有一个类型)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

参见:行为生态学(behavioral ecology)。

约翰·冯·诺依曼博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

博弈论思想古已有之,中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。

1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。

1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。

1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的策墨洛(Zermelo)基础。

纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。

此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的学科。

编辑本段诺贝尔奖从1994年诺贝尔经济学奖授予3位博弈论专家开始,共有5届的诺贝尔经济学奖与博弈论的研究有关,分别为:1994年,授予美国伯克利加利福尼亚大学的约翰·海萨尼(J.Narsanyi)、普林斯顿大学约翰·纳什(J.Nash)和德国波恩大学的赖因哈德·泽尔滕(Reinhard Selten)。

1996年,授予英国剑桥大学的詹姆斯·莫里斯(James A. Mirrlees)与美国哥伦比亚大学的威廉·维克瑞(William Vickrey)。

2001年,授予美国加州大学伯克莱分校的乔治·阿克尔洛夫(George A. Akerlof )生于1940年、美国斯坦福大学的迈克尔·斯宾塞(A. Michael Spence )和美国纽约哥伦比亚大学的约瑟夫·斯蒂格利茨(Joseph E. Stiglitz)。

2005年,授予美国马里兰大学的托马斯·克罗姆比·谢林(Thomas Crombie Schelling)和耶路撒冷希伯来大学的罗伯特·约翰·奥曼(Robert John Aumann)。

2007年,授予美国明尼苏达大学的里奥尼德·赫维茨(Leonid Hurwicz)、美国普林斯顿大学的埃里克·马斯金(Eric S. Maskin)以及美国芝加哥大学的罗杰·迈尔森(Roger B. Myerson)。

作为一门工具学科能够在经济学中如此广泛运用并得到学界垂青实为罕见。

编辑本段基本概念(1)决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。

(2)对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的决定,并且他的动作是滞后的、默认的、被动的,但最终占优。

他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。

(3)局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

(4)策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

(5)得失(payoffs):一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。

所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

(6)次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

(7)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。

在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。

所谓纳什均衡,它是一稳定的博弈结果。

纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

也就是说,此时如果他改变策略他的收益将会降低。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A的收益不会超过他采取原来的策略a*的收益。

这一结果对局中人B亦是如此。

这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a,b*)≤偶对(a*,b*)≥偶对(a*,b)。

对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a,b*)≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。

有了上述定义,就立即得到纳什定理:任何具有有限纯策略的二人博弈至少有一个均衡偶。

这一均衡偶就称为纳什均衡点。

纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。

通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。

纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。

但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。

塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。

编辑本段博弈类型博弈的分类根据不同的基准也有不同的分类。

一般认为,博弈主要可以分为合作博弈和非合作博弈。

合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。

完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。

不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。

非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。

博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型,等等。

编辑本段纳什均衡定义纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。

假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。

所有局中人策略构成一个策略组合(Strategy Profile)。

纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。

即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

纳什均衡,从实质上说,是一种非合作博弈状态。

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。

纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。

相关文档
最新文档