MBA必修课程《博弈论》第二部分：穷途困境与纳什均衡

合集下载

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡？1、纳什均衡（Nash equilibrium )，又称非合作博弈均衡，是博弈论概念，指的是：一种博弈稳定结果，谁单方改变策略，谁就会损失。

两个囚徒互相揭发，就是一种纳什均衡。

对于每个囚徒来说，如果打破纳什均衡，在对方实施揭发策略时，改变揭发策略，保持沉默，自己就会由判刑2年，变成判刑5年。

也就是说，两个囚徒互相揭发是稳定博弈结果，谁单方改变策略，就会受到损失。

这也就是均衡涵义所在，两个囚徒从利己角度，都不会单方改变策略。

博弈策略稳定，博弈结果也稳定。

之所以命名为纳什均衡，是因为提出者是经济学家、博弈论创始人约翰．纳什。

之所以称为非合作博弈均衡，原因就是：两个囚徒如果合作，互相保持沉默，各自只要坐牢1年；但最终博弈结果，也就是纳什均衡显著特征，是不合作。

2、纳什均衡意义重大。

纳什均衡提出，震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说：“你只要教会鹦鹉说‘需求和供给’，它也是经济学家。

”博弈论专家坎多瑞则说：“这只鹦鹉现在必须多学一个词了，那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说：“发现纳什均衡意义，可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡，创立博弈论，而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大，简单来说，就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理，就知道，古典经济学认为，通过市场这只‘看不见的手’调节，个体追求私利行为，会促进集体利益最大化。

但纳什均衡却违反上述原理：两个囚徒分别追求私利行为，并没有促进集体（囚徒整体）利益最大化，反而是损人不利己。

这正是市场失灵软肋之处，通过博弈论视角可以得到合乎逻辑解释，更有条件找到合适解决方案。

从上述这点，读友们可以“一斑窥全豹”，感受到博弈论重要性。

更重要的是，纳什均衡非常普遍，小至个人沟通，中到公司竞争，大到国家往来，都可以观察到。

Q2：怎样运用纳什均衡？1、分析囚徒困境。

博弈论中的纳什均衡

博弈论中的纳什均衡纳什均衡，Nash equilibrium ,又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》（1950）的博士论文。

该博士论文导致了《n人博弈中的均衡点》（1950）和题为《非合作博弈》（1951）两篇论文的发表。

纳什在上述论文中，介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念，也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

定义：纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。

也就是说，此时如果他改变策略他的支付将会降低。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

纳什均衡的经典范例就是囚徒博弈，但是研究博弈论常常会使人陷入一种只追求个人利益的误区，事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设，并不总能说明事实。

只是假定他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。

也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。

没有人会主动改变自己的策略以便使自己获得更大利益。

“囚徒的两难选择”有着广泛而深刻的意义。

个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。

大学课程《博弈论及其应用》PPT课件：第二章(1234节)

博弈方2
左
中
右
上博弈方1
下
1，0 0，4
1，3 0，2
0，1 2，0
图 2-7 划线法
博弈的相对优势策略位置在图2-7标出，策略组合{上，中}格子中的两个数字下面都划了短线，这个格子对应的策略组合就是由划线法得到的纳什均衡。
第四节箭头方法
还有一种寻找纳什均衡的方法，和划线法的分析理念的出发点不同，这种方法的思路是对博弈中的每个策略组合进行分析，判断各博弈方是否能够通过单独改变自己的策略而改善自己的得益，如果可以，则从所考察的策略组合的得益引一个箭头到改变策略后的策略组合对应的得益。这样对每个可能的策略组合都分析考察过以后，根据箭头反映的情况来判断博弈的结果。
博弈方2
Hale Waihona Puke 左中上博弈方1
下
1，0 0，4
1，3 0，2
右
0，1 2，0
图 2-8 箭头法
观察图2-8，在策略组合{上，中}中只有指向的箭头，没有指出的格子所代表的就是纳什均衡。
略“上”改变的倾向，用一个竖着的箭头表示这个倾向；横着比较后面的得益，4比2大，4比0大，博弈方2没有改变的动力。在策略组合{上，左}中，横着比较后面，分析博弈方2 的得益，3比0大，1比0大，所以博弈方2有从策略“左”向
策略“中”和策略“右”改变的倾向，用两个横向的箭头表示这两个改变的倾向。
在策略组合{上，中}中，竖着比较前面的得益，还是横着比较后面的得益，博弈方1和博弈方2都没有改变的倾向。在策略组合 {上，右}中，竖着比较前面，2比0大，博弈方1有从策略“上”
向策略“下”改变的倾向，用一个竖向的箭头表示这个倾向；横着比较后面，3比1大，博弈方2有从策略“右”向策略“中” 改变的倾向，用一个横向的箭头表示这个倾向。

第二讲纳什均衡

猎人博弈得益矩阵
乙
猎鹿打兔
10
4 0
甲
猎鹿
10 0
4 4
打兔
4
博弈论故事之五－－高薪养廉
• “高薪养廉”是公务员制度方面的一种理论，我们分高薪养廉”是公务员制度方面的一种理论，析一下“高薪”为什么能养廉？析一下“高薪”为什么能养廉？ • 假设甲乙为一家单位的主任和书记关系密切的国家公务员，代表现在政府给他们的高薪如果两人受贿，代表现在政府给他们的高薪。务员，7代表现在政府给他们的高薪。如果两人受贿，因为串谋而一时不被人发现，他们可以达到9的位置的位置；因为串谋而一时不被人发现，他们可以达到的位置；而一旦“东窗事发” 他就要被撤职查办，而一旦“东窗事发”，他就要被撤职查办，不受贿一方得8 方得 • 画出得益矩阵
美苏争霸的囚徒困境
• 军备竞赛的博弈：从军事上看，二三十年前美国和前苏联是世界军备竞赛的博弈：从军事上看，上的两个超级大国，他们相互对垒。上的两个超级大国，他们相互对垒。假定每一方都有两种策略选一个是扩军，发展核武器，实施“星球大战”计划等；择：一个是扩军，发展核武器，实施“星球大战”计划等；另一个是彻底裁军，直至不设军备。个是彻底裁军，直至不设军备。 • 如果双方都扩军，则各花费2000亿美元用于军费。彻底裁军，则如果双方都扩军，则各花费亿美元用于军费。亿美元用于军费彻底裁军，军费为0。军费为。 • 如果美军不设防，但前苏联扩军，前苏联就可以任意欺负和损害如果美军不设防，但前苏联扩军，美国，这样，美国会受到很大损失，直至丧失主权。我们记得益美国，这样，美国会受到很大损失，直至丧失主权。？，假定为亿美元。为－∞；而苏联又会是多少呢？为＋∞？，假定为；？，假定为10000亿美元。亿美元反之也成立。反之也成立。

博弈论课件第二章

2.3 无限策略博弈分析和反应函数
2.3.1 古诺的寡头模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性
2.3.1 古诺的寡头模型
假设条件：
市场总产量Q q1 q2 市场出清价格 P P(Q) 8Q 边际成本c1 c2 2，无固定成本两厂商同时决定各自产的量
2.2.1 纳什均衡的定义
博弈、博弈方的策略空间和得益的一般表示法 G 表示一个博弈； n个博弈方；
S1,S2, ,Sn表示每个博策弈略方集的合可，空选称间为 ”“ ； sijSi表示博 i的弈第 j个方策略；博弈i的方得益 ui表用示ui，是各博弈方策函略数的；多元
★★★学习博弈论，大家一定要记忆一些基本的模型。因为很多
时候，我们总是基于已有的模型，对其做出修订来考察一些新的问题。完全创新的模型是很少见的，当我们记忆的模型多了，就很容易在分析问题时套用模型，并修订模型的条件来考察自己研究的问题。
其实大家学习西方经济学理论的时候，会发现它与大家曾接触的马克思主义经济学理论，以及国内一些逻辑思辩型的经济学研究范式一个很大不同就在于，它采取的是一种模型化的思维。我们学习西方经济学的时候，会发现始终在学习一些模型，因为模型是帮助我们简单地理解现实世界的有用工具。经济学中的数学模型，其实与生物课教学的塑料人体模型等在本质上并无不同。
左
中
右
博弈的解：（上，中）
博上弈方一
下
1，0 0，4
1，3 0，2
0，1 2，0
2.1.3 划线法
囚徒困境
囚坦白徒 1 不坦白
囚徒 2 坦白

浅析囚徒困境与纳什均衡

浅析囚徒困境欧阳学文囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。

囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。

囚徒困境在生活中最常见的表现就是挤公共汽车。

从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。

学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。

但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。

可见“减负令”难以见效，中小学生课业负担不减反增。

又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。

可是，我错了吗？没有。

当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。

人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。

可是，我对了吗？没有。

”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。

含泪的“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。

再看中国的法治之路。

虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。

绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。

不过，任何事物都有两面性，“理性”过了头也就成了非理性。

这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。

我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法治。

但囚徒困境一定是坏事吗？就以囚徒困境的经典案例来说，作为一个比喻，我们会为囚犯不能合作而遗憾；可是如果它发生在现实中，我们就巴不得他们不能合作。

第二讲纳什均衡 PPT课件

二、情侣博弈的结论：纳什均衡（三）分类 2.普通纳什均衡（1）均衡战略与非均衡战略无差异（2）参与人单独改变策略后，支付可
能不变
2020年1月5日
博弈论第二章
12
第二讲纳什均衡
第三节纳什均衡
三、寻找纳什均衡的方法
团队合作
（一）严格劣势策略反复消去法
乙

工作偷懒
工作
6,6
+1，-1
+1，-1 +1，-1
博弈论第二章第二讲纳什均衡
-1，+1
+1，-1 +3，-3
37
博弈论第二章
33
第二讲纳什均衡
第三节纳什均衡
四、纳什均衡在微观经济学中的应用：古诺模型
1.博弈三要素（3）支付
i (q1, q2 ) (a q1 q2 ) qi ciqi
2020年1月5日
博弈论第二章
34
第二讲纳什均衡
第三节纳什均衡
四、古诺模型
2.企业i的目标： max i
二、情侣博弈结论：纳什均衡（一）表述若存在一个策略组合（足球，足球），
当参与人单独改变策略后，支付下降，此策略组合为纳什均衡。 ——博弈各方相互作用的稳定结局
2020年1月5日
博弈论第二章
9
第二讲纳什均衡
第三节纳什均衡
二、情侣博弈的结论：纳什均衡（二）定义
给定G=｛S1，…,Sn;u1,…,un｝, s*=(s*1,…,sn*) 对于所有i和si∈Si，有： ui(si*,s-i*)≥ ui(si’,s-i*)
2020年1月5日
博弈论第二章
23
第二讲纳什均衡

纳什均衡与囚徒困境

交通拥堵中的纳什均衡
在交通拥堵中，如果所有驾驶员都选择走某一条路，那么这条路就会变得非常拥堵。
如果一个驾驶员选择走另一条路，那么他可能会更快地到达目的地，但其他驾驶员也可能会效仿，导致另一条路也变得拥堵。
纳什均衡在交通拥堵中的表现为：所有驾驶员都选择走同一条路，形成一种稳定的交通状态。
公共资源中的纳什均衡
建立信任
通过建立信任机制，让囚犯相信对方不会出卖自己，从而都
选择抵赖。
引入第三方监管
由第三方监管机构介入，制定规则并监督执行，确保双方都遵守规则。
改变奖励机制
改变奖励机制，使得双方都选择抵赖成为最优解，例如将坦白惩罚变得更重。
增加沟通机会
让囚犯有更多的沟通机会，了解对方的想法和处境，从而更
企业竞争中的囚徒困境
价格战
01
企业为了争夺市场份额，可能会采取降价策略，但这种策略可
能导致整个行业的利润下降。
技术研发
02
企业在研发新技术时面临投入不足或过度投入的困境，如何平
衡研发投入与市场收益是一大挑战。
广告策略
03
企业在广告投放上可能存在囚徒困境，过多的广告投入可能增
加品牌知名度，但也可能导致广告费用过高而降低利润。
01
02
03
公共资源是指那些不属于任何个人或组织的资源，如海洋、森林、空气等。
在公共资源的使用中，如果每个人或组织都过度使用资源，那么资源将会被耗尽或使用资源，导致资源的过度消耗和破坏，形成一种稳定的竞争状态。
05 囚徒困境的实例分析
促进学科发展
纳什均衡与囚徒困境的研究推动了博弈论和其他相关学科的发展，促进了学术交流和知识创新。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Page 32
如果其他牧民约束放牧规模，我单独一家人过度放牧不会破坏广褒的牧场，但自己却获得了高额的收益。因此，任何一位牧民的结论都会是：无论其他牧民是否过度放牧，我选择“约束自己的放牧规模”都是劣战略，从而被剔除。大家最终都会选择过度放牧，结果导致草地消失，生态破坏。
内蒙古草原的沙漠化
三、囚徒困境详解和延伸
1、囚徒困境详解
Page 17
囚徒乙
S i 称为占优策略，或占优于其他策略坦白
抵赖
囚徒甲坦白 -8，-8 0，-10
抵赖 -10，0 -1，-1
占优策略均衡囚徒甲
坦白抵赖
囚徒乙
坦白
抵赖
-8，-8
0，-10
-10，0
-1，-1
Page 18
每个参与人组成的优势策略称为占优策略均衡。甲和乙都不会选择劣战略“抵赖”，称为“剔除劣战略的占优战略均衡”。其中“坦白”是占优于(优于)“抵赖”的占优战略。
2、囚徒困境特点
Page 19
•利己、理性
•非合作
•存在严格劣策略
囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。
参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。
解决方案
Page 7
这么一直迭代下去，理论上如果所有学生都是理性人。平均数应当是1。应该说选择了1的学生都看出了这个博弈的窍门。但是他们的选择不是最接近平均数的。因为在现实中不可能所有人都是理性人。
最终12是最接近平均数2/3的数。
案例——囚徒困境
Page 8
两个嫌疑犯甲和乙作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。
这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建的原因。同样的道理，国防、教育、社会保障，环境卫生等都由政府承担资金投入，私人一般没有积极性承担这方面服务的积极性和能力。
案例（2）苏格兰的草地消失了
Page 30
在18世纪以前，英国苏格兰地区有大量的草地，其产权没有界定，属公共资源，大家都可以自由地在那里放牧。草地属于“可再生资源”，如果草场，但如果不限制放牧规模，过多的牛羊将草吃得一光二净，则今后不会再有新草生长出来，草场就会消失。
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。
Page 38
“纳什均衡”对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。《国富论》中有这样一句名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益”。从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。
在一个特定的战略组合下参与人得到的确定效用水平，或是指参与人得到的期望效用水平。
均衡equilibrium:指所有参与人的最优战略的组合。
囚徒甲
坦白抵赖
囚徒乙
坦白
抵赖
-8，-8
0，-10
-10，0
-1，-1
二、分类
•合作与非合作 •信息、动态
完全信息静态、动态不完全信息静态、动态
Page 14
不顾及团体利益。“囚徒的困境”问题都是个体理性和集体理性的矛盾引起的。
以全体利益而言，如果两个参与者都合作保持沉默，两
人都只会被判刑1年，总体利益更高，结果也比两人背叛对
方、判刑8年的情况较佳。
囚徒乙
坦白
抵赖
囚徒甲
坦白抵赖
-8，-8 -10，0
0，-10 -1，-1
囚徒困境的启示
Page 37
解决方案
Page 5
假设每个人都选择100，平均数100×2/3＝66.66。所以不能选择67-100之间的数（严格劣势策略）。现实中有两名学生选择了。剔除了step1中的严格劣势策略后，重复迭代， 66×2/3＝44。所以不能选择44-67之间的数（弱劣势策略）。现实中有四名学生选择了。
3、囚徒困境结论
Page 20
结论1 不要选择严格劣势策略，因为选择优势策略，我们每次
都能得到更好的收益. 结论2
汝欲得之，必先知之。结论3
站在别人的立场上去分析他们会怎么做。
思考1
Page 21
如果你是个“恶魔饭桶”，你的对手是个“愤怒天使”，这种情况下我们该怎么办？
博弈论信息整理表格如下
5、如何走出囚徒困境？
Page 35
从以上例子我们可以看出：生活中存在着大量的“囚徒困境”事例，有很多对我们的生活与合作不利。那么怎样才能有效避免囚徒困境的出现，从而改善我们的生活呢？
囚徒困境延伸——合作：团体理性
Page 36
若要不是经济学，理性的选择，反而是选择优势策略
（次优的结果），即帕累托效率。
Page 31
由于草地的产权没有界定，政府也没有对放牧作出规模限制，每家牧民都会如此盘算：如果其他牧民不约束自己的放牧规模，让自己的牛羊过多地到草地上吃草，那么，我自己一家约束自己的放牧规模规模对保护草场的贡献是微乎其微的，不会使草场免于破坏；相反，我也加入过度放牧的行列，至少在草场消失之前还会获得一部分短期的收益。
如果其他国家拥有这个鱼群，假设这个鱼群在大西洋，如果其他国家打算正常捕捞，你应该也会正常捕捞。如果其他国家不打算减少捕捞量，那么你现在就想把鱼捞出来，因为没准明天就会没鱼可捞了。
思考5
Page 26
全球变暖和碳排放问题大家能理解碳排放也是一种囚徒困境吗？
4、囚徒困境案例
Page 27
（1）政府要负责修建公共设施
恶魔饭桶
α
β
愤怒天使 α 0，0 -1，1
β 3,-3 1，1
21
Page 22
大揭秘
正确答案选，因为是优势策略，是
劣势策略。
22
思考2 市场进入阻挠（静态）
Page 23
在位者
默许
斗争
进入进入者
不进入
40,50 0,300
-10,0 0,300
思考3
Page 24
价格竞争
两家互相打价格战的企业，可能会陷入囚徒困境。为什么？
设想有两户相居为邻的农家，十分需要有一条好路从居住地通往公路。修一条路的成本为4，每个农家从修好的好路上获得的好处为3。如果两户居民共同出资联合修路，并平均分摊修路成本，则每户居民获得净的好处（支付）为 34/2=1；当只有一户人家单独出资修路时，修路的居民获得的支付为3-4=-1（亏损）
Page 12
参与人在给定信息集的情况下的行动规则，它规定参与人在什么时候选择什么行动。
战略与行动：战略是行动的规则而不是行动本身。在静态博弈中，战略和行动是相同的。战略必须是完备的，要给出参与人在每一种可想象得到的情况下的行动选择。
5、支付payoff（效用utility）
Page 13
Page 11
参与人有关博弈的知识，特别是有关自然的选择，其他参与人的特征和行动的知识。
表中每一个小方格内的数字被称为局中人的支付，其中左边的数字代表甲的支付，右边的是乙的支付。表1中的双变量矩阵称为博弈支付矩阵。囚徒乙
坦白
抵赖
囚徒甲
坦白抵赖
-8，-8 -10，0
0，-10 -1，-1
4、战略strategies
警察将两人分别置于两间房间分开审讯：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。
如何选择？
一、博弈的要素
Page 9
1、参与人 players
一个博弈中的决策主体，他的目的是通过选择行动（或战略）以最大化自己的支付（效用水平）。参与人可能是自然人，也可能是团体，如企业，国家等。囚徒困境中甲和乙是参与博弈的人，称为“局中人”。
信息和动态分类
Page 16
完全信息
静态
完全信息静态博弈；纳什均衡； Nash(1950)
动态
完全信息动态博弈；子博弈精炼纳什均衡；泽尔腾（1965）
不完全信息
不完全信息静态博弈；贝叶斯纳什均衡；海萨尼（1967-1968）
不完全信息动态博弈，精炼贝叶斯纳什均衡；泽尔腾（1975） Kreps,Wilson(1982), Fudenberg,Tirole(1991)
MBA必修课
Page 1
博弈论
(Game Theory)
目录
第Ⅰ部分博弈论导论案例诺贝尔经济学奖与博弈论
第Ⅱ部分博弈论与纳什均衡基本概念（策略、局中人）与分类囚徒困境及延伸（合作博弈、口头承诺）智猪博弈及延伸纳什均衡、零和博弈
第Ⅲ部分博弈论与其他三类博弈第Ⅳ部分博弈论与信息（与机制设计）
非合作与合作
Page 15
博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能，则称非合作博弈Non-Cooperative Game。
Collective Rationality，是效率、公平、公正。