北京大学博弈论课件第1章_博弈论概述

合集下载

博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i，对于所有的 σi∈Mi，都有ui﹙σ*﹚≥ui﹙σi，σ-i*﹚，则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中解：设猜方猜正方的概率为p，猜反方的概率则为1－
无名氏（大众）定理
无名氏定理：在无穷次重复的由n个游戏者参与的博弈里，如果在每一次重复中博弈的行动集是有限的，则在满足下列三个条件时，在任何有限次重复中所观察到的任何行动组合都是某个子博弈完美均衡的惟一结果：
条件1：贴现因子接近于1；条件2：在每一次重复中，博弈结束的概率或等于0，或为非常小的一个正值；条件3：严格占优于一次性博弈中的最小最大收益组合的那个收益组合集是n维的。
博弈方
博弈方：独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略
策略：博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可
游戏和经济等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用
游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊朗、以色列和巴勒斯坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) （或称支付，或得益）

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u}，其中N=（1,2)， Si={(0,2),(1,1),(2,0)}，ui (s1, s2) = ri，i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败，成功
成功，失败
成功，失败
失败，成功
成功，失败
成功，失败
《博弈论》课程
（一）什么是博弈论
我们首先看几个例子。例1 石头、剪刀、布
猪八戒
石头石头孙悟空剪刀布未定，未定找水，休息休息，找水剪刀休息，找水未定，未定找水，休息布找水，休息休息，找水未定，未定
2
例2 诺曼底登陆
德军
加来设防加来登陆盟军
诺曼底登陆成功，失败
诺曼பைடு நூலகம்设防成功，失败
9
例4 进攻与防守双方争夺一个据点，有两条进攻路线X和Y，攻方有两个军，而防守方也有两个军，只有当守方的兵力不少于攻方时，才能击退进攻，否则据点将会失守。首先可知守方的防守方案（即策略）为(0,2)，(1,1)，(2,0)，即在X 线路和Y线路驻扎军队数，同样可以到的攻方的进攻方案(0,2)，(1,1)和(2,0)。容易看出，行动并非策略，策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心，因而博弈论对于各门社会科学而言，就具有了方法论意义，成为各门学科的有力分析工具。
6
（二）博弈表达的科学式
（1）博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来科学地描述一个博弈，就称为博弈表达的策略式（或基本式、标准式）。

博弈论最全完整ppt-讲解

能提供万无一失的应对办法。
例1：无谓竞争（The GPA Rat Race）
你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀， 40％的人能得良好。
所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
问题是，大家都这么做。这样一来，所有人的成绩都不比大家遵守协议来得高。而且，大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈德·泽尔腾， 1930 年生于德国
约翰· 海萨尼 1920年生于美国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由：前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论的论述；后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。
博弈论为众多学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。
如何在“博弈”中获胜？
日常生活中的博弈（“游戏”）往往指的是诸如赌博和运动这样的东西：赌抛硬币百米赛跑打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示，默契的合作就完全不可能。
例3：为什么教授如此苛刻？
许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
教授们为何如此苛刻？如果允许某种迟交，而且教授又不能辨
别真伪，那么学生就总是会迟交。期限本身就毫无意义了。避免这一“滑梯”通常只有一种办法，

博弈论ppt课件

15
➢ 扩展术语：
信息：信息集；完全信息（complete）；完美信息（perfect）。
共同知识：双方可能获取的相同信息；彼此都能算清楚。
博弈结果：均衡策略组合；均衡行动组合。均衡：所有局中人最优策略的组合。
博弈论2009
精选ppt课件
16
3. 博弈描述
➢博弈的策略型（标准型、正则型）表述：
33
博弈论2009Leabharlann 精选ppt课件34
毕业后先后在兰德研究所、普林斯顿大学、MIT工作。
1957年他与MIT学生爱莉西娅结婚。
在而立之年患上了妄想型精神分裂症，九十年代逐渐恢复了正常。
1994年纳什博士获诺贝尔经济学奖。
2002年来北京参加 “国际数学家大会”
博弈论2009
精选ppt课件
35
博弈论2009
则，不开发。（？）
博弈论2009
精选ppt课件
22
关键问题：对自然状态的概率估计；不同时间决策（决策顺序）；对对方先验信息的估计（即估计对方对信
息的掌握程度）。
现实困难：对市场了解程度不同；对对方了解程度不同；如何向对方暗示自己的行动。
博弈论2009
精选ppt课件
23
4.博弈练习
➢游戏一：心灵感应两个人一组，独立写出1至10之间的任
乙甲
理性的人是自私自利的；理性选择不是全局最优。
博弈论2009
精选ppt课件
6
➢经济合作：
乙甲
诚信的价值；一报还一报策略；人类生存环境启示。
博弈论2009
精选ppt课件
7
➢长街上的超市（海滩占位模型）
＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊

博弈论课件

第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏但C不知道
B
所以我脸脏
所以B一定知道自己脸脏但B不知道，说明我的假设不正确故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS：
NO.1 知占识优目策标略均衡 NO.2 能重力复目剔标除占优均衡 NO.3 情纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析，掌握重复剔除的占优策略、纳什均衡与混合策略均衡理论。培养分析问题、解决问题的能力。体会博弈论的应用价值，开拓视野，激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频参考书目
教学课件
Teaching courseware
目录
• 第一章博弈论概述
006
• 第二章完全信息静态博弈
041
第一节占优策略均衡
043
第二节重复剔除的占优均衡
066
第三节纳什均衡
088
第四节混合策略均衡
106
第一章
教学要求
知识目标掌握博弈论的概念、发展、分类与要素
42
第二章完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达：策略式表达和扩展式表达。策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。

精品课程《博弈论》PPT课件(全)

人博弈两人博弈有多种可能性，博弈方的利益方向可
能一致，也可以不一致
三、多人博弈
三个博弈方之间的博弈可能存在“破坏者”：其策略选择对自身的利
益并没有影响，但却会对其他博弈方的利益产生很大的，有时甚至是决定性的影响。申办奥运会是典型例子。多人博弈的表示有时与两人博弈不同，需要多个得益矩阵，或者只能用描述法
动态博弈、重复博弈。
静态博弈：所有博弈方同时或可看作同时选择策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈：各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场结构
重复博弈：同一个博弈反复进行所构成的博弈，提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时，有一夛，父亭乘了冩丢梨回宛，
陶谦吏亸叹孜癿时俳，又问亸：“亵绉泶孜癿觇
店看，佝觏为叴小梨刁算叾？”孔融回答该： “我丌
过觑了一次梨，哏哏単因此爱抋了我一辈子，社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨看俺
昤道徇成本，简直就昤一本万利唲！
阿克洛夫：买卖
主对于要交易的“旧车”存在信息不对称，买主通常不愿意出高价，这样持有好车的买主只好退出市场，市场上都剩下“坏车”，买主则越来越不愿意光顾，旧车市场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16

博弈论讲义-概述1

第一章概述-人生处处皆博弈
注意两点：注意两点： 1、是两个或两个以上参与者之间的对策论当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章概述-人生处处皆博弈
2、理性人假设理性人是指一个很好定义的偏好，在面临定的约束条件下最大化自己的偏好。博弈论说起来有些绕嘴，但理解起来很好理解，那就是每个对弈者在决定采取哪种行动时，不但要根据自身的利益的利益和目的行事，而且要考虑到他的决策行为对其他人可能的影响，通过选择最佳行动计划，来寻求收益或效用的最大化。
参与人
ห้องสมุดไป่ตู้
第一章概述-人生处处皆博弈-基本概念
博弈论的基本概念包括：参与人：博弈论中选择行动以最大化自己效用的决策主体；参与人：博弈论中选择行动以最大化自己效用的决策主体；行动：行动：参与人的决策变量战略：战略：参与人选择行动的规则信息：参与人在博弈中的知识，特别是有关其他参与人的特征和行动的知识支付函数：支付函数：参与人从博弈中获得的效用水平结果：博弈分析真正感兴趣的要素的集合均衡：均衡：所有参与人的最优战略的组合参与人、行动、结果称为博弈规则；博弈分析的目的是使用博弈规则决定均衡。
完全信息静态博弈纳什均衡
第一章概述-人生处处皆博弈
纳什（1950，1951）
分析：上述博弈属于何种类型的博弈？
囚徒困境坦白
囚徒 B 囚徒A
抵赖
坦白抵赖行动
-8，-8 -10，0
0，-10 -1，-1
支付函数
完全信息静态博弈纳什均衡
纳什（1950，1951）
第一章概述-人生处处皆博弈-智猪博弈
第一章概述-人生处处皆博弈-囚徒困境亚当斯密在1776年发表的经典之作《原富》中认为：亚当斯密在1776年发表的经典之作《原富》中认为： 1776年发表的经典之作

北京大学博弈论课件第1章博弈论概述

博弈参与者可能是单个的个人，也可能是组织或集体
企业、社会团体、国家
博弈参与者可能多于两方，三方或多方博弈参与者
二、博弈策略（Strategy）
博弈策略指博弈参与者可以采取的行动在“锤头、剪刀、布”博弈中，博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中，博弈参与者所能采取的博弈策
博弈参与者：两个人博弈过程：
两人在校门口集合，一起逛博物馆
博弈策略和结果
两人都去南门，成功碰面两人都去北门，成功碰面同学甲去南门，同学乙去北门，两人错过同学甲去北门，同学乙去南门，两人错过
博弈双方策略相互依赖，不独立。
其他博弈实例
棋类比赛：象棋、围棋等。古人“对弈”。寡头市场：
遇、不能够相遇两种可能的结果。在“囚徒困境”博弈中，博弈参与者得到的收益是
如果甲、乙都坦白，则甲、乙均得到 5 年徒刑如果甲、乙都不坦白，则甲、乙均得到 2 年徒刑如果甲坦白、乙不坦白，则甲得到 1 年、乙得到 10 年有期徒刑如果甲不坦白、乙坦白，则甲得到 10 年、乙得到 1年有期徒刑
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中，博弈参与者所能采取的博弈策略均为
“坦白”或“不坦白”
三、博弈的收益（Payoff）
博弈收益指不同博弈策略给博弈参与者带来的利益在“锤头、剪刀、布”博弈中，博弈参与者得到的收益是：赢、平局、
输三种可能的结果。两名同学去相约去博物馆博弈中，博弈参与者得到的收益是：能够相
2．非合作博弈（Non-cooperative games），纳什就读于普林斯顿大学数学系的博士毕业论文，1950年。

博弈论ppt课件

精选课件ppt
7
囚徒B 坦白
不坦白
囚徒A
坦白－8，－8 0，-10
不坦白 -10，0 －1，－1
精选课件ppt
8
博弈的分类
ห้องสมุดไป่ตู้
1、从行动的先后次序来分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动，或虽非同时但后行动者并不知道前行动者采取了什么具体行动；
动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。
21世纪，应站在博弈论的前沿。尽管博弈经济学家很少，但其获诺贝尔
奖的比例最高。最能震动人类情感的是博弈，对未来最有影响力的还是
博弈。
精选课件ppt
6
著名的“囚徒困境”的例子
警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判一年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判10年徒刑；果两人都坦白认罪，则他们将被各判8年监禁。问：两个罪犯会如何选择（即是坦白还是抵赖）？
不过，2号推知3号的方案，就会提出“98，0，1，1”的方案，即放弃3号，而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利，他们将支持他而不希望他出局而由3号来分配。这样，2号将拿走98枚金币。
同样，2号的方案也会被1号所洞悉，1号并将提出（97，0，1，2，0）或（97，0，1，0，2）的方案，即放弃2号，而给3号一枚金币，同时给4号（或5号）2枚金币。由于1号的这一方案对于3号和4号（或5号）来说，相比2号分配时更优，他们将投1号的赞成票，再加上1号自己的票，1号的方案可获通过，97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了！答案是：1号强盗分给3号1枚金币，分给4号或5号强盗2枚，自己独得97枚。分配方案可写成（97，0，1，2， 0）或（97，0，1，0，2）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

纳什的代表作
1．多人博弈的均衡（Equilibrium points in n-person games）国家科学院学报（Proceedings National Academy of Sciences），36: 48 – 49，1950年。 2．非合作博弈（Non-cooperative games），纳什就读于普林斯顿大学数学系的博士毕业论文，1950年。 3．讨价还价问题（The bargaining problem）。计量经济学杂志（Econometrica）18: 155 – 162，1950年。 4．非合作博弈（Non-cooperative games）数学年报（Annals of Mathematics），54: 286 – 295，1951年。
第一章
博弈论概述
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
2012-8-28

博弈参与者（Player）博弈策略（Strategy）博弈的收益（Payoff）博弈的均衡（Equilibrium）

一、博弈参与者（Player）

博弈参与者指参与博弈的主体在“锤头、剪刀、布”博弈中，博弈参与者是玩游戏的两个人两名同学去相约去博物馆博弈中，博弈参与者是两名同学在“囚徒困境”博弈中，博弈参与者是两名犯罪嫌疑人

产量博弈模式价格博弈模式领先者、跟随者博弈模式

大国之间关于汇率政策的博弈经典博弈实例：囚徒困境（Prisoner's Dilemma）
囚徒困境
警方逮捕了甲、乙两名犯罪嫌疑人警方分开审讯两人根据“坦白从宽、抗拒从严”的原则：

如甲、乙均坦白，则两人将分别被判处 5 年有期徒刑如甲坦白、乙不坦白，则甲被判 1 年、乙被判 10 年徒刑如甲不坦白、乙坦白，则甲被判 10 年、乙被判 1 年徒刑如甲、乙均不坦白，则两人将分别被判处 2 年有期徒刑

1950、1951 年，约翰 · 纳什（John Nash）利用不动点定
理证明了博弈均衡的存在性，为博弈论奠定了坚实的理论基础。 20 世纪 70 年代，约翰 · 海萨尼（John Harsanyi）和莱因

哈德 · 泽尔腾（Reinhard Selten）等将不完全信息理论融入
到博弈论的研究中。

在“囚徒困境”博弈中，博弈参与者得到的收益是

如果甲、乙都坦白，则甲、乙均得到 5 年徒刑如果甲、乙都不坦白，则甲、乙均得到 2 年徒刑如果甲坦白、乙不坦白，则甲得到 1 年、乙得到 10 年有期徒刑

如果甲不坦白、乙坦白，则甲得到 10 年、乙得到 1年有期徒刑
四、博弈的均衡（Equilibrium）

参与者策略集
收益
均衡
本章习题
• 1．试举出两个现实生活中的博弈实例。 • 2．博弈的构成要素有哪些？
2012-8-28
金融
中国古人思想中的“博弈”智慧
《战国策》：田忌赛马马分为上、中、下三等

我方上等马 vs. 对方中等马我方中等马 vs. 对方下等马我方下等马 vs. 对方上等马

三局两胜，田忌胜出正确运用战略，也是取胜的重要因素之一
第二节：博弈的构成要素
完整的博弈通常包含四个构成要素

甲、乙二人独立决策

对甲而言，不管乙选择坦白还是不坦白，甲的最优策略都是坦白。对乙而言，不管甲选择坦白还是不坦白，乙的最优策略都是坦白。

结果：甲、乙均选择坦白，分别被判处 5 年有期徒刑甲、乙如均不坦白，则分别被判处 2 年有期徒刑个体理性与集体理性的冲突
囚徒困境
分析中
博弈理论丰富了人们认识世界的角度和工具
第一节：博弈的定义和实例
博弈论（Game Theory）又名对策论博弈理论原本是运筹学的一个重要分支。目前博弈论已发展为一门备受关注的独立学科。博弈的定义

“博弈”指当两个或多个决策主体之间存在相互作用，任何一方的决策策略（Strategy）都不能完全独立于其他各方策略时，各方的决策过程及均衡问题。
博弈参与者：两个人博弈过程：

两人在校门口集合，一起逛博物馆
博弈策略和结果

两人都去南门，成功碰面
两人都去北门，成功碰面
同学甲去南门，同学乙去北门，两人错过同学甲去北门，同学乙去南门，两人错过
博弈双方策略相互依赖，不独立。
其他博弈实例
棋类比赛：象棋、围棋等。古人“对弈”。寡头市场：
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE

完全信息静态博弈（Static Game with Complete
Information）

完全信息动态博弈（ Dynamic Game with Complete Information）

不完全信息静态博弈（Static Game with Incomplete
Information）

不完全信息动态博弈（ Dynamic Game with Incomplete Information）

博弈的均衡指所有参与者最优策略的组合两名同学去相约去博物馆博弈中，博弈均衡有两个

两个同学都去学校南门

两个同学都去学校北门

在“囚徒困境”博弈中，博弈均衡有一个

嫌疑人甲和嫌疑人乙都坦白
第三节：博弈论的发展历史和分类
博弈的思想古已有之《孙子兵法》、《三国演义》等中国古典名著都蕴含着丰富的博弈智慧当代博弈理论的研究源于西方一、博弈理论的发展历史
纳什对非合作博弈均衡进行了独到精辟的阐述对合作博弈的博弈过程及策略选择进行了系统的归纳和证明
纳什的思想对日后博弈理论的发展影响深远
以纳什的名字命名的“纳什均衡”
尽管不得不时常与医院、药物和孤独为伴，但纳什仍然一如
既往的进行着他所痴迷的研究工作。 1994 年，因为在博弈理论方面的突出贡献，纳什获得了当年度的诺贝尔经济学奖

20 世纪初，塞梅鲁（Zermelo）、鲍罗（Borel）和冯 · 诺依曼（Von Neumann）开始研究博弈的数学表达方式
一、博弈理论的发展历史（续）

1944 年，冯 · 诺依曼（ Von Neumann）和经济学家奥斯
卡· 摩根斯坦（Oskar Morgenstern）合作发表了《博弈理论与经济行为》一书，使博弈的理论和思想进入经济学领域。
5．两人合作博弈（Two-person cooperative games）。计量经
济学杂志（Econometrica），21: 128 – 140，1951年。
本章小结
本章给出了博弈的基本定义通过现实实例分析了博弈的基本内涵和主要思想 “囚徒困境”是博弈理论中的经典案例博弈的构成要素主要包括：
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
2012-8-28
POWERPOINT TEMPLATE 金融
引言
博弈的思想古已有之
博弈理论是当代经济学不可或缺的重要组成部分
博弈思想及理论已被广泛应用于对各类经济和社会现象的
博弈实例1：锤头、剪刀、布
博弈参与者：两名同学博弈过程：

两人在“锤子、剪刀、布”三种策略中选择一种。如果两人的策略一样，则平局。出“锤子”一方胜过出“剪刀”一方。出“剪刀”一方胜过出“布”一方出“布”一方胜过出“锤子”一方

博弈双方策略相互依赖，不独立。
博弈实例2：聚会
博弈论大师——约翰 · 纳什简介
约翰 · 纳什（John Nash）1928 年 6 月出生于美国一个中产阶级家庭纳什自幼便显露出过人的数学天赋 1948 年，纳什在普林斯顿大学攻读博士学位 1950 年至 1953 年，纳什撰写了多篇在博弈论研究领域颇具开创性和奠基性的论文。纳什的论文对合作博弈和非合作博弈进行了明确定义和区分

20 世纪 90 年代之后，博弈论作为一种方法被普遍运用到经济
学、政治学、生物学、军事学、统计学等领域中。

博弈理论已成为当代经济学理论不可分割的重要组成部分。
二、博弈的分类
根据博弈参与者能否达成相互合作的和约束性协议

合作博弈（Cooperative Games）非合作博弈（Non-Cooperative Games）
略均为“去学校南门集合”或“去学校北门集合”

在“囚徒困境”博弈中，博弈参与者所能采取的博弈策略均为 “坦白”或“不坦白”
三、博弈的收益（Payoff）

博弈收益指不同博弈策略给博弈参与者带来的利益

在“锤头、剪刀、布”博弈中，博弈参与者得到的收益是：赢、平局、
输三种可能的结果。

两名同学去相约去博物馆博弈中，博弈参与者得到的收益是：能够相遇、不能够相遇两种可能的结果。