博弈论课程概要(I)

合集下载

第一章博弈论概述PPT课件

博弈论与信息经济学
Game Theory and Information Economics 天津大学管理与经济学部
授课：XXX
1
第一章博弈论概述（Game Theory）
授课：XXX
2
一、博弈论的定义
又称对策论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
➢ 博弈分析的基本假设（1）个人理性假设当事人在决策时能够充分考虑他所面临的局势，并能做出合乎理性的选择。
（2）最大化自己的收益假设当事人在决策时通常选择使自己收益最
大化的策略。
授课：XXX
12
坦白抵赖
➢ 博弈问题的基本要素
坦白
（1）局中人（Players）
抵赖
参与对抗的各方；不一定指自然人
若二人均不坦白，则只能因藏有枪支而被判刑1年；若有一人坦白而另一个不坦白，则坦白者无罪释放，
不坦白者被判刑10年；若二人都坦白了，则同判8年。此二人确系抢劫犯，请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8，-8 -10，0
抵赖 0，-10 -1，-1
授课：XXX
均衡解：二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》，该影片获得了2002年奥斯卡金像奖的四项大奖
授课：XXX
7
2002年北京国际数学家大会（ICM）
授课：XXX
8
• 主演
罗素·克劳，Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课：XXX
9
1. 囚犯困境（Prisoners’ dilemma

博弈论概要

博弈论概要1．研究背景及意义在现实生活中，人们的利益冲突与一致具有普遍性，因此，几乎所有的决策问题都可以认为是博弈。

博弈论在政治学、经济学等许多领域都有着广泛的应用。

在经济学中博弈论作为一种重要的分析方法已渗透到几乎所有的领域，每一领域的最新进展都应用了博弈论，博弈论已经成为主流经济学的一部分，对经济学理论与方法正产生越来越重要的影响。

虽然博弈论是数学的一个分支，但其应用范围十分广泛，在经济学、管理学、社会学、政治学、法律学、军事学等领域都有许多成功运用博弈论的案例。

早在1994年，提出博弈均衡理论的纳什博士与他的伙伴哈尔萨尼教授、泽尔滕教授就共同分享了当年的诺贝尔经济学奖和93万美元的奖金。

2005年，瑞典皇家科学院再次把诺贝尔经济学奖颁给了有着以色列、美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林，以表彰他们在博弈论领域作出的贡献。

纳什的贡献是在1944年与奥斯卡·摩根斯特恩合著了《博弈论与经济行为》一书，标志着现代系统博弈理论的的初步形成。

而谢林和奥曼两位博弈论先驱在政治理论、社会学甚至生物学等方面成功运用到了博弈学理论。

奥曼用数学分析为博弈论列出了精确的公式，谢林则是想通过实践来展示博弈论在社会各个领域的实际意义。

他们两位利用博弈论对商业谈判、种族隔离、武器控制等领域进行了实际分析，谢林教授认为博弈论运用的重要领域应该包括核威慑和武器控制，同时还可以研究种族关系、有组织犯罪、雇员关系乃至自我管理等方面。

2．博弈论相关概念与发展史综述2.1博弈论的概念2.1.1博弈论的定义博弈论（Game Theory,又称对策论）研究决策主体的行为在发生直接的相互作用时，人们如何进行决策以及这种决策的均衡问题。

博弈论是研究理性的决策者之间冲突与合作的理论。

在博弈论分析中，一定场合中的每个对弈者在决定采取何种行动时都策略地、有目的地行事，他考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响，通过选择最佳行动计划，来寻求收益或效用的最大化。

博弈论概述

博弈论与企业决策博弈论与企业决策第一章概述第二章博弈论的非技术描述第三章完全信息静态博弈第四章完全信息动态博弈第五章不完全信息静态博弈第六章不完全信息动态博弈第一章概述第一节博弈论与企业决策第二节博弈论的基本概念第三节博弈的分类第四节博弈论的发展简史第五节本课程基本内容第一节博弈论与企业决策一、市场结构与企业决策1、完全竞争市场1.市场特点：厂商假设产品假设信息假设要素假设2.厂商关系：相互独立影响极小3.厂商决策：MP=P P市场均衡价格4.市场性质：理论标尺第一节博弈论与企业决策2、完全垄断市场1.市场特点：一个厂商无相近替代品市场不可进入2.厂商关系：完全独立3.厂商决策：MR=P P由市场需求曲线决定4.市场性质：理论标尺注意：1.竞争和垄断的两重含义：市场状态和行为2.垄断厂商的需求曲线弹性不是无穷大的，而是有一定的弹性，弹性越小越可能垄断。

第一节博弈论与企业决策 3、垄断竞争市场1.市场特点：厂商众多产品差异自由进退2.厂商关系：相互影响，不易觉察3.厂商决策：MR=P P受厂商相互行为影响4.市场性质：现实市场第一节博弈论与企业决策4、寡头垄断市场1.市场特点：厂商数量不多产品同质或差异需求曲线不确定2.厂商行为：相互依赖，相互依存3.厂商决策：MR=P P可能是决策变量4.市场性质：现实市场第一节博弈论与企业决策二、企业决策特点1、现实市场是垄断竞争和寡头垄断市场2、现实市场上企业之间的决策是相互依赖，相互影响的3、传统的自我决策是不行的，企业之间的决策是策略性决策举例：二食堂一楼的盖饭（垄断竞争）一般两荤一素6.5元，有一家涨到10元，结果冷冷清清汽车制造企业的决策（寡头垄断）见：《中国企业企业广告行为》第一节博弈论与企业决策三、博弈论与企业决策1、博弈论就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。

2、现实中企业就是相互依赖、相互影响的关系。

3、因此，企业决策必须有博弈论的思想和方法。

《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u}，其中N=（1,2)， Si={(0,2),(1,1),(2,0)}，ui (s1, s2) = ri，i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败，成功
成功，失败
成功，失败
失败，成功
成功，失败
成功，失败
《博弈论》课程
（一）什么是博弈论
我们首先看几个例子。例1 石头、剪刀、布
猪八戒
石头石头孙悟空剪刀布未定，未定找水，休息休息，找水剪刀休息，找水未定，未定找水，休息布找水，休息休息，找水未定，未定
2
例2 诺曼底登陆
德军
加来设防加来登陆盟军
诺曼底登陆成功，失败
诺曼பைடு நூலகம்设防成功，失败
9
例4 进攻与防守双方争夺一个据点，有两条进攻路线X和Y，攻方有两个军，而防守方也有两个军，只有当守方的兵力不少于攻方时，才能击退进攻，否则据点将会失守。首先可知守方的防守方案（即策略）为(0,2)，(1,1)，(2,0)，即在X 线路和Y线路驻扎军队数，同样可以到的攻方的进攻方案(0,2)，(1,1)和(2,0)。容易看出，行动并非策略，策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心，因而博弈论对于各门社会科学而言，就具有了方法论意义，成为各门学科的有力分析工具。
6
（二）博弈表达的科学式
（1）博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来科学地描述一个博弈，就称为博弈表达的策略式（或基本式、标准式）。

北京大学博弈论课件第1章_博弈论概述

纳什的代表作
1．多人博弈的均衡（Equilibrium points in n-person games）国家科学院学报（Proceedings National Academy of Sciences），36: 48 – 49，1950年。 2．非合作博弈（Non-cooperative games），纳什就读于普林斯顿大学数学系的博士毕业论文，1950年。 3．讨价还价问题（The bargaining problem）。计量经济学杂志（Econometrica）18: 155 – 162，1950年。 4．非合作博弈（Non-cooperative games）数学年报（Annals of Mathematics），54: 286 – 295，1951年。
第一章
博弈论概述
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
2012-8-28

博弈参与者（Player）博弈策略（Strategy）博弈的收益（Payoff）博弈的均衡（Equilibrium）

一、博弈参与者（Player）

博弈参与者指参与博弈的主体在“锤头、剪刀、布”博弈中，博弈参与者是玩游戏的两个人两名同学去相约去博物馆博弈中，博弈参与者是两名同学在“囚徒困境”博弈中，博弈参与者是两名犯罪嫌疑人

产量博弈模式价格博弈模式领先者、跟随者博弈模式

大国之间关于汇率政策的博弈经典博弈实例：囚徒困境（Prisoner's Dilemma）

北京大学博弈论课件第1章-博弈论概述

❖ 博弈参与者可能多于两方，三方或多方博弈参与者
❖ 二、博弈策略（Strategy）
博弈策略指博弈参与者可以采取的行动在“锤头、剪刀、布”博弈中去相约去博物馆博弈中，博弈参与者所能采取的博弈策
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中，博弈参与者所能采取的博弈策略均为
❖ 一、博弈参与者（Player）
博弈参与者指参与博弈的主体在“锤头、剪刀、布”博弈中，博弈参与者是玩游戏的两个人两名同学去相约去博物馆博弈中，博弈参与者是两名同学在“囚徒困境”博弈中，博弈参与者是两名犯罪嫌疑人
❖ 博弈参与者可能是单个的个人，也可能是组织或集体
企业、社会团体、国家
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
❖ 参考教材 ❖ 博弈论教程
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
❖ 岳昌君主审；沈琪编PO著WERPOINT TEMPLATE
“坦白”或“不坦白”
❖ 三、博弈的收益（Payoff）
博弈收益指不同博弈策略给博弈参与者带来的利益在“锤头、剪刀、布”博弈中，博弈参与者得到的收益是：赢、平局、
输三种可能的结果。两名同学去相约去博物馆博弈中，博弈参与者得到的收益是：能够相
遇、不能够相遇两种可能的结果。在“囚徒困境”博弈中，博弈参与者得到的收益是
❖ 甲、乙二人独立决策
对甲而言，不管乙选择坦白还是不坦白，甲的最优策略都是坦白。对乙而言，不管甲选择坦白还是不坦白，乙的最优策略都是坦白。
❖ 结果：甲、乙均选择坦白，分别被判处 5 年有期徒刑 ❖ 甲、乙如均不坦白，则分别被判处 2 年有期徒刑 ❖ 个体理性与集体理性的冲突 ❖ 囚徒困境

博弈论(课一)

博弈论(课一)课程内容和时光支配第一讲：概述（第一、二章）其次讲：术语解读和基本假设（第三、四章）第三讲：囚犯逆境和破解之道（第五、六、七章）第四讲：万元陷阱和智猪博弈（第八、九章）第五讲：懦夫博弈和性别战（第十、十一章）博弈学-----博览全局对弈棋局课一博弈在中国的理解--略观围棋，法于用兵，怯者无功，贪者先亡。

西方国家的理解--Game fair play。

（中国人在博弈中关注的是获胜，西方人在博弈中关注的是怎么玩的愉快。

）博弈可以在工作领域，可以在社交往来，可以在家庭相处，无处不在，博大精深。

知人者智，自知者明;胜人者力，自胜者强;小胜者术，大胜者德。

推举书刊1、蒋文华：《用博弈的思维看世界》，浙江高校出版社，2022年。

2、张维迎：《博弈论与信息经济学》，上海三联书店，上海人民出版社，1996年。

3、詹姆斯·米勒：《活学活用博弈论－如何利用博弈论在竞争中取胜》，中国财政经济出版社，2022年。

4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫：《策略思维》，中国人民高校出版社，2022年。

5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫：《妙趣横生博弈论》，机械工业出版社，2022年。

博弈指在一定的嬉戏规章约束下，基于直接互相作用的环境条件，各参加人依据所把握的信息，挑选各自的策略（行动），以实现利益最大化的过程。

故事1，两人同行打猎，忽遇一猛狮。

一人卸下身上物品狂奔，同伴不解，问道：“汝能胜狮？”答曰：“非需胜狮，只需胜汝！” （博弈既可以是竞争，也可以是合作！）嬉戏1，每位学生写1个介于1与100之间的自然数（整数，包括1与100在内），然后求出全部数字的平均数，假如你所写的数字最临近该平均数的二分之一，那么你将在嬉戏中胜出。

（博弈，必需学会换位思量！）博弈只需率先一步，高人一筹！大智若愚假如由于对方眼中的你的傻，而让对方更情愿和你合作，何乐而不为呢？嬉戏2，每位学生写5个大于0的自然数，假如你所写的5个数字中有一个是全部学生中所写的数字中最小的（在没有重合的状况下），那么你将在该嬉戏中胜出。

北京大学博弈论课件第1章-博弈论概述

POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
第一章 POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
二、博弈的分类
❖ 根据博弈参与者能否达成相互合作的和约束性协议
合作博弈（Cooperative Games）非合作博弈（Non-Cooperative Games）
完全信息静态博弈（Static Game with Complete Information）
完全信息动态博弈（ Dynamic Game with Complete Information）
第一节：博弈的定义和实例
❖ 博弈论（Game Theory）又名对策论 ❖ 博弈理论原本是运筹学的一个重要分支。 ❖ 目前博弈论已发展为一门备受关注的独立学科。 ❖ 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用，任何一方的决策策略（Strategy）都不能完全独立于其他各方策略时，各方的决策过程及均衡问题。
20 世纪 70 年代，约翰 ·海萨尼（John Harsanyi）和莱因哈德 ·泽尔腾（Reinhard Selten）等将不完全信息理论融入到博弈论的研究中。
20 世纪 90 年代之后，博弈论作为一种方法被普遍运用到经济学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
如果甲、乙都坦白，则甲、乙均得到 5 年徒刑如果甲、乙都不坦白，则甲、乙均得到 2 年徒刑如果甲坦白、乙不坦白，则甲得到 1 年、乙得到 10 年有期徒刑如果甲不坦白、乙坦白，则甲得到 10 年、乙得到 1年有期徒刑

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

交通大学博弈论课程概要 (I)
周林
二零零四年十二月
主要教材：博弈论（Fudenberg & Tirole ）
引言：博弈论与决策论的差别. 例子：田忌赛马，换钱.
第一部分：完全信息策略式博弈 — 静态博弈
1. 策略式博弈的基本三要素：博弈者，策略空间，收益函数
2. 策略式博弈的基本三解法：
a. 占优策略. 例子: 囚徒困境，二价拍卖（Ebay ，易趣网）
b. 重复剔除劣策略. 例子：双寡头Cournot 竞争（线性需求）
c. Nash 均衡 (最重要的概念)
三种解法的合理性依次减低，而三种解法的适用范围(存在性)依次增加.
3. Nash 均衡存在性定理：如果策略空间是凸紧集，收益函数连续和自拟凹，至少存在一个Nash 均衡.
证明基本思路：最佳反应映射是从策略空间到策略空间的(上半)连续映射(Berge 定理), 最佳反应映射的不动点就是Nash 均衡. 利用(Kakutani 不动点定理)Brouwer 不动点定理找出不动点.（注意：这里的最佳反应映射不是一个压缩映射, 因此不能用迭代法逼近不动点.）
推论：任何有限策略博弈至少有一个混合策略Nash 均衡.
4. Nash 均衡一般非唯一，非Pareto 最优. 可以通过外在信号机制改善收益. 相关均衡：公共信号仅将不同的Nash 均衡混合，私人信号更为有效.
作业：1.1，1.2, 1.5, 1.7, 1.10, 1.12, 2.2 （F&T ）. 以及下面的题目：
A ．证明任何一个满足Nash 均衡存在性定理的对称博弈(首先给出一个合
理的定义)一定存在一个对称的Nash 均衡.
B ．画出下列博弈中所有的相关均衡生成的收益向量:
博弈者 2
博弈者 1 T W
第二部分：完全信息扩展式博弈 — 动态博弈
1. 例子：斯塔克伯格模型
2. 多阶段可观察行为博弈
0阶段: 每一个博弈者可以独立选择一个行动 i i A a ∈0.
1阶段: 在本阶段前的历史),,(00101n a a a h == 决定了本阶段每一个博
弈者可以选择的行动的范围)(1h A i . 每一个博弈者再独立选择一个行动)(11h A a i i ∈.
…………
k 阶段: 在本阶段前的历史),,,(110-=k k a a a h 决定了本阶段每一个博弈者可以选择的行动的范围)(k i h A . 每一个博弈者再独立选择一个行动)(k i k i h A a ∈.
…………
博弈在K 阶段后中止.（我们允许K 为无穷，此时博弈可能进行无限阶段.）每一个博弈者获得的收益取决于博弈的全部历史
),,,(101K K a a a h =+： )(1+=K i i h u u .
（不一定每一个博弈者在任何一个阶段k 和历史k h 时都要做选择. 此时我们只要让1)(=k i h A 即可.)
3. 多阶段可观察行为博弈的策略式博弈表示
策略空间: 每一个博弈者的策略是一个完整的计划，包括了在所有的阶段k 和所有可能发生的历史k h 时会采取怎样的相应行动(想象一本理想化的棋谱).
收益函数: 对于任何一个所有博弈者的策略的组合，我们可以逐阶段的找出相应博弈者行动的历史，从而决定每一个博弈者获得的收益.
4. 多阶段可观察行为博弈的求解
对任何一个多阶段可观察行为博弈，我们首先可以找出它的策略式博弈的Nash 均衡. 但是其中可能含有不合理的解，我们需要对Nash 均衡进行挑选(精炼).
逆向归纳法: 仅适用于具有完美信息的有限阶段的博弈.
子博弈完美: 可以用于所有的多阶段可观察行为博弈.
一个多阶段可观察行为博弈G 在任何一个历史k h 后的延续本身也是一个博弈. 我们称其为原博弈G 的一个子博弈, 记为)(k h G . 如果G 的一个Nash 均衡在它所有的子博弈上的限制也是子博弈的一个Nash 均衡，我们称之为一个子博弈完美的Nash 均衡.
5. 子博弈完美Nash 均衡的判断条件：单阶段偏离原则*
6. 子博弈完美Nash 均衡的应用：囚徒困境的重复博弈, 有限和无限情况
7. 子博弈完美Nash 均衡的应用：Rubinstein 议价模型
作业：3.3，3.5, 3.7, 3.8, 4.5(a)(b), 4.8 . 以及下面的题目：
A ．证明：在囚徒困境的有限重复博弈中，任何一个Nash 均衡(不管是否
子博弈完美)的途径一定是每阶段 (不合作, 不合作).
B ． G 是一个静态双人策略式博弈. 每个博弈者有两个选择变量：博弈者
一选择1x 和1y ，博弈者二选择2x 和2y . 假设()),(),,(*2*2*1*1y x y x 是G 的
Nash 均衡. 现在我们将G 变化为一个双人两阶段博弈G ~. 在阶段0时人博弈者一选择1x ，博弈者二选择2x . 在阶段1时，当双方都观测到1x 和2x 之后，博弈者一再选择1y ，博弈者二再选择2y . G ~的子博弈完美Nash 均衡同G 的Nash 均衡是否一样？请仔细解释.。

博弈论课程概要(I)

第一章 博弈论概述PPT课件

博弈论概要

博弈论概述

《博弈论》课程ppt课件

北京大学博弈论课件第1章_博弈论概述

北京大学博弈论课件第1章-博弈论概述

博弈论(课一)

北京大学博弈论课件第1章-博弈论概述

第一章博弈论概述PPT课件