《博弈论基础》

合集下载

博弈论基础PPT精品课程课件全册课件汇总

自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束？
我们必须知道参与人关心什么，才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。首先，它提供了一种语言。其次，它提供了应该框架，能够指导我们建立策略环境模型。其三，它有助于我们追朔，对行为假设的逻辑推理过程。
1 概述
好几百年前，数学家就开始研究室内游戏，试图构造最优的游戏策略。
在1713年，沃尔德格雷夫就某种纸牌游戏的解决方法，与他的同事德莫特和贝努利进行交流。沃尔德格雷夫的解决方法，与现代理论的结论相一致。
支付(payoff)，或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈，两个厂商通过选择高价或者低价进行竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个参与人的博弈中，i=1,2,…,n。在某些博弈中，一个参与人可以在无限多个行动中进行选择。

博弈论基础吉本斯课后答案

博弈论基础吉本斯课后答案
一、原题
1. 什么是博弈论？
答：博弈论是一门研究决策者之间的竞争性行为的学科，它研究的是如何在竞争性环境中获得最佳结果。

它涉及到决策者之间的博弈，以及如何利用策略来获得最佳结果。

2. 什么是吉本斯博弈论？
答：吉本斯博弈论是一种研究两个或多个决策者之间的博弈的学科，它研究的是如何在竞争性环境中获得最佳结果。

它是由美国经济学家约翰·吉本斯在20世纪50年代提出的，他提出了一种新的方法来研究博弈，即使用数学模型来分析博弈的结果。

3. 吉本斯博弈论的基本概念是什么？
答：吉本斯博弈论的基本概念是博弈矩阵，它是一个表格，用来描述两个或多个决策者之间的博弈。

它由行和列组成，每一行代表一个决策者，每一列代表另一个决策者，每个单元格中的数字代表每个决策者在每种可能的结果下的收益。

4. 吉本斯博弈论中的均衡点是什么？
答：吉本斯博弈论中的均衡点是指当两个或多个决策者之间的博弈结果达到一种平衡时，每个决策者都不会有更多的收益。

这种平衡可以是一个纳什均衡，也可以是一个非纳什均衡，具体取决于博弈的结构。

博弈论基础

博弈论基础第一节博弈问题概述一、博弈的基本概念博弈论的基本概念包括：参与人、行为、信息、战略、支付函数、结果、均衡。

参与人是指博弈中选择行动以最大化自身利益（效用、利润等）的决策主体（如个人、厂商、国家）。

行动是指参与人的决策变量。

战略是指参与人选择行动的规则，它告诉参与人在什么时候选择什么行动。

例如，“人不犯我、我不犯人；人若犯我、我必犯人”是一种战略。

这里，“犯”与“不犯”是两种不同的行动。

战略规定了什么时候选择“犯”，什么时候选择“不犯”。

信息是指参与人在博弈中的知识，特别是有关其他参与人（对手）的特征和行动的知识。

支付函数是参与人从博弈中获得的效用水平，它是所有参与人战略或行动的函数，是每个参与人真正关心的东西。

结果是指博弈者感兴趣的要素的集合。

均衡是所有参与人的最优战略或行动的组合。

上述概念中，参与人、行动、结果统称为博弈规则。

博弈分析的目的是使用博弈规则决定均衡。

二、博弈的分类根据博弈者选择的战略，可以将博弈分成合作博弈(cooperative games)与非合作博弈(non-cooperative games).合作博弈与非合作博弈之间的区别，主要在于博弈的当事人之间能否达成一个有约束力的协议。

如果有，就是合作博弈；反之，就是非合作博弈。

根据参与人行动的先后顺序，可以将博弈分成静态博弈(static game)与动态博弈(dynamic game)。

静态博弈是指，博弈中参与人同时选择行动；或者虽非同时行动，但行动在后者并不知道行动在先者采取了什么具体行动。

动态博弈是指参与人的行动有先后顺序，而且行动在后者可以观察到行动在先者的选择，并据此作出相应的选择。

根据参与人对其他参与人的了解程度，可以将博弈分成完全信息博弈(games of complete information)和不完全信息博弈(games of incomplete information)。

完全信息博弈是指：在每个参与人对所有其他参与人（对手）的特征、战略和支付函数都有精确了解的情况下，所进行的博弈。

博弈论基础Axjh(共48张PPT)

行动顺序信息
完全信息结构
静态结构
（战略博弈）
完全信息静态博弈 Nash均衡
Nash(1950,1951)
动态结构
（扩展博弈）
完全信息动态博弈子博弈精练Nash均衡
Selten(1965)
不完全信息结构
不完全信息静态博弈
不完全信息动态博弈
贝叶斯Nash均衡
精练贝叶斯Nash均衡
Harsanyi(1967-1968)
不完全信息（incomplete information）：指至少有一个局中
人不完全了解其他局中人的收益或收益函数。
完备信息（perfect information）：指一个参与人对其他参与
人的行动选择有准确的了解。
不完备信息（Imperfect information）：指博弈中至少有一个局中人不了解其他局中人的行动选择。
由大学、比勒菲尔特大学和波恩大学。其主要贡献是在博弈论中引入了动态分析。
1920年Harsanyi出生于匈牙利，1947年获布达佩斯大学博士学位，后到，1954年获斯坦福大学博士学位，曾先后任教于澳大利亚国立大学、加州伯克利分校。于2000年去世。他的贡献是将不完全信息引入了博弈论的研究。
例如：
出门
——对天气的判断打牌
——对其他人的判断装修
——对产品的了解
战略（strategies）或策略，是局中人选择行动的规则，它告诉局中
人在什么时候选择什么行动。
例如：
——“人不犯我，我不犯人；人若犯我，我必犯人”
—— 三个和尚没水喝
支付（payoff）：指每个参与人从博弈中获得的效用水平。既可以指实际支付，也可以用来指期望支付。它是所有局中人战略或行动的函数，是每个局中人关注的核心问题。

博弈论基础吉本斯答案

两人的选择: (招认，招认)。
定义：si?是si??的严格劣势战略（strictly dominated），如果:
ui(si?，s-i) ? ui(si??，s-i)
“沉默”是“招认”的严格劣战略
例3:
参与人2
左中右
上1，0 1，33，0
参与人1中0, 2 0，16，0
下0, 2 2,4 5,3
参与人1:没有严格劣战略。
1.13有两个纯战略纳什均衡，一个混合战略纳什均衡。
纯战略纳什均衡为：（向企业1申请，向企业2申请）；（向企业2申请，向企业1申请）混合战略纳什均衡为：
{（（2w1-w2）/（w1+w2）,（2w2-w1）/（w1+w2）），（（2w1-w2）/（w1+w2）,（2w2-w1）/
（w1+w2））}
布1，-1-1，1 0，0
博弈的问题：能否知道每个参与人选择的战略？
例2:囚徒困境(the prisoner’s dilemma)
囚徒2
沉默招认
沉默-1，-1 -9，0
囚徒1
招认0，-9-6，-6
囚徒1的考虑：无论对方选沉默还是招认，自己选“招认”好于“沉默”。
囚徒2的考虑：无论对方选什么，“招认”好于“沉默”。
还有几本也不错的：
上面的这些教材一般不使用微积分
比较深入一点，使用了微积分：
【篇三：大连理工大学博弈论作业2】
sn;u1,…,un}，假设si={si1,…,sik}。那么，
参与者i的一个混合战略为概率分布pi=(pi1,,…pik)，其中对所有k=1，…，k,0≤pik≤1,且pi1+…+pik=1。
战略的一个组合: s ={s1，s2, ?, sn}.

《博弈论基础》读后感范文(二篇)

《博弈论基础》读后感范文读《博弈论基础》给我带来了很多的启发和思考。

通过阅读这本书，我对博弈论的概念、原理和应用有了更深入的了解。

首先，这本书很好地介绍了博弈论的基本概念和原理。

作者通过具体的例子和数学模型，清晰地解释了博弈论的核心思想和应用。

我对博弈的定义和分类有了更清晰的认识，同时也明白了博弈论的数学基础和形式化建模的重要性。

此外，书中还介绍了博弈论中的一些重要概念，比如纳什均衡和博弈矩阵，使我对博弈论的理论框架有了更全面的理解。

其次，这本书还涉及了博弈论的应用领域。

作者通过实际案例，讲述了博弈论在经济学、政治学、社会学等领域的应用。

我特别关注了博弈论在商业决策和谈判策略中的应用。

书中的案例非常有启发性，让我明白了博弈论在实际问题中的价值和作用。

最后，这本书给我留下了思考问题的余地。

博弈论涉及的问题非常复杂，且不断变化。

我认识到只是初步了解了博弈论的基础知识，还需要进一步的学习和研究。

这本书激发了我对博弈论研究的兴趣，并且让我明白了博弈论在现代社会中的重要性。

总之，读《博弈论基础》对我来说是一次非常有益的经历。

通过阅读这本书，我对博弈论的概念、原理和应用有了更深入的了解，而且激发了我对博弈论研究的兴趣。

我相信这本书对于对博弈论感兴趣的读者来说，也会是一本非常有价值的参考书。

《博弈论基础》读后感范文（二）读完《博弈论基础》，我对博弈论这个领域有了更深入的了解和认识。

本书通过简洁明了的语言，解释了博弈论的基本概念、原理和应用。

首先，书中介绍了博弈论的基本概念。

博弈论是研究决策者在相互作用中争夺利益的数学模型。

作者通过几个简单的例子，很好地向读者解释了博弈论的基本概念，如策略、策略组合、收益等。

其次，书中详细讲解了博弈论的基本原理。

作者通过对不完全信息博弈、合作博弈和非合作博弈等不同类型的博弈进行深入的分析，揭示了博弈论的基本原理和规律。

我尤其对合作博弈的内容印象深刻，合作博弈是指决策者之间通过合作达成最优解的博弈模型。

博弈论基础复习

《博弈论基础》主要知识点一、名词解释（5×2＝10分）策略型博弈它是由三个部分组成，即局中人、策略和各种策略组合中所得到的利益。

纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。

混合策略局中人的混合策略是其纯策略空间上的一种概率分布，表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。

扩展型博弈博弈存在着局中人行动的先后次序，是对具有动态结构的决策形式进行研究的规范分析工具。

博弈树对于任何一种双人完备博弈，都可以用一个博弈树来描述，并通过博弈树搜索策略寻找最佳解。

博弈树类似于状态图和问题求解搜索中使用的搜索树。

完美信息博弈是指一次只有一个局中人在行动，而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。

子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。

行为策略是指每一个参与人在每一个信息集上随机的选择行动。

逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。

在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上。

冷酷策略又称触发策略。

指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。

类型:一般地，将一个参与人所拥有的所有私人信息称为他的类型。

信号博弈是研究具有信息传递作用的信号机制的一般博弈模型，其基本特征是两个博弈方，分别称为信号发出方和信号接收方。

分离均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者以概率1选择不同的信号，接收者完全可以通过信号来准确判断出发送者的类型。

混同均衡信号博弈中的完美贝叶斯均衡之一，这种均衡中不同类型的发送者选择了相同的信号，接收者无法从信号中得到新的信息，无法对先验信念进行修正。

特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益，也就是给出了一种集合函数，称为特征函数。

联盟二、选择题（5×2＝10分）三、简答题（28-30分）1.博弈的分类及相关概念。

博弈论基础(不完全信息博弈)

础
不完全信息动态博弈 3、举例：市场进入博弈举例：
炸鸡翅的价格：炸鸡翅的价格： 1元、3元、5元元元元
博
弈
论
基
础
不完全信息动态博弈
（1）进入者是否进入取决于对在位者类型的判断）（2）进入者将依据在位者的价格选择而修正对在位者类型的判）断（3）在位者需要考虑价格选择的信息效应，所以，在位者选择）在位者需要考虑价格选择的信息效应，所以，什么价格不仅与自身的成本函数有关，什么价格不仅与自身的成本函数有关，而且与进入者的先验概率及条件概率有关。验概率及条件概率有关。（4）若高成本的先验概率小于，则出现混同均衡：在位者不）若高成本的先验概率小于1/5，则出现混同均衡：论成本高低，都选择中等价格，进入者只有在观测到高价论成本高低，都选择中等价格，格时才选择进入（5）若高成本的先验概率大于，则出现分离均衡：在位者在）若高成本的先验概率大于1/5，则出现分离均衡：低成本时，选择低价格，在高成本时，选择高价格，低成本时，选择低价格，在高成本时，选择高价格，进入者观测到低价格时选择不进入，者观测到低价格时选择不进入，观测到中价格或高价格时才选择进入。（。（低成本在位者通过低价格显示自己是低成才选择进入。（低成本在位者通过低价格显示自己是低成此乃“认证费” 本，此乃“认证费”）
Prob（GT）=P（GT/GP）P（GP）+P（GT/BP）P（BP）（）（）（）（）（）
（4）一个人做了好事是好人的概率
Prob（GP/GT）=P（GT/GP）P（GP）/ Prob（GT）（）（）（）（）
博
弈
论
基
础
不完全信息动态博弈

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

01-3-2 6
2、博弈规则（续）
（ 3）行动的先后顺序 ● 静态（ S tatic 同时） ● 动态（ D y nam ic 先后）（ 4）信息结构：参与人在行动时知道了什么（５）战略（Ｓｔｒａｔｅｇｙ）Ｓ＝（ｓ１，ｓ２， … ，ｓｋ）＝（ｓｋ，ｓ－ｋ）
01-3-2
17
２、ＮＥ的求解
例 1：囚犯困境 C C 囚犯 A DC
-10 0 -2 -2 -5 -5 0
囚犯 B DC
-10
●验证：{s*1=（C，C）；s*2=（C，C）}为 NE 战略 ●但 Pareto 改进（-2，-2）未能自发达到——外部性 ●个人理性与集体理性产生冲突
<The Theory of Games & Economic Behavior> ●John Harsanyi & John Nash & Reinhard Selten
01-3-2 1
3、应用阶段
（1）宏观经济学：●政策动态一致性（SPNE） ●劳动力市场 ●（金融）信贷市场（2）微观经济学 ●外部性 ●公共产品的投资激励 ●工资（薪酬）决定
四、博弈的表示方式
1．矩阵博弈例：囚犯困境囚犯B C
囚犯C A -5 -5 0 -2 0 -2
DC
-10
DC -10
01-3-2
12
例：性别战（Battle of Ｓｅｘｅｓ）
● 新婚夫妇： Opera Opera Sandy Football ● 百年夫妻： Opera Opera Sandy Football
01-3-2
{犯；不犯}
9
2、博弈规则（续）
而我的战略集合： {s1， s2， s3， s4} 其中， s1= （犯，犯）； s2= （犯，不犯） s3= （不犯，犯）； s4= （不犯，不犯）上述例子，我的战略为 s2 （ 6 ）支付（ Payoff）： U K（ s1， s2，…， sn） =U K（ sk， s-k）
01-3-2 14
例：囚犯两难（困境）矩阵博弈与博弈树的转换
（ -5 ， -5 ） C B○ C A○ DC B○ DC （ -2 ， -2 ） C （ -1 0 ， 0 ） DC （ 0 ， -1 0 ）
01-3-2
15
五、均衡（Equilibrium)
静态完全信息不完全信息
NE
动态
SPNE
BNE
PBNE
01-3-2
16
纳什均衡（ＮＥ）
1、定义： ● 战略 S * = （ s* 1 ， s* 2 ， … ， s* n ）为 N E 战略等价于对 k=1， 2， … ， n，有 s* k ∈ a rg · M a x { U k （ s* k ， s* -k ） } ● 也就是说，在均衡战略下，如果他人不改变战略，任意参与人不会单方面改变战略
第六讲博弈论基础
一．博弈论的发展阶段
1．传统阶段： ●Theory of Oligopoly: Cournot(1838) Betrand(1883) ●Theory of Bargaining: Edgeworth(1887) Hicks(1932) 2．现代阶段： ●Von Neumann & Morgenstern (1944)
01-3-2
∈∏Ｓｋ
7
2、博弈规则（续）
●参与人 k 的战略应说明 k 在各种可能情况下的行动方针，如：胡荣华与赵国荣下一盘象棋，胡自始至终的行动计划称为“战略” ；而每一步棋称为“行动” ● 静态时，战略 =行动 ●动态时，战略≠行动
01-3-2 8
2、博弈规则（续）
●“兵来将挡、水来土掩” ●“以不变应万变” 、 “以静制动” ●毛主席语录： “人不犯我，我不犯人；人若犯我，我必犯人”—这里，人的行动集：{犯；不犯}；人的战略集：{犯；不犯} 我的行动集:
01-3-2 4
三、非合作博弈
1 ．引例（ 1 ）零和博弈（对抗性） ● 猜拳 ● 打牌、下棋（ 2 ）非零和博弈 ● 囚犯困境 ● 体育比赛
01-3-2
● 航空公司价格战
5
2、博弈规则
（1）参与人（Players）： ●k=1，2，…，n（虚拟参与人——自然） ●参与人是理性的（即谋求效用最大化）（2）参与人的行动集（Action Set）： ●行动 ak∈AK（行动集合），k=1，2，…，n ●行动组合（Profile）： a=（a1，a2，…，an）=（ak，a-k）∈∏Ak
01-3-2
10
2、博弈规则（续）
●博弈：规定谁在什么时候行动；行动时知道了什么；有什么可供选择；得到多少 ●有限博弈：参与人有限；行动集合有限 ●博弈规则为共同知识的博弈称为完全信息博弈 ●所有参与人在行动时均知道其他参与人之前的行动的博弈称为完美信息博弈 ●完美→完全；不完全→不完美
01-3-2 11
01-3-2 2
应用阶段（续）
（ 3）市场营销 ● Sales Force Mgt. ● Channel Mgt. ● Pricing Startegy （ 4）产业组织理论 ● 市场竞争与 R&D 竞争 ● 市场进入与反进入 ● 广告方法选择
01-3-2● 产业规制3二、合作博弈
● Cartel （ OPEC ） ● RJVs ● 合作讨价还价模型（ Nash ， 1950 ）： Max{ （ X 1-D 1）（ X 2-D 2） } S． T． X 1+X 2≤ 1 其中， D 1、 D 2 分别为 1 与 2 的初始禀赋，成为威胁点（ Threat Point），产权配置改变 D 1、 D 2。当 D 1=D 2， X 1=X 2=1/2
01-3-2
Paul Football
1 0 0 1 0 2 2 0
Paul Football
0 1 0 1 2 0 2 0
13
２、博弈树
例：欧盟航空公司空中争夺战中陆￥ 380 法航 380 490 380 ￥ 490 法航 490
（ 8 ， 8 ）（ 1 3 ， 4 ）（ 4 ， 1 3 ）（ 1 0 ， 1 0 ）