完全信息的静态博弈讲义
合集下载
博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪
踩
不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者
正
反
正 盖硬币者
反
-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2
左
中
右
上 博弈方1
下
1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0
西经第八讲.完全信息静态博弈.ppt

重复剔除劣策略
• 在海战博弈中,将军K认为将军I会选择北, 因为这是弱占优策略,因此,将军K在考虑 中就放弃了I会选择南这个想法。从而博弈 成为:
将军I
北
K将军
北
2,-2
南
1,-1
重复剔除劣策略
• 此时,将军K就有了一个强占优策略-北。 • 因此,策略组合(北,北)就是重复占优
均衡。
重复剔除劣策略
• 剔除严格劣策略与剔除弱被占优策略之间 存在两个区别。
– 其次,剔除弱被占优策略存在多均衡问题。如 果存在占优策略均衡,那么就一定是唯一的。 如果是重复剔除严格劣策略,均衡存在的时候 也一定是唯一的。剔除弱被占优策略就可能存 在多均衡,因为剔除的顺序就很重要。考虑下 面的博弈:
重复剔除劣策略
列
c1
博弈规则
• 参与人 • 行动 • 支付 • 信息
– 知道对手的支付,但是不知道对手的行动
博弈的标准型表示
• 例如双变量矩阵
囚徒2
沉默 招认
囚徒1 沉默 -1,-1 -9,0
招认 0,-9 -6,-6
求解博弈
• 策略
– 策略与行动不可区分
• 均衡概念
– 占优策略 – 重复剔除严格劣策略 – 纳什均衡
纳什均衡
建模者困境
列
抵赖
坦白
抵赖 0,0
-10,0
行
坦白 0,-10
-8,-8
纳什均衡
• (坦白、坦白)是弱占优均衡,也是重复 剔除均衡,也是强纳什均衡。
• 不过,(抵赖、抵赖)是另一个纳什均衡。 这个结果没有上面的均衡强,但是是帕累 托最优。
• 均衡精炼:向基本的均衡概念增加限制, 直到仅仅剩下一个均衡为止。Fra bibliotek纳什均衡
应用博弈论第二讲完全信息静态博弈

生活中其实有很多相关的例子。
•
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。
•
例2
为什么中小企业不会花钱去开发新产品 ?
•
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。
•
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
•
例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
•
生活中的例子
例1 股市博弈 在股票市场上,大户是大猪,他们
要进行技术分析,收集信息、预测股价 走势,但大量散户就是小猪。
他们不会花成本去进行技术分析, 而是跟着大户的投资战略进行股票买卖 ,即所谓“散户跟大户”的现象。
•
例2
为什么中小企业不会花钱去开发新产品 ?
•
完全信息静态博弈的内涵
完全信息静态博弈,它有两个条件,(1 )各博弈方一次性的、同时决策(如剪 刀、石头、布的游戏,以及囚徒困境) ,(2)所有博弈方对各方得益都了解的 博弈,即各博弈方都完全了解所有博弈 方在各种情况下的得益。
见下页具体实例(石头、剪子、布游戏 )来理解什么是完全信息静态博弈。
•
生活中的“囚徒困境”例子
至迟从休谟(1739)开始,政治哲学
和经济学家已经认识到如果公民只关注 个人福利,公共物品就会出现短缺,并
且公共资源也会过度使用。因此政府应 该积极合理的干预经济生活。
•
例子
为什么政府要负责修建公共设施,因
为私人没有积极性出资修建公共设施
设想有两户相居为邻的农家,十分需要 有一条好路从居住地通往公路。修一条路的成 本为4,每个农家从修好的好路上获得的好处为 3。如果两户居民共同出资联合修路,并平均分 摊修路成本,则每户居民获得净的好处(支付 )为3-4/2=1;当只有一户人家单独出资修路时 ,修路的居民获得的支付为3-4=-1(亏损), “ 搭便车”不出资但仍然可以使用修好的路的另一 户人家获得支付3-0=3,见表2。
在技术创新市场上,大企业是大猪,它 们投入大量资金进行技术创新,开发新 产品,而中小企业是小猪,不会进行大 规模技术创新,而是等待大企业的新产 品形成新的市场后生产模仿大企业的新 产品的产品去销售。
经济博弈论之完全信息静态博弈培训

2023
PART 04
完全信息静态博弈的策略 分析
REPORTING
优势策略
优势策略是指参与者在给定信息下, 选择对自己最有利的策略,而不考虑 其他参与者的反应。
优势策略是博弈分析中的重要概念, 它可以帮助参与者找到最优的策略选 择。
在完全信息静态博弈中,如果某个参 与者有一个优势策略,那么无论其他 参与者选择什么策略,该参与者都应 该坚持这个优势策略。
收益
每个参与者在博弈中获得的效用或收益,是衡量参与者利益的标准。
在完全信息静态博弈中,每个参与者的收益函数是共同知识,即所有参与者都知 道其他参与者的收益函数。
纳什均衡
纳什均衡是指在一个博弈中,每个参 与者的最优策略选择在其他参与者最 优策略选择给定的情况下是最优的。
在完全信息静态博弈中,纳什均衡是 所有参与者的最优策略组合,满足每 个参与者的最优策略选择在其他参与 者最优策略选择给定的情况下是最优 的。
2023
PART 02
完全信息静态博弈的基本 概念
REPORTING
参与者
博弈中的决策主体,通常称为局中人 或参与人。
在完全信息静态博弈中,每个参与者 都了解其他参与者的身份及其所有可 能的策略和收益。
策略
参与者在博弈中可以选择的行动方案,是参与者在给定信 息集下的决策变量。
在完全信息静态博弈中,每个参与者的策略空间是共同知 识,即所有参与者都知道其他参与者的所有可能策略。
2023
PART 03
完全信息静态博弈的经典 案例
REPORTING
囚徒困境
总结词
描述两个囚犯因被捕而面临供述与否的决策,揭示个 体理性与集体理性的矛盾。
详细描述
在囚徒困境中,两个囚犯因共同犯罪被捕,并分别被 关押在独立的房间。每个囚犯都有供述和保持沉默两 种选择。如果两个囚犯都保持沉默,则他们都不会受 到严重惩罚;但如果一个囚犯供述,另一个保持沉默 ,则供述者会得到较轻的惩罚,而沉默者会受到更严 厉的惩罚。由于囚犯之间无法进行沟通,他们往往会 基于自身利益而选择供述,从而导致双方都受到较重 的惩罚。
博弈论讲义2

13
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,
第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。
在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i
命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法
箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法
完全信息静态博弈

• (三)最优反应函数法 • 所谓最优反应,指的是对某个局中人而言, 当其他人的策略给定时,使自己的收益最 大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中,彼此都互为最优反 应,那么,这个结果是均衡的,我们称之 为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如 下: p (q1 q2 ) ,边际称为常数c , 产量为 qi 。
• 首先,推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组,可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因,例 如,大家都靠右边行驶。
• 交通博弈:人们可以选择靠左或靠右行驶。
•
R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争(Battle of Sexes)
•
F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球,女士偏好看戏。 • 两者既有协作,又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。 三个实验: (1)你是其中之一(男士),如何选? (2)如果女士有权声明:看戏,你如何选? (cheap talk) • (3)如果女士有权发表如上声明,但放弃 了,你如何选?
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白,而另一方不坦白。则坦白 的一方因立功而释放;不坦白的一方因抗 拒且证据确凿,从众判10年徒刑。
完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
函数等)有完全的了解。 静态:指所有参与人同时选择行动且只选择一次。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
完全信息的静态博弈
占优战略均衡
重复剔除劣战略 纳什均衡
占优战略均衡、重复剔除的占优均衡及纳 什均衡的关系
纳什均衡举例
2.每个参与人可选择的战略是有限的。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
完全信息th complete information 完全信息:每个参与人对所有其他参与人的特征(包括战略空间、支付
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
2.行动(Actions):参与人在博弈的某个时点的决策变量。 ai— 第i个参与人的一个特定行动 Ai={ai}— 可供i选择的所有行动的集合 a=(a1,…,ai,…,an)— 行动组合
1. 参与人(Players):参与人指的是一个博弈中的决策主 体,它的目的是通过选择行动(或战略)以最大化自己的支 付(效用)水平。 自然(Nature)——虚拟参与人:决定外生的随机变量的 概 率 分 布 的 机 制 。 (the probability distribution of exogenous random variable)
混合战略纳什均衡
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
占优战略均衡
占优战略(Dominant-strategy):一个参与人的最优战略并不依赖于 其他参与人的战略选择,也就是说,不论其他参与人选择什么战略,他 的最优战略是唯一的(sole),这样的最优战略被称为“占优战略”。 例:囚徒困境(Prisoner's Dilemma) “囚徒困境”:两个嫌疑犯作案后被警察抓住,被分别关在不同的房间
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
组内学习汇报
博弈论(Game Theory)
---完全信息的静态博弈
博弈论的基本概念
博弈论的基本概念包括参与人、行动、信息、战略、支付( 效用)、结果和均衡。其中,参与人、战略和支付是描述一 个博弈所需要的最少的要素。
5.支付(Payoffs):指在一个特定的战略组合下参与人得到的确定效用水 平;或指参与人得到的期望效用水平。
ui— 第i个参与人的支付(效用水平) u=(u1,…,ui,…,un)为n个参与人的支付组合
博弈的一个基本特征是一个参与人的支付不仅取决于自己的战略选择 ,而且取决于所有其他参与人的战略选择。 ui是所有参与人的战略选择的函数:ui=ui(s1,…,si,…,sn)
ui或Eui最大化的战略。 为了把一个特定的参与人与其他参与人相区别,用s-i=(s1,…,si1,si+1,…,sn)表示除i之外的所有参与人的战略组成的向量。 si*是给定s-i情况下第i个参与人的最优战略,意味着ui(si*,s-i)≥ui( si’,s-i)
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
战略与行动是两种不同的概念,战略是行动的规则而不是行动本身。 例:人不犯我,我不犯人;人若犯我,我必犯人。—— 战略
犯、不犯—— 行动 特例:在静态博弈中,战略和行动是相同的。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
3.信息(Information):参与人有关博弈的知识,特别是有关“自然”的 选择,其他参与人的特征和行动的知识。
完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然”)的 行动选择有准确了解的情况,即每一个信息集只包含一个值。
完全信息:指自然不首先行动或自然地初始行动被所有参与人准确观察 到的情况,即没有事前的不确定性。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
4.战略(Strategies):参与人在给定信息集的情况下的行动规则,它规定 参与人在什么时候选择什么行动。
si— 第i个参与人的一个特定战略 Si={si}— 第i个参与人的所有可选择的战略集合 s=(s1,…,si,…,sn)— 战略组合
6.结果(Result)
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
7.均衡(equilibrium):所有参与人的最优战略的组合。 si*=(s1*,…,si*,…,sn*) si*— 第i个参与人在均衡情况下的最优战略,是i的所有可能的战略中使
里受审讯。警察知道两人有罪,但缺乏足够的证据定罪,除非两人当 中至少有一个人坦白。警察告诉每个人:如果两人都不承认,每个人 都以轻微的犯罪判刑1年;如果两人都坦白,各判刑8年;如果两人中 一个人坦白另一个人抵赖,坦白的释放出去,抵赖的判刑10年。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
战略表达式
战略表达式(The expression form of strategy):所有参与人同时选 择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。 战略式表达给出: 博弈的参与人集合(Set):i∈Γ,Γ=(1,2,…,n) 每个参与人的战略空间:Si,i=1,2,…,n 每个参与人的支付函数:ui(s1,…,si,…,sn),i=1,2,…,n G={S1,…,Sn;u1,…,un}— 战略式表达博弈 有限博弈:1.参与人的个数是有限的;
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
完全信息的静态博弈
占优战略均衡
重复剔除劣战略 纳什均衡
占优战略均衡、重复剔除的占优均衡及纳 什均衡的关系
纳什均衡举例
2.每个参与人可选择的战略是有限的。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
完全信息th complete information 完全信息:每个参与人对所有其他参与人的特征(包括战略空间、支付
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
2.行动(Actions):参与人在博弈的某个时点的决策变量。 ai— 第i个参与人的一个特定行动 Ai={ai}— 可供i选择的所有行动的集合 a=(a1,…,ai,…,an)— 行动组合
1. 参与人(Players):参与人指的是一个博弈中的决策主 体,它的目的是通过选择行动(或战略)以最大化自己的支 付(效用)水平。 自然(Nature)——虚拟参与人:决定外生的随机变量的 概 率 分 布 的 机 制 。 (the probability distribution of exogenous random variable)
混合战略纳什均衡
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
占优战略均衡
占优战略(Dominant-strategy):一个参与人的最优战略并不依赖于 其他参与人的战略选择,也就是说,不论其他参与人选择什么战略,他 的最优战略是唯一的(sole),这样的最优战略被称为“占优战略”。 例:囚徒困境(Prisoner's Dilemma) “囚徒困境”:两个嫌疑犯作案后被警察抓住,被分别关在不同的房间
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
组内学习汇报
博弈论(Game Theory)
---完全信息的静态博弈
博弈论的基本概念
博弈论的基本概念包括参与人、行动、信息、战略、支付( 效用)、结果和均衡。其中,参与人、战略和支付是描述一 个博弈所需要的最少的要素。
5.支付(Payoffs):指在一个特定的战略组合下参与人得到的确定效用水 平;或指参与人得到的期望效用水平。
ui— 第i个参与人的支付(效用水平) u=(u1,…,ui,…,un)为n个参与人的支付组合
博弈的一个基本特征是一个参与人的支付不仅取决于自己的战略选择 ,而且取决于所有其他参与人的战略选择。 ui是所有参与人的战略选择的函数:ui=ui(s1,…,si,…,sn)
ui或Eui最大化的战略。 为了把一个特定的参与人与其他参与人相区别,用s-i=(s1,…,si1,si+1,…,sn)表示除i之外的所有参与人的战略组成的向量。 si*是给定s-i情况下第i个参与人的最优战略,意味着ui(si*,s-i)≥ui( si’,s-i)
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
战略与行动是两种不同的概念,战略是行动的规则而不是行动本身。 例:人不犯我,我不犯人;人若犯我,我必犯人。—— 战略
犯、不犯—— 行动 特例:在静态博弈中,战略和行动是相同的。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
3.信息(Information):参与人有关博弈的知识,特别是有关“自然”的 选择,其他参与人的特征和行动的知识。
完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然”)的 行动选择有准确了解的情况,即每一个信息集只包含一个值。
完全信息:指自然不首先行动或自然地初始行动被所有参与人准确观察 到的情况,即没有事前的不确定性。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
4.战略(Strategies):参与人在给定信息集的情况下的行动规则,它规定 参与人在什么时候选择什么行动。
si— 第i个参与人的一个特定战略 Si={si}— 第i个参与人的所有可选择的战略集合 s=(s1,…,si,…,sn)— 战略组合
6.结果(Result)
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
博弈论的基本概念
7.均衡(equilibrium):所有参与人的最优战略的组合。 si*=(s1*,…,si*,…,sn*) si*— 第i个参与人在均衡情况下的最优战略,是i的所有可能的战略中使
里受审讯。警察知道两人有罪,但缺乏足够的证据定罪,除非两人当 中至少有一个人坦白。警察告诉每个人:如果两人都不承认,每个人 都以轻微的犯罪判刑1年;如果两人都坦白,各判刑8年;如果两人中 一个人坦白另一个人抵赖,坦白的释放出去,抵赖的判刑10年。
南京航空航天大学经济与管理学院
College of Economics and Manangement of NUAA
战略表达式
战略表达式(The expression form of strategy):所有参与人同时选 择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。 战略式表达给出: 博弈的参与人集合(Set):i∈Γ,Γ=(1,2,…,n) 每个参与人的战略空间:Si,i=1,2,…,n 每个参与人的支付函数:ui(s1,…,si,…,sn),i=1,2,…,n G={S1,…,Sn;u1,…,un}— 战略式表达博弈 有限博弈:1.参与人的个数是有限的;