完全信息静态博弈.

合集下载

完全信息静态博弈

博弈论的发展前景
无论是从社会经济发展的客观要求，还是从经济学理论发展本身的规律来看，博弈论都有很大的发展前途。 1）博弈论本身具有优美深刻的本质魅力，新的分析工具和应用领域的不断发现，以及博弈论价值得到越来越充分的认识，不断吸引大量学者加入学习、研究和应用博弈论的队伍。这是博弈论继续向前发展的根本基础和保证。 2）在博弈规则的来源、博弈方的行为模式和理性等基础理论方面，博弈论还存在不少没有很好解决的问题，有待进一步研究和解决。这正是博弈论未来发展的动力。 3）当前合作博弈理论发展相对落后，这个领域有很大的发展潜力，很可能孕育出引发经济学新革命的重大成果。非合作博弈和合作博弈理论的重新组合也可能给博弈论的发展提出新的方向和课题。
1）决策者考虑短期利益、个人或者小集团利益更多，决策者确实缺乏理智和理性； 2）局部地区或特定时期战争的利益比上述博弈中所假设的要大； 3）其他国家选择战争时还击比不还击损失小，先发制人则更能使自己相对有利；
以上因素都是导致发生战争机会增大的重要原因。
2）风险上策均衡法
风险上策均衡：如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时，都偏爱其中某一个纳什均衡，则该纳什均衡就是一个“风险上策均衡”。
博弈论在我国经济中的应用
企业经营者的启示：
1）在我国经济体制改革和国有企业管理体制改革中，委托人—代理人理论和激励机制设计原理有很大的应用价值。如，对“监督困难的委托人—代理人理论”的研究，找到可以调整各方面的利益关系和调动职工和经营者的积极性和责任心的依据和方法。 2）博弈论领域中“囚徒困境”，“激励悖论”等众多模型和命题为企业经营者揭示了众多经济、经营活动中的内在规律，企业决策者利用这些工具可以大大提高在价格和产量决策、经济合作和经贸谈判，参与投标拍卖，处理劳资关系等问题的决策效率。

经济博弈论之完全信息静态博弈培训

2023
PART 04
完全信息静态博弈的策略分析
REPORTING
优势策略
优势策略是指参与者在给定信息下，选择对自己最有利的策略，而不考虑其他参与者的反应。
优势策略是博弈分析中的重要概念，它可以帮助参与者找到最优的策略选择。
在完全信息静态博弈中，如果某个参与者有一个优势策略，那么无论其他参与者选择什么策略，该参与者都应该坚持这个优势策略。
收益
每个参与者在博弈中获得的效用或收益，是衡量参与者利益的标准。
在完全信息静态博弈中，每个参与者的收益函数是共同知识，即所有参与者都知道其他参与者的收益函数。
纳什均衡
纳什均衡是指在一个博弈中，每个参与者的最优策略选择在其他参与者最优策略选择给定的情况下是最优的。
在完全信息静态博弈中，纳什均衡是所有参与者的最优策略组合，满足每个参与者的最优策略选择在其他参与者最优策略选择给定的情况下是最优的。
2023
PART 02
完全信息静态博弈的基本概念
REPORTING
参与者
博弈中的决策主体，通常称为局中人或参与人。
在完全信息静态博弈中，每个参与者都了解其他参与者的身份及其所有可能的策略和收益。
策略
参与者在博弈中可以选择的行动方案，是参与者在给定信息集下的决策变量。
在完全信息静态博弈中，每个参与者的策略空间是共同知识，即所有参与者都知道其他参与者的所有可能策略。
2023
PART 03
完全信息静态博弈的经典案例
REPORTING
囚徒困境
总结词
描述两个囚犯因被捕而面临供述与否的决策，揭示个体理性与集体理性的矛盾。
详细描述
在囚徒困境中，两个囚犯因共同犯罪被捕，并分别被关押在独立的房间。每个囚犯都有供述和保持沉默两种选择。如果两个囚犯都保持沉默，则他们都不会受到严重惩罚；但如果一个囚犯供述，另一个保持沉默，则供述者会得到较轻的惩罚，而沉默者会受到更严厉的惩罚。由于囚犯之间无法进行沟通，他们往往会基于自身利益而选择供述，从而导致双方都受到较重的惩罚。

完全信息静态博弈

一占优战略均衡
占优战略均衡
定义：在博弈的战略表达式中，如果对于所
有的i，Si*是i的占优战略，下列战略组合称为
占优战略均衡：
s* (s1*, , sn* )
一占优战略均衡
注意：
✓ 如果所有人都有（严格）占优战略存在，那么占优战略均衡就是可以预测的唯一均衡。
✓ 占优战略只要求每个参与人是理性的，而不要求每个参与人知道其他参与人是理性的（也就是说，不要求理性是共同知识）。为什么？
二重复剔除的占优均衡
举例：剔除顺序：R3、C3、C2、R2，战略组合（R1，C1）
C1
R1
2，12
R2
0，12
R3
0，12
C2
1，10 0，10 0，10
C3
1，12 0，11 0，13
剔除顺序：C2、R2、C1、R3，战略组合（R1，C3）
故一般使用严格劣战略剔除，可以看到，（R1，C3）（R1，C1）都是纳什均衡，但在这里是不可解的。
开发商B 开发不开发
开发 4000，4000 8000，0
不开发 0，8000
0，0
需求小的情况开发商A
开发商B 开发不开发
开发 -3000，-3000 1000，0
不开发 0，1000
0，0
博弈的战略式表述
斗鸡博弈
独木桥
进 A
退
B
进
退
-3，-3 2，0
0，2 0，0
纳什均衡：A进，B退；A退，B进对于相当多的博弈，我们无法运用重复剔除劣战略的方法找出均衡解。
6，2
R2
2，1
R3
3，0
8，4 9，6
3，6 2，8

完全信息静态博弈

三纳什均衡
n 纳什均衡与占优战略均衡及重复剔除的占优均衡：
n （1）每一个占优战略均衡及重复剔除的占优均衡一定是纳什均衡，但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优均衡；
n （2）纳什均衡一定是在重复剔除严格劣战略过程中没有被剔除掉的战略组合，但没有被剔除掉的组合不一定是纳什均衡，除非它是唯一的（不适用于严格弱劣战略的情况）
第二章完全信息静态信息博弈-纳什均衡
n 一占优战略均衡 n 二重复剔除的占优均衡 n 三纳什均衡 n 四混合战略纳什均衡 n 五纳什均衡存在性及相关讨论 n 六纳什均衡应用举例
一占优战略均衡
n 完全信息静态博弈 ü 完全信息：每个参与人对所有其他参与人的特
征（包括战略空间、支付函数等）完全了解 ü 静态：所有参与人同时选择行动且只选择一次。 ü 同时：只要每个参与人在选择自己的行动时不
四混合战略纳什均衡
n 社会福利博弈
政府
流浪汉
寻找工作流浪
2 救济 3，
1 不救济 -1，
3 -1，
0 0，
没有一个战略组合构成纳什均衡
四混合战略纳什均衡
猜谜游戏
v两个儿童各拿一枚硬币，
v若同时正面朝上或朝下， A给B 1分钱，
v若只有一面朝上，B给A 1分钱。
零和博弈
博弈参与者有输有赢，但结果永远是0。
正面反面
正面
反面
1 -1，
-1 1，
-1 1，
1 -1，
没有一个战略组合构成纳什均衡
四混合战略纳什均衡
n 警察与小偷
1万元
酒馆东边
小偷
警察
警察与小偷的最优策略各是什么？

第二讲完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义：在博弈 G S1,..., Sn ; u1,..., un 中，
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策，也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中，如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。合，则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中， * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡，则严格下策反复消去法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法思路对博弈中的每个策略组合进行分析，考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能，则从所分析的策略组合对应的得益数组引一箭头，到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

完全信息静态博弈

• （三）最优反应函数法 • 所谓最优反应，指的是对某个局中人而言，当其他人的策略给定时，使自己的收益最大的那个策略。
Bi (si ) {si Si : ui (si , si ) ui (s 'i , si ), s 'i Si }
• 如果某个策略组合中，彼此都互为最优反应，那么，这个结果是均衡的，我们称之为纳什均衡。
• (1) 古诺模型 • 两个寡头企业进行产量竞争, 市场需求函数如下: p (q1 q2 ) ，边际称为常数c ，产量为 qi 。
• 首先，推导两家企业的最优反应函数。
c qj qi (q j ) 2 2
• 联立方程组，可以解出纳什均衡产量。
2( c) q* 3
• 社会规范是聚点形成的一个重要原因，例如，大家都靠右边行驶。
• 交通博弈：人们可以选择靠左或靠右行驶。
•
R R L L
1, 1 0, 0
0, 0 1, 1
2. 性别之争（Battle of Sexes）
•
F F O 2, 1 0, 0 O 0, 0 1, 2
• 男士偏好足球，女士偏好看戏。 • 两者既有协作，又有冲突。
• • • •
(F,F)和(O,O)都是纳什均衡。三个实验：（1）你是其中之一（男士），如何选？（2）如果女士有权声明：看戏，你如何选？（cheap talk) • （3）如果女士有权发表如上声明，但放弃了，你如何选？
3. 协作与风险占优
A A B
B
9, 9 8, -15
-15, 8 7, 7
• 如果一方坦白，而另一方不坦白。则坦白的一方因立功而释放；不坦白的一方因抗拒且证据确凿，从众判10年徒刑。

完全信息静态博弈教学课件

完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下，没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中，每个参与者都做出了最优策略，并且没有其他可行的更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法，并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。我们将探讨完全信息博弈的特点，并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策，没有机会进行反复决策。我们将学习静态博弈的概念和分类，为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例，讲解完全信息静态博弈的应用和分析过程。
谈判中的博弈
探讨在谈判中的决策制定者之间如何利用博弈论分析对方策略，并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞拍者如何制定最佳出价策略。
完全信息静态博弈教学课件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息静态博弈的定义、特点以及解决方法，并通过案例讲解和应用帮助理解。
什么是博弈论？
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。我们将深入探讨博弈论的应用和它在现实生活中的重要性。

博弈论完全信息静态博弈

max u1 max(6q1 q1q2 q12 )
q1
1 q1 R1 (q2 ) (6 q2 ) 2
同样有： 2 max u1 max(6q2 q1q2 q2 )
q2
1 q2 R2 (q1 ) (6 q1 ) 2
2.3.2 反应函数
古诺模型的反应函数
个博弈方的各一个策略组成的某个策略组合 (s1*,…,sn*)中，任
一博弈方 i的策略si*，都是对其余博弈方策略的组合 (s1*,…, si1 *,
si+1* ,…,sn*) 的最佳对策，也即
* * ui ( si* , si*1 , si* , si*1 ,...sn ) ui ( si* , si*1 , sij , si*1 ,...sn )
q2
(0,6)
R1 (q2 )
q1 R1 (q2 ) 1 (6 q2 ) 2 q2 R2 (q1 ) (6 q1 )
1 2
(0,3)
R2 (q1 )
(3,0) (6,0)
q1
古诺模型的反应函数图示

对一个一般的博弈，只要得益是策略的多元连续函数，我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数，也即反应函数，而解出的各个博弈方反应函数的交点就是纳什均衡。这种利用反应函数求博弈的纳什均衡的方法称为“反应函数法”。
本部分主要内容
2.1 基本分析思路和方法
2.2 纳什均衡
2.3 无限策略博弈分析和反应函数 2.4 混合策略和混合策略纳什均衡
2.5 纳什均衡的存在性
2.6 纳什均衡的选择和分析方法扩展
2.1 基本分析思路和方法
2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3 划线法 2.1.4 箭头法

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

三：优超
１、优超概念 • 如果一个局中人在任何情况下从某种策略中得到的支付均大于从另一种策略中得到的支付，那么显然对他而言，前一种策略优于后一种策略，这就是优超概念的意义。 • （有严格优势策略和严格劣势策略、弱优势策略）
三：优超
２、囚徒困境中的优超在囚徒困境中，对局中人1而言，无论局中人2采取何种策略，采用“坦白”策略得到的支付都大于采用“不坦白”策略的支付。对局中人1来讲，“坦白”策略优超 “不坦白”策略，或者说“不坦白”策略被优超。从个人利益出发，显然被优超的策略不应被局中人采用，因此可以利用优超概念来简化博弈局势，从而获得博弈的结果（解）。
三：优超
３、囚徒困境的结局理性的人是不会采用对自己不利的严格劣势策略的，所以在分析博弈的可能结局时，我们应该把局中人的严格劣势策略剔除。这样我们就得到囚徒困境的结局为：双方坦白，各得－６。因此，我们在分析一个局中人的决策行为是，可以首先把一个严格劣势策略从该局中人的策略中去掉，然后在余下的策略范围中，试图再找出这个局中人或者别的局中人的严格劣势策略，并将它去掉。不断重复这一过程，直到对每个局中人而言，再也找不出严格劣势策略为止。
• 在该矩阵中，括号内的第一个数字表示局中人1在对应策略形成的结局中得到的支付，第二个数字表示局中人 2的相应支付。这种矩阵有时也被称为双支付矩阵，表中常常省略局中人1和局中人2的标记。缺省的设定是，局中人1选择行．局中人2选择列。如果有三个局中人，则局中人3选择矩阵。 • 在不同的博弈论论著中，囚徒困境中的具体数值往往不一样，情节上也略有差别，但所描述的原理都是一样的，其中起关键作用的是数值的相对大小而不是数值的绝对水平。 • 矩阵形式能够很清晰地表示只有两个局中人且每个局中人可选策略数目不多的博弈局势，有时也用来表示3个局中人策略有限的局势(列出若干个矩阵)。但它不能表示局中人可选策略数目无限(或相当多)的情形，也很少用于4个和更多局中人的情形。在不宜使用矩阵形式表示的情况下，只能用语言描述或者使用数学公式进行描述。
•
•
• • •
“完全信息”是指局中人对自己与其他局中人的所有与博弈有关的事前信息(策略、空间、支付函数等)有充分的了解。 “静态博弈”是指在博弈实际进行时，每个局中人的策略选择同时进行而且仅进行一次。这里的“同时”并不要求时间上的完全一致，只要每个局中人在选择策略时不知道其他局中人所选择的策略即可。我们以下通过一个经典实例来说明策略型博弈是如何描述博弈局势的。
二：囚徒困境
• 有两个人因为涉嫌一次犯罪而被捕，被警方分别关在两个房间内审讯，他们面临的形势是：如果两个人都坦白罪行，那么将各被判处6年有期徒刑；如果一方坦白另一方不坦白，那么坦白者从宽，判处1年徒刑，抗拒者从严，判处8年徒刑；如果两个人均不坦白．则各被判处2年徒刑。
囚徒困境策略型博弈
一：策略型表述
三种基本要素构成了策略型博弈 • 1．局中人： • 2 ．策略； • 3 ．支付：
• 双人博弈:如果局中人只有两个。则称其为双人博弈
•
• 零和博弈:如果说所有局中人的支付之和在任何情况下均为零的博弈 • 有限博弈:指博弈的局中人个数与每个局中人的策略数均是有限的 •
完全信息与静态博弈的理解
完全信息静态博弈
• • • • 教学任务 1、策略型博弈的表达形式 2、如何进行策略型博弈 3、介绍其他策略型
第一节策略型博弈
• 策略型博弈的定义在博弈论中抽象出现实博弈中的最基本要素构成的模型描述就是所谓的策略型，或称标准型，用这种方式描述的博弈常常称为策略型博弈。是整个博弈的基石，在此基础上进行博弈分析
严格劣势策略逐次消除法
局中人２
ＬＴ局中人１１０１Ｃ３３Ｒ０
Ｍ
０
２
０
１
３
０３
５
Ｂ
０
２
２
４
严格劣势策略逐次消除法
局中人２
ＬＴ局中人１Ｍ０１２００１１Ｃ３
Ｂ
０
２
２
４
严格劣势策略逐次消除法
局中人２
ＬＴ局中人１１０１Ｃ３
Ｂ
０
２
２
４
严格劣势策略逐次消除法
第二节纳什均衡
• 一、纳什均衡的含义
一策略组合中，所有的参与者面临这样的一种情况：当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。
第二节
• 二、纳什均衡的意义
纳什均衡
１、它是关于博弈结局的一致性预测如果所有局中人预测一个特定的纳什均衡会出现，那么之中均衡就会出现，预测之间没有矛盾，不会因为有的局中人认为认为不符合自己的利益而失败。只有纳什均衡才能使每个局中人均认可这种结局，而且他们均知道其他局中人也认可这种结局。而非纳什均衡的结局并非一致性预测．如果局中人预测会出现非纳什均衡，那么或者是局中人的预测相互不统一，或者是局中人在估计别人的策略选择或极大化自己的支付时犯了错误。纳什均衡最重要的性质是“自我强制性”，如果局中人就纳什均衡结局达成协议，那么不需要任何外力的帮助，它自身就蕴含着保障实现的力量。 • ２、任何非纳什均衡的结局要成为协定都需要外在强制力量(道德、法律等)的帮助，否则有的局中人将会有动机背叛协定。 • ３、纳什均衡的弱点 • 它并不能保证惟一性，存在多个纳什均衡时哪一个会在现实中出现是一个难以解决的问题。另外，引入其他理性考虑后，有些纳什均衡并不那么合理。
局中人２
ＣＴ局中人１１３
Ｂ
２
４
弱优势策略
乙
左上４１２３中１０２右１２
甲
中
０下
１２
２１２
１１
１８
１１
１３
３
１
２
四：囚徒困境的结果及意义
• １、对于囚徒困境，可以利用严格劣势策略逐次消除法（迭代剔除被优超策略）的方法去求得结果。 • ２、囚徒困境反映了一个深刻的问题：个体理性与集体理性之间的矛盾。个体理性选择的结果并非最优，不符合集体理性的要求。囚徒陷入了理性的困境。 • ３、当每个人都为各自利益而努力的时候，市场经济体制可以是资源配置得到最有效率的应用。然而类似囚徒困境的博弈局势显示，每个人仅仅考虑自己利益要求时的结果不一定是最优结局，存在使参与者利益都得到改进的可能性却无法实现。 • ４、囚徒困境为我们理解人类理性提供了强有力的分析工具。

完全信息静态博弈.

完全信息静态博弈

经济博弈论之完全信息静态博弈培训

完全信息静态博弈

完全信息静态博弈

第二讲 完全信息静态博弈

完全信息静态博弈

完全信息静态博弈教学课件

博弈论 完全信息静态博弈

第二讲完全信息静态博弈

博弈论完全信息静态博弈