Game04纳什均衡博弈论。课件。

合集下载

博弈论-混合策略纳什均衡PPT课件

25
说明
• 如果纳税人逃税的概率小于q*, • 则q<C/a+F ，税收机关的最优选择是不检
查； • 如果纳税人逃税的概率大于q*, • 则q>C/a+F ，税收机关的最优选择是检查； • 如果纳税人逃税的概率等于q*, • 则q=C/a+F ，税收机关随机地选择检查或
不检查。
26
之二
• 假设采用混合策略是税务机关的最优选择那么给定p ,纳税人选择逃税和不逃税的期望收益相等：
那么，政府的期望效用函数为：
vG G , L 3 11 1 01
5 1
对上述效用函数求微分，得到政府最优化的一阶条件为：
vG

5
1 0 0.2
就是说，从政府的最优化条件找到流浪汉混合策略— —流浪汉以0.2的概率选择寻找工作，0 .8的概率选择游闲。
• 答案是否定的。
• 事实上，局中人的选择仍然是很有讲究的，策略选择的好坏对局中人的利益仍然有很大的影响。
• 在这个零和博弈里，无论双方采用哪种策略组合，结果都是一方输一方赢，而输的一方又总是可以通过单独改变策略而反输为赢。如果哪个局中人能找到对手方的规律或者偏好，他就能猜测到对手的策略而采用针对性策略从而保证赢。
政府
不救济（-1，1）（0，0） 8
政府和流浪汉的博弈
• 思考：政府会采用纯策略吗？流浪汉呢？这个博弈有没有纯策略的纳什均衡？
• ——跟你玩剪子石头布游戏一样，你会一直采用纯策略吗？
• 那么政府和流浪汉最有可能采用什么策略？ • ——使自己的预期支付最大化。 • ——若能够猜的对方的策略，就可以采用针
vL 1, 1 3 vL 0,

纳什均衡理论课件

迭代逼近法
总结词
通过不断迭代和调整策略来逼近纳什均衡。
VS
详细描述
迭代逼近法是一种通过不断迭代和调整参与者的策略，以逐渐逼近纳什均衡的方法。这种方法可以在不知道具体的纳什均衡的情况下，通过迭代过程找到近似解。
04
纳什均衡的扩展与深化
非合作博弈中的纳什均衡
要点一
总结词
非合作博弈中，纳什均衡是指参与人选择策略时，没有达成任何协议或合作，各自追求自身利益的最大化。
纳什均衡理论课件
目录 CONTENTS
• 纳什均衡理论概述 • 纳什均衡的分类与特性 • 纳什均衡的证明方法 • 纳什均衡的扩展与深化 • 纳什均衡理论的现实应用 • 纳什均衡理论的前沿研究与展望
01
纳什均衡理论概述
定义与概念
纳什均衡定义：在博弈中，如果每个参与者的策略都是针对其他参与者的最优策略，则该博弈状态被称为纳什均衡。
社会学
纳什均衡理论在社会学中用于研究社会行为、合作与冲突、社会规范等领域，揭示了社会现象背后的博弈逻辑。
生物学
在生物学中，纳什均衡理论用于研究生物种群竞争、进化策略等领域，解释了生物种群之间的生存竞争与演化现象。
政治学
在政治学中，纳什均衡理论用于分析国际关系、政治竞争等领域，揭示了权力与利益分配的博弈逻辑。
社会冲突管理
在处理社会冲突时，可运用纳什均衡理论来分析各方的利益和策略，寻求最优解决方案。
公共资源管理
在管理公共资源时，政府可运用纳什均衡理论来分析个体和团体的竞争策略，制定最佳资源分配方案。
06
纳什均衡理论的前沿研究与展望
当前研究热点与难点
热点
复杂系统中的纳什均衡、多智能体系统中的纳什均衡、网络博弈中的纳什均衡

博弈论课件第四章

3
合作博弈
参与者之间可以合作并制定共同策略，追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念，指的是当参与者根据对手的选择来选择自己的策略时，不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等概率性决策中，以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零，一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作，每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科，第四章将介绍博弈论的基本概念、应用领域、主要模型以及纳什均衡理论和混合策略的应用，同时提供实际应用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多次对局中，通过随机选择策略以增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注决策，以提高筹码的价值和战略性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略

F-博弈论专题--纳什均衡多重性精选PPT

中国
欧盟求助
救助（1500，300）
不救（-200，-100）
等待（2000，-200）
（0，0）
讨论分析：
1、温州民间借贷问题：政府如何出手？（1）出手600亿；（2）不管；（3）？ 2、郑州市担保公司——扭曲的学习效应
温州市金融综合改革试验区，位于中国浙江省，由国务院决定设立。年3月28日，国务院常务会议决定设立温州市金融综合改革试验区，批准实施《浙江省温州市金融综合改革试验区总体方案》，引导民间
在“性别战”博弈中，存在两个纯战略Nash均衡——(F,F)和(B,B)以及一个混合战略Nash均衡 ((3 , 1),(1 , 3)) 。
44 44
事实上，在对“性别战”博弈进行建模的过程中，除了保留上图所示的要素(即参与人、战略和支付)以外，其它与“性别战”博弈有关的所有信息，如夫妻双方的生活习俗、他们所遵循的文化传统等等，都被我们抛弃在模型之外。
博
弈U
方 1
D
博弈方2
L
R
9， 9 8， 0
0， 8 7， 7
风险上策均衡（D，R）
猎人2
鹿
兔子
猎人
鹿
1 兔子
5， 5 3， 0
0， 3 3， 3
猎鹿博弈风险上策均衡（兔子，兔子）
三、聚点（焦点）均衡
一对青年夫妻决定周末出去娱乐，可供他们娱乐的项目有或者去观看足球比赛(用表示F)，或者观看芭蕾演出(用表示B)。（2000，-200）（十）加强社会信用体系建设。
引导民间资金依法设立创业企业、股权企业及相关管理机构。（三）发展专业资产管理机构。事实上，在对“性别战”博弈进行建模的过程中，除了保留上图所示的要素(即参与人、战略和支付)以外，其它与“性别战”博弈有关

Game_04_纳什均衡(纯策略)

– 没有单方偏离激励
3. 信念的协调
• 例：投资博弈
• 信念与行动一致
– 每个人对他人策略选择有着正确的信念参与者 2 X L 参与者 1 F T 1, 0 0, 3 2, 1 Y 2, 2 0, 1 0, 0 Z 0, 1 2, 1 1, 2
9 10
乙投资甲投资不投资（5， 5) 不投资（-10, 0）
投资不投资
（5， 5) （0, -10）
投资博弈：N=2
• 称策略组合 (投资，投资）、 (不投资，不投资）为纳什均衡
– 没有单方偏离激励，具有自我实施性质
定义：纳什均衡
• 策略组合 s*=(s*1, s*2)是纳什均衡，如果 – 参与者的策略互为最优反应 • u1 (s*1, s*2) ≥ u1 (s1, s*2) – s*1=b1(s*2) s b (s 任意 s1 ∈S1
乙投资甲投资不投资（5， 5) （0, -10）不投资（-10, 0）（0， 0）
5
• u2 (s*1, s*2) ≥ u2 (s*1, s2) – s*2=b2(s*1)
任意 s2 ∈S2
6
1
2. 纳什均衡与占优
• 占优策略组合：（坦白，坦白）
–是纳什均衡
2. 纳什均衡与占优
• 重复剔除严格劣策略得到的唯一策略组合：（X，X）
15
c
甲 c d （0， 0) （2, -1））
⎧ si if s1 +s 2 ≤ 100 ui ( s ) = ⎨ ⎩0 if s1 +s 2 >100
i = 1, 2
16
16
例：分饼博弈
• 参与者 i 的最优反应函数
例：分饼博弈

第十章博弈论初步-PPT精品

▪ 1、纳什均衡的定义：
▪ 设 s(s1， ..， .sn)是n人博弈G＝{ ； S1， ..， . Sn u1，..， . un } 的一个策略组合。如果对于每个局中人 i ， ui(s1 ， .， .s .i 1 ， si ， si 1 ， .， .s .n )≥ ui(s1 ， .， .s .i 1 ， si， si 1 ， .， .s .n )
第十章博弈论初步 Game Theory
博弈论概述纳什均衡序贯博弈与重复博弈进入威慑
第一节博弈论概述
▪ 什么是博弈？ ▪ 拍卖金钱 ▪ 海盗博弈 ▪ 田忌赛马 ▪ 围棋和象棋
齐王
田忌
上
中
下
上赢，输赢，输赢，输
中输，赢赢，输赢，输
下输，赢输，赢赢，输
一、博弈的基本要素
ui(si，si) ≥ ui(si，si) 对于所有si Si 都成立，则我们称策略组合
s(s1， ..， .sn)
是该博弈的一个纳什均衡。
▪ 纳什简介： ▪ 约翰·纳什生于1928年6月13日。父亲是电子工程师
与教师，第一次世界大战的老兵。纳什小时孤独内向。纳什的数学天分大约在14岁开始展现。他在普林斯顿大学读博士时刚刚二十出头，但他的一篇关于非合作博弈的博士论文和其他相关文章，确立了他博弈论大师的地位。在20世纪50年代末，他已是闻名世界的科学家了。 ▪ 然而，30岁的时候，纳什和他惟一儿子都罹患精神分裂症。半个世纪之后，在他妻子（艾利西亚—— —麻省理工学院物理系毕业生）的精心照料下，和她的儿子一样，纳什教授渐渐康复，并在1994年获得诺贝尔经济学奖。 ▪ 影片《美丽心灵》是一部以纳什的生平经历为基础而创作的人物传记片。该片荣获2019年奥斯卡金像奖。

《博弈论与信息经济学》纳什均衡的应用-PPT精选全文完整版

pi 2 ln Y ln N 2 ln N 1 ln n 1 ln y 1
p
N
n
2 ln Y
N
n
1 ln
N
N
n
2 ln
N
1
N n 1 ln n 1 N n 1 ln y 1
si
2 ln Y
2 ln
N
2 ln
n
2
ln
y
1
s
N
n
2 ln Y
N
n
2 ln
N
N
n
2 ln
n
2
p 2 ln y 3 ln y 6 2 ln y 3 y 6 4 ln y 4 ln 3 2 ln 2
s
4 ln y
4 4 ln y 8ln 2
s p 8ln 2 4 ln 3 2 ln 2 4 ln 3 6 ln 2 ln 81 ln 64 2 ln 9 8 0
y ，
6
2
ln
y 3
ln
y 6
每一期的消费量y1
2 3
y，y2
1 3
y
10
博弈论与信息经济学
2024/10/15
b.社会效益最大化模式假定以整个村庄的人对公地消费的总体效用达到最大化为目标，即公地问
题的社会最优问题。
ln c1
ln c2
2 ln
y
c1 c2
2
最优条件为：
c1
pi s
p
2024/10/15
16
博弈论与信息经济学
比较的结果说明：
1 从社会整体上看，以社会利益最大化为目的的消费管理
方式优于以个人利益最大化的消费管理方式；

第二讲纳什均衡 PPT课件

二、情侣博弈的结论：纳什均衡（三）分类 2.普通纳什均衡（1）均衡战略与非均衡战略无差异（2）参与人单独改变策略后，支付可
能不变
2020年1月5日
博弈论第二章
12
第二讲纳什均衡
第三节纳什均衡
三、寻找纳什均衡的方法
团队合作
（一）严格劣势策略反复消去法
乙

工作偷懒
工作
6,6
+1，-1
+1，-1 +1，-1
博弈论第二章第二讲纳什均衡
-1，+1
+1，-1 +3，-3
37
博弈论第二章
33
第二讲纳什均衡
第三节纳什均衡
四、纳什均衡在微观经济学中的应用：古诺模型
1.博弈三要素（3）支付
i (q1, q2 ) (a q1 q2 ) qi ciqi
2020年1月5日
博弈论第二章
34
第二讲纳什均衡
第三节纳什均衡
四、古诺模型
2.企业i的目标： max i
二、情侣博弈结论：纳什均衡（一）表述若存在一个策略组合（足球，足球），
当参与人单独改变策略后，支付下降，此策略组合为纳什均衡。 ——博弈各方相互作用的稳定结局
2020年1月5日
博弈论第二章
9
第二讲纳什均衡
第三节纳什均衡
二、情侣博弈的结论：纳什均衡（二）定义
给定G=｛S1，…,Sn;u1,…,un｝, s*=(s*1,…,sn*) 对于所有i和si∈Si，有： ui(si*,s-i*)≥ ui(si’,s-i*)
2020年1月5日
博弈论第二章
23
第二讲纳什均衡

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

• 两个均衡无差异：没有明确的好与坏
24
一般博弈
l
r
• 如左图博弈，存在弱
劣策略时易出现多重
U
1,1
0,0
NE。
D
0,0
0,0
25
聚点（ focal point）均衡
• 如何在多重NE中选择一个确定的结果呢？
• 谢林（Schelling） (1961)提出——“聚点”
– 根据博弈规则以外的某些特定信息（如共同的社会规范、知识或某些特征）从多个NE中确定出一个
– 彼此最优反应：在对方的最优反应下的反应最优 • 没有一个局中人会轻易改变策略而使自己蒙受损失； – 即任何改变NE状态的策略将不会严格增加自身的效用。
17
NE的特点：
• 不后悔： – 即其他人不改变行为的前提下，自己改变行为没有好处； – 只有在NE时才不后悔； • 如对方如果选择非NE策略，你先NE策略会后悔；
若策略组合 (s1 ,s2 , si, ,sn ) 满足：
u i(s 1 ,s 2 , ,s i 1 ,s i ,s i 1 , s n ) u i(s 1 , ,s i 1 ,s i,s i 1 , s n )
则称 (s1,s2,sn) 是博弈G的一个NE。等价定义：
在博弈 G S 1 ,S 2 , S n ;u 1 ,u 2 , u n 中，若策略组合 (s1,s2,sn)
– 强NE比弱NE更容易取舍（因为弱均衡有无差异的策略存在）；
• 强NE对博弈支付矩阵的微小改变不敏感。
16
NE的含义：
博弈G的NE指这样一个策略组合：
• 为了极大化自己的收益（效用），每个局中人所采取的策略必定是其它局中人所采取策略的最优反应；
– 给定你的策略，我的策略是最优的；（同时）给定我的策略，你的策略是最优的；
➢ 显然，只有遵守协议带来的效用大于不遵守协议的效用时，每个参与人才会遵守协议。
➢ 如果没有参与人有积极性不遵守协议，则该协议就是自动实施的，则该协议就构成一个NE.
19
三、NE解的特征
（一）单一NE的博弈
– 有唯一的NE解。
20
囚徒困境
• 唯一的NE: (D,D)
2
• 如（C,C）就不是NE，因为：
• 可从哪方面对上述模型进行扩展？（射门力度和精确度）
9
最佳策略的正式定义
• 定义一：如果满足以下条件，则参与人i的策略 s i是
对手策略s-i的最佳对策BR：
u i(si,s i)u i(si',s i) si' Si
• 定义二：s i 最大化了对手选 S-i时我的收益： si au m gu a i(s x i',s i)
– 聚点就成为博弈的最终结果，是多个NE解中的一个
• 如在一双行道上的两个相对开车的人，各自既可选择左行（L），也可右行（R）；共同的交通规则下，结果（R,R)。
26
性别战
• 两NE: (F,F)和（O,O)
– 对两博弈人（夫妇），这两均衡解不是无差异的。
27
实验：性别战之一
• 假设你和你的女（男）朋友正在进行“性别战” 博弈。实验人群分为男、女生两组，男、女两类实验者均做为博弈人1（丈夫）在看踢足球、看歌剧这两个行动中进行选择。
• 如果降低b（即降低了协同性）会如何？ – 会出现剪刀效应（BR1更陡、更平缓BR2）： • 参与人1会减少努力； • 2知道1会降低努力水平，2也会降低自己的努力水平； • ····
14
二、纳什均衡的定义
在博弈 G S 1 ,S 2 , S n ;u 1 ,u 2 , u n 中，对 si Si (in)
36
实验五——合作与风险偏好
• 对称的合作博弈：有两个NE: (A, A)和(B, B) 问：你认为博弈结果应该是哪一个呢？
• 实验结果：
– 人数： – (A, A): – (B, B):
37
• 说明：
– （A, A)帕累托占优于(B,B)； – 但博弈人选择A的风险高于B； – 实验结果是(B,B)更有可能。
满足：
m si Si u ai(sx i,s i)ui(si,s i)
则称 (s1,s2 , sn )是G的一个NE策略组合。
15
• 定义：策略组合 s*是博弈G的一个纯策略纳什均
衡（a pure strategy Nash equilibrium），当且仅
当对所有博弈人i和所有策略
– 定义：纯策略NE是严格的，当且仅当
完全信息静态博弈
LEC04 纳什均衡
内容概览
一、最优反应（best response) 二、纳什均衡的定义
– 有关NE的几点说明
三、NE解的特征（一）单一NE的博弈（二）有多个NE的博弈 – 聚点（ focal point）均衡 – 聚点实验 » 性别战实验一——四 »实验六五——合作与风险偏好 – 对NE信念的说明
• 博弈规则： – 只能选择一次；不能讨论，窥视
28
实验结果：
– Men are simply more aggressive creatures...
29
实验：性别战之二
• 博弈规则： – 你作为博弈人1先进行选择；你选完后对方再选择；对方选择时无法观察到你的选择；
• 问你如何进行选择？
30
2
回顾
• 重复剔除严格劣战略法 – 严格的前提假设：所有参与人是理性的；理性是共同知识 – 解完全信息静态博弈问题的一种方法。
• 因有严格假设前提，不是所有博弈都能用该方法。 • 纳什均衡（Nash Equilibrium，NE）的提出：对所有
有限次博弈来说，从纳什均衡角度是可解的，且至少有一个纳什均衡解。
l
r
• U1(L,l)=4。
队员L
4，-4 9，-9
• 你作为A队队员该如何选择？ – 有无劣策略？
M
6，-6 6，-6
R
9，-9 4，-4
8
• M是你无论如何都不会选的，为什么？ – 因为不论对方门将的可能选择是什么，M都不是最优策略；（试做图分析）
• 结论： – 不要选择一个在任何信念下都不是最佳策略的策略。
– 博弈人2选C时，博弈 1 人1会偏离C而选D；
– 博弈人1选D时，博弈人2也会偏离C而选D;
– 2选D时，1只会选D；说明：
反之亦然。
1. 严格劣势策略永远不会形成NE;
2. 重复剔除劣策略均衡属于NE.21
一般博弈
• 唯一的NE: (U,L) • 求解方法：划线法
• NE与重复剔除的占优均衡之间的关系：
BR2(s1) =1+bs1=s2*
参与人1的哪些策略是非最佳策略？（作图分析）
12
• 参与人1（or 2）的非最佳策略： – [0,1)和(2,4]；
• 因参与人永远不会选其非最佳策略，因此可剔除，缩小策略选择范围到[1,2]； – 再找非最佳策略：[1,5/4) 和 (7/4,2]; – 剔除
– 这种信息示意可以是有作为的、也可以是无作为的； – 但博弈的标准型分析无法捕捉到这种信念形成过程。
• 新信息的来源，即推动参与人信念更新的因素有哪些呢？
39
信念的来源
1. 博弈规则 2. 事先的交流 3. 聚点
– 社会规范、或某些显著的特征（如对风险的厌恶）会促使参与人选择某个特定策略
• 反映了信念的自我实施（self-fulfilling）（分析见下页）；
18
信念自我实施的含义：
• 假设n个参与人在博弈前协商达成一个协议：
(s1 ,s2 , si , ,sn )
– 其中si* 是协议规定的参与人i的策略；
– 在给定其他参与人都遵守协议、且没有外在强制情况下，是否有任何参与人有积极性不遵守这个协议？
– “cheap talk”：这种事先的口头宣告的交流方式 • 发出的信号（message）是没有成本的； • 博弈的分析不应该考虑这种信号的作用，为什么？（见下页）
33
• 博弈人2的策略集变为：
– {Ff, Fo, Of, Oo}
（第1个数字：实际选择的策略；第2个数字代表：宣布的策略）
• 博弈支付没有变，实质博弈、博弈结果不变
合伙人博弈（Partnership Game)
两个人要共同完成一个合作项目（如律师事务所），各自都需要对项目做出努力，最后平分利润；
• 博弈人：各持50%股份的两个股东； • 策略：每个股东要选择为项目投入的精力，即努力水
平（小时数），如Si=[0,4]；（连续策略）
• 收益：
– 项目收益4(s1+s2+bs1s2)（b=[0,1/4]，表示协同性）； – u1(s1,s2)= 2(s1+s2+bs1s2)- s12
F
• 然而，2的宣告对1是一个
成功的误导信号，使1认
为2会选她喜欢的策略
“O”。
O
F
O
Ff
Fo
Of Oo
2,1
0,0
2, 1
0,0
0,0
1,2
0, 0
1,2
34
实验：性别战之四
• 博弈规则： – 在开始博弈前，博弈人2（妻子）有机会事先宣布，但2却选择了沉默；
• 问你如何进行选择？
35
• 实验结果：说明： – ”沉默”会被看作博弈人2软弱的表现，会导致1选择“O”的人数减少。
• ·····（重复剔除非最佳策略的过程） • 结果：两参与人最优反应函数的交点，即
– s1*= s2*= 1/(1-b)。
合伙人会努力工作达到最优解吗？最优效率解在实际中是否总能达到呢？最优效率解收效如何？