哈工大管理学院 选修课 博弈论 第5讲1
博弈论非常好的讲解ppt课件

“乘客侧前轮”看起来是一个合乎逻辑的选 择。
但真正起作用的是你的朋友是否使用同样的 逻辑,或者认为这一选择同样显然。并且是 否你认为这一选择是否对他同样显然;反之, 是否她认为这一选择对你同样显然。……以 此类推。
也就是说,需要的是对这样的情况下该选什 么的预期的收敛。这一使得参与者能够成功 合作的共同预期的策略被称为焦点。心有灵 犀一点通。
获奖原因:“通过博弈论分析加强了 我们对冲突和合作的理解”所作出 的贡献而获奖。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
1994年诺贝尔经济学奖获得者
美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.) 以及德国人莱因哈德-泽尔腾(Reinhard Selten)
获奖理由:在非合作博弈的均衡分析理 论方面做出了开创性的贡献,对博弈论 和经济学产生了重大影响 。
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
ቤተ መጻሕፍቲ ባይዱ
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
博弈论讲义完整版

第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈
一 博弈的基本概念及战略表述 二 占优战略(上策)均衡
三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈
完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境
囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。
思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?
博弈论PPT课件

这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中,每个囚徒 都有两种可选择的策略:坦白或抵赖。显然不 论同伙选择什么策略,每个囚徒的最优策略是 “坦白”。如果一个博弈中,某个参与人有占 优策略,那么该参与人的其他可选择策略就被 称为“劣策略”。
在一个博弈里,如果所有参与人都有占优 策略存在,那么占优策略均衡是可以预测到的 唯一的均衡,因为没有一个理性的参与人选择 劣策略。所以在“囚徒困境”博弈里,“坦白、 坦白”是占优策略均衡。
第五章 博弈
第一节 博弈论的基本概念与应用
一、博弈论的定义 博弈论,英文为Game theory,是研究相互依赖、相 互影响的决策主体的理性决策行为以及这些决策的均衡 结果的理论。一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈。 博弈论研究的是存在相互外部效应条件下的主体的 决策问题。
在寡头垄断的市场上,只有少数几家厂商 在相互竞争,寡头们面对的市场环境或者说竞 争对手的行为将随着他们本身的决策行为而变 动,即寡头们的决策是相互作用的,每个企业 的得益和利润不仅取决于自身的决策,也取决 于其他厂商的决策。寡头厂商之间可能有激烈 的竞争,这些竞争涉及价格、产量、广告、投 资等许多方面的决策,在分析寡头垄断市场中 的企业决策行为时,就必须把各种决策者之间 的策略相互作用纳入到经济模型中,这就是一 种博弈分析。
1.从行动的先后次序来划分,博弈可以分为静态博 弈和动态博弈。静态博弈指在博弈中,参与人同时选择行 动或虽非同时但后行动者并不知道先行动者采取了什么具 体行动;动态博弈指的是参与人的行动有先后顺序,且后 行动者能够观察到先行动者所选择的行动的博弈。
2.从参与人对其他参与人的各种特征信息 的获得差异来划分,博弈可分为完全信息博弈 和不完全信息博弈。完全信息博弈指的是每一 个参与人对所有其他参与人的特征,如策略集 合及得益函数都有准确完备的知识;否则就是 不完全信息博弈。
博弈论第5次课——完全信息静态博弈

0.2 ,政府将选择救济;只有当 0.2 时,政府才会选择混合策略 ( 0, 1) 或任何纯策 • 略。 要找出政府的均衡混合策略,需求流浪汉的最优 化问题。流浪汉的效用函数为: v L ( G , L ) (2 1(1 ) (1 )( 3 0(1 )) • ( 1) 3(1 ) • (2 1) 3 v L 最优化一阶条件为: (2 1) 0 因此, * 0.5 该结论可解释为:若θ<0.5,流浪汉的最优选择是找 工作;若θ>0.5,其最优选择是游荡;只有当θ=0.5时, 他才选择混合策略 ( 0, 1) 或任何纯策略。 •
混合纳什均衡
女 足球 男 足球 芭蕾 2,1 0,0 芭蕾 0,0 1,2
如在“性别战”博弈中,有两个纯策略纳什 均衡:(足球,足球),(芭蕾,芭蕾)。事实 上,可以验证,还有一个混合策略纳什均衡,即 男的以2/3的概率选择足球赛,以1/3的概率选择 芭蕾舞;女的以1/3的概率选择足球赛,以2/3的 概率选择芭蕾舞。
混合策略纳什均衡
在n个参与人的策略式表述 博弈G {S1 ,, Sn ; u1 ,, un } 中, 假定参与人 i有K个纯策略 : Si {si1 ,, siK }, 则概率分 布 i ( i1 ,, iK )称为i的一个混合策略 . ik ( sik )是 i选sik的概率, 对于所有的 k 1,, K ,0 ik 1,
哈工大管理学院选修课博弈论第1讲

31
通俗的理解
从汉字的理解看:博是广泛、丰富的意 思,也是古代的一种棋戏,弈是指围棋、 下棋的意思,这样理解“博弈论”也就 是下棋的理论。
从英文的理解看:博弈论的英文翻译是 Game Theory,Game 是游戏,Theory 是理论,也就是外国人的理解是游戏的 理论。
与经济学间的桥梁
35
博弈论发展简史
John von Neumann 生平
❖ 8岁就掌握了微积分,19岁发表 了第一篇学术论文
❖30岁成为最年轻的普林斯顿数学 学院6名教授之一 (Einstein was one of the others)(1933年)
1903-1957
36
博弈论发展简史
❖20世纪40年代开始转向பைடு நூலகம்用数学 领域
博弈论
GAME THEORY
主讲教师 台双良 博士 所在院系 管理学院 Email: taishlhit@ 电话:13936133292
1
第一章 绪 论
2
讲义蓝本及推荐著作
讲义蓝本
❖[美]艾里克.拉斯缪森.博弈与信息——博弈 论概论.北京大学出版社. 2003.10
❖ [美]迈尔森(Myerson, R. B.)著. 于寅, 费剑 平译. 博弈论——矛盾冲突分析. 经济出版 社. 2002(偏向于决策论)
• 每一个体猜测其他个体的选择是什么?
• 每个人将采取什么样的行动?(当最优的行动依赖 于其他人的所作所为时,这个问题尤其令人关 注。)
• 这些行动产生什么样的结局?对于整个群体,这 个结局好吗?
• 如果群体不止一次地互相作用,会有任何差异吗 如果每一个体对群体内其他个体的特性没有把握 答案将发生怎样的变化?
博弈论选修课
一、假设市场上有三个垄断企业,企业无生产成本,问达到纳什均衡时的产量为多少?假设市场的价格和数量之间P=a—b*Q二、什么是纳什均衡,你是如何理解纳什均衡的?答:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。
当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。
如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。
三、构建一个博弈,说明如何杜绝学生考试作弊现象(参考高薪养廉博弈)答:四、给出该博弈的纳什均衡,并用消除劣势战略法,找出(R1,C3)这个纳什均衡。
C1 C2 C3R1 2,12 1,10 1,12R2 0,12 0,10 0,11R3 0,12 0,10 0,13五、两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。
如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,计算其混合战略纳什均衡。
答:设S为棒子T为老虎C为鸡W为虫子,则其支付矩阵为:2S T C WS 0,0 1,-1 0,0 -1,11 T -1,1 0,0 1,-1 0,0C 0,0 -1,1 0,0 1,-1W 1,-1 0,0 -1,1 0,0设1、2出STCW的概率分别为P1P2P3P4和Q1Q2Q3Q4,则矩阵达到均衡时,2的期望收益必须满足:0*p1—1*p2+0*p3+1*p4=1*p1+0*p2—1*p3+0*p4=0*p1+1*p2+0*p3—1*p4= —1*p1+0*p2+1*p3+0*p4 整理为—p2+p4=p1—p3= —p1+p3由于上式为对称的,所以,p1=p2=p3=p4,又p1+p2+p3+p4=1,可得p1=p2=p3=p4=0.25. 同理q1=q2=q3=q4=0.25 综上所述,混合战略的纳什均衡为:A1(0.25,0.25,0.25,0.25)A2(0.25,0.25,0.25,0.25)六、5个海盗抢到了100颗宝石,每一颗大小和价值都一样他们决定这么分:抽签决定自己的号码(1、2、3、4、5)。
博弈论完整课件浙江大学Game Chapter5博弈论经典
Definition 满足要求1-4的策略和推断构成博弈 的完美贝叶斯均衡〔PBE〕。Gibbons
PBE:Consider a strategy profile for the players, As well as beliefs over the nodes at all informa -tion sets.These are called a perfect Bayesian equilibrium(PBE) if:(1)each player’s strategy specifies optimal actions, given his beliefs and the strategies of the other players and (2)the
“萨摩亚岛居民以文身的好差作为挑选武士 的标准〞
在波纳佩岛上,谁能种出特别大的山药,谁 的社会地位就高,谁就能赢得人们的尊敬并可 担任公共职务。
Signals:经济或其他活动中具有信息传递作用 的行为。
Signaling Mechanism:通过信号传递信息的过程。
Pooling-strategy separating-strategy Hybrid-strategy
Game Theory(5)
Dynamic Games of Incomplete Information PERFECT BAYESIAN EQUILIBRIUM
PBE<BNE <SNE<NE
在完全信息静态博弈中,有 PBE=BNE=SNE=NE
一、Introduction to PBE
如果一个博弈没有子博弈,那么子博弈精炼 的要求〔参与人的策略在每一个子博弈中 君构成NE的要求〕自然就得到满足,从 而在任何没有子博弈的博弈中,SNE=NE。
博弈论——策略互动的艺术_哈尔滨工业大学中国大学mooc课后章节答案期末考试题库2023年
博弈论——策略互动的艺术_哈尔滨工业大学中国大学mooc课后章节答案期末考试题库2023年1.下面例子,()不属于博弈行为。
答案:樵夫在森林砍柴,樵夫和树木的关系2.关于博弈论纳什均衡的论述,下列说法中,()是正确的。
答案:纳什均衡中任意一个参与人的对应策略,一定是关于该均衡中其他参与人在均衡中的策略或策略组合的最佳应对(best reply)3.关于纳什均衡、子博弈完美均衡、完美贝叶斯均衡三个概念,下面说法正确的是()。
答案:完美贝叶斯均衡一定是子博弈完美均衡4.观察如下的一个博弈树,下面结论正确的是()。
答案:该博弈实质上是一个二人同时进行的博弈,其中参与人1的策略集为{a,b},参与人2的策略集为{c, d}5.在下面的博弈树中,子博弈的数目(这里规定子博弈不包括整个博弈树本身)为()。
答案:1个6.继续观察上一题中的博弈树,下面说法正确的是()(可多选)答案:该博弈是不完全信息博弈参与人1具有不完美回忆(忘记了自己过去曾经做过什么)参与人1有两个信息集7.对于如下猎鹿博弈,下面说法正确的是()(可多选)猎人2猎鹿抓兔猎人1 猎鹿3,3 0,2抓兔2,0 2,2答案:该博弈存在一个非退化混合策略均衡(每个参与人以严格正概率选择每个纯策略)该博弈的风险占优均衡为{抓兔,抓兔}该博弈的帕累托占优均衡为{猎鹿,猎鹿}8.对于如下博弈树,下面各题表述正确的是()。
(可多选)答案:虚拟参与人是表述自然的选择,此处虚拟参与人为Chance参与人1的策略集为S1 = {Aa, Ab, Ba, Bb, Ca, Cb }9.对于第8题所示的博弈树,该博弈的子博弈完美均衡为()。
答案:参与人1在博弈开始阶段选择C,随后若可能,在他的第二个信息集选a;参与人2分别在她的信息集,从左到右,依次选择r、l、R10.对于如下所示的博弈,下面()选项为完美贝叶斯均衡?答案:参与人1选B,参与人2选择R,参与人3选择r,概率设定为a=011.对于一个3行2列的矩阵博弈,参与人1有A,B,C三个纯策略,参与人2有两个纯策略。
博弈论第五讲
与生活中的经济学
河南工程学院 主讲 陈海堂
E-mail: haitangchen@
LOGO
第五讲 让策略混合起来
1、策略混合动机 2、如何寻找混合策略均衡
LOGO
3、随机的好处
小结 4、 如何认识混合策略
5、 混合策略的麻烦 6、小 结
Game Theory & Life
haitangchen@
6.1 策略混合动机
LOGO
这样,司机乙以2/3的概率选择转向,以1/3的概率选择向 前,就可以使你在两个策略间无差异而无法采取纯策略 (同学们可计算,你选择转向的预期赢利是0,选择向前 的预期赢利也是0)。由此,我们可以记下司机乙采取的 混合策略:(2/3,1/3)。(它是混合策略的表示方法, 括号中第一个数字表示选择第一个策略的概率,第二个数 字表示第二个策略的概率,依此类推,在这里(2/3,1/3) 表示司机乙以2/3的概率选择转向《策略一》,以1/3的概 率选择向前《策略二》) 。 反过来,司机乙对你的选择也有着概率判断,而为了保持 这种判断信念的后果与信念本身一致,你也以一定概率 (比如P)随机选择你的策略,且p需要满足使司机乙在他 的两个策略之间没有差异。此时他两种策略预期赢利为: ·司机乙选择转向的预期赢利:1×p+(-2) ×(1-p)=3p-2; ·司机乙选择向前的预期赢利:2×p+(-4) ×(1-p)=6p-4.
6.1 策略混合动机
LOGO
6.1.2 会发生车毁人亡的情况吗 既然你和司机乙都采用了(2/3.1/3) 的混合策略,那就 意味着结果是你看出现的。我们可以计算各种情况出现的 概率,见图6-2,懦夫博弈各情况出现的概率。
司机乙
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多重纳什均衡解及其分析
而另一个纯策略组 合(D,R)则是风险占 优的 许多博弈实验研究 表明,实际中,人 们更愿意选择风险 占优均衡
参 与 人 1
参与人 2
L U
D 图1-21
R 0, 8
7, 7
9, 9
8, 0
风险占优均衡
27
多重纳什均衡解及其分析
一个经典博弈问题:Stag Hunt
34
聚点
两个空降兵意外落到图 中所示的地区。双方 知道都携带了一张地 图,但不清楚对方降 落的地点,也无法与 对方联络,双方只有 尽快找到对方才能获 救。 如果是你,选择在何处 会面?
35
聚点
你将与同学约定在哈尔滨会面。事先没有 约定具体的地点,而且无法与对方联络。 你和对方只能自己寻找会面的地点。你 将怎么做?
参与人2
左
A 上 下
11
右
-1,3 0,0
C 参 与 人 1 A 2, 3
D 5, 2
3,2 -1,1
B
3, 1
1, 5
(四)Existence of Nash Equilibrium *Nash在1950年证明:任何有限博弈,都至 少存在一个NE。 Theorem(Nash 1950):In the n-player normal- form game G={S1,… , Sn; u1, … , un}, if n is finite and Si is finite for every i then there exists at least one Nash equilibrium, possibly involving mixed strategies.
这三个点的坐标为(0, 0), (1/3, 3/4),(1, 1)。对应 的三个策略分别是:(足球,足球);妻子、丈 夫分别以1/3、3/4的概率选择时装;(时装,时 装)。 r
1 3/4 r=R1(q) q=R2(r)
0 图1-19
1/3
1
q
q
性别战的图解法
10
纳什均衡求解:图解法(练习)
B
29
多重纳什均衡解及其分析
风险占优均衡的进一步说明。
参与人对风险占优均衡的选择倾向,有一 种强化的机制。当部分或所有参与人选择 风险占优均衡的可能性增强的时候,任一 参与人选择帕雷托占优均衡策略的期望支 付会进一步减小,而这又使得帕雷托占优 均衡策略的支付更小,从而形成一种选择 风险占优均衡策略的正反馈机制,并使其 出现的概率越来越大。
30
多重纳什均衡解及其分析
当参与人数目增加时,选择合作的风险将 会更大,可借助该点考虑招标机制如何减 少投标方勾结问题 上述问题是我们知道建立诚信机制社会的 重要意义 上述问题引出一个博弈相关分支为协调博 弈(coordination game)
31
多重纳什均衡解及其分析
聚点均衡
由实际问题抽象出来的博弈模型中,更多的一类 问题是:多个纳什均衡间不存在帕雷托占优关系 或明显的风险占优关系,如夫妻爱好问题的两个 纯策略均衡。这时如何预测哪一个纳什均衡会出 现是一个很有意义的问题
20
纳什定理的一些说明
因此只要证明前面的最优反应对应满足 不动点定理条件就可以了。
21
多重纳什均衡解及其分析
纳什定理说明了纳什均衡在相当广泛的 博弈模型中普遍存在
但是纳什均衡只是理论模型的导出结果, 其适用性存在一定局限
纳什均衡的理论基础:如经济理性、决策 准则一致性、共同知识等并不能涵盖现实 行为(互惠性、利他性、不理性等)
{(r,1-r), (q,1-q)}
丈 夫
时装 时装
足球 图1-16
足球 0, 0
1, 3
2, 1
0, 0 性别战
2×2双矩阵博弈的图解法
若丈夫以q的概率选 择去看时装表演 (以1-q的概率去看 足球),则妻子选 择时装和观看足球 的期望收益分别为 {(r,1-r), (q,1-q)}
丈 夫
时装
混合策略NE的求解-支付等值法
这种通过使对方选择各个纯策略的期望
支付值相等来确定自己的策略空间上的 最优概率分布的方法被称为“支付等值 法”。 参与人实施混合策略的目的是给其他 参与人造成不确定性,尽管其他参与人 能推测到他选择某个纯策略的概率有多 大,但却不知道他到底会选哪个纯策略
1
2×2双矩阵博弈的图解法
17
不动点
一个和尚周六早上七点钟开始上山,晚 上七点钟到达山顶,周日早上七点钟开 始下山,晚上七点钟到达山脚。现在要 你证明山路上一定存在一点,使得和尚 周六上山时经过这点的时刻,与周日下 山时经过这点的时刻重合。
18
不动点
你看出这一点为什么是一个不动点了吗?把山路 看成是容器,把山路上的点看成是容器里的小球, 现在我们这样来搅拌这些小球:拿来一个小球甲, 它对应山路上的一点,记下和尚周六经过这点的 时刻,比如说9点15分,然后找到周日9点15分 和尚所在的位置,它对应山路上另一点,也就是 容器里的另一个小球乙,搅拌过后,甲占据了乙 的位置。根据不动点定理,一定有一个小球,搅 拌过后自己占据了自己的位置,也就是说和尚周 六经过这个小球的时刻,与周日经过这个小球的 时刻,是同一时刻!
多重纳什均衡解及其分析
上述问题可表示为双 矩阵形式,见图1-22 该博弈也存在两个纯 策略纳什均衡,分别 猎 为(鹿,鹿)、(兔子, 人 兔子) 1
猎人 2
鹿 鹿
兔子
兔子 0, 3
3, 3
5, 5
3, 0
其中风险占优的均衡 为(兔子,兔子), 图1-22 猎鹿博弈 均衡收益分别为(3, 3)
双矩阵的含义…
以Battle of Sexes为例,介绍2×2双 矩阵博弈模型的图解法 为便于说明,将Battle of Sexes模型 再次复制与此
2
2×2双矩阵博弈的图解法
一对夫妻要决定去看时 装表演还是看足球赛。 有关纯策略及相应支付 情况如图1-16所示
设妻子的混合策略为 妻 (r,1-r),丈夫的策略为 子 (q,1-q)。这里的r,q分别 表示妻子或丈夫观看时 装表演的概率 为便于分析,将混合策 略列于右上角 3
14
纳什定理的一些说明
纳什定理的证明要用到不动点定理。
所谓不动点定理,是指
一个定义在X X上的函数f(x),
集合X是非空的、闭的、有界的和凸的
函数f是连续的
则至少存在一个x,使得f(x)=x, x 被称为不 动点
15
纳什定理的一些说明
运用不动点定理证明纳什定理的主要步 骤是
设计一个策略组合空间上的一个映射,说 明该映射的任何不动点都是一个纳什均衡 使用不动点定理证明这个映射一定存在一 个不动点
0
1/3
1
q
0 图1-18
1/3
1
q
8
图1-17
妻子的反应函数
丈夫的反应函数
2×2双矩阵博弈的图解法
按照纳什均衡的定义,图上的三个交点既 是参与人1的最优反应函数上的点,同时也 是参与人2最优反应函数上的点
r 1 3/4 r=R1(q) q=R2(r)
0 图1-19
1/3
1
q
q
性别战的图解法
9
2×2双矩阵博弈的图解法
22
多重纳什均衡解及其分析
帕雷托占优均衡
帕雷托占优均衡的含义是:在多个纳什均 衡中,若存在一个纳什均衡,其支付结果 针对每个参与人而言都严格优于其它纳什 均衡,则该纳什均衡是帕雷托占优纳什均 衡。 Nhomakorabea23
多重纳什均衡解及其分析
一个战争与和平的博 弈简例,见图1-20。
该博弈有两个纯策略 战争 和平 国 均衡(战争,战争), 家 战争 -5, -5 8, -10 (和平,和平)。 1 和平 -10, 8 10, 10 (和平,和平)在帕 雷托占优意义上是较 好的一个均衡策略。 图1-20 帕雷托占优均衡
妻 子
足球 0, 0
1, 3
时装
足球 图1-16
2, 1
0, 0 性别战
1 2q 2 1(1 q)
4
2×2双矩阵博弈的图解法
比较π1与π2可知
当q<1/3时,妻子选 择看时装的支付为2q, 小于看足球的支付, 因此,应选择看足球; 妻 当q=1/3时,选择看 子 时装和足球支付情况 没有差异; 当q>1/3时,则选择 看时装表演
0, 8 7, 7
多重纳什均衡解及其分析
但进一步分析不难 发现,若参与人选 参与人 2 择策略U,万一参与 人2选择策略R,参 参 L R 与 与人2损失只有1单 U 9, 9 0, 8 位,但对于参与人1 人 D 8, 0 7, 7 来说只能得到支付0。 1 也就是说,策略U对 于参与人1来说是风 图1-21 风险占优均衡 险较大的策略。
33
多重纳什均衡解及其分析
一些 可能的“聚点”,如中午与12:00的 聚点;夫妻爱好博弈中“(服装,服装)” 与“今天是妻子生日”的聚点;参与人中 地位不一致造成的均衡向有地位方倾斜的 “聚点”,等等
聚点均衡确实反映了人们在多重纳什均衡 选择中的某些规律性,但因为涉及因素太 多,对于一般博弈模型很难总结普遍规律, 只能具体问题具体分析
12
Wilson(1971)证明,几乎所有有限博 弈,都存在有限奇数个NE,包括纯策 略NE和混合策略NE。——Oddness Theorem
13
纳什定理
纳什于1950年提出并证明了纳什定理
纳什定理的主要内容为:在一个有n个 参与人的策略式博弈G={S1,…,Sn; u1,…,un}中,如果n是有限的,且Si是有 限集(i=1,…,n),则该博弈至少存在 一个纳什均衡(在混合策略意义下)