金融数学博弈论第一章4-1
合集下载
博弈论第一章 绪论PPT资料54页

本章要求掌握博弈论的概念、要素和类型,求解 完全信息和不完全信息对策均衡的方法,并初步 接触进化博弈。
Definition
Game theory attempts to mathematically capture behaviour in strategic situations, in which an individual's success in making choices depends on the choices of others.
博弈论(对策论、赛局理论)是研究具有斗争 或竞争性质现象的理论和方法。
Definition
Game theory is a branch of applied mathematics that is widely used in the biology, engineering, social sciences, and most notably in economics.
press 罗伯特.吉本斯 博弈论概论
参考资料
J. Tirole, D. Fudenberg, Game Theory, MIT Press
O. Martin, A. Rubinstein, A Course in Game Theory. MIT Press
其他主流教学参考书
考试
期末考试占60% 平时作业占30% 出勤占10%
博弈论是应用数学的分支,现在广泛应用于经济 学、管理学、生物学、计算机科学和政治学等学 科的研究中。
有人说......
"Game theory is a sort of umbrella or 'unified field' theory for the rational side of social science, where 'social' is interpreted broadly, to include human as well as nonhuman players (computers, animals, plants)." ——R. Aumann
Definition
Game theory attempts to mathematically capture behaviour in strategic situations, in which an individual's success in making choices depends on the choices of others.
博弈论(对策论、赛局理论)是研究具有斗争 或竞争性质现象的理论和方法。
Definition
Game theory is a branch of applied mathematics that is widely used in the biology, engineering, social sciences, and most notably in economics.
press 罗伯特.吉本斯 博弈论概论
参考资料
J. Tirole, D. Fudenberg, Game Theory, MIT Press
O. Martin, A. Rubinstein, A Course in Game Theory. MIT Press
其他主流教学参考书
考试
期末考试占60% 平时作业占30% 出勤占10%
博弈论是应用数学的分支,现在广泛应用于经济 学、管理学、生物学、计算机科学和政治学等学 科的研究中。
有人说......
"Game theory is a sort of umbrella or 'unified field' theory for the rational side of social science, where 'social' is interpreted broadly, to include human as well as nonhuman players (computers, animals, plants)." ——R. Aumann
北京大学博弈论课件第1章_博弈论概述

纳什的代表作
1.多人博弈的均衡(Equilibrium points in n-person games) 国家科学院学报(Proceedings National Academy of Sciences),36: 48 – 49,1950年。 2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。 3.讨价还价问题(The bargaining problem)。计量经济学杂志 (Econometrica)18: 155 – 162,1950年。 4.非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 – 295,1951年。
第一章
博弈论概述
POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
2012-8-28
博弈参与者(Player) 博弈策略(Strategy) 博弈的收益(Payoff) 博弈的均衡(Equilibrium)
一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
产量博弈模式 价格博弈模式 领先者、跟随者博弈模式
大国之间关于汇率政策的博弈 经典博弈实例:囚徒困境(Prisoner's Dilemma)
1博弈论第一章

i 1
n n
n
厂商i的收益:
i 1
qi P( qi ) cqi qi [ P( qi ) c]
i 1
厂商i的收益不仅与自己既定成本和产量有关,还与 其他厂商的产量决策有关。
1.3.1 博弈中的参与人 1.3.2 博弈中的策略 1.3.3 博弈中的收益 1.3.4 博弈的过程 1.3.5 博弈的信息 1.3.6 参与人的能力和理性 1.3.7 博弈的分类
哲理:相生相克,以柔克刚
猜硬币方 正 面 反 面 1, -1 -1, 1 参 与 人 1 石 头 剪 子 布 石 头 0, 0 -1, 1 1, -1 参与人2 剪 子 1, -1 0, 0 -1, 1 布 -1, 1 1, -1 0, 0
盖 硬 币 方
正 面 反 面
-1, 1 1, -1
1.2.3 产量决策Cournot模型
4
2015/12/5
1.3.1 博弈中的参与人
参与人:独立决策、独立承担博弈结果的个 人或组织。只要在一个博弈中统一决策、统一行动、
统一承担结果,不管一个组织有多大,甚至大到一个国家 或多国,都可以作为一个参与人。囚徒困境中的警察、田 忌赛马中的孙膑都不是参与人。
一、单人博弈——只有一个参与人的博弈
严格地讲,单人博弈由于不存在其他参与人的反应和反 作用,因此不属于博弈论的研究对象。但是讨论单人 博弈会使理论更完整,为多人博弈提供基础和启示。 例一:单人迷宫 扩展型
入口 右 A B 0 出口(奖金M) 右 M
A,1
左 B,1
博弈规则面前参与人之间平等,不因参与 人之间权利、地位的差异而改变 参与人数量对博弈结果和分析有影响。根
两个囚徒的收益矩阵
n n
n
厂商i的收益:
i 1
qi P( qi ) cqi qi [ P( qi ) c]
i 1
厂商i的收益不仅与自己既定成本和产量有关,还与 其他厂商的产量决策有关。
1.3.1 博弈中的参与人 1.3.2 博弈中的策略 1.3.3 博弈中的收益 1.3.4 博弈的过程 1.3.5 博弈的信息 1.3.6 参与人的能力和理性 1.3.7 博弈的分类
哲理:相生相克,以柔克刚
猜硬币方 正 面 反 面 1, -1 -1, 1 参 与 人 1 石 头 剪 子 布 石 头 0, 0 -1, 1 1, -1 参与人2 剪 子 1, -1 0, 0 -1, 1 布 -1, 1 1, -1 0, 0
盖 硬 币 方
正 面 反 面
-1, 1 1, -1
1.2.3 产量决策Cournot模型
4
2015/12/5
1.3.1 博弈中的参与人
参与人:独立决策、独立承担博弈结果的个 人或组织。只要在一个博弈中统一决策、统一行动、
统一承担结果,不管一个组织有多大,甚至大到一个国家 或多国,都可以作为一个参与人。囚徒困境中的警察、田 忌赛马中的孙膑都不是参与人。
一、单人博弈——只有一个参与人的博弈
严格地讲,单人博弈由于不存在其他参与人的反应和反 作用,因此不属于博弈论的研究对象。但是讨论单人 博弈会使理论更完整,为多人博弈提供基础和启示。 例一:单人迷宫 扩展型
入口 右 A B 0 出口(奖金M) 右 M
A,1
左 B,1
博弈规则面前参与人之间平等,不因参与 人之间权利、地位的差异而改变 参与人数量对博弈结果和分析有影响。根
两个囚徒的收益矩阵
博弈论最全完整-讲解PPT课件

王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。
Roger B. Myerson著:Game Theory(原文版、译文 版),中国经济出版社,2001年版。
是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
对手和你一样聪明! 许多博弈相当复杂,博弈论并不
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
北京大学博弈论课件第1章-博弈论概述

❖ 博弈参与者可能多于两方,三方或多方博弈参与者
❖ 二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中去相约去博物馆博弈中,博弈参与者所能采取的博弈策
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
❖ 一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
❖ 博弈参与者可能是单个的个人,也可能是组织或集体
企业、社会团体、国家
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
❖ 参考教材 ❖ 博弈论教程
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
❖ 岳昌君主审;沈琪编PO著WERPOINT TEMPLATE
“坦白”或“不坦白”
❖ 三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
❖ 甲、乙二人独立决策
对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。
❖ 结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 ❖ 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 ❖ 个体理性与集体理性的冲突 ❖ 囚徒困境
❖ 二、博弈策略(Strategy)
博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中去相约去博物馆博弈中,博弈参与者所能采取的博弈策
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为
❖ 一、博弈参与者(Player)
博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人
❖ 博弈参与者可能是单个的个人,也可能是组织或集体
企业、社会团体、国家
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
❖ 参考教材 ❖ 博弈论教程
POWERPOINT TEMPLATE POWERPOINT TEMPLATE
❖ 岳昌君主审;沈琪编PO著WERPOINT TEMPLATE
“坦白”或“不坦白”
❖ 三、博弈的收益(Payoff)
博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博弈中,博弈参与者得到的收益是:赢、平局、
输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相
遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是
❖ 甲、乙二人独立决策
对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。
❖ 结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 ❖ 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 ❖ 个体理性与集体理性的冲突 ❖ 囚徒困境
北京大学博弈论课件第1章-博弈论概述

❖ 博弈参与者:两个人 ❖ 博弈过程:
两人在校门口集合,一起逛博物馆
❖ 博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
❖ 博弈双方策略相互依赖,不独立。
其他博弈实例
❖ 棋类比赛:象棋、围棋等。古人“对弈”。 ❖ 寡头市场:
❖ 2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。
❖ 3.讨价还价问题(The bargaining problem)。计量经济学杂志 (Econometrica)18: 155 – 162,1950年。
❖ 4.非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 – 295,1951年。
❖ 5.两人合作博弈(Two-person cooperative games)。计量经 济学杂志(Econometrica),21: 128 – 140,1951年。
本章小结
❖ 本章给出了博弈的基本定义 ❖ 通过现实实例分析了博弈的基本内涵和主要思想 ❖ “囚徒困境”是博弈理论中的经典案例 ❖ 博弈的构成要素主要包括:
20 世纪 70 年代,约翰 ·海萨尼(John Harsanyi)和莱因 哈德 ·泽尔腾(Reinhard Selten)等将不完全信息理论融入 到博弈论的研究中。
20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济 学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
博弈论概述 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
两人在校门口集合,一起逛博物馆
❖ 博弈策略和结果
两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过
❖ 博弈双方策略相互依赖,不独立。
其他博弈实例
❖ 棋类比赛:象棋、围棋等。古人“对弈”。 ❖ 寡头市场:
❖ 2.非合作博弈(Non-cooperative games),纳什就读于普林斯 顿大学数学系的博士毕业论文,1950年。
❖ 3.讨价还价问题(The bargaining problem)。计量经济学杂志 (Econometrica)18: 155 – 162,1950年。
❖ 4.非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 – 295,1951年。
❖ 5.两人合作博弈(Two-person cooperative games)。计量经 济学杂志(Econometrica),21: 128 – 140,1951年。
本章小结
❖ 本章给出了博弈的基本定义 ❖ 通过现实实例分析了博弈的基本内涵和主要思想 ❖ “囚徒困境”是博弈理论中的经典案例 ❖ 博弈的构成要素主要包括:
20 世纪 70 年代,约翰 ·海萨尼(John Harsanyi)和莱因 哈德 ·泽尔腾(Reinhard Selten)等将不完全信息理论融入 到博弈论的研究中。
20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济 学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
博弈论概述 POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE
博弈论第一章ppt课件

qj ( j k) 必须使(3)式极大化.于是,令
j 0 , j1,2,,n.
qj
n
于是有 a2bqj b qkc0
(4)
kj1
n
即 bjq acb qk, j1,2,,n (5)
k1 .
n
n
将这 n个式子相加得 b qj n(ac)nb qj
j1
j1
行业的总产量为
n j1
qj
n(ac) b(n1)
设市场需求为
n
pab(qj) a0,b0 j1
(2)
当然a >c(否则会有问题,后面可以看到),由
(1)与(2)两式易知企业 j 的利润为
.
n
j(q1,q2,qn)(ab qj)qjcqj (3) j1
所谓古诺均衡,便是存在一个产量:
q(q1 ,q2 ,,qn )使得每个企业的利润都达到
最大.即当所有别的企业的产量 qk 时q,k
.
1·2 应用举例 古诺(1838年)提出了纳什所定义的均衡(但 只是在特定的双头垄断模型中),但是他并没有 从理论上系统的定义均衡的意义.古诺的研究 被认为是最早的博弈论的经典文献之一. 此模型告诉我们; (1)如何对一个问题的非正式描述转化为一
个博弈的标准式表述; (2)如何通过计算解出博弈的纳什均衡; (3)重复剔除严格劣战略的步骤.
所选战略的函数,假定企业 的i 收益就是其利润
ui(si,sj)i(qi,qj)qi[a(qiqj)c]
i1 ,j2(i2,j1 )
.
一对战略 (s1, s如2)是纳什均衡,则对每个参与
者
i,s
i
应满足:
ui(si,sj)ui(si,sj) (NE)
经济博弈论第一讲

22
乙如果买经济舱,则其净效用(经 济学称为消费者剩余)为1000-1000=0, 但当乙买头等舱票时的消费者剩余为 1800-1500=300元,所以乙会买头等舱。 甲的支付能力只有1000元,所以甲只有 买经济舱。这时,航空公司的利润增大 为 (1000-800)+(1500-1200)=500 元 >400 元 。
开发
不开发
开发 波音
不开发
-10,10 0, 120
100,0 0,0
16
这时只有一个纳什均衡,即波音公 司不开发和空中客车公司开发的均衡 (不开发,开发),这有利于空中客车。
在这里,欧共体对空中客车的补贴 就是使空中客车一定要开发(无论波音 是否开发)的威胁变得可置信的一种 “承诺行动”。
17
五、不对称信息下的博弈
LMR U 1,1 4,2 1,3 甲 D 2,3 1,2 2,1
(问题2:甲和乙分别会选择什么战略?)
5
当甲选“U”时,乙会选“R”; 而当乙选“R”时,甲应该选“D”而 不是“U”;但当甲选“D”时,乙会 选“L”;给定乙选“L”,甲选“D” 是最好的选择,他不会改变选择 “D”;给定甲不改变选“D”,乙也 不会改变其选择“L”。所以,可以 预期(D,L)是甲乙最终完成的稳定 的选择。
通过机制设计增大了公司利润。
23
终于有一天,有一位女士问他:难 道你不知道两块钱比一块钱更多一些钱 吗?他如此回答道:如果我有一次选择 了两块钱,就不会有人来找我让我在一 块钱与两块钱之间选择了,我也讨不到 钱了。
这个故事告诉我们有时候“扮傻” 也许是有好处的。下面再来看一个例子, 这是一个动态博弈,局中人A有两次决 策机会,一次在局中人B决策之前,另 一次在B决策之后。
乙如果买经济舱,则其净效用(经 济学称为消费者剩余)为1000-1000=0, 但当乙买头等舱票时的消费者剩余为 1800-1500=300元,所以乙会买头等舱。 甲的支付能力只有1000元,所以甲只有 买经济舱。这时,航空公司的利润增大 为 (1000-800)+(1500-1200)=500 元 >400 元 。
开发
不开发
开发 波音
不开发
-10,10 0, 120
100,0 0,0
16
这时只有一个纳什均衡,即波音公 司不开发和空中客车公司开发的均衡 (不开发,开发),这有利于空中客车。
在这里,欧共体对空中客车的补贴 就是使空中客车一定要开发(无论波音 是否开发)的威胁变得可置信的一种 “承诺行动”。
17
五、不对称信息下的博弈
LMR U 1,1 4,2 1,3 甲 D 2,3 1,2 2,1
(问题2:甲和乙分别会选择什么战略?)
5
当甲选“U”时,乙会选“R”; 而当乙选“R”时,甲应该选“D”而 不是“U”;但当甲选“D”时,乙会 选“L”;给定乙选“L”,甲选“D” 是最好的选择,他不会改变选择 “D”;给定甲不改变选“D”,乙也 不会改变其选择“L”。所以,可以 预期(D,L)是甲乙最终完成的稳定 的选择。
通过机制设计增大了公司利润。
23
终于有一天,有一位女士问他:难 道你不知道两块钱比一块钱更多一些钱 吗?他如此回答道:如果我有一次选择 了两块钱,就不会有人来找我让我在一 块钱与两块钱之间选择了,我也讨不到 钱了。
这个故事告诉我们有时候“扮傻” 也许是有好处的。下面再来看一个例子, 这是一个动态博弈,局中人A有两次决 策机会,一次在局中人B决策之前,另 一次在B决策之后。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
混合战略 (1, 0) 表示参与者的一个纯战略,即选择正 面. 而混合战略 (1 3 , 2 3)表示以概率1/3选择正面,以 概率2/3选择反面. 一般地,假设参与者i有K个纯战略:Si {si1 ,, siK }, 则参与者i 的一个混合战略是一个概率分布 ( pi1 , piK ), 其中 pik 表示对所有k 1, 2, K , 参与者i 选择战略sik的概 率,且 pi1 piK 1, 0 pik 1, i 1, 2, K . 我们用 其中包含了参 pi 表示基于Si 的任意一个混合战略组合, 与者选择的每一个纯战略. 正如我们用si 表示Si 内任意 一个纯战略. 定义 对标准式博弈 G S1,, Sn ; u1,, un , 假设 Si {si1 ,, si K }, 那么参与者i 的一个混合战略为概率分 布 pi ( pi1 , piK ). 其中对所有 i 1, 2,, K , 0 pik 1,
vi ( i , i ) ( j ( s j ))ui ( s)
sS j 1
n
其中 s (s1 , s2 ,, sn ), S 表示参与者i 的纯战略组合空 间, j ( s j ) 是参与者j 选择纯战略 s j 的概率. 定义:在n个参与者博弈的战略式表述
中,混和战略组合 ( 1 ,, i , n ) 是一个纳什均 衡. 如果对于所有的i =1, 2, …, n ,下式 vi ( i , i ) vi ( i , i ), i i 成立. i表示参与者i 的混合战略空间. 等价地, ( 1 ,, i , n ) 是下列最优化问题的解
因为这时参与者的最优行为是不确定的, 而博弈的结 果必然包含这种不确定性. 混合战略可以解释为 一个参与者对其他参与者行 为的不确定性. 规范的表述,参与者i 的一个混合战略是在其战略 空间Si 上的一些或全部战略的概率分布. 以后我们称Si 中的战略为参与者i 的纯战略. 对完全信息静态同时行动博弈来说, 一个参与者 的纯战略就是他可以选择的不同行动. 例如, 在猜硬币 分别为正面和反面,这时 博弈中Si 内含有两个纯战略, 参与者i 的一个混合战略为概率分布 (q , 1 q), 其中q为 出现正面的概率, 1-q为出现反面的概率,而且 例如, 0 q 1. 另外,混合战略也可以表示纯战略,
1· 3 理论发展:混合战略和均衡的存在性 1· 3· A 混合战略 纳什均衡不存在的例子 正面 反面
正面 反面
-1 ,1 1 ,-1
1 ,-1 -1 , 1
“猜硬币”博弈不存在纳什均衡. 猜硬币博弈一个非常突出的特点是 每个参与者都 试图能先猜中对方的战略. 在博弈中, 一旦每个参与者 都竭力猜测其他参与者的战略选择, 就不存在纳什均衡 (至少不存在第 1· 1· C 节所定义的所定义的纳什均衡),
证明: 不妨假设参与者1有m个概率大于0 的纯战略 s1i1 , s1i 2 ,, s1im , m K 是对P2 的最优反应,且它们对应 的概率 p1il 0, l 1, 2,, m. 其它纯战略对应的概率为0, 则纯战略 s1i1 , s1i 2 , , s1im 形成的混合战略 (0,, p1i1 , p1i 2 ,, p1im ,,0) 一定是对P2 的最优反应.
k 1
j 1
p1 j p2 k u2 ( s1 j , s2 k )
k 1 j 1
k
J
类似于纯战略意义下纳什均衡, 定义:在两个参与者博弈 G S1 ,, Sn ; u1,, un 中,混和战略组合 P ( P 是一个纳什均衡的充 , P 1 2 ) 要条件为:每一个参与者的混合战略是另一个参与者 混合战略的最优反应. 即在参与者期望收益的意义下, v1 ( P , P ) v ( P , P (1. 3. 4) 1 2 1 1 2 ) 对S1中战略所有可能的概率分布P1 都成立. 并且 P2 必 须满足 v2 ( P (1. 3. 5) 1 , P 2 ) v2 ( P 1 , P 2 ) 对S2中战略所有可能的概率分布P2 都成立.
且 pi1 piK 1. 混合战略的一个应用 前面讲到,如果战略si 为严格劣战略,那么参与者 i 的最优反应战略不会是 si . 如果引入混合战略,就可 以证明其逆命题:如果(针对其他参与者的战略选择)参 与者i 都不可能作出这样的推断,即其战略 s i 会成为最 优反应战略,则一定存在另一个战略严格优于 si . 参与者2 (证明的说明参见课本 25页脚注) T 3,— 0,—
事实上, p2 k u1 ( s1i , s2 k ) p2 k u1 ( s1 il , s2 k ) l
k 1 k 1
K
K
对于 l 1, 2,, m 都成立,所以,
K
p1i
k 1
K
il , s2 k ) p1il p2 k u1 ( s1il , s2 k ) p1il p2 k u1 ( s1
p1 j p2 k u1 ( s1 j , s2 k )
j 1 k 1 j 1 J K
k 1
J
K
(1. 3. 3)
如果参与者1的混合战略 P ( p , , p 1 11 1J ) 是对参与 者2的混合战略P2 的最优反应,则
p
j 1 k 1
J
K
参与者2
T 3,— 0,—
参与者1 M 0,— 3,—
B 2,— 2,—
图 1.3.2
类似于对图 1.3.1的分析,对图 1.3.2分析可以得出 一个给定的纯战略可能会严格优于一个混合战略, 即使 这个纯战略并不严格劣于其他任何一个纯战略. 1· 3· B 纳什均衡的存在性 参与者混合战略的使用,使得参与者的战略选择带 有不确定性, 因此参与者的收益必然也不确定. 纯战略情况下,参与者i 的收益ui 是纯战略组合的函
k 1
l
K
il , s2 k ) p2 k u1 ( s1il , s2 k ) p1il p2 k u1 ( s1
k 1
K
k 1
由于除了l 1, 2,, m, 其它纯战略对应的概率 p1 j 0,
j il , l 1, 2,, m, 所以,
u ( s , s2 k ) p p p p 1 1 i u ( s , s ) 1 i 2 k 1 i 2 k l l 1 1i 2k
K k 1 k 1
K
j 都成立. (因为当参与者1选择 s1 j时, 对S1中每一个 s1 )这表明,一个混合战略P1要成为P2 的最优反 p1 j 1 应,混合战略P1中每一个概率大于0的纯战略本身也必 须是对P2 的最优反应. Conversely, if player 1 has several pure stratregies that are best responses to P2 , then any mixed strategy that puts all its probability on some or all of pure stratregies best response(and zero probability on all other pure stratregies ) is also a best response player 1 to P2 . 反之,如果参与者1有一些纯战略都是P2 的最优应,那 么对于赋予这些或部分是最优反应的纯战略正的概率 (其它的纯战略0 概率)的混合战略一定也是参与者1 对P2的最优反应.(补证)
1j
p u1 ( s1 j , s2 k )
2k
j 1 k 1
J
K
p1 j p2 k u1 ( s1 j , s2 k )
对p1中每一个 p1 j 都成立. 特别地,对其中任何大于0 的 p1 j 相对应的纯战略 s1 j 必须满足:
u ( s , s ) p u ( s , s ) p 1 1 j 2 k 2 k 2k 1 1 j 2k
参与者1 M 0,— 3,—
B 1,— 1,—
图 1.3.1
图1.3.1显示出,一个给定的纯战略可能会严格劣 于一个混合战略, 即使这个纯战略并不严格劣于其他 任何一个纯战略. 对于参与者2的任何一个混合战略 ( , 1 ), 参与 者2选择L的概率为 , 选择R 的概率为1 . 可以断言: 参与者1的最优反应要么是T,要么是M,但不会 是B. 注意:此时参与者关心的是期望收益. 参与者1选 择T 的期望收益为 3 0 (1 ), 选择M 的期望收益为 0 3(1 ). 容易得出当 1 2 时,参与者1选择T ;当 1 2 时,参与者1选择M . 当 1 2时, 选择T,M无差异. 由此说明T 和M 的混合战略 严格优于纯战略 B.
l 1 k 1
l
l
m
K
m
K
l 1 k 1
所以,
p1 j p2 k u1 (s1 j , s2k ) p1 j p2 k u1 (s1 j , s2k )
j 1 k 1 j 1 k 1合战略 (0,, p1i1 , p1i 2 ,, p1im ,,0)是对P2 的最 优反应. 可以证明: 对于n个参与者的情形,以上结论也成立. 类似地可以得出参与者2在混合战略P1和P2下的期 K J 望收益. v2 ( P 1, P 2 ) p2 k [ p1 j u 2 ( s1 j , s2 k ) ]
数,混合战略情况下, 参与者i 的收益ui 是混合战略 组合的函数,也就是纯战略情况下期望收益. 假设博弈是有限的. 参与者i 在纯战略组合 s (s1 , s2 ,, sn ),i 1, 2, n, 其中 s j是参与者j 的纯战略, j 1, 2,n 下的收益函数为ui ,即 ui ui (s1 , s2 ,, sn ), 参与者i 在混合战略情况下的期望收益用 vi ( ) v( i , i ) 表示. 其中 (1,, 2 ,, n )表示 混合战略组合, k 是参与者k 的混合战略,k 1, 2,n i ( 1 ,, i 1 , i 1 , n ) 表示除i 之外的混合战略组 合,参与者i 期望收益可以定义为: