博弈ppt
合集下载
博弈论的几个经典模型ppt课件

博弈论的几个经典模型
22
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题: • 冲突情形下,参与人的目标是什么?是采用(作 为个人 ) 他自己的最好策略,还是采用 ( 作为集 体的一员)他们共同的最好策略?前者导致均衡 策略 ( 坦白,坦白 ) ,支付为 (-8 , -8) ;后者的最 好策略是 ( 抵赖,抵赖 ) ,支付为 (-1 , -1) 。这里 反映了个体理性行为与集体理性行为之间的矛 盾、冲突。 • 此博弈只进行一次还是重复进行?如果博弈只 进行一次,参与人似乎只有坦白才是最好的策 略,因为没有理由相信对手会对你有信心,他 总认为你自己会坦白;因此,双方都采取坦白 策略。然而,若博弈进行多次,则结论将会发 生变化。
第四章 博弈论的几个经典模型
1
引言
博弈论又被称为对策论(Game Theory), 按照2005年因对博弈论的贡献而获得诺贝尔经 济学奖的Robert Aumann教授的说法,博弈论 就是研究互动决策的理论。所谓互动决策, 即各行动方(即局中人[player])的决策是相互 影响的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也需要 把别人对于自己的考虑也要纳入考虑之 中……在如此迭代考虑情形进行决策,选择 最有利于自己的战略(strategy)。
此外此外还与会计学还与会计学统计学统计学数学基础数学基础社会心理学社会心理学以及诸如认识论与伦理学等哲学分支有重要联以及诸如认识论与伦理学等哲学分支有重要联博弈论的几个经典模型按照按照aumannaumann所撰写的所撰写的新帕尔格雷夫经新帕尔格雷夫经济学大辞典济学大辞典博弈论博弈论辞条的看法辞条的看法标准的标准的博弈论分析出发点是理性的博弈论分析出发点是理性的而不是心理的而不是心理的或社会的角度或社会的角度
博弈论PPT课件

第1个数字表示企业1 的收入, 第2个数字表示企业2的收入。
13
7.2.2合作博弈:建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈:怎样对付欺骗者 • 重复性博弈:反复进行多次博弈 • 重复性博弈的最优策略——针锋相对:模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单,不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为,但要给欺骗行为以处罚 ☞针锋相对是宽大的,允许对方恢复合作
可以采取降价策略,使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策:投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损 失
29
7.3.4先发制人:使市场饱和
• 在各地布点,使新的进入者无法利用高运 输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策 略。
的违约问题 • 先合作,第N次违约的收入:
30+30+30+30+······+40
• 现实:不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工? • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有 利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入:30+30+30+30+······
• 不合作收入:40+20+20+20 +······
微分博弈理论ppt课件

• 这时,个体的理性利 益选择是与整体的理 性利益选择不一致的。
鞍点(Saddle point)
• 在微分方程中,沿着某一 方向是稳定的,另一条方 向是不稳定的奇点,叫做 鞍点。
• 在泛函中,既不是极大值 点也不是极小值点的临界 点,叫做鞍点。
• 在矩阵中,一个数在所在 行中是最大值,在所在列 中是最小值,则被称为鞍 点。
• 方程(3)将这一微分博弈描述成最小最大值优化问题。
• L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的 最大值,如方程(4)所示。
纳什均衡解
• 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式 (5):
成立 • 纳什均衡解的含义是在最坏扰动W*(试图使L最大)
工况下,最好的控制器输入是U*(试图使L最小);反 之亦然。
• 在数学中,把函数上具有上 述“极大一极小”性质的点 称为鞍点(Sadd了lePoint)。 把同鞍点有关的数学问题称 为鞍点问题。
形象地说,鞍点就是处于 “马鞍中央的点”,从纵向 看取极小值,从横向看取极 大值。
鞍点的含义
• 下面用二元函数z=f(x,y)来说明鞍点的含义: 对于二元函数z=f(x,y),(x*,y*)为其上一点。若 在邻域|x-x*|<£,|y-y*|<£内
纳什均衡解
• 其均衡解是通过进化遗传算 法得到的,对进化遗传算法 的适应性估计是在汽车仿真 软件Carsim上进行的。
进化遗传算法的适应性估计
进化遗传算法流程图
数值仿真及结论
• 通过分析伯德图和在 Carsim中的仿真结 果,证明它设计的控 制器保证了在最坏的 转向角输入工况下最 坏防侧翻性能,同时 分别通过抵抗路面扰 动以及侧向加速度, 提供了良好的乘坐质 量以及防侧翻性能。
鞍点(Saddle point)
• 在微分方程中,沿着某一 方向是稳定的,另一条方 向是不稳定的奇点,叫做 鞍点。
• 在泛函中,既不是极大值 点也不是极小值点的临界 点,叫做鞍点。
• 在矩阵中,一个数在所在 行中是最大值,在所在列 中是最小值,则被称为鞍 点。
• 方程(3)将这一微分博弈描述成最小最大值优化问题。
• L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的 最大值,如方程(4)所示。
纳什均衡解
• 分析可得存在纳什均衡解(u*,w*),使得鞍点不等式 (5):
成立 • 纳什均衡解的含义是在最坏扰动W*(试图使L最大)
工况下,最好的控制器输入是U*(试图使L最小);反 之亦然。
• 在数学中,把函数上具有上 述“极大一极小”性质的点 称为鞍点(Sadd了lePoint)。 把同鞍点有关的数学问题称 为鞍点问题。
形象地说,鞍点就是处于 “马鞍中央的点”,从纵向 看取极小值,从横向看取极 大值。
鞍点的含义
• 下面用二元函数z=f(x,y)来说明鞍点的含义: 对于二元函数z=f(x,y),(x*,y*)为其上一点。若 在邻域|x-x*|<£,|y-y*|<£内
纳什均衡解
• 其均衡解是通过进化遗传算 法得到的,对进化遗传算法 的适应性估计是在汽车仿真 软件Carsim上进行的。
进化遗传算法的适应性估计
进化遗传算法流程图
数值仿真及结论
• 通过分析伯德图和在 Carsim中的仿真结 果,证明它设计的控 制器保证了在最坏的 转向角输入工况下最 坏防侧翻性能,同时 分别通过抵抗路面扰 动以及侧向加速度, 提供了良好的乘坐质 量以及防侧翻性能。
博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
第九章 运筹学博弈论 ppt课件

则。
1988年 法国人莫里斯-阿莱斯(Maurice Allais)
获奖理由:在市场理论及资源有效利用方面做出了
开创性贡献,并对一般均衡理论重新做了系统阐述。
1987年 美国人罗伯特-索洛(Robert M. Solow)
获奖理由:对增长理论做出贡献。提出长期的经济
增长主要依靠技术进步,而不是依靠资本和劳动力的
获奖理由:对不同汇率体制下的货币和财政政策以及最
优货币区域的分析做出了伟大贡ppt献课件。
8
1998年 印度籍经济学家阿马蒂亚-森(Amartya Sen) 获奖理由:对福利经济学以及发展经济学做出了突破
性贡献。 1997年 美国经济学家迈伦-斯科尔斯(Myron S.
Scholes)和罗伯特-默顿(Robert C. Merton) 获奖理由:前者给出了著名的布莱克-斯科尔斯期权
获奖理由:在动态宏观经济学方面做出了
巨大贡献。 2003年 美国经济学家罗伯特-恩格尔
(Robert F. Engle III)和英国经济学家克莱夫格兰杰(Clive W.J. Granger)
获奖理由:在经济时间数列中运用了统计
学的方法。
ppt课件
7
2002年 美国学者丹尼尔-卡尼曼(Daniel Kahneman)和弗农-
ppt课件
4
在国外,1912年E.Zermelo用集合论研究过下棋 问题,四十年代由于生产和战争的需要,博弈理 论得到了发展,系统博弈理论的形成则以1944 年V.Neumann,O.Morgensten合著的《博弈论 和经济行为》一书为标志.1994年瑞士皇家科 学院决定将诺贝尔经济学奖授予纳什(Nash),哈 萨尼(Harsanyi)和泽尔腾(Selten)三人,表彰他们 在博弈理论和应用研究方面作出的杰出贡献. 目前,博弈论在定价,招投标,拍卖,委托代理以及 很多重要的经营决策中得到应用,它已成为现代 经济学的重要基础.
博弈论与竞争策略ppt课件

结局(outcome):对参与人的不同行动,这场博弈 的结果或结局是什么
报酬(payoff)(支付)与报酬函数(payoff function):博弈的结果给参与人带来的好处。可 以用报酬矩阵(支付矩阵、得益矩阵、赢得矩阵)
3
2、博弈均衡的基本概念
(1)占优策略均衡 占优策略:无论其他参与者采取什么策略,
博弈论就是用数学方法研究决策相互影响的理性人是 如何进行决策以获取最大收益的。
博奕:多人决策过程 引例:田忌赛马
2
1、博奕论的基本要素
参与者(player)(博奕方、局中人、对局者):即 有哪些人参与博弈。一般至少有两个参与者。
策略(strategy)与策略空间(strategy set):什么人 在什么时候行动;当他行动时,他具有什么样的信 息;他能做什么,不能做什么。
-1 -12
不坦白
-12 -1
-2 -2
5
• 如果两个疑犯都能够选择不坦白的话,他们 将明显地得到一个更大的收益,但由于两人 的信息无法沟通,选择不坦白并不是两人的 理性选择。对于两人而言,不管对方坦白或 是不坦白,自己选择坦白都是更优的选择, 因而,{坦白,坦白}就是均衡战略。
6
占优策略均衡
犯人招供与黑社会制裁
嫌犯B
坦白
嫌犯A
坦白
-∞ -∞
不坦白
-12 -∞
不坦白 -∞ -12 -2 -2
7
(2)纳什均衡
纳什均衡:在一个纳什均衡里,任何一个 参与者都不会改变自己的策略,如果其他 参与者均不改变各自的策略。
博弈中双方都没有绝对的最优策略,一方 的最优策略取决于对方的选择。
占优策略均衡一定是纳什均衡,但纳什均 衡不一定是占优策略均衡。
报酬(payoff)(支付)与报酬函数(payoff function):博弈的结果给参与人带来的好处。可 以用报酬矩阵(支付矩阵、得益矩阵、赢得矩阵)
3
2、博弈均衡的基本概念
(1)占优策略均衡 占优策略:无论其他参与者采取什么策略,
博弈论就是用数学方法研究决策相互影响的理性人是 如何进行决策以获取最大收益的。
博奕:多人决策过程 引例:田忌赛马
2
1、博奕论的基本要素
参与者(player)(博奕方、局中人、对局者):即 有哪些人参与博弈。一般至少有两个参与者。
策略(strategy)与策略空间(strategy set):什么人 在什么时候行动;当他行动时,他具有什么样的信 息;他能做什么,不能做什么。
-1 -12
不坦白
-12 -1
-2 -2
5
• 如果两个疑犯都能够选择不坦白的话,他们 将明显地得到一个更大的收益,但由于两人 的信息无法沟通,选择不坦白并不是两人的 理性选择。对于两人而言,不管对方坦白或 是不坦白,自己选择坦白都是更优的选择, 因而,{坦白,坦白}就是均衡战略。
6
占优策略均衡
犯人招供与黑社会制裁
嫌犯B
坦白
嫌犯A
坦白
-∞ -∞
不坦白
-12 -∞
不坦白 -∞ -12 -2 -2
7
(2)纳什均衡
纳什均衡:在一个纳什均衡里,任何一个 参与者都不会改变自己的策略,如果其他 参与者均不改变各自的策略。
博弈中双方都没有绝对的最优策略,一方 的最优策略取决于对方的选择。
占优策略均衡一定是纳什均衡,但纳什均 衡不一定是占优策略均衡。
博弈论 PPT课件

所有别的游戏者策略的简记法
s-i=(s1,…,si-1,si+1,…, sn) 纳什均衡简述为: ui(si*,s-i*)≥ui(si,s-i*), si∈Si
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织 博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变 博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人 博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略 策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可 选策略数量也可不同 有限博弈:每个博弈方的策略数都是有限的 无限博弈:至少有某些博弈方的策略有无限 多个
纳什均衡
策略空间:S1,……Sn 博弈方i的第j个策略:sij∈Si 博弈方i的得益:ui 博弈:G={S1 ,…,Sn,u1,…,un} 纳什均衡:在博弈G={S1 ,…,Sn,u1,…,un}中,如果 由各个博弈方的各一个策略组成的某个策略组合( s1*,…, sn* )中,任一i博弈方si*的策略,都是对其余博弈方策略的组 合( s1*,…,si-1*,si+1*,…,sn* )的最佳对策,即ui( s1*,…,si-1*,si*,si+1*,…,sn* )≥ ui( s1*,…,si-1*,sij, si+1*,…,sn* ) 对任意sij∈Si都成立,则称( s1*,…,sn* ) 为G的一个纳什均衡
严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略 严格下策反复消去
左 上 下 1,0 0,4 1,3 中 1, 3 0, 2 右 0, 1 2, 0 左 1,0 0,4 中 1, 3 0, 2 左 1,0 中 1,3
《博弈论教程》课件

博弈论的应用领域
经济学
博弈论在经济学中广泛应用于 市场行为、产业组织、贸易政
策等领域。
政治学
博弈论在政治学中用于研究国 际关系、政治制度、选举行为 等领域。
社会学
博弈论在社会学中用于研究社 会结构、社会互动、社会行为 等领域。
计算机科学
博弈论在计算机科学中用于人 工智能、机器学习、网络安全
等领域。
应用场景
保险市场、拍卖、投资决策等。
04
纳什均衡
纳什均衡的定义
纳什均衡是指在博弈中,所有参与者 的最优策略组合,即在这种策略组合 下,每个参与者都认为没有更好的选 择。
纳什均衡是一种非合作博弈的解概念 ,适用于各种博弈类型,如囚徒困境 、智猪博弈等。
纳什均衡的求解方法
迭代法
通过不断迭代每个参与者的最优策略,逐步逼近纳什均衡。
03
博弈论应用
04
市场进入博弈中,企业通常会选 择不同的策略,如快速进入、缓 慢进入或等待观察等。这些策略 的选择会影响到企业的收益和市 场格局。
结论
市场进入博弈可以帮助企业制定 出最优的市场进入策略,以最大 化自身的收益。
价格战博弈
总结词
价格战博弈是博弈论中研究企业之间价格竞争的 模型。
博弈论应用
03
市场竞争、个人决策、政治选举等。
完全信息博弈
定义
参与者拥有完全的信息,即每个 参与者都了解其他参与者的策略 和收益。
特点
信息对称、策略空间明确。
应用场景
金融市场、体育比赛等。
不完全信息博弈
定义
参与者之间存在信息不对称,即某个参与者 对其他参与者的策略和收益不完全了解。
特点
不确定性、信息不完全、策略空间的模糊性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论(Game Theory) 博弈论(Game Theory)
简单说来博弈论就是研究人们如何进 行决策,以及这种决策如何达到均衡(合 理策略)的问题。每个博弈者在决定采取 何种行动时,不但要根据自身的利益和目 的行事,还必须考虑到他的决策行为对其 他人的可能影响,以及其他人的反应行为 的可能后果,通过选择最佳行动计划,来 寻求收益或效用的最大化。
类似的事情发生于电视台的节目播放。 很多电视迷会发现,大部分电视台总是将 最精彩的节目放在相同的时间段,甚至有 些时候是在相同时间段播放类似的节目, 比如你播“快乐大本营”,我就播“超级 总动员”;你播“玫瑰有约”,我就播 “单身男女”。人都说文人相轻,电视台 也是这么相煎太急。
混合策略的均衡
混合策略: 纯策略的概率分布 解法:支付等值法
50,200
动态博弈:序贯行动
动态:策略行动 核心:策略行动的可信性 表示的方法:博弈树 求解的办法: 逆向归纳法:向前展望,向后推理
策略行动:通过采取某种行动,改变博弈 以得到更好的结果。 1、承诺:无条件的一种行动 单边裁军、许愿和立志、学车 2、许诺:有条件的一种行动,奖励按照你 意愿行事的其他参与者 3、威胁:有条件的一种行动,惩罚不按照 你意愿行事的其他参与者
公共品问题——搭便车 每个参与者都有偷懒或保留贡献的动机, 却指望能享受别人的贡献带来的利益。
公共品——搭便车 公共品——搭便车
B 买 买 A 不买 2000,-1000 0,0 500,500 不买 -1000,2000
公地的悲剧——过渡放牧 全球气候变暖
公地悲剧——过渡放牧 公地悲剧——过渡放牧
夫妻吵架 麻将、下棋 蒙牛和伊利的竞争 2000年的彩电联盟 上有政策、下有对策 军备竞赛
田忌赛马:历史上最早的博弈
齐国的大将田忌和齐威王约定赛马。 齐国的大将田忌和齐威王约定赛马。 比赛的时候, 比赛的时候,由于齐威王每个等级的马都比田忌的马强 得多,田忌用上马对上马 用上马对上马, 下马对下马, 得多,田忌用上马对上马,中马对中 马,下马对下马, 所以比赛了几次, 失败了。 所以比赛了几次,田忌都 失败了。
解决方式: (1)混合策略 (2)聚点 (3)策略行动:行动的可信性(承诺、许 诺或威胁的可信性)
斗鸡博弈的策略形式
鸡 进 鸡 A 退 -1,2 0,0 进 -3,-3 B 退 2,-1
斗鸡博弈的实际案例: 1、夫妻吵架 2、进入市场的博弈 3、两军交战:两军交战勇者胜,置之死地而后 生 4、戴高乐的策略:去掉一些选择往往会让你变 得更好 斗鸡博弈的解决: 1、聚点;2、混合策略; 3、策略行动
竞赛 美 国
危险(-3) 危险(-3)
安全且强大(6) 非常危险(-6)
不竞赛
非常危险(-6) 安全且强大(6)
安全(3) 安全(3)
捐款博弈
4个参与者得到一笔初始资金:10美元。 每人可选择保留其中一部分,再把另一部 分捐给共同储金。然后,实验者把累积的 共同储金翻倍,在所有参与者之间平分, 捐款人和非捐款人都同等对待。 请问你愿意捐款多少?
方案 U和M都 通过 只有U通 过 只有M通 过 U和M都 通不过
国会 3 4 1 2
总统 3 1 4 2
无逐项否决权的博弈树 有逐项否决权的博弈树 结果和讨论
“幸存者”游戏
在两个部落之间的地面插着21支旗,两个部落轮 流移走这些旗。每个部落在轮到自己时,可以选 择移走1支、2支或3支旗。(这里,0支旗代表放 弃移走旗的机会,是不允许的;也不允许一次移 走4支或4支以上的旗。)拿走最后1支旗的一组 获胜,无论这支旗是最后1支,还是2支或3支旗 中的一支。 问题:选择先移还是后移? 什么样的策略能保证获胜?
甲想,甲想乙怎么想……. 乙想,乙想甲怎么想……. 聚点: 国外的实验:找人和分地图 选美博弈和股市解释 协调和沟通的重要性
猎鹿博弈的变化
乙 鹿 鹿 甲 牛 0,0 4,4 3,3 牛 0,0
案例:键盘的选择 windows的选择 如何走出低效率的均衡
性别战博弈的策略形式
女 足球 男 生 电影 0,0 1,2 足球 2,1 生 电影 0,0
农户 B 少养 少养 5,5 多养 2,7
农户 A
多养
7,2
3,3
剔除劣策略:排除不好的策略 劣策略
左
中
右
上
1,0
1,2
0,1
下
0,3
0,1
2,0
左
中
上
1,0
1,2
下
0,3
0,1
左
中
上
1,0
1,2
中
上
1,2
智猪博弈的策略形式
小 按 大 猪 等 9,-1 0,0 按 5,1 猪 等 4,4
猜谜博弈的策略形式
B 正 正 A 反 1,-1 -1,1 -1,1 反 1,-1
鹰鸽博弈的策略形式
乙 鹰 鹰 甲 鸽 0,4 2,2 -2,-2 鸽 4,0
监管博弈的策略形式
被监管方 遵守 (t) 监管 (r) 监管方 不监管 (1-r) 50,100 不遵守 (1-t) 100,50
100,100
智猪博弈的运用: 大股东收集信息,小股东跟进 大企业研发,小企业模仿 TCL案例
诺曼底登陆
1944年,艾森豪威尔为总司令的盟国远征军经过近一年的准备,在 英国集结了强大的军事力量,准备横渡英吉利海峡,在欧洲开辟第 二战场。 当时可供盟军选择的登陆地点有两个,一是塞纳河东岸的布隆涅— —加来——敦刻尔克一带,这里海峡最狭窄的地方只有几十公里, 是一个理想的登陆地点;另一个地点是塞纳河西岸的诺曼底半岛, 这里海面宽阔,渡海时间较长,容易被敌人发现。 当时德军的总兵力是58个师,比盟军略多。所获情报表明,德军在 布隆涅一带的防守兵力多于在诺曼底的防守兵力,盟军拟以诺曼底 为登陆点。 诺曼底登陆战本来是计划在6月5日打响的,但遇上了暴风雨。盟军 参谋部预测在6月6日有一段时间的好天气,艾森豪威尔当机立断, 决定冒险抓住这个机会,发起进攻。 6月6日凌晨两点,盟军的2个伞兵师空降道德军的防线后面,接着, 飞机和军舰猛烈轰击德军的防御阵地,凌晨6点半,第一批地面部队 登陆。
现在回到普林斯顿的博弈论练习题: 我方2个师的兵力,敌方3个师的兵力,只能整师调动。 有两条进攻路线。我方兵力超过敌方,则获胜;我方兵 力小于或等于敌方兵力,则我方负。问如何决策? 敌方有四种方案: A、三个师都驻守甲方向; B、反过来,三个师都驻守乙方向; C、两个师驻守甲方向,一个师驻守乙方向; D、反过来,一个师驻守甲方向,两个师驻守乙方向。 我方有三种方案: a、两个师从甲方向进攻; b、反过来,两个师从乙方向进攻; c、兵分两路,两个方向各派一个师进攻。
威胁需要考虑的两个问题: 1、威胁的代价: 边缘政策:逐渐提高威胁的程度 2、威胁的目的: 吓阻还是强迫:期限
பைடு நூலகம்
2、许诺的可信性 斗鸡博弈和性别战博弈的变形 3、承诺的可信性 起床闹钟,破釜沉舟
一个更复杂的例子
总统的逐项否决权 有两个支出项目正在 考虑中:城市重建(U) 和反弹道导弹系统(M)。 国会喜欢前者,而总统喜 欢后者。但相对于维持现 状来说,双方都更喜欢让 两个法案都通过。下面的 表格展示了两个参与者对 可能出现的情况的评价, 其中4代表最好,1代表最 差。
假设在这个组中总共有四个参与者:A、B、C和D。 不论其他人怎么做,A只要向共同储金捐献1美元,共同 储金翻倍后就会增加2美元。但是,增加的2美元中,会 有1.5美元分给B、C和D;而A只能得到50美分。因此, A提高了其捐献量,最后却亏了本;相反,他减少捐献量 反而会获益。不论其他人捐多少(如果有捐款的话), 这一点都是成立的。换句话说,对A来说,一分钱也不捐 是优势策略。对B、C和D来说亦是如此。这个逻辑是说, 人人都应当希望成为一个分享别人成就的“免费搭车 者”。如果四位参与者都采取他们的优势策略,共同储 金便空空如也,每个人只保有他们的初始资金10美元。 当人人都想成为免费搭车者时,车就会停滞不前。如果 人人把他们所有的初始资金捐给共同储金,那么,翻倍 后的共同储金将是80美元,每个人将分到20美元。然而, 每个人都有背叛这样协议的个人动机。这就是他们的困 境。
1、威胁的可信性 例子:遏制进入博弈(1) ·
进入 在位者 斗争 进入者 不进入
·
不 斗争
·在位者
不斗争
0 0
2 1
1 1 8 8
1 9
遏制进入博弈(2) ·
进入 在位者 · 斗争 不 斗争 不斗争 进入者 不进入
·在位者
0 2
2 1
1 1 8 8
1 9
思想:威胁(惩罚)的可信性 1、人不犯我,我不犯人;人若犯我,我必 犯人。 2、重庆出租车罢工 3、性别战、斗鸡博弈中的威胁 4、不战而屈人之兵
田忌的朋友孙膑说: 我有办法准能让你赢了他。 田忌的朋友孙膑说:“我有办法准能让你赢了他。” 孙 膑先以下等马对齐威王的上等马 第一局输了。 以下等马对齐威王的上等马, 膑先以下等马对齐威王的上等马,第一局输了。第二场 比赛,孙膑拿上等马对齐威王的中等马 获胜了一局。 上等马对齐威王的中等马, 比赛,孙膑拿上等马对齐威王的中等马,获胜了一局。 中等马对齐威王的下等马, 第三局比赛,孙膑拿中等马对齐威王的下等马 第三局比赛,孙膑拿中等马对齐威王的下等马,又战胜 了一局。 了一局。 这样田忌三局两胜赢了齐威王。 这样田忌三局两胜赢了齐威王。
A a b c -,+ +,+,-
B +,-,+ +,-
C -,+ +,-,+
D +,-,+ -,+
C a b c -,+ +,-,+
D +,-,+ -,+