博弈论与政治第四讲_755106771

合集下载

博弈论课件第四章

博弈论课件第四章

3
合作博弈
参与者之间可以合作并制定共同策略,追求更大的利益。
纳什均衡理论
纳什均衡是博弈论中的一个重要概念,指的是当参与者根据对手的选择来选 择自己的策略时,不存在更好的选择。这种均衡状态具有稳定性和可持续性。
混合策略的应用
硬币翻转
混合策略可以应用于硬币翻转等 概率性决策中,以平衡风险。
剪刀石头布
博弈理论在法律
博弈论可在法律领域中应用于博弈模型的构建和法律决策的优化。
博弈论的应用领域
经济学
博弈论在经济学中用于研究市场竞争、拍卖和价格形成等问题。
政治学
博弈论在政治学中用于分析选举、合作和冲突等政治策略。
生物学
博弈论在生物学中用于研究进化和动物行为等领域。
博弈论中的主要模型
1
零和游戏
参与者的收益总和为零,一方的利益损失即为另一方的利益增益。
2
非合作博弈
参与者之间缺乏合作,每个参与者根据自身利益进行决策。
博弈论课件第四章
博弈论是研究决策制定和互动模型的学科,第四章将介绍博弈论的基本概念、 应用领域、主要模型以及纳什均衡理论和混合策略的应用,同时提供实际应 用案例。
博弈论的基本概念
1 参与者
博弈论研究多人决策制定过程中的参与者之间的互动。
2 策略
参与者在决策过程中可选择参与者根据他们的行动所获得的支付或效益。
混合策略可用于剪刀石头布等多 次对局中,通过随机选择策略以 增加不可预测性。
扑克筹码
混合策略可应用于扑克中的下注 决策,以提高筹码的价值和战略 性。
博弈论在实际问题中的应用案例
商业竞争
博弈论可用于分析企业在市场竞争中的策略选择和定价决策。
军事战略

博弈论讲义完整PPT课件

博弈论讲义完整PPT课件
• 两个寡头企业选择产量的博弈:
如果两个企业联合起来形成卡特尔,选择垄断利润最大化的产量,每 个企业都可以得到更多的利润。给定对方遵守协议的情况下,每个企业都 想增加产量,结果是,每个企业都只得到纳什均衡产量的利润,它严格小 于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章 导论-囚徒困境
知识:完全信息博弈和不完全信息博弈。 ❖完全信息:每一个参与人对所有其他参与人的(对手)的特征、
战略空间及支付函数有准确的 知识,否则为不完全信息。
第33页/共293页
第一章 导论-基本概念
• 博弈的划分:
行动顺序 信息
完全信息
静态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
0,300 0,300
纳什均衡:进入,默许;不进入,斗争
第29页/共293页
第一章 导论
• 人生是永不停歇的博弈过程,博弈意略达到合意的结果。 • 作为博弈者,最佳策略是最大限度地利用游戏规则,最
大化自己的利益; • 作为社会最佳策略,是通过规则使社会整体福利增加。
第30页/共293页
第一章 导论-基本概念
一只河蚌正张开壳晒太阳,不料,飞 来了一只鸟,张嘴去啄他的肉,河蚌连忙合 起两张壳,紧紧钳住鸟的嘴巴,鸟说:“今 天不下雨,明天不下雨,就会有死蚌肉。” 河蚌说:“今天不放你,明天不放你,就会 有死鸟。”谁也不肯松口,有一个渔夫看见 了,便过来把他们一起捉走了。
第17页/共293页
第一章 导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”?
第20页/共293页

博弈论课件

博弈论课件

博弈论强调参与者之间的互动关系,通过数学模型和理论分析来研究 策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初,当时数学家和经 济学家开始研究游戏中的策略和均衡。
1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济 行为》标志着博弈论的诞生。
随后,纳什、泽尔腾和哈萨尼等学者进一步发展了博弈 论,形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为,例如价格战、广告战等。通过 博弈论,企业可以更好地理解竞争对手的策略,制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为,例如供应链管理、合资企业 等。通过博弈论,企业可以更好地理解合作伙伴的需求和期望,制定出更有效 的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中,如果所有参与 者都根据自己掌握的信息选择最优策 略,则所有参与者都能获得最大收益 。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序,后选择的参与者可以观察到先选择的参与 者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法, 用于找到在满足一组约束条件下 最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方 法,用于找到一组变量的最优值 ,使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解 为相互重叠的子问题来解决问题 的方法,每个子问题的解被保存
博弈论课件
汇报人:
汇报时间:202X-01-04

博弈论PPT资料整理

博弈论PPT资料整理

博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。

1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。

2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。

博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。

于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。

中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。

博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。

生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。

而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。

特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。

由此可见,博弈论是适合所有人的科学。

在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。

博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。

可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。

从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损如果势均力敌,则应考虑到对手的反击手段。

《博弈论》

《博弈论》

博弈论在大数据分析中的应用
数据挖掘
博弈论可以应用于数据挖掘中的关联规则挖掘、分类和聚类等问 题,如基于博弈论的关联规则挖掘算法等。
异常检测
博弈论可以应用于异常检测中的异常值识别和分类等问题,如基 于博弈论的异常检测算法等。
推荐系统
博弈论可以应用于推荐系统中的用户行为预测和个性化推荐等问 题,如基于博弈论的推荐算法等。
04
博弈论的应用领域
经济领域
价格竞争
博弈论可以用来分析企业之间的价格竞争,研究竞争对手的反应 和策略,以制定更有效的定价策略。
寡头市场
博弈论可以用来研究寡头市场的均衡和稳定性,分析不同寡头企业 的策略和相互影响。
拍卖理论
博弈论可以用来研究拍卖机制的设计和优化,以提高拍卖的效率和 公平性。
政治领域
线性方程组
02
求解博弈中的均衡策略通常需要解线性方程组。
特征值与特征向量
03
一些博弈问题可以通过分析矩阵的特征值和特征向量来得到解
决。
概率论与数理统计基础
概率分布
在博弈中,支付通常被假 设为随机变量,其分布可 以通过概率分布来描述。
期望与方差
支付的期望和方差是博弈 论中常用的概念,它们可 以用来衡量支付的不确定 性。
弈。
特点
混合博弈既强调参与者的合作与协 商,又强调参与者的竞争与对抗, 通过综合运用两种策略实现自身利 益最大化。
应用领域
混合博弈在经济学、政治学、社会 学等领域都有广泛的应用,尤其是 在现实世界中,很多博弈都可以被 视为混合博弈。
03
博弈论的数学基础
线性代数基础
向量与矩阵
01
博弈论中经常使用向量和矩阵来表示策略和支付。

博弈论最全完整-讲解课件

博弈论最全完整-讲解课件
(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之 得益总和总是保持为零,这个博弈就叫零和博 弈;
• 相反,如果一个博弈在所有各种对局下全体参 与人之得益总和不总是保持为零,这个博弈就 叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后,但只要局中人在决策 时都还不知道对手的决策或者行动是什么,也 算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人 的得益。
供万无一失的应对办法。
学习交流PPT
5
例1:无谓竞争(The GPA Rat Race)
• 你所注册的一门课程按照比例来给分:无论卷 面分数是多少,只有40%的人能够得优秀,40 %的人能得良好。
• 所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
• 某些博弈中,由于偶然的外因可以对策略贴标 签,或者参与者之间拥有某些共同的知识体验, 导致了焦点的存在。
• 没有某个这样的暗示,默契的合作就完全不可 能。
学习交流PPT
9
例3:为什么教授如此苛刻?
• 许多教授强硬地规定,不进行补考,不允许迟 交作业或论文。
• 教授们为何如此苛刻?
• 如果允许某种迟交,而且教授又不能辨别真伪, 那么学生就总是会迟交。
• 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。

第四篇博弈论PPT课件

第四篇博弈论PPT课件
• 此情况下由于博弈没有可预测的明确的博弈结果,所以就不能 确定博弈方的策略。但是是否在这样的博弈中,各博弈方选择 任何策略都是一样的,因此可以随意选择吗?
• 按博弈中的得益
• 零和博弈 (Zero-sum Games) (严格竞争博 弈)
(麻将、赌博、猜硬币)
• 常和博弈 (Constant-sum Games)
博弈)
(固定数量利润、财产分配的讨价还价
• 变和博弈 (Variable-sum Games) (囚徒 困境博弈、古诺模型)
• 按博弈过程的次序
囚犯困境博弈
• 个人理性选择的结果: -5)
(坦白,坦白)——(-5,
• 集体理性决策的结果: -1)
(抵赖,抵赖)——(-1,
• 个人理性不一定导致集体理性
• 现实中的囚徒困境模型:价格战、恶性广告竞争、军备竞赛等。
第12页/共83页
2、猜硬币博弈

硬 正面 币 反面 方
猜硬币方
正面
反面
-1,1
• 博弈论是系统研究各种博弈问题,寻求博弈方合理的策略选择 和合理选择策略时的博弈结果,并分析结果的经济、效率意义 的理论与方法。
第3页/共83页
二、博弈论发展的里程碑
• 古诺模型(Cournot) (1838)(两寡头通过 产量决策进行竞争的模型;
• 伯特兰德模型(Bertrand) (1883)(价格竞争) • 《博弈论与经济行为》(1944)
六、博弈的表示方法
• 标准型 (normal form ) 收益矩阵
对简单的博弈适用(二人有限博弈)
• 扩展型 (extensive form )
博弈树
适用于动态博弈
• 特征式

博弈论课件

博弈论课件

脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高 达美乐 中

60, 60 70, 36
35, 36
44
最优反应分析规则: 在均衡点的情况, 每 个参与人的行动一定是对于其他参与人最 优反应的最优反应。 最优反应曲线: 某个参与人所有相对于其 他参与人所有策略的最优反应。

45
TALIA 贡献 NINA 贡献 贡献 EMILY 不贡献 5, 5, 5 不贡献 3, 6, 3 EMILY 贡献 贡献 3, 3, 6 不贡献 NINA 不贡献 1, 4, 4
◦ 参与人不能后悔。
在其他参与人已经选择的行动情况下,参与人 必须偏好现有选择的策略。
最直觉检查是否为纳许均衡方法,就是问参与人 是否还有比现在更好的行动可选。 如果答案为“否”,那就是纳许均衡—这也是纳 许解法(Nash Solution)。
13
纯策略: 行动中没有随机的部分 ◦ 也就是说,任意时间点上的行动都是确定 的。 混合策略: 从纯策略中随机地以概率的方 式决定行动。
20
俾斯麦海战争赛局: 俾斯麦海(Bismarck Sea)在太平洋西 南部,为巴布亚新几内亚西北岸和俾斯麦 群岛所围绕。总面积24万平方公里。北 接太平洋,东南经维蒂亚兹海峡(Vitiaz)、 丹皮尔海峡(Dampier)和圣乔治海峡通所 罗门(Solomon)海。四周岛屿多山地。

21

7

同时行动博弈:
◦ 参与人在不清楚对手所做选择的情况下采取行 动。 ◦ 即使这些行动选择不是同时进行的。 ◦ 又称不完美信息博弈。 ◦ 所以你的行动不可以按照对方行动后才决择。

使用博弈矩阵(game matrix) 或称为报酬 表(payoff table)
◦ 规范式(normal form)或策略式(strategic form) ◦ 矩阵的维度等于参与人的数目 (所以参与人越多, 越难以矩阵表示). ◦ 在两人游戏中,行、列、玩家策略都是两个。
6, 3, 3
4, 4, 1
不贡献
4, 1, 4
2, 2, 2
FIGURE 4.8 Street-Garden Game
Copyright © 2000 by W.W. Norton & Company 46
TALIA 贡献 NINA 贡献 贡献 EMILY 5, 5, 5 不贡献 3, 6, 3 EMILY 贡献 不贡献 不贡献 NINA 贡献 3, 3, 6 不贡献 1, 4, 4
9
零和游戏与非零和游戏 在零和(等和)游戏中,我们只需要知道n-1 人的报酬,因为他们的报酬总和为零。 ◦ 在零和(非等和)游戏中,我们就需要知道 所有参与人的报酬。

10
建立赛局表 剪刀-石头-布游戏 每个参与人有三个纯策略:

◦ 剪刀 ◦ 石头 ◦布
在同时行动赛局,参与人不能以他人反应 作出行动决定 每个参与人的策略在任何一点的决策都是 相同的。

37
守方 跑位 跑位 攻防 短传 中传 长传 2 6 6 10 max = 10 传球 5 5.6 4.5 3 max = 5.6 四分卫 13 10.5 1 -2 max = 13 min = 2 min = 5.6 min = 1 min = -2
38
守方 跑位 跑位 攻防 短传 中传 长传 2 6 6 10 max = 10 传球 5 5.6 4.5 3 max = 5.6 四分卫 13 10.5 1 -2 max = 13 min = 2 min = 5.6 min = 1 min = -2
L 8, 2
a
L c
H
11, 0
L
9, 0.5
GRAY GREEN,
GRAY
H
1, 1
H
GREEN
b
L 0, 2
a
L c
H
2, 0
L
0.5,0.5
2 A 1 B 2
C
3,3
D E 1
5,4
G
6,2
H F 2,2
2,6





图示同时行动赛局 纳许平衡(Nash Equilibrium) 占优策略(Dominant Strategies) 当两个玩家都有占优策略的情况 当只有一个玩家有占优策略的情况 连续删除劣策略(Dominated Strategies) 零和游戏的最大最小值方法(Minimax Strategies 逐个单位各检查法(Cell-By-Cell Inspection) 纯策略是连续型变量的情形(Continuous Variables) 三个参与人赛局 纯策略中的多重均衡点 纯策略中没有均衡点的情形
32
必胜客 高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高 达美乐 中

60, 60 70, 36
35, 36
33
必胜客 高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高 达美乐 中

60, 60 70, 36
35, 36
抵赖 (合作)
1 , 25
3, 3
19
任何一个有占优策略的参与人都会在均衡 中选择该策略。 如果所有的参与人都有占优策略,那纳许 解法就容易多了。

◦ 如果只有一个参与人有占优策略会发生什么事? ◦ 没有占优策略的参与人会依有占优策略的参与 人的占优策略来反应—最佳反应(best response)
1942年3月,日军海上运输船队从新不列 颠的拉包尔浩浩荡荡出发,经过俾斯麦海, 抵达新几内亚,沿途几乎没有什么美军舰 机的拦截,因此损失很少。这个时候的美 军,正全力阻止日军向澳大利亚推进,无 暇它顾。
22

1943年1月,美军西南太平洋战区司令麦克阿瑟 上将开始实施“蛙跳战略”——逐个夺取日占岛 屿,最后打进日本本土。 美军经过一番琢磨,攻 击新几内亚沿海的日军集结地。那儿有三大目标:

11
(a) 报酬全视图
玩家 2 石头 石头 玩家 1 布 剪刀 布 剪刀 赢,输 输,赢
(b) 零和游戏简图
玩家 2 石头 石头 玩家 1 布 剪刀 和 赢 输 布 输 和 赢 剪刀 赢 输 和
和,和 输,赢 赢, 输 和, 和
输, 赢 赢, 输 和,和
12

若每个参与者根据对其他参与者策略的信 念,采用最大自身化收益的策略,则这样 的一个策略组合就是纳什均衡。
不贡献
6, 3, 3
4, 4, 1
4, 1, 4
2, 2, 2
47
有一个以上的纳许均衡点 安全赛局(Game of Assurance) 懦夫赛局(Chicken) 性别战赛局(Battle of Sex) 弱优势(Weak Dominance)
39
守方 跑位 跑位 攻防 短传 中传 长传 2 6 6 10 max = 10 传球 5 5.6 4.5 3 max = 5.6 四分卫 13 10.5 1 -2 max = 13 min = 2 min = 5.6 min = 1 min = -2
40

If all else fails…
◦ Cell-by-cell inspection can be used to find Nash equilibria in any game
ቤተ መጻሕፍቲ ባይዱ
28
日本海军 北 南 2, 2

美国空军
2, 2 1, 3

3, 1
29
日本海军 北 南

美国空军
2 1
2 3

30
日本海军 北 南

美国空军
2 1
2 3

31
即是对参与人删除所有可能劣策略。 如果删除后只有一个独特结果,这就是纳
许解法。 占优可解(Dominance Solvable)赛局。

◦ 参与人都可以获得更好的报酬,如果两人合作。 ◦ 但是如果只是某位参与人一厢情愿,他们只会 得到更少。 ◦ 单方面背叛会是总报酬减少。
17
妻子
认罪 (背叛) 认罪 (背叛)
丈夫 抵赖 (合作) 25, 1 10, 10
抵赖 (合作)
1 , 25
3, 3
18
妻子
认罪 (背叛) 认罪 (背叛)
丈夫 抵赖 (合作) 25, 1 10, 10
◦ 莱城——大型基地和大型机场; ◦ 萨拉莫阿——重要的港口和机场; ◦ 芬斯彻哈芬——运输中心和水上飞机及供应舰锚泊地。

为了孤立这些地方的日军,美军决定,一旦日军 船队通过俾斯麦海支援,就予以摧毁性打击。
23



日本海军官员于2月21日拟订了“81号作战 计划”,决定从拉包尔向莱城运送6900多 名官兵,250吨的弹药、车辆等作战物资。 2月28日,日军船队从拉包尔启航,沿着新 不列颠岛北海岸西进。 3月1日,日军船队被美军发现。美军太平洋 战区陆军航空兵的克耐将军认为,这是显示 陆基航空兵威力的大好时机。
高 达美乐 中

60, 60 70, 36
35, 36
42
必胜客 高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
高 达美乐 中

60, 60 70, 36
35, 36
43
必胜客 高
中 36, 70 50, 50
35, 30
低 36, 35 30, 35
25, 25
24


3月2日,美机发现,这支船队开始从俾斯麦海向 维蒂埃兹海峡行驶。 持续3天的俾斯麦之战结束了。作战中,美军只 战死13人,受伤12人,4架飞机被击落,2架负 伤落在美军机场附近。 而日军13-14艘商船被击沉,7艘驱逐舰被击沉, 死亡人数达3000多人,损失战机59架。 这是美军陆基飞机首次攻击大规模日军船队之战, 没有任何盟军水面战舰参战,但却取得巨大胜利 的一次海战。
相关文档
最新文档