博弈论(11级郭俊聪)11172434

合集下载

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论及经典案例简介PPT课件

⑶ 上策均衡是纳什均衡的一种特殊情况，但纳什均衡却不一定是上策均衡。
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下，各自对局者所选择的策略都是最好的。合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应策略（给自己带来最大收益的策略）。
论和经济行为”，推动了博弈论在经济管理中的应用；（5）近年来，由于纳什、泽尔腾、海萨尼获诺贝尔经济学奖（1994），进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》（《孟子•告子》）：弈秋，通国之善弈也。使弈秋侮二人弈，其一人专心致志，惟弈秋之为听；一人虽听之，一心以为有鸿鹄将至，思援弓缴而射之。虽与之俱学，弗若之矣。为是其智弗若与？吾曰：非然也。
其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗，每人有2颗子弹，每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射，两轮后对决结束。
13
博弈又称博戏，是一门古老的游戏。《世本》说，“乌曹作博”，乌曹乃是夏代著名之能工巧匠。千百年来，博弈更是与人们的生活紧紧相连，从博棋到牌戏，从斗戏到彩票，中华民族的历史长河中就这样形成了别具风情的博弈文化

第八章博弈论简要课件

11
第八章博弈论
四、重复博弈和序列博弈
➢静态博弈是指局中人同时决策或虽非同时决策，但后决策者不知道先决策者采取什么策略的博弈。 ➢动态博弈是指局中人决策有先有后，后决策者能观察到先决策者决策情况下的博弈。
12
第八章博弈论
动态博弈的例子
进入
在位者甲
合作斗争
进入者乙
(400 ，500) ( -100 ，100)
6
第八章博弈论
3、策略集合：是指所有局中人可能采取的行动方案总和。例如：都坦白，都抵赖，坦白与抵赖，抵赖与坦白 4、收益：是指在每种组合情况下，局中人采取特定策略得到的结果。例如:判3年， 6年，释放等
7
第八章博弈论
三、上策均衡和纳什均衡
1、上策：是指不管其他局中人采取什么策略，某一局中人都采取自认为对自己最有利的策略。 2、均衡：是指博弈中所有局中人都不想改变自己策略的一种相对静止状态。
1
第八章博弈论
博弈论字面的意思是游戏策略，及用类似游戏中解决问题的方法，揭示解决社会、经济及其他领域问题的策略、对策，因此有的还把博弈论译成对策论。准确的说博弈论是在给定的条件下寻求最优策略，这里给定的条件包含其他人的策略以及本人的决策对其他决策主体的影响。
2
第八章博弈论
策略性活动在社会、经济、政治生活中大量存在，也可以说，整个社会、经济、政治生活都是博弈行为。因此，博弈论作为一种方法，广泛的应用在经济、政治、军事、外交中，只是博弈论在经济学中应用的最广泛、最成功。如前面介绍过的古诺均衡，就属于经济学中的博弈过程。
8
第八章博弈论
3、上策均衡：不管其他局众人采取什么策略，每个局中人都选择了对自己最有利的策略所构成的一个策略组合。 4、纳什均衡：是指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。注：所有上策均衡都是纳什均衡，但不能反过来说所有纳什均衡都是上策均衡。

博弈论最全完整-讲解课件

(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零，这个博弈就叫零和博弈；
• 相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人的得益。
供万无一失的应对办法。
学习交流PPT
5
例1：无谓竞争（The GPA Rat Race）
• 你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀，40 ％的人能得良好。
• 所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
• 某些博弈中，由于偶然的外因可以对策略贴标签，或者参与者之间拥有某些共同的知识体验，导致了焦点的存在。
• 没有某个这样的暗示，默契的合作就完全不可能。
学习交流PPT
9
例3：为什么教授如此苛刻？
• 许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
• 教授们为何如此苛刻？
• 如果允许某种迟交，而且教授又不能辨别真伪，那么学生就总是会迟交。
• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。

混合的策略纳什均衡

流浪汉寻找工作流浪
救济政府
不救济
2 3，
1 -1，
3 -1，
0 0，
虽这模型没有PNE，却有下述的MNE：参与人以一定的概率选择某种策略，然后计算相应于不同概率的期望效用。
2020/6/17
9
设：政府救济的概率θ=1/2 ；不救济的概率1-θ=1/2。流浪汉寻找工作的期望效用： 1/2×2+1/2 ×1=1.5 流浪的期望效用： 1/2×3+1/2 ×0=1.5
✓ 每个参与人都想猜透对方的策略，而每个参与人又不愿意让对方猜透自己的策略。
这种博弈的类型是什么？如何找到均衡？
2020/6/17
3
2. 混合策略、混合策略博弈和混合策略纳什均衡
• 策略：
– 参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的“相机行动方案”。
E1(正面)=(-1)×r+1×(1-r)=1-2r 参与人1选取反面的期望效用为
E1(反面)=1×r+(-1)×(1-r)=2r-1
2020/6/17
15
参与人1的期望效用为 E1= E1(正面)×q + E1(反面)×(1- q ) =(1-2r)(2q-1)
类似地，得到参与人2的期望效用为
E2= E2(正面)×r + E2(反面)×(1- r ) =(1-2q)(2r-1)
参与人2
正面
反面
参与人1
正面反面
-1， 1 1，-1
1，-1 -1， 1
由划线法可知，该博弈不存在纳什均衡。所以采取纯策略不存在稳定的纳什均衡解。
2020/6/17
2

博弈论

Day 1
Day 2
Day 3
分析
如果是情况（2），2红1黑

那么在第一天，红头发的人会看到1红1黑，他会考虑如果自己头发颜色是黑的，那么为情况（1），他所见的红发人会在第一天黄昏自杀，如果他头发为红，为情况（2），他所见的红发人不会自杀。黑头发人看到2红，那么可排除情况（1），如果他头发为黑，则为情况（2），否则为情况（3）。到了第二天，没有人自杀。那么两个红发人都认定此为情况（2），知道自己头发为红，于第二天晚自杀。黑发人第三天发现这是情况（2），知道自己头发为黑，于当晚自杀。
分析
我们从1个海盗的情况开始讨论。（1）如果只有1个海盗，那么他显然会把 10个金币都分给自己。此时最佳方案为{10}。
分析

（2）如果有2个海盗，那么2号来制定方案。但是他无论怎么制定，1号海盗都投反对票，根据规则2号海盗会被丢入大海，并且金币被1号海盗独享。最佳方案为{死，10}。
2 1
分析

（3）如果有3个海盗，那么3号无论怎么制定方案，2号必同意（因为如果只剩2人了那么2号必死，他保命要紧），而1号必反对（因为如果只剩 2人，他将独享10金币并搞死2号）。所以3号可以给自己分10个，依然能通过。最佳方案为{10， 0，0}。 3 2 1
分析

（4）如果有4个海盗，那么4号除自己需要2票，此时3号必反对提议（因为如果到3海盗情况他将得10金币，就算现在给他 10金币他也反对因为他还想搞死4号），那么此时需要1、2号各一票。如果到3海盗情况，那么1、2号会颗粒无收。若不给他们金币让他们同样颗粒无收，他们将反对（同样都一无所获那为什么不让你死），但若给他们1人1金币，他们就会同意。所以最佳方案为{8，0，1，1}。

博弈论与竞争策略ppt课件

结局(outcome)：对参与人的不同行动，这场博弈的结果或结局是什么
报酬(payoff)（支付）与报酬函数(payoff function)：博弈的结果给参与人带来的好处。可以用报酬矩阵（支付矩阵、得益矩阵、赢得矩阵）
3
2、博弈均衡的基本概念
（1）占优策略均衡占优策略：无论其他参与者采取什么策略，
博弈论就是用数学方法研究决策相互影响的理性人是如何进行决策以获取最大收益的。
博奕：多人决策过程引例：田忌赛马
2
1、博奕论的基本要素
参与者(player)（博奕方、局中人、对局者）：即有哪些人参与博弈。一般至少有两个参与者。
策略(strategy)与策略空间(strategy set)：什么人在什么时候行动；当他行动时，他具有什么样的信息；他能做什么，不能做什么。
-1 -12
不坦白
-12 -1
-2 -2
5
• 如果两个疑犯都能够选择不坦白的话，他们将明显地得到一个更大的收益，但由于两人的信息无法沟通，选择不坦白并不是两人的理性选择。对于两人而言，不管对方坦白或是不坦白，自己选择坦白都是更优的选择，因而，{坦白，坦白}就是均衡战略。
6
占优策略均衡
犯人招供与黑社会制裁
嫌犯B
坦白
嫌犯A
坦白
-∞ -∞
不坦白
-12 -∞
不坦白 -∞ -12 -2 -2
7
（2）纳什均衡
纳什均衡：在一个纳什均衡里，任何一个参与者都不会改变自己的策略，如果其他参与者均不改变各自的策略。
博弈中双方都没有绝对的最优策略，一方的最优策略取决于对方的选择。
占优策略均衡一定是纳什均衡，但纳什均衡不一定是占优策略均衡。

博弈论理和对策行为

略数也是有限的)往往用矩阵形式表示。
博弈论和对策行为
策略型博弈的实例和解(囚徒困境)
例1. 囚徒困境(prisoner’s dilemma) 在对博奕局势进行描述后，博奕论分析就是要求
出局中人进行策略选择的理性结局，或者说找出博奕问题的解。在非合作博奕中，有两种解的技术：一种是纳什均衡，一种是优超解。
概论
博弈论和对策行为
博奕论是一门内容广泛且复杂的学科，不仅是经济学，政治学、军事、外交、国际关系、公共选择，还有犯罪学等，都涉及到博奕论。
实际上，很多人把博奕论看成数学的一个分支，博奕论的一个重要代表人物---纳什(Nash，曾获1994 年诺贝尔经济学奖，该年度的诺贝尔经济学奖授与了三位博奕论专家)，在1951年的一篇奠基性的文章就是发表在数学杂志上，而非在经济学杂志上。
对囚徒B作同样分析：如果囚徒A的策略是“坦白”，则他采取“坦白”策略为好；如果囚徒A的策略是“抵赖”,他还是采取“坦白”策略好，所以囚徒B对囚徒A的最优反应也是“坦白”。
两个最优反应形成了一个策略组合(坦白，坦白)，这就是一个纳什均衡。
博弈论和对策行为
囚徒困境在经济学上的应用
两个寡头企业选择产量的博奕就是一个囚徒困境问题。
博弈论和对策行为
囚徒困境在经济学上的应用
以上的分析告诉我们，用经济学的观点来看，只有由满足个人理性选择的策略组成的集合才是均衡的，或者说只有纳什均衡才是稳定的。
博弈论和对策行为
囚徒困境在经济学上的应用
看两个寡头合谋与价格卡特尔的情形，它也存在个人理性与集体理性的冲突。
在两个寡头合谋条件下的产量与价格决定，是基于两个寡头利润总和的最大化目标，而不是每个企业自己的利润最大化。因此这种最大化目标下的产量分配符合两家企业的共同利益，却不是使每家企业自己的利润最大化的产量，换言之，并不是每家企业自己的“最优反应”。所以，卡特尔产量分配不是一个纳什均衡。正因为此，卡特尔下一定会有违约冲动，卡特尔具有不稳定性。

第11章博奕论

齐王田忌
3 1 1 3 1 − 1 A= −1 1 1 1 1 1
1 1 3 1
1 1 3
1 1 1 3 1
1 −1
−1 1 1 −1
−1 −1 1 1 1 1 3
第二节矩阵对策二人有限零和对策也称矩阵对策，二人有限零和对策也称矩阵对策，在众多对策模型中占有主要的地位，模型中占有主要的地位，矩阵对策是到目前为止在理论研究和求解方法方面都比较完善的一类对策。理论研究和求解方法方面都比较完善的一类对策。
每一个局中人 i , i = 1,2,..., n ，都有自己的策略集 S i ，一般地，每一局中人的策略集中至少包含两个策略。一般地，每一局中人的策略集中至少包含两个策略。参与方的收益（payoffs）（3）参与方的收益（payoffs）每一局中人 i , i = 1,2,..., n ,各自选定自己的策略 si ∈ S i 后，就形成一个局势。全体局势的集合S可用各局中人就形成一个局势。全体局势的集合S 的策略集的迪卡尔集表示，即：S = S1 × S 2 × L × S n 的策略集的迪卡尔集表示，对应于每一局势，局中人对应于每一局势，
给他们同样的选择机会:如果他们两人都拒不给他们同样的选择机会: 认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑；认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑；则坦白者从轻处理, 如果两人中有一人坦白认罪,则坦白者从轻处理, 立即释放,而另一人则将重判10年徒刑；如果两人立即释放,而另一人则将重判10年徒刑； 10年徒刑同时认罪,则他们将被各判6年监禁．同时认罪,则他们将被各判6年监禁．问题是两名罪犯如何选择他的行为（坦白或不坦白）罪犯如何选择他的行为（坦白或不坦白）使结果对自己最有利。自己最有利。用一个矩阵表表示两囚徒的得益，如表11.2 11.2，用一个矩阵表表示两囚徒的得益，如表11.2，这种矩阵是表示对策问题的一种常用方法，这种矩阵是表示对策问题的一种常用方法，我们称这种矩阵为一个对策的得益矩阵” “得益矩阵” Matrix）。（Payoff Matrix）。

清华大学博弈论

Slide 10
教学方法 Strategy for Studying
案例教学使用现实生活中的例子（故事），使得它背后的概念易懂易记。 Using examples/stories in real life, case study approach offers a concrete and y pp memorable vehicle for the underlying concepts. 读案例可以帮助你掌握如何进行某些特定的博弈的秘方。 Reading cases can help you know the recipes for how to play some specific games. games
第四部分：应用 Part IV: Applications to Specific Strategic Situations (1 ) classes)

第17章：讨价还价 Ch17: Bargaining (1)
期末测验 Final Exam (Week 16) ( )
Slide 5
教材
Dixit, Avinash, and Susan Skeath, Games of St t G f Strategy, 2nd edition, W. diti W W. Norton & Company, 2004.

案例描述说明事情如何发生 Case Study (how) 理论分析说明事情为何发生 Theory (why) y( y)
通过例子（案例）引入一般理论，然后用现实来检验它，并用来解释现实。 Examples lead to general theories that are then tested against reality and used to i t t interpret reality. t lit

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

站长素材
认识博弈论
by郭俊聪
互动测试
• 规则：在纸上写下1—100之间的任意数，最接近平均数2/3的人获胜。
LOGO
• 奖励：胜者为一人，请看电影一场或35元现金；胜者多于一人，均分 20元钱。
博弈论的发展
• 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。 • 1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。 • 1950～1951年，ห้องสมุดไป่ตู้ 翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。——纳什均衡（Nash equilibrium ）
如果其中一人是你，你如何抉择？绝对优势策略
到底什么是博弈？
LOGO
• 博弈（game playing):在多决策主体之间行为具有相互作用时，各主体根据所掌握信息及对自身能力的认知，做出有利于自己的决策的一种行为。 • 满足博弈的三个条件：参与者，策略，收益
基本分析方法
• 情景假设：假设你现在是钟会要去攻打蜀国，你有两队人马。蜀国守将姜维有两队人马 • 你有两种路线方案： • 1、入剑阁经大道步步为营攻下成都； • 2、偷渡阴平，直取蜀汉。同样姜维也有对应的防守策略。 • 注意： • 1、走阴平因路途坎坷你会直接损失一队人马； • 2、相同兵力遭遇以双方都全军覆没算，2v1,2方剩 1,1方无。 • 3、双方都只能选择一条路线 • 请问，为了取得胜利，你会如何安排进攻？
LOGO
2012诺贝尔奖获得者夏普利夏普利值——n人博弈
经典案例
囚徒困境（博弈论的非零和博弈中具代表性的例子，反
映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。）
LOGO
两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。
LOGO
基本分析方法
• • 收益假设：你所剩余的人马为你的收益，姜维消灭的你的人马为姜维的收益。问题分析——二维表
LOGO
姜维剑阁钟会（你）剑阁阴平
（0,2）（2,0）（1,1）（0,2）
阴平
Thank you