博弈论及其应用(汪贤裕,肖玉明编著)思维导图

博弈论及应用3

第三章完全且完美信息动态博弈
本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。
3.1 阶段和扩展性表示
Cont..
将式(1)代入企业1的的得益函数 u 1 (q1, q2) = 6 q1- q1 q2-q12 =3 q1 – q12 /2 max q1 (3 q1 – q12 /2) 一阶条件： 3 - q1*= 0 有 q1*=3 (单位), q2*=3 - q1* /2 = 1.5 (单位), 使 u 1= 4.5 , u 2 = 2.25 使市场总产量 Q =q1+q2=4.5, 得二企业总得益 U = u 1 + u 2 =4.5+2.25=6.75
Cont..
例1中，仿冒和反仿冒博弈的博弈方的“策略”（略）二、动态博弈的结果指各博弈方在上面类型的策略构成的策略组合下，各博弈方的策略组合形成的一条联结各个阶段的“路径”的结果。即：得益对应每条路径，而不是对应每步选择、行为例1，例2中的“结果” 。三、动态博弈的非对称性先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利，有“先行优势”。
不开发
N
需求大
N
需求小
A的选择，那么其信息集
虽然也是两个，但却与前述的不同。博弈过程如图所示。
B
开发
B B
B
不开发
(4,4)
(8,0)(-3,-3) (1,0) (0,8) (0,0)(0,1) (0,0)
举例：房地产开发（Ⅰ）：另一种表述

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论的几个经典模型ppt课件

博弈论的几个经典模型
22
模型二、囚徒困境/非合作博弈
该博弈刻划了两大难题： • 冲突情形下，参与人的目标是什么？是采用(作为个人 ) 他自己的最好策略，还是采用 ( 作为集体的一员)他们共同的最好策略？前者导致均衡策略 ( 坦白，坦白 ) ，支付为 (-8 ， -8) ；后者的最好策略是 ( 抵赖，抵赖 ) ，支付为 (-1 ， -1) 。这里反映了个体理性行为与集体理性行为之间的矛盾、冲突。 • 此博弈只进行一次还是重复进行？如果博弈只进行一次，参与人似乎只有坦白才是最好的策略，因为没有理由相信对手会对你有信心，他总认为你自己会坦白；因此，双方都采取坦白策略。然而，若博弈进行多次，则结论将会发生变化。
第四章博弈论的几个经典模型
1
引言
博弈论又被称为对策论（Game Theory)，按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann教授的说法，博弈论就是研究互动决策的理论。所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决策，选择最有利于自己的战略(strategy)。
此外此外还与会计学还与会计学统计学统计学数学基础数学基础社会心理学社会心理学以及诸如认识论与伦理学等哲学分支有重要联以及诸如认识论与伦理学等哲学分支有重要联博弈论的几个经典模型按照按照aumannaumann所撰写的所撰写的新帕尔格雷夫经新帕尔格雷夫经济学大辞典济学大辞典博弈论博弈论辞条的看法辞条的看法标准的标准的博弈论分析出发点是理性的博弈论分析出发点是理性的而不是心理的而不是心理的或社会的角度或社会的角度

1分钟漫画博弈论

在阅读过程中，我逐渐领悟到博弈论在日常生活中的广泛应用。无论是工作、学习还是娱乐，博弈论都能提供一种独特的视角和思考方式，帮助我们更好地理解和应对各种情况。例如，在工作中，如何与同事进行有效的沟通与合作，如何争取到更好的资源，其实都可以从博弈论中找到启示。而在学习中，如何合理分配时间，如何制定有效的学习策略，同样可以从博弈论中找到答案。
纳什均衡是博弈论中的一个重要概念，它描述了在给定其他参与者策略的情况下，每个参与者都选择最优策略的状态。了解纳什均衡有助于我们分析竞争场景，预测参与者的行为，并找到最佳应对策略。
“囚徒困境是一种博弈场景，其中参与者因追求个体利益而最终导致集体利益受损。”
囚徒困境是博弈论中经典的案例之一，它揭示了个体利益与集体利益之间的矛盾。在这个场景中，两个囚犯因被分别审讯而面临选择：坦白罪行以换取个人利益，或保持沉默以维护集体利益。
“博弈论教会我们如何在竞争与合作中找到最佳策略，让我们的决策更具智慧。”
这句话简洁明了地概括了博弈论的核心பைடு நூலகம்值。在现实生活中，我们经常面临各种决策场景，如商业竞争、团队合作、人际关系等。通过学习博弈论，我们可以更好地理解这些场景的本质，从而做出更明智的决策。
“纳什均衡是一种博弈策略组合，其中每个参与者都采取最优策略，以应对其他参与者的策略。”
然而，由于信任缺失和个体理性的局限，最终往往会导致集体利益受损。这个案例提醒我们，在现实生活中，我们需要合作与信任的重要性，以实现更好的集体利益。
“智猪博弈则说明了在某些场景中，先动优势可能比后动优势更为有利。”
智猪博弈是一个关于竞争与合作的有趣案例。在这个场景中，两头猪共享有限的资源，但其中一头猪（“智猪”）拥有更大的抢占资源的能力。通过合理利用先动优势，“智猪”能够获得更多的资源。这个案例告诉我们，在竞争场景中，了解自己的优势并合理利用它，往往能够获得更好的结果。

大学课程《博弈论及其应用》PPT课件：第二章(1234节)

博弈方2
左
中
右
上博弈方1
下
1，0 0，4
1，3 0，2
0，1 2，0
图 2-7 划线法
博弈的相对优势策略位置在图2-7标出，策略组合{上，中}格子中的两个数字下面都划了短线，这个格子对应的策略组合就是由划线法得到的纳什均衡。
第四节箭头方法
还有一种寻找纳什均衡的方法，和划线法的分析理念的出发点不同，这种方法的思路是对博弈中的每个策略组合进行分析，判断各博弈方是否能够通过单独改变自己的策略而改善自己的得益，如果可以，则从所考察的策略组合的得益引一个箭头到改变策略后的策略组合对应的得益。这样对每个可能的策略组合都分析考察过以后，根据箭头反映的情况来判断博弈的结果。
博弈方2
Hale Waihona Puke 左中上博弈方1
下
1，0 0，4
1，3 0，2
右
0，1 2，0
图 2-8 箭头法
观察图2-8，在策略组合{上，中}中只有指向的箭头，没有指出的格子所代表的就是纳什均衡。
略“上”改变的倾向，用一个竖着的箭头表示这个倾向；横着比较后面的得益，4比2大，4比0大，博弈方2没有改变的动力。在策略组合{上，左}中，横着比较后面，分析博弈方2 的得益，3比0大，1比0大，所以博弈方2有从策略“左”向
策略“中”和策略“右”改变的倾向，用两个横向的箭头表示这两个改变的倾向。
在策略组合{上，中}中，竖着比较前面的得益，还是横着比较后面的得益，博弈方1和博弈方2都没有改变的倾向。在策略组合 {上，右}中，竖着比较前面，2比0大，博弈方1有从策略“上”
向策略“下”改变的倾向，用一个竖向的箭头表示这个倾向；横着比较后面，3比1大，博弈方2有从策略“右”向策略“中” 改变的倾向，用一个横向的箭头表示这个倾向。

博弈论知识地图

纯战略纳什均衡-重复剔除的占优均衡智猪博弈
1完全信息静态博弈--纳什均衡任何有限博
弈都至少存
在一个纳什
均衡
是合作共
赢，而不是
斗争到底什均衡
混合战略纳
什均衡
有两个纯策
略，且都帕
累托有效
均衡筛选
非合作博弈类型秩序与产权
非合作博弈
类型
2完全信息
动态博弈--
子博弈精炼
纳什均衡
SPNE
理
还价与耐心砝码与谈判能力
誉
3不完全信
息（信息不
对称）静态
博弈--贝叶
斯纳什均衡
BNE
衡的应用举
例
书/349
设计与收入分配公共产品偏好
克服信息不对称的方法。

博弈论PPT课件

第1个数字表示企业1 的收入，第2个数字表示企业2的收入。
13
7.2.2合作博弈：建立卡特尔 • 合作是避免囚徒困境的有效方法 • 合作博弈与欺骗者
14
7.2.3重复性博弈：怎样对付欺骗者 • 重复性博弈：反复进行多次博弈 • 重复性博弈的最优策略——针锋相对：模仿上一
次博弈中对手的行为 • 针锋相对是最优策略 • 好的博弈四原则 ☞简单，不易误解 ☞针锋相对不是先搞欺骗 ☞不允许欺骗行为，但要给欺骗行为以处罚 ☞针锋相对是宽大的，允许对方恢复合作
可以采取降价策略，使新的进入者不敢贸然进入 • 投资于剩余生产能力的决策：投资引起的当前的
利润损失低于新企业进入而引起的将来的利润损失
29
7.3.4先发制人：使市场饱和
• 在各地布点，使新的进入者无法利用高运输成本的机会
N1 E N2
E1
E2
E4
E3
30
7.3.5 市场渗透定价 •通过制定低价抢占市场份额的策略。 •市场渗透定价是网络外部性明显的产业常用策略。
的违约问题 • 先合作，第N次违约的收入：
30+30+30+30+······+40
• 现实：不知道N是多少→选择合作策略 • 如何在员工工作的最后一天激励员工？ • 有结止日期的有限重复博弈等于一次性博弈
17
•市场中的重复博弈的作用 •市场中的一次性博弈使得生产劣质产品的企业有利 •市场中的重复博弈促使生产者生产高质量产品
15
重复性博弈下的行为选择
• 合作收入：30+30+30+30+······
• 不合作收入：40+20+20+20 +······

运筹学第13章博弈论

动态博弈（dynamic game）指局中人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。
“石头、剪刀、布”的游戏；
下棋、打牌等游戏。
运筹学第13章博弈论
第1节博弈论概论│博弈分类
1.2.2 博弈分类详解
完全信息博弈(completeⅠinformation)
将各博弈方都完全了解所有博弈方各种情况下得益的博弈称为“完全信息博弈” 。
运筹学第13章博弈论
第1节博弈论概论│什么是博弈论
1.1.2 引例囚徒困境是图克（Tucker）1950年提出的，该博弈是博弈论最经典、著名的博弈。该博弈本身
讲的是一个法律刑侦或犯罪学方面的问题，但可以扩展到许多经济问题，以及各种社会问题。
坦白
囚徒 B
不坦白
囚徒 A
坦白不坦白
-5, -5 -10, -1
运筹学第13章博弈论
第1节博弈论概论│什么是博弈论
1.1.5 博弈论的基本概念
博弈方的得益(Payoffs)
博弈的参加者(Player)
四个核心
各博弈方的策略(Strategies) 或行为(Actions)
博弈的次序(Order)
运筹学第13章博弈论
2 博弈的分类
运筹学第13章博弈论
第1节博弈论概论│博弈分类
1.2.2 博弈分类详解
零和博弈
在博弈中一组局中人所得到的支付（或收益）恰好是另一组局中人的损失。通俗地说，博弈结果总和为零的博弈称为零和博弈。
非零和博弈非零和博弈指所有局中人的支付（或收益）的代数和不为零。为正或为负。
赢钱与输钱为零和博弈；
工会与厂方达成增加工资的协议双方获得“双赢”。反之，罢工导致“两败俱伤”。

大学课程《博弈论及其应用》PPT课件：第一章

2021/11/19
• 博弈方：两个嫌疑犯A和 B。 • 策略：每个嫌疑犯的行动集是(坦白，不坦白)。 • 收益：对应于每种策略组合，有相应的收益结果。 • 策略组合：嫌疑犯A和B从可以选择的策略中选择并实施，有四种
情况（括号中前面是A的策略，后面是B的策略）。 • 每个策略组合对应下的A的结果，从优到劣，依次为： • （坦白，不坦白），结果是A被释放； • （不坦白，不坦白），A被判刑1年； • (坦白，坦白)，各被判5年； • （不坦白，坦白），A被判8年。 • 同理，每个策略组合对应下的B的结果，从优到劣，依次为： • (不坦白,坦白)、(不坦白，不坦白)、(坦白，坦白)、(坦白，不坦
第一章博弈概述
2021/11/19
第一节海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳，游泳。海滩有月牙形，弧形，绵延数公里。为了研究问题方便，我们姑且把海滩的长度抽象定为1，[0,1]区间就表示海滩的长度。 A和B是两个小商贩，出售无差异的补给品，同质同价，同一品牌的矿泉水，面包等。“*”表示游客均匀的分布在海滩上，游客就近购买补给品。在沙滩上应该如何分布两个小商贩的位置呢？
• A猎兔，B猎兔，鹿逃掉，A收益一只兔子，B收益一只兔子。
• 可见，每个猎人的期望，不能由自己决定，要看对方的策略选择，是能够捉得到鹿，依赖对方的选择，如果对方选择捉兔子，而你选择猎鹿，这个策略组合，对你而言，是最差的选择，也是最坏的策略。
2021/11/19
第三节博弈论是什么
• 博弈论：就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素： • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事，它的重要性在大量情形中体现,参与者面临着与故事中嫌疑犯面临的同样的动机。

博弈论PPT资料整理

博弈论PPT资料整理第一章博弈是一场至繁至简的游戏1928年冯诺伊曼系统证明了博弈论的基本原理，并宣告了博弈论的诞生。

1994年，纳什，海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。

2005年，谢林和奥曼因把博弈论引入国家管理，获得诺贝尔经济学奖。

博弈论也称对策论，原来是数学的一个分支，但由于它比较好的解决了对竞争等问题的可操作性分析，从而发展成为经济学中的一个研究领域，并以其鲜明的特征改变了经济学的传统研究其实，博弈论就是一种关于决策和对策的博弈的理论，更多的用于人与人之间，但是，因为人的思维是随环境、心情等不断变化的。

于是对于每个人每个时间应对的策略都是变化，这就增加了博弈分析的深度和难度。

中国古代的《孙子兵法》就不仅是一部军事著作，也算是世界上最早的一部博弈论专著。

博弈是个人、团队或其他组织、面对一定的环境条件，在一定的约束条件下依靠自身掌握的信息，同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施，从中取得相应的结果或收益的过程。

生活中的博弈：购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。

而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结，并帮助你完成优化效果的过程。

特别是在现代，可以说人们在日常生活中的一切行为均可以通过博弈论来解释，因为博弈的本质就是在进行一场生存的游戏。

由此可见，博弈论是适合所有人的科学。

在人际交往的过程中，博弈就是运用你的智慧和理性思维，在纷繁的事件中选择能够使你的利益最大达到最大化的科学。

博弈论能够起到重要的作用，由此，你可以看到博弈论在生活当中的广泛应用。

可以说作为一门关系学，它是人与人之间的行动互相影响的科学，是伴随你一生的科学。

从围棋定式谈纳什均衡过分的骗着与本手、缓手之间一般以本手应对着招过分不遇反击，则可能占到便宜，如遇反击则可能亏损如果势均力敌，则应考虑到对手的反击手段。