博弈论基础课件

合集下载

博弈论基础PPT精品课程课件全册课件汇总

自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束？
我们必须知道参与人关心什么，才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。首先，它提供了一种语言。其次，它提供了应该框架，能够指导我们建立策略环境模型。其三，它有助于我们追朔，对行为假设的逻辑推理过程。
1 概述
好几百年前，数学家就开始研究室内游戏，试图构造最优的游戏策略。
在1713年，沃尔德格雷夫就某种纸牌游戏的解决方法，与他的同事德莫特和贝努利进行交流。沃尔德格雷夫的解决方法，与现代理论的结论相一致。
支付(payoff)，或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈，两个厂商通过选择高价或者低价进行竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个参与人的博弈中，i=1,2,…,n。在某些博弈中，一个参与人可以在无限多个行动中进行选择。

《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u}，其中N=（1,2)， Si={(0,2),(1,1),(2,0)}，ui (s1, s2) = ri，i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败，成功
成功，失败
成功，失败
失败，成功
成功，失败
成功，失败
《博弈论》课程
（一）什么是博弈论
我们首先看几个例子。例1 石头、剪刀、布
猪八戒
石头石头孙悟空剪刀布未定，未定找水，休息休息，找水剪刀休息，找水未定，未定找水，休息布找水，休息休息，找水未定，未定
2
例2 诺曼底登陆
德军
加来设防加来登陆盟军
诺曼底登陆成功，失败
诺曼பைடு நூலகம்设防成功，失败
9
例4 进攻与防守双方争夺一个据点，有两条进攻路线X和Y，攻方有两个军，而防守方也有两个军，只有当守方的兵力不少于攻方时，才能击退进攻，否则据点将会失守。首先可知守方的防守方案（即策略）为(0,2)，(1,1)，(2,0)，即在X 线路和Y线路驻扎军队数，同样可以到的攻方的进攻方案(0,2)，(1,1)和(2,0)。容易看出，行动并非策略，策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心，因而博弈论对于各门社会科学而言，就具有了方法论意义，成为各门学科的有力分析工具。
6
（二）博弈表达的科学式
（1）博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来科学地描述一个博弈，就称为博弈表达的策略式（或基本式、标准式）。

博弈论基础Axjh(共48张PPT)

行动顺序信息
完全信息结构
静态结构
（战略博弈）
完全信息静态博弈 Nash均衡
Nash(1950,1951)
动态结构
（扩展博弈）
完全信息动态博弈子博弈精练Nash均衡
Selten(1965)
不完全信息结构
不完全信息静态博弈
不完全信息动态博弈
贝叶斯Nash均衡
精练贝叶斯Nash均衡
Harsanyi(1967-1968)
不完全信息（incomplete information）：指至少有一个局中
人不完全了解其他局中人的收益或收益函数。
完备信息（perfect information）：指一个参与人对其他参与
人的行动选择有准确的了解。
不完备信息（Imperfect information）：指博弈中至少有一个局中人不了解其他局中人的行动选择。
由大学、比勒菲尔特大学和波恩大学。其主要贡献是在博弈论中引入了动态分析。
1920年Harsanyi出生于匈牙利，1947年获布达佩斯大学博士学位，后到，1954年获斯坦福大学博士学位，曾先后任教于澳大利亚国立大学、加州伯克利分校。于2000年去世。他的贡献是将不完全信息引入了博弈论的研究。
例如：
出门
——对天气的判断打牌
——对其他人的判断装修
——对产品的了解
战略（strategies）或策略，是局中人选择行动的规则，它告诉局中
人在什么时候选择什么行动。
例如：
——“人不犯我，我不犯人；人若犯我，我必犯人”
—— 三个和尚没水喝
支付（payoff）：指每个参与人从博弈中获得的效用水平。既可以指实际支付，也可以用来指期望支付。它是所有局中人战略或行动的函数，是每个局中人关注的核心问题。

博弈论最全完整ppt-讲解

能提供万无一失的应对办法。
例1：无谓竞争（The GPA Rat Race）
你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀， 40％的人能得良好。
所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
问题是，大家都这么做。这样一来，所有人的成绩都不比大家遵守协议来得高。而且，大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈德·泽尔腾， 1930 年生于德国
约翰· 海萨尼 1920年生于美国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由：前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论的论述；后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。
博弈论为众多学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。
如何在“博弈”中获胜？
日常生活中的博弈（“游戏”）往往指的是诸如赌博和运动这样的东西：赌抛硬币百米赛跑打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示，默契的合作就完全不可能。
例3：为什么教授如此苛刻？
许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
教授们为何如此苛刻？如果允许某种迟交，而且教授又不能辨
别真伪，那么学生就总是会迟交。期限本身就毫无意义了。避免这一“滑梯”通常只有一种办法，

博弈论最全完整-讲解PPT课件

王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。
艾里克.拉斯缪森（Eric Rasmusen）著，《博弈与信息：博弈论概论》，北京大学出版社，2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著，《信息经济学引论：激励与合约》,上海财经大学出版社，2004年版。
常和博弈也是利益对抗程度最高的博弈。非常和（变和）博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著，《博弈论与信息经济学》，上海三联书店、上海人民出版社，1996年版。
Roger B. Myerson著：Game Theory（原文版、译文版），中国经济出版社，2001年版。
是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻，面临决策或者行动的参与人，对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚，则称为完美信息博弈；否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束，然后以精心策划的方式选择自己的行为，按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜？
…… 真的能在博弈中（总是）获胜吗？
对手和你一样聪明！许多博弈相当复杂，博弈论并不
施锡铨编著，《博弈论》上海财大出版社，2000年版。
谢识予编著，《经济博弈论》，复旦大学出版社， 2002年版。
谢识予主编，《经济博弈论习题指南》，复旦大学出版社，2003年版。

第十章博弈论初步PPT课件

2020年3月2日星期一
12
第十章博弈论初步第二节同时博弈：纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法第一，把整个的支付矩阵分解为甲厂商的支付矩阵和乙厂商的支付矩阵
2020年3月2日星期一
13
第十章博弈论初步第二节同时博弈：纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2020年3月2日星期一
11
第十章博弈论初步第二节同时博弈：纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
1.基本方法先用下划线法分别表示甲厂商和乙厂商的条件策
略，最后确定博弈的均衡（就是找到在两个数字之下都划线的单元格即可，与这些单元格相对应的策略组合就是所要求的均衡策略组合）。
1
第十章博弈论初步第一节博弈论和策略行为
2.博弈的三个基本要素三个基本要素，即参与人、参与人的策略和参与
人的支付。所谓参与人（或称局中人），就是在博弈中进行
决策的个体；所谓参与人的策略，指的是一项规则，根据该规则，参与人在博弈的每一时点上选择如何行动；所谓参与人的支付则是指，在所有参与人都选择了各自的策略且博弈已经完成之后，参与人获得的效用（或期望效用）。
2020年3月2日星期一
2
第十章博弈论初步第一节博弈论和策略行为
3.博弈的简单分类根据参与人的数量，可以分为二人博弈和多人博
弈；根据参与人的支付情况，可分为零和博弈和非零和博弈；根据参与人拥有的策略的数量多少，可分为有限博弈和无限博弈；根据参与人在实施策略上是否有时间的先后，可分为同时博弈和序贯博弈。
二、支付矩阵
1.支付矩阵使用支付矩阵来描述和分析只有两人参加且两人

博弈论最全完整-讲解课件

(zero-sum game and non-zero-sum game)
• 如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零，这个博弈就叫零和博弈；
• 相反，如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零，这个博弈就叫非零和博弈。
• 零和博弈是利益对抗程度最高的博弈。
• 即使决策或行动有先后，但只要局中人在决策时都还不知道对手的决策或者行动是什么，也算是静态博弈
学习交流PPT
28
完全信息博弈与不完全信息博弈
(games of complete information and games of incomplete information)
• 按照大家是否清楚对局情况下每个局中人的得益。
供万无一失的应对办法。
学习交流PPT
5
例1：无谓竞争（The GPA Rat Race）
• 你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀，40 ％的人能得良好。
• 所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
• 某些博弈中，由于偶然的外因可以对策略贴标签，或者参与者之间拥有某些共同的知识体验，导致了焦点的存在。
• 没有某个这样的暗示，默契的合作就完全不可能。
学习交流PPT
9
例3：为什么教授如此苛刻？
• 许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
• 教授们为何如此苛刻？
• 如果允许某种迟交，而且教授又不能辨别真伪，那么学生就总是会迟交。
• 王则柯、李杰编著，《博弈论教程》，中国人民大学出版社，2004年版。

《博弈论的基本概念》课件

智猪博弈
• 总结词：描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述：在智猪博弈中，一个大猪和一个小猪共同生活在一个猪圈里，食槽位于猪圈的一端。每次食物被放入食槽时，大猪和小猪都有两种选择：冲向食槽或继续等待。如果大猪选择冲向食槽，小猪的最佳策略是等待，因为大猪吃掉大部分食物后，小猪可以享用剩余的食物。相反，如果小猪选择冲向食槽，大猪的最佳策略也是等待，因为小猪可能无法抢到任何食物。因此，无论大猪如何选择，小猪的最佳策略都是等待；同样地，无论小猪如何选择，大猪的最佳策略也是等待。
合作博弈
特征
强调合作、协议和联盟，目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动，目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递，策略和行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论：研究决策主体在相互影响、相互作用的环境中如何进行决策，以及这种决策的均衡结果的学科。
02
博弈论强调参与者之间的互动关系，通过数学模型和理论分析来研究策略选择和均衡结果。
应用领域：拍卖机制设计、保险市场分析、医疗资源分配等。

03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中，参与者是决策的主体，可以是个人或组织。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

汉堡王的行动低价麦当劳的行动低价现状大量广告 60，35 ， 40，40 ， 55，50 ，现状 65，20 ， 60，40 ， 60，30 ，大量广告 55，45 ， 45，55 ， 60，40 ，
7.6混合策略博弈
收益矩阵（麦当劳、汉堡王）收益矩阵（麦当劳、汉堡王）
汉堡王的行动低价麦当劳的行动低价大量广告 60，35 ， 55，50 ，大量广告 55，45 ， 60，40 ，
第7章博弈论基础
本章概览
• • • • • • • 博弈论零和博弈信息结构囚徒困境重复博弈混合策略博弈序贯博弈
7.1 博弈论
• 博弈论史研究决策者如何相互依赖的决策中作出选择。 • 产业组织理论核心关注寡头企业的策略相互作用。
博弈的构成要素
• • • • • • • 参与者行动信息策略收益结果均衡
7.2 零和博弈
冰淇淋销售额杰克斯停车地起点中点终点
沃德曼停车地
起点中点终点
50，50 ， 75，25 ， 50，50 ，
25，75 ， 50，50 ， 25，75 ，
50，50 ， 75，25 ， 5050 ，• 占优策略：无论对手选择何种策略，都优于其它策略选择的策略。 • 纳什均衡：博弈中唯一能是两个参与人在给定对手的选择是策略方案。 • 零和博弈：一个参与者的收益总与另一个参与者的损失相等的博弈。
7.4囚徒困境
利润（通用电气、西屋）利润（通用电气、西屋）西屋的价格高价通用电气的价格高价低价 100，100 ， 140，25 ，低价 25，140 ， 80，80 ，
7.4囚徒困境
量刑（大哥、小弟）量刑（大哥、小弟）小弟的行动坦白大哥的行动死扛
坦白死扛
6，6 ， 10，1 ，
1，10 ， 3，3 ，
7.4囚徒困境
量刑（大哥、小弟）量刑（大哥、小弟）小弟的行动坦白大哥的行动死扛
坦白死扛
死，死 10，死，
死，10 3，3 ，
7.5 重复博弈
• 有限次重复 • 无限次重复
7.6 混合策略博弈
7.6混合策略博弈
收益矩阵（麦当劳、汉堡王）收益矩阵（麦当劳、汉堡王）
7.3 博弈论的信息结构
• 完美信息：每个参与者都知道其他参与者在采取行动前所决定的行动。 • 不完美信息：参与者无法知道另一个参与者的同时行动选择。 • 完全信息：自然不首先采取行动或它的首次行动可以被所有的参与者观察到。 • 确定信息：自然从不在其他参与者之后行动
• 对称信息：所有参与者拥有完全相同的信息。 • 不对称信息：如果一些参与者知道其他参与者不知道的信息。
7-2 进入博弈
•
J1
（1，6）不进
B
• • •
（1，6）（-2，0）
J2
进
（4， 4 ）
7.6混合策略博弈
收益矩阵（麦当劳、汉堡王）收益矩阵（麦当劳、汉堡王）
汉堡王的行动低价麦当劳的行动低价大量广告 60，35 ， 58，50 ，大量广告 56，45 ， 60，40 ，
7.7 序贯博弈
• 博弈树 • 博弈展开式
7.7 序贯博弈
收益矩阵
Ben的行动的行动左边 Jerry的行动的行动顶端底部 6，1 ， 6，1 ，右边 0，-2 ， 4，4 ，