博弈论概述ppt课件

合集下载

第六讲博弈论课件

❖ 对于矩阵博弈，其主要的任务就是求出矩阵博弈的Nash均衡解-----双方尽可能满意的结果。
例12.1 智猪博弈模型
❖ 每次踩出6个单位的食物，按者支付2个单位成本，小踩，（1，5）大踩（4，2）同时（2，4）
大猪
小猪
踩
踩 2，4 等待 4，2
等待
1，5 0，0
小猪的收入矩阵
A
2, 4,
❖ 20世纪50年代以来，纳什、泽尔腾、海萨尼等人使博弈论最终成熟并进入实用。
三位大师主要的贡献
❖ 1950年和1951年纳什的两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。因为在现实世界中，非合作博弈要比合作博弈普遍得多。
囚徒困境的意义
❖ “囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。
❖ 他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。
顺序和信息
❖ 博弈论非常强调时间和信息的重要性，认为时间和信息是影响博弈均衡的主要因素。
❖ 在博弈过程中，参与者之间的信息传递决定了其行动空间和最优战略的选择；
❖ 同时，博弈过程中始终存在一个先后问题 Sequence order，参与人的行动次序对博弈最后的均衡有直接的影响。
分类
❖ 博弈的划分可以从参与人行动的次序和参与人对其它参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。

第一章博弈论概述PPT课件

博弈论与信息经济学
Game Theory and Information Economics 天津大学管理与经济学部
授课：XXX
1
第一章博弈论概述（Game Theory）
授课：XXX
2
一、博弈论的定义
又称对策论，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。
➢ 博弈分析的基本假设（1）个人理性假设当事人在决策时能够充分考虑他所面临的局势，并能做出合乎理性的选择。
（2）最大化自己的收益假设当事人在决策时通常选择使自己收益最
大化的策略。
授课：XXX
12
坦白抵赖
➢ 博弈问题的基本要素
坦白
（1）局中人（Players）
抵赖
参与对抗的各方；不一定指自然人
若二人均不坦白，则只能因藏有枪支而被判刑1年；若有一人坦白而另一个不坦白，则坦白者无罪释放，
不坦白者被判刑10年；若二人都坦白了，则同判8年。此二人确系抢劫犯，请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8，-8 -10，0
抵赖 0，-10 -1，-1
授课：XXX
均衡解：二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》，该影片获得了2002年奥斯卡金像奖的四项大奖
授课：XXX
7
2002年北京国际数学家大会（ICM）
授课：XXX
8
• 主演
罗素·克劳，Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课：XXX
9
1. 囚犯困境（Prisoners’ dilemma

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

博弈论简介PPT

1.3博弈论的理论体系
核心是策略选择
非合作博弈理论
博弈论
承诺的强制力不同不完全信息静态博弈不完全信息动态博弈
合作博弈理论
完全信息静态博弈
完全信息动态博弈
核心是利益分配
二、完全信息静态博弈
在博弈论中由抽象出来现实博弈中的最基本要素所构成的模型就是所谓的策略型，或称标准型博弈。是整个博弈论的基石
多种定义：
（1）以严格的数学模型对人类斗智现象进行规范描述，并加以数学分析。（2）博弈论是关于策略相互作用的理论，就是说，它是关于社会形势中理性行为的理论，其中每个局中人对自己行动的选择必须以他对其他局中人将如何反应的判断为基础。——豪尔绍尼，1994诺贝尔经济学奖得主（3）博弈论研究的是人与人之间利益相互制约下策略选择时的理性行为及相应结局。
引入市场进入博弈事例：
一种行业有两个相关企业，一个是垄断者（局中人1），另一个是潜在的进入者（局中人2），局中人1决定是否建立一个新工厂，而同时局中人 2决定是否进入这一行业。其中存在着不完全信息，局中人2不知道局中人1的建厂成本是3还是1，而局中人1知道自己的成本。这样形成的不完全信息博弈局势如下图。
豪尔绍尼转换
3.2联合概率分布实例
内容：
两个企业在一种产品市场竞争，它们彼此不清楚对方对于相关事务的真实力量，而只知道自己的力量，双方力量的不同会导致双方使用策略不变的情况下最终结局的不同。这种局势的简化描述为：双方均有两种类型，即力量的强与弱。
联合概率分布：
强强弱 0.3 0.1 弱 0.2 0.4
如果企业1为“强”类型，那么它对企业2的类型判断依据贝叶斯推断原则有：企业2为“强”类型的概率为0.3/（0.3+0.2）=0.6；企业2为 “弱”类型的概率为0.2/(0.3+0.2)=0.4.而当企业1为“弱”时，它对企业2 类型的主观判断为企业2为强与弱的概率分别为0.2和0.8。以此类推。

《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u}，其中N=（1,2)， Si={(0,2),(1,1),(2,0)}，ui (s1, s2) = ri，i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败，成功
成功，失败
成功，失败
失败，成功
成功，失败
成功，失败
《博弈论》课程
（一）什么是博弈论
我们首先看几个例子。例1 石头、剪刀、布
猪八戒
石头石头孙悟空剪刀布未定，未定找水，休息休息，找水剪刀休息，找水未定，未定找水，休息布找水，休息休息，找水未定，未定
2
例2 诺曼底登陆
德军
加来设防加来登陆盟军
诺曼底登陆成功，失败
诺曼பைடு நூலகம்设防成功，失败
9
例4 进攻与防守双方争夺一个据点，有两条进攻路线X和Y，攻方有两个军，而防守方也有两个军，只有当守方的兵力不少于攻方时，才能击退进攻，否则据点将会失守。首先可知守方的防守方案（即策略）为(0,2)，(1,1)，(2,0)，即在X 线路和Y线路驻扎军队数，同样可以到的攻方的进攻方案(0,2)，(1,1)和(2,0)。容易看出，行动并非策略，策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心，因而博弈论对于各门社会科学而言，就具有了方法论意义，成为各门学科的有力分析工具。
6
（二）博弈表达的科学式
（1）博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然是很重要的。如果用参与者、策略和收益函数来科学地描述一个博弈，就称为博弈表达的策略式（或基本式、标准式）。

博弈论讲义完整PPT课件

• 两个寡头企业选择产量的博弈：
如果两个企业联合起来形成卡特尔，选择垄断利润最大化的产量，每个企业都可以得到更多的利润。给定对方遵守协议的情况下，每个企业都想增加产量，结果是，每个企业都只得到纳什均衡产量的利润，它严格小于卡特而产量下的利润。
• 请举几个囚徒困境的例子
第18页/共293页
第一章导论-囚徒困境
知识：完全信息博弈和不完全信息博弈。 ❖完全信息：每一个参与人对所有其他参与人的（对手）的特征、
战略空间及支付函数有准确的知识，否则为不完全信息。
第33页/共293页
第一章导论-基本概念
• 博弈的划分：
行动顺序信息
完全信息
静态
完全信息静态博弈纳什均衡
纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡
0，300 0，300
纳什均衡：进入，默许；不进入，斗争
第29页/共293页
第一章导论
• 人生是永不停歇的博弈过程，博弈意略达到合意的结果。 • 作为博弈者，最佳策略是最大限度地利用游戏规则，最
大化自己的利益； • 作为社会最佳策略，是通过规则使社会整体福利增加。
第30页/共293页
第一章导论-基本概念
一只河蚌正张开壳晒太阳，不料，飞来了一只鸟，张嘴去啄他的肉，河蚌连忙合起两张壳，紧紧钳住鸟的嘴巴，鸟说：“今天不下雨，明天不下雨，就会有死蚌肉。” 河蚌说：“今天不放你，明天不放你，就会有死鸟。”谁也不肯松口，有一个渔夫看见了，便过来把他们一起捉走了。
第17页/共293页
第一章导论-囚徒困境
✓“要害”是否在于“利己主义”即“个人理
性”？
第20页/共293页

博弈论最全完整ppt-讲解

能提供万无一失的应对办法。
例1：无谓竞争（The GPA Rat Race）
你所注册的一门课程按照比例来给分：无论卷面分数是多少，只有40％的人能够得优秀， 40％的人能得良好。
所有学生达成一个协议，大家都不要太用功，如何？想法不错，但无法实施!稍加努力即可胜过他人，诱惑大矣。
问题是，大家都这么做。这样一来，所有人的成绩都不比大家遵守协议来得高。而且，大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈德·泽尔腾， 1930 年生于德国
约翰· 海萨尼 1920年生于美国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由：前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论的论述；后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。
博弈论为众多学科提供了分析的概念和方法：经济学和商学,政治科学,生物学, 心理学和哲学。
如何在“博弈”中获胜？
日常生活中的博弈（“游戏”）往往指的是诸如赌博和运动这样的东西：赌抛硬币百米赛跑打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示，默契的合作就完全不可能。
例3：为什么教授如此苛刻？
许多教授强硬地规定，不进行补考，不允许迟交作业或论文。
教授们为何如此苛刻？如果允许某种迟交，而且教授又不能辨
别真伪，那么学生就总是会迟交。期限本身就毫无意义了。避免这一“滑梯”通常只有一种办法，

博弈论课件

博弈论强调参与者之间的互动关系，通过数学模型和理论分析来研究策略选择和均衡结果。
博弈论的发展历程
博弈论的起源可以追溯到20世纪初，当时数学家和经济学家开始研究游戏中的策略和均衡。
1944年，冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》标志着博弈论的诞生。
随后，纳什、泽尔腾和哈萨尼等学者进一步发展了博弈论，形成了现代博弈论的基础。
商业竞争与合作
商业竞争
博弈论可以用于分析商业竞争中的策略和行为，例如价格战、广告战等。通过博弈论，企业可以更好地理解竞争对手的策略，制定出更有效的竞争策略。
商业合作
博弈论也可以用于分析商业合作中的策略和行为，例如供应链管理、合资企业等。通过博弈论，企业可以更好地理解合作伙伴的需求和期望，制定出更有效的合作策略。
贝叶斯纳什均衡
在不完全信息博弈中，如果所有参与者都根据自己掌握的信息选择最优策略，则所有参与者都能获得最大收益。
静态博弈与动态博弈
01
静态博弈
02
动态博弈
所有参与者在同一时间点选择策略并获得收益。
参与者的选择有先后顺序，后选择的参与者可以观察到先选择的参与者的策略和收益。
03
纳什均衡
纳什均衡的定义
博弈优化方法
线性规划
线性规划是一种数学优化方法，用于找到在满足一组约束条件下最大化或最小化目标函数的最优
解。
非线性规划
非线性规划是数学优化的一种方法，用于找到一组变量的最优值，使得一个或多个目标函数达到
最优。
动态规划
动态规划是一种通过将问题分解为相互重叠的子问题来解决问题的方法，每个子问题的解被保存
博弈论课件
汇报人：
汇报时间：202X-01-04

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

3/4
1
A
B
资源浪费还是理性的必然？
其它相似情形：旅行社的热门路线；黄金时间的电视节目；总统竞选。
知己知彼百战不殆
8
狩猎与投资狩猎：
两个猎人围住一头鹿，各卡住两个关口中的一个，齐心协力即可成功获得并平分猎物。此时有一群兔子跑过，任何一人去抓兔子必可成功，但鹿会跑掉。
他们会坚持猎鹿还是去抓兔子？
博弈论
Game Theory
知己知彼百战不殆
1
主要内容
一、博弈现象及基本概念二、完全信息静态博弈三、完全信息动态博弈四、不完全信息静态博弈五、不完全信息动态博弈六、不对称信息应用专题
知己知彼百战不殆
2
主要参考书
(1) 罗云峰：《博弈论教程》，清华大学出版社、北京交通大学出版社，2007。
都认罪，各判5年
判0
判10年
罪犯彼此知道对方策略同时行动完全信息静态博弈
乙
认罪不认罪
甲
认罪 -5,-5 0,-10
不认罪 -10,0 -1,-1
个人理性与集体理乙性矛盾
坦白不认罪
甲
坦白 -5,-5 0,-10
不认罪 -10,0 -1,-1
知己知彼，百战不殆
囚徒困境的意义
他们两人都是在坦白与不坦白策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。
略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中，博弈参与者所能采取的博弈策略均为
知己知彼百战不殆
9
猎人B
猎人A 抓兔子打梅花鹿
抓兔子
4,4
4,0
打梅花鹿
0,4
10,10
知己知彼百战不殆
10
共同投资：
双方共同投资一个大项目，可期望有较大收益。此时如某方抽出资金去进行小项目投资，必可成功获小利，但会使共同项目陷入困境，使对方蒙受损失。
投资者会如何选择？
知己知彼百战不殆
博弈参与者可能是单个的个人，也可能是组织或集体
企业、社会团体、国家
博弈参与者可能多于两方，三方或多方博弈参与者
二、博弈策略（Strategy）
博弈策略指博弈参与者可以采取的行动在“锤头、剪刀、布”博弈中，博弈参与者所能采取的博弈策略
均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中，博弈参与者所能采取的博弈策
“博弈”指当两个或多个决策主体之间存在相互作用，任何一方的决策策略（Strategy）。
2. 博弈概念
2.1 什么是博弈：
个人或团体间在依存和对抗、合作和冲突中的决策问题。
博弈论研究博弈过程中的理性行为。
知己知彼百战不殆
20
2.2博弈的构成要素
完整的博弈通常包含三个构成要素
博弈参与者（Player）博弈策略（Strategy）博弈的收益（Payoff）
一、博弈参与者（Player）
博弈参与者指参与博弈的主体在“锤头、剪刀、布”博弈中，博弈参与者是玩游戏的两个人两名同学去相约去博物馆博弈中，博弈参与者是两名同学在“囚徒困境”博弈中，博弈参与者是两名犯罪嫌疑人
田忌齐
上马中马下马
策略：
∨
∨
∨
田
上马中马下马
结果：田忌将军每次输掉三千金
谋士齐
上马中马下马
孙膑
∨
∧
∧
策略：田
下马上马中马
结果：田忌将军胜二负一赢一千金
知己知彼百战不殆
7
学校门口的超市（海滩占位模型）
＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊
0
1/4
A’ 1/2 O’
11
囚徒困境：
乙
认罪不认罪
甲认罪 -5,-5
不认罪 -10,0
0,-10 -1,-1
1950年美国普林斯顿大学数学家A.W.塔克提出来的，他当时编出一个故事，向斯坦福大学的心理学家介绍什么是博弈论
理性的人是自私自利的；
理性选择不是全局最优。
知己知彼百战不殆
12
囚徒困境 Prisoner's Dilemma
田忌赛马
正确的策略可以反败为胜。
知己知彼百战不殆
6
博弈论的创立与发展
博弈论思想最早产生于我国古代
2000多年前的春秋时期孙武在《孙子兵法》中论述的军事思想和治国策略，就蕴育了丰富和深刻的博弈论思想。
田忌赛马：齐威王的上、中、下马分别优于大将田忌的上、中、下，但田忌上马、中马分别优于齐威王的中、下马。比赛规则：每次双方各出三匹马，一对一比赛三场，第一场的输方要赔一千金给赢方。
(7) [美]弗登博格：《博弈论》，中国人民大学出版社，2002。
(8) 焦宝聪陈兰平等《博弈论思想方法及应用，中国人民大学出版社2013，6
知己知彼百战不殆
4
第一讲博弈现象与基本概念
1．博弈现象 2. 博弈概念 3. 博弈描述 4. 博弈分类 5. 博弈论的历史
知己知彼百战不殆
5
1．博弈现象
知己知彼百战不殆
17
问题：“谁该率先行动？”
担当这个任务的领头人意味着要付出重大的代价
——流血甚至死亡。
结论：每个人都按照自己的利益来行动，结果对集体来说却是灾难性的。
启示：自由市场的价格体系真的可靠吗？
知己知彼百战不殆
18
2. 博弈概念
博弈论（Game Theory）又名对策论博弈理论原本是运筹学的一个重要分支。目前博弈论已发展为一门备受关注的独立学科。博弈的定义
(2) 姚国庆：《博弈论》，高等教育出版社，2007. (3) 张维迎：《博弈论与信息经济学》，上海三联书
店，上海人民出版社，2004。 (4) 施锡铨，《博弈论》，上海财经大学出版社，
2002。
知己知彼百战不殆
3
(5) 张守一，《现代经济对策论》，高等教育出版社， 1998。
(6) [美]艾里克.拉斯缪森：《博弈与信息》，北京大学出版社，2003。
“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，从个人利益出发的行为往往不能实现团体的最大利益，同时也揭示了市场理性本身的内在矛盾，个人理性出发的行为最终也不一定能真正实现个人的最大利益，甚至会得到相当差的结果。
知己知彼百战不殆
16
囚徒困境应用
[美]杜鲁门·卡波特《冷血》；电影《卡波特》《给猫拴个铃铛》：谁会愿意冒陪掉小命的风险给猫拴上铃铛呢？不得民心的暴君怎样才能长期控制一个数目庞大的人群呢？为什么一个暴徒出现，就足以让整个校园陷入恐慌？