博弈论简单支付矩阵共25页文档
合集下载
博弈论讲义完整版

第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈
一 博弈的基本概念及战略表述 二 占优战略(上策)均衡
三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈
完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境
囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。
思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?
微观经济学-第十章-博弈论初步PPT课件

12
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4;
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
信息经济学第三章博弈论

博弈的思想既然来自现实生活,它就既可以高度 抽象化地用数学工具来表述,也可以用日常事例 来说明,并运用到生活中去。
没有高深的数学知识,我们同样通过博弈论的学 习成为生活中的策略高手,学习到最适合的为人 处世的方法。
一、囚徒困境——自愿坐牢的嫌疑人
两个嫌疑犯作案后被警察抓住,被分别关在不同 的房间里受审讯。警察知道两个人有罪,但缺乏足够 的证据定罪,除非两个人当中至少有一个人坦白。
1928年纳什出生于美国,1950年获普林斯顿大学数学博 士学位,其博士论文《非合作博弈》首次区分了合作博弈 与非合作博弈,并且提出了非合作博弈的所谓纳什均衡概 念。
1930年 泽尔滕出生于现属于波兰的德国 城市,1961年获法兰克福大学数学博士学位, 曾先后任教于柏林自由大学、比勒菲尔特大 学和波恩大学。其主要贡献是在博弈论中引 入了动态分析。
60年代,泽尔腾将纳什均衡的概念引入了动态 分析,提出“精炼纳什均衡”概念。1967-1968年, 海萨尼将不完全信息引入博弈论的研究。此后, 他们两人长期合作,发展了非合作博弈理论。 80年代,克瑞普斯和威尔逊于1982年合作发表 了关于动态不完全信息博弈的重要文章。
1994年诺贝尔经济学奖获得者:
⑵ 给定小猪的最优策略是等待,大猪的最优策略只 能是按。 所以,此博弈的纳什均衡是(按,等待)。
智猪博弈表明:能者多劳,但多劳者未必多得。
对管理者的启示
在“智猪博弈”的模型中,小猪搭便车的现象 是由于规则所导致。为使资源最有效配置,如何才 能激励小猪和大猪去抢按按钮?其核心问题是每次 落下食物数量和按钮与投食口之间的距离。
零和博弈指在博弈中一组局中人所得到的支付(或收益) 恰好是另一组局中人的损失。通俗地说,博弈结果总和为零 的博弈称为零和博弈。
没有高深的数学知识,我们同样通过博弈论的学 习成为生活中的策略高手,学习到最适合的为人 处世的方法。
一、囚徒困境——自愿坐牢的嫌疑人
两个嫌疑犯作案后被警察抓住,被分别关在不同 的房间里受审讯。警察知道两个人有罪,但缺乏足够 的证据定罪,除非两个人当中至少有一个人坦白。
1928年纳什出生于美国,1950年获普林斯顿大学数学博 士学位,其博士论文《非合作博弈》首次区分了合作博弈 与非合作博弈,并且提出了非合作博弈的所谓纳什均衡概 念。
1930年 泽尔滕出生于现属于波兰的德国 城市,1961年获法兰克福大学数学博士学位, 曾先后任教于柏林自由大学、比勒菲尔特大 学和波恩大学。其主要贡献是在博弈论中引 入了动态分析。
60年代,泽尔腾将纳什均衡的概念引入了动态 分析,提出“精炼纳什均衡”概念。1967-1968年, 海萨尼将不完全信息引入博弈论的研究。此后, 他们两人长期合作,发展了非合作博弈理论。 80年代,克瑞普斯和威尔逊于1982年合作发表 了关于动态不完全信息博弈的重要文章。
1994年诺贝尔经济学奖获得者:
⑵ 给定小猪的最优策略是等待,大猪的最优策略只 能是按。 所以,此博弈的纳什均衡是(按,等待)。
智猪博弈表明:能者多劳,但多劳者未必多得。
对管理者的启示
在“智猪博弈”的模型中,小猪搭便车的现象 是由于规则所导致。为使资源最有效配置,如何才 能激励小猪和大猪去抢按按钮?其核心问题是每次 落下食物数量和按钮与投食口之间的距离。
零和博弈指在博弈中一组局中人所得到的支付(或收益) 恰好是另一组局中人的损失。通俗地说,博弈结果总和为零 的博弈称为零和博弈。
博弈论 第5讲

博 弈 论 讲 义 完 全 信 息 动 态 博 弈
一些说明
现实中不具完美回忆的一个例子是扑克 比赛。在扑克比赛中,参与人常常忘记 别人曾出过些什么牌。
——
博 弈 论 讲 义 完 全 信 息 动 态 博 弈
一些说明
“完美回忆”的数学描述
若x1和x2属于同一个信息集,即x2∈h(x1), x∈P(x1), x是x1的前列结(排在x1前面的决 策结),且均属于同一参与人i。 那么,存在一个x‘(可能是x本身),满足 x’∈h(x); x‘是x2的前列结;在x到达x1的行 动与x‘到达x2的行动完全一致。
{开发,开发}
{开发,不开发} {不开发,开发} 开发 B
——
A 不开发 B
{不开发,不开发}
开发
不开发 开发 (1,0) (0,1)
不开发
(0,0)
(-3,-3)
图2-8 房地产开发博弈
博 弈 论 讲 义 完 全 信 息 动 态 博 弈
动态博弈的策略式表述
B的纯策略为
{开发,开发} {开发,不开发} A 开发 B 不开发 B
开发,开发 开发,不 开发 不开发, 开发 不开发, 不开发
(不开发,{开发,开 发})
开发 不开发
-3,-3 0,1
1,0 0,0
1,0 0,1
1,0 0,0
博 弈 论 讲 义 完 全 信 息 动 态 博 弈
动态博弈的策略式表述
A
在扩展式表述博弈中, 所有n个参与人的一 个纯战略组合 s=(s1,…,sn)决定了博 弈树上的一个路径。
动态博弈的策略式表述
给出了扩展式表述的战略式表述转换,就可 以像静态博弈那样,定义纯战略纳什均衡或 混合战略纳什均衡。 按照Von Neumann观点,将动态博弈模型转化 成策略式表述形式后,按照静态博弈分析方 法,即可处理动态博弈问题。 近来研究表明,存在策略式表述相同,但却 有本质差别的,不同扩展式表述的动态博弈。 说明上述观点具有一定的局限性。因此,策 略式表述并不能取代扩展式表述。
2024年微观经济学-博弈论及应用

根据以上特点可以画出A的最优反应曲线: c
1
A的最优反应曲线
1/3
0
1
r
行参与 人A
上r 下(1-r)
列参与人B
左c
右(1-c)
2,1 0,0 0,0 1,2
B的期望收益=1rc+2(1-r)(1-c)=3rc-2r-2c+2 B的边际期望收益(MR=dR/dc)=3r-2
B的边际期望收益(MR=dR/dc)=3r-2 r=2/3,MR=0,期望收益达到最大值,c为[0,1]任意值; r<2/3,MR<0,降低c可以使收益增大,c最小为0; r>1/3,MR>0,提高c可以使收益增大,c最大为1。
在该序贯博弈中,我们依据收益矩阵找到的N.E.(上,左)并 不是合理的均衡,因为A选择“上”是愚蠢的。
B
左
• 1,9
A
上•
•
下B
右
• 1,9
左
• 0,0
•
右 • 2,1
从博弈的结果看,B非常不幸,最终他只能得到1而非9。面临巨大落 差,B极有可能威胁A,声称如果A选“下”,那他就选“左”,让大家一 无所获。
博弈的扩展形式 B
左
• 1,9
A
上•
•
下B
右
• 1,9
左
• 0,0
•
右 • 2,1
参与人B
左右
参与 上 1,9 1,9 人A 下 0,0 2,1
序贯博弈中,先行者需要分析跟随者的反应,因此,分析博弈树是由 后往前推算。
首先考虑B的 选择:
如果A选“上”, 那么B选“左”或“右”无差异; 如果A选“下”, 那么B选“右”比较明智(1>0)。
博弈论课件

第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏 但C不知道
B
所以我脸脏
所以B一定知道自己脸脏 但B不知道,说明我的假设不正确 故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS:
NO.1 知 占识优目策标略均衡 NO.2 能 重力复目剔标除占优均衡 NO.3 情 纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析,掌握重复剔除的占优策略、纳什均 衡与混合策略均衡理论。 培养分析问题、解决问题的能力。 体会博弈论的应用价值,开拓视野,激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频 参考书目
教学课件
Teaching courseware
目录
• 第一章 博弈论概述
006
• 第二章 完全信息静态博弈
041
第一节 占优策略均衡
043
第二节 重复剔除的占优均衡
066
第三节 纳什均衡
088
第四节 混合策略均衡
106
第一章
教学要求
知识目标 掌握博弈论的概念、发展、分类与要素
42
第二章 完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达: 策略式表达 和 扩展式表达 。策略式表达更适合于静态 博弈,而扩展式表达更适合于讨论动态博弈。
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
博弈ห้องสมุดไป่ตู้分类
4 Part
课堂互动
假设我脸干净
A脸干净
如果我脸也干净
A
则
C一定知道自己脸脏 但C不知道
B
所以我脸脏
所以B一定知道自己脸脏 但B不知道,说明我的假设不正确 故我脸脏
第一章
1 Part
博弈论简介
2 Part
博弈的要素
3 Part
Static Game Perfect Information
教CO学NT要EN求TS:
NO.1 知 占识优目策标略均衡 NO.2 能 重力复目剔标除占优均衡 NO.3 情 纳感什目均标衡 NO.4 重混点合难策点略均衡
Static Game Perfect Information
通过经典案例分析,掌握重复剔除的占优策略、纳什均 衡与混合策略均衡理论。 培养分析问题、解决问题的能力。 体会博弈论的应用价值,开拓视野,激发学习兴趣。
自测题目
教学大纲
教学课件
相关视频 参考书目
教学课件
Teaching courseware
目录
• 第一章 博弈论概述
006
• 第二章 完全信息静态博弈
041
第一节 占优策略均衡
043
第二节 重复剔除的占优均衡
066
第三节 纳什均衡
088
第四节 混合策略均衡
106
第一章
教学要求
知识目标 掌握博弈论的概念、发展、分类与要素
42
第二章 完全信息静态博弈
1.1 博弈的策略式表述
在博弈论中,一个博弈可以用两种不同的方式来表达: 策略式表达 和 扩展式表达 。策略式表达更适合于静态 博弈,而扩展式表达更适合于讨论动态博弈。
非合作博弈学习.pptx

• 政府管制使厂商从 “囚徒困境中” 解放出来,
说明自由竞争并不是最有效的经济体系,适
当的政府管制可以更有效的提高社会经济和
政治效益
10
第11页/共33页
3努力还是偷懒
甲
博弈的标准式
乙
努力
偷懒
努力 (10,10) (2,15)
偷懒
(15,2) (5,5)
要改变 合作困境,即改变博弈的均衡,可 采取奖勤罚懒措施
32
第33页/共33页
第17页/共33页
• 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另 一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小 猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按压开关 的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪 的收益为 -1。
• 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开 关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定 时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强力壮的 大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况下,大猪 得到的收益是 4,小猪得到的收益是 2。
第22页/共33页
二存在多个纳什均衡的博弈
• 1 性别博弈
男方
看足球 听昆曲
女方
看足球
听昆曲
(10,2) (-1,-1)
(-1,-1) (2,10)
❖ 采用“划横线法”寻找“性别博弈”的纳什均衡 ❖ (男方看足球、女方看足球)和(男方听昆曲、女方听昆曲)都是“性别博
弈”的纳什均衡。 ❖ 在特定情况下,惯例和传统能够提供博弈的多重纳什均衡中那个更可能出现
(a,a) (d,c)
偷懒
(c,d) (b,b)