十章博弈论ppt课件
合集下载
微观经济学-第十章-博弈论初步PPT课件

12
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
[资料] 约翰·纳什
[资料] 约翰·纳什
❖ 1994年与泽尔腾、海萨尼 分享了诺贝尔经济学奖。
❖ 他说自己只做了两件事: 一是研究过讨价还价的问 题;二是关注了经济问题 并从数学角度加以分析。
❖ 理性决策决不会无缘无故 地损害自身的利益,也就 是一个人肯定不会故意做 出对自己不利的事。
13
[案例]“华容道”里的纳什均衡(1)
1/2
1/2
▲
▲
▲
▲
1×1/2
▲▲
27
第四节 动态博弈 一、竞争者-垄断者博弈
第四节 动态博弈
一 竞争者-垄断者博弈
竞争者
进 入 不进入
竞争者
进 入 不进入
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
900
1300
抵
垄制
断
者
不 抵
制
600
900
800
1300
1200
900
700
1300
23
第三节 混合策略均衡 一、混合策略与策略组合
第三节 混合策略均衡
一 混合策略与策略组合
❖ 在混合策略博弈中,对于每一个混合策略组合也
存在一个支付组合。 ❖ 参与人都以一定的概率
乙厂商
q1
q2
来选择其纯策略,相应
形成“期望支付”。 甲 p1
1
p1 0,1
q1 0.7 q1 0.7
0
q1 0,1
p1厂 0.5 p1商 0p.52
0 q1 0.7
1 p1 0.5
6– 4
博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i,对于所有的 σi∈Mi,都有ui﹙σ*﹚≥ui﹙σi,σ-i*﹚,则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中 解:设猜方猜正方的概率为p,猜反方的概率则为1-
无名氏(大众)定理
无名氏定理:在无穷次重复的由n个游戏者参与的 博弈里,如果在每一次重复中博弈的行动集是有限 的,则在满足下列三个条件时,在任何有限次重复 中所观察到的任何行动组合都是某个子博弈完美均 衡的惟一结果:
条件1:贴现因子接近于1; 条件2:在每一次重复中,博弈结束的概率或等于0,或 为非常小的一个正值; 条件3:严格占优于一次性博弈中的最小最大收益组合的 那个收益组合集是n维的。
博弈方
博弈方:独立决策、独立承担博弈结果的个人 或组织
博弈规则面前博弈方之间平等,不因博弈方之 间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响 根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈,单人博弈是退 化的博弈
策略
策略:博弈中各博弈方的选择内容 策略有定性定量、简单复杂之分 不同博弈方之间不仅可选策略不同,而且可
游戏和经济等决策竞争较量的共同特征:规 则、结果、策略选择,策略和利益相互依存, 策略的关键作用
游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊朗、以色列和巴勒斯 坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方 各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) (或称支付,或得益)
第十章博弈论(微观经济学-南开大学刘骏民)

⒋寻求纳什平衡 首先思索A的战略,关于B的每一个给定战略,找出A
的最优战略,在其对应的支付下划一横线,再用相似的方 法找出B的最优战略。完成这个进程后,假设某个支付组 合的两个数字下都有线,这个支付组合所对应的战略组合 就是一个纳什平衡。
表10-7 寻求纳什均衡Βιβλιοθήκη 参与人BLC
R
参与人A
U
0,2 1,4
三、博弈的要素
博弈的要素包括参与人、举动、信息、战略、支付、 结果战争衡,其中,参与人、战略和支付是描画一个博 弈所需求的最基本的要素,参与人、举动和结果统称为 博弈规那么。
①参与人:指一个博弈中的决策主体在囚徒困境模 型中,有两个参与人,即〝囚徒A〞和〝囚徒B〞。
②举动:是参与人在博弈的某个时点的决策变量。 在囚徒困境模型中,囚徒A、B都只要两种举动可供选择, 即〝坦率〞和〝供认〞。
一切参与人占优战略的组合称为占优战略平衡。
⒉重复剔除的占优平衡
思索〝智猪博弈〞例子。猪圈里围着中间猪,一头大 猪,一头小猪。猪圈的一头有一个猪槽,另一头装置了一 个按钮,控制着猪食的供应。按下一按钮会有8个单位的 猪食进槽,但按下按钮的猪需求付出2个单位的本钱。假 定大猪先到,大猪吃到7个单位,小猪只能吃1个单位;假 定同时到,大猪吃5个单位,小猪吃3个单位;假定小猪先 到,大猪和小猪各吃4个单位。表10-5的Ⅰ表列出对应不同 战略组合的支付水平,如第一格表示中间猪同时按下按钮, 就会同时走到猪食槽,大猪吃5个单位,小猪吃3个,扣除 2个单位的本钱,支付水平区分为3和1。
20世纪70年代以后,经济学家末尾强调团体理性。
⒉博弈论与主流经济学 博弈论进入主流经济学,反映了经济学开展的以下几
个趋向:①经济学研讨的对象越来越转向集体,坚持了一 些没有微观基础的假定;②经济学越来越转向人与人之间 竞争与协作的研讨,特别是经济学留意到理性人的团体理 性行为能够招致的团体非理性;③经济学越来越注重对信 息的研讨。
博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
精品课程《博弈论》PPT课件(全)

人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
10章博弈论

解题思路:由Q=QS+Qb, QS=49p, p=300-Q得出支配型厂商的需求 曲线,再对总收益求导得出MRb; 令MRb=MCb,得出利润最大化产量、价格;行业产量=Qb+49p
寡头厂商之间的博弈: 博弈论初步 •博弈论的基本概念及其分类; •完全信息静态博弈 •完全信息的动态博弈;
•不完全信息的静态博弈
思考:子博弈精练纳什均衡的特点是什么?
•参与人在前一个阶段的选择将决 定随后的子博弈的结构。
•子博弈精练纳什均衡:若A开发,B
不开发;若A不开发,B开发;若A 先开发,B的子博弈已就被排除了, B只能选择不开发。
思考:为什么序列博弈中,厂商 成功的关键是先行者优势? •在房地产开发的案例中纳什均衡是: 若A开发,B不开发;若A不开发,B 开发;
博弈的分类1 ——合作博弈与非合作博弈
如果各博弈方能达成某种有约束力的契约或默契, 以选择共同的策略,此种博弈就是合作博弈。 反之,就属于非合作博弈。 企业之间的联合定价就属于合作博弈,而经常挑起 价格战的企业采用的便主要是非合作博弈。 在合作博弈中往往包含着非合作博弈,如石油输出 国组织是合作博弈的产物,但其中为了各自利益的 超产和争吵又属于非合作博弈。
在智猪博弈中,先剔除小猪的严格 劣战略“按按纽”,在这一选择后的新 博弈中,小猪只有“等待”一个战略, 而大猪有两个战略可供选择。再剔除新 博弈中大猪的严格劣战略“等待”,从 而达到重复剔除的占优战略均衡: 小猪等待,大猪按按纽。
严格劣战略是指无论其他参与者采取什么 战略,该战略是对自己严格不利的战略。
实行承诺后的阻止市场进入博弈
垄断者
商战 默许 900,300
潜 在 进入 进 不进入 入 者
寡头厂商之间的博弈: 博弈论初步 •博弈论的基本概念及其分类; •完全信息静态博弈 •完全信息的动态博弈;
•不完全信息的静态博弈
思考:子博弈精练纳什均衡的特点是什么?
•参与人在前一个阶段的选择将决 定随后的子博弈的结构。
•子博弈精练纳什均衡:若A开发,B
不开发;若A不开发,B开发;若A 先开发,B的子博弈已就被排除了, B只能选择不开发。
思考:为什么序列博弈中,厂商 成功的关键是先行者优势? •在房地产开发的案例中纳什均衡是: 若A开发,B不开发;若A不开发,B 开发;
博弈的分类1 ——合作博弈与非合作博弈
如果各博弈方能达成某种有约束力的契约或默契, 以选择共同的策略,此种博弈就是合作博弈。 反之,就属于非合作博弈。 企业之间的联合定价就属于合作博弈,而经常挑起 价格战的企业采用的便主要是非合作博弈。 在合作博弈中往往包含着非合作博弈,如石油输出 国组织是合作博弈的产物,但其中为了各自利益的 超产和争吵又属于非合作博弈。
在智猪博弈中,先剔除小猪的严格 劣战略“按按纽”,在这一选择后的新 博弈中,小猪只有“等待”一个战略, 而大猪有两个战略可供选择。再剔除新 博弈中大猪的严格劣战略“等待”,从 而达到重复剔除的占优战略均衡: 小猪等待,大猪按按纽。
严格劣战略是指无论其他参与者采取什么 战略,该战略是对自己严格不利的战略。
实行承诺后的阻止市场进入博弈
垄断者
商战 默许 900,300
潜 在 进入 进 不进入 入 者
博弈论贝叶斯博弈与贝叶斯均衡ppt课件
the example
given
by
Ha
rsanyi, consider the following prob
abilities of occurrence for the fou
rDepaprtmoenst sofiMabthlemeaticsmatch-ups:
Bayesian Nash Equilibrium
Department of Mathematics
不完全信息博弈问题
将博弈开始时就存在事前不确 定性的博弈问题称为不完全信息博弈问 题。
Department of Mathematics
例子:斗鸡博弈
两个所谓的勇士举着长枪,准备从独木桥 的两端冲上桥中央进行决斗。每位勇士都有
两种选择:冲上去(用U表示),或退下来(用D
Department of Mathematics
Example: Scalping Tickets
• For example, consider a scenario in which you and the Cavalier are each scalping tickets for beer money bef ore the UVa-Miami football game
This yields the following payoff matrix an d a single pure strategy Nash equilibriu m:
BS b1, BW b1 BS b1, BW b2 BS b2, BW b1 BS b2, BW b2
AS a1, AW a1 AS a1, AW a2 AS a2, AW a1 AS a2, AW a2
Department of Mathematics
given
by
Ha
rsanyi, consider the following prob
abilities of occurrence for the fou
rDepaprtmoenst sofiMabthlemeaticsmatch-ups:
Bayesian Nash Equilibrium
Department of Mathematics
不完全信息博弈问题
将博弈开始时就存在事前不确 定性的博弈问题称为不完全信息博弈问 题。
Department of Mathematics
例子:斗鸡博弈
两个所谓的勇士举着长枪,准备从独木桥 的两端冲上桥中央进行决斗。每位勇士都有
两种选择:冲上去(用U表示),或退下来(用D
Department of Mathematics
Example: Scalping Tickets
• For example, consider a scenario in which you and the Cavalier are each scalping tickets for beer money bef ore the UVa-Miami football game
This yields the following payoff matrix an d a single pure strategy Nash equilibriu m:
BS b1, BW b1 BS b1, BW b2 BS b2, BW b1 BS b2, BW b2
AS a1, AW a1 AS a1, AW a2 AS a2, AW a1 AS a2, AW a2
Department of Mathematics
微观经济学第十章博弈论
博弈论的基本概念
策略
参与者为达到最优目标而采取的 行动方案。
信息
参与者对其他参与者的行动或策 略的了解程度。
01
02
参与者
参与博弈的决策主体,可以是个 人、组织或国家。
03
04
收益
参与者在博弈中获得的利益或损 失。
博弈论的应用场景
01
02
03
04
商业竞争
企业间竞争策略、市场份额争 夺等。
政治外交
05
博弈论的实际应用
商业竞争中的博弈策略
竞争策略
企业可以利用博弈论来制定竞争 策略,例如通过分析竞争对手的
可能行动来制定最优反应。
合作博弈
企业也可以通过合作博弈来寻求共 赢,例如通过建立战略联盟或进行 合作研发来共同开拓市场或降低成 本。
市场进入与退出
博弈论可以帮助企业分析市场进入 和退出的可能性,以及制定相应的 策略。
感谢您的观看
THANKS
政策制定中的博弈论应用
政策制定
政府可以利用博弈论来制定政策, 例如通过分析利益相关方的博弈
行为来制定最优政策。
政策执行
政府也可以利用博弈论来分析政 策的执行效果,例如通过分析利 益相关方的反应来评估政策的可
行性。
政策调整
博弈论可以帮助政府根据利益相 关方的反应来调整政策,以实现
更好的政策效果。
国际关系中的博弈策略
纳什均衡的应用实例
囚徒困境
两个囚犯选择坦白或沉默,在给定对 方选择的情况下,自己选择坦白是最 优策略,最终导致两个囚犯都坦白, 实现了纳什均衡。
寡头竞争
公共资源过度使用
在公共资源的使用中,每个个体都追 求自身利益最大化,最终导致公共资 源过度使用,这也是一种纳什均衡的 现象。
宏观经济学第10章 博弈论
囚徒困境
囚犯B
坦白 不坦白 -8 ) 0 0 -1 -10 -1
囚 犯 A
坦白
(-8
-10
不坦白
• 练习:价格竞争策略
厂商B
10 20
100 200 50
厂 商 A
10
20
150
80
180
170
160
三、重复剔除的占优均衡
首先找出某一参与人的严格劣战略,将 它剔除掉,重新构造一个不包括已剔除战略 的新的博弈,然后继续剔除这个新的博弈中 某一参与人的严格劣战略,直到剩下唯一的 参与人战略组合为止。这个唯一剩下的参与 人的战略组合,就是博弈的均衡解,称为 “重复剔除的占优战略均衡”。
进入者
不进 在位者 打击
进入
在位者
默许 打击
厂商B 左 上 厂商A 下 1,2 2,1 右 0,1 1,0
二、占优战略均衡
占优战略均衡是指参与人的最优战略不 依赖于其他参与人的战略选择。不论其他参 与人选择什么战略,他的最优战略是唯一的, 这个最优战略被称为占优战略。
在一个博弈中,如果所有参与人都有占 优战略,那么所有参与人的占优战略组合便 是该博弈的唯一均衡,叫占优战略均衡。
第十章 博弈论
第一节
研究的对象
经济资源的稀缺性 选择与资源配置
博弈论概述
主流经济学假设行为 决策人是完全理性的, 且具有与最优化相关 的所有信息,并能正 确地运用这些信息来 指导自己的行理论动。 在该假定下,经济学 家们不顾现实世界的 纷繁复杂,致力于对 均衡和本质规律的研 究。
一、经济学与博弈论
中心理论
价格理论
基本假设前提
1. 2.
高鸿业西方经济学-第10章博弈论初步dmqn.pptx
30
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
二、存在纯策略均衡时的混合策略均衡
求解混合策略纳什均衡的方法不仅适用于纯策略 纳什均衡不存在的情况,而且也适用于纯策略纳什均 衡存在的情况。在后面这种情况下,纯策略纳什均衡 将作为特例被包含在相应的混合策略纳什均衡之中。
2024年9月29日星期日
12
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第二,在甲厂商的支付矩阵中,找出每一列的最大者 (每列的最大者可能不只一个),并在其下划线
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
13
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
个厂商都不再有单独改变策略的倾向时,整个博弈就 达到了均衡,即博弈均衡。
博弈均衡是博弈各方最终选取的策略组合,是博 弈的最终结果,是博弈的解。
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
8
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
四、纳什均衡
2.纳什均衡的概念 第一,纳什均衡的概念
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
24
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
一、不存在纯策略均衡时的混合策略均衡
1.混合策略 第三,“混合”策略的概念
把甲厂商和乙厂商原来的策略叫做“纯”策略, 把赋予这些纯策略的概率向量叫做“混合”策略。
2024年9月29日星期日
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
23
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
33
34
重复博弈
在现实经济运行中,寡头之间的价格默契并 不容易,主要原因有:
如果博弈重复是有限的,则最后一次博弈会采取低价策 略,理性的结果是抢先低价,一直到第一次博弈;但是, 只要以牙还牙的理性行为有一定折扣或(怀疑),合作 以避免价格战的结果仍然会出现。
厂商较多,使以牙还牙(对欺骗者进行报复和惩罚)难 以实现,合作就十分困难。
参与者Players (玩家): 即参加博弈过程的行为和决策 主体,也是利益主体。在一个博弈中,最少要有两个参 与者。
策略Strategies (战略或策略行为):即参与者在某个博 弈时点,根据其掌握的有关博弈信息而选择的决策变量 和行动计划,一个参与者的全部可行策略称为他的策略 空间。
收益Payoff(支付、得益)和收益函数: 收益是指在既定 策略组合条件下参与者的得失情况。每个参与者的收益 取决于全部参与者所采取的策略,称为收益函数。
11
博弈的分类
(二)静态博弈与动态博弈
(根据参与者选择策略的关系划分) • 参与者同时或独立选择策略的博弈是静态博弈。 • 参与者按照一定的次序选择策略,后选择者了解
先选择者的行动,这种博弈是动态博弈。
12
博弈的分类
(三)完全信息博弈与不完全信息博
(根据参与者对其他参与者的特征、策略空间、 收益函数等信息的了解程度划分)
做广告 10, 5
不做广告 15, 0
不做广告
6, 8
20, 2
19
不存在优势策略的夫妻之争
王先生W 张女士Z
看球赛(T)
看球赛 (T)
1,2
看电影 (F)
0,0
看电影(F) 0,0
3,1
20
2、纳什均衡
• 纳什均衡是在博弈一方既定的策略下,博弈的另一方 所能选择的最佳策略,并且没有改变策略的冲动。
4
二、特 点
参与者具有各自的目标: 参与者都是理性行为者; 参与者之间具有相关性; 事态发展的结果取决于全部参与自己的行动,因而是对策。
5
博弈论与优化论的不同
优化论是一种单方决策理论 博弈论所揭示的是一种多方决策理论
6
三、博弈的基本要素
第十章 博弈论
通过前面分析可知,寡头想达到垄断 的结果,需要进行合作,而合作往往 难以维持。其均衡是博弈的结果。 博弈论:研究人们在各种战略情况下 如何行事。
1
囚犯的两难处境
李四
坦白
抵赖
张三 坦白 -8,-8
抵赖 -20,0
0,-20 -1,-1
2
红与黑的游戏
MAX:profit
红,红 -3, -3 黑,黑 +3,+3 红,黑 +5,-5
• 优势策略(上策)均衡是不管博弈一方选择什么策略, 博弈的另一方所选择的策略都是最好的。
• 优势策略均衡是纳什均衡的特例,但是反过来纳什均 衡未必是优势策略均衡。
21
产品选择问题的纳什均衡
厂商 2 厂商1
咸
咸
-4, -4
甜
9, 9
甜
10, 10 -4, -4
22
3、最大最小策略
纳什均衡是建立在参与者理性行为基础上的,这 就使参与者在决策时面临可能出现某些非理性 行为的风险。为了降低风险,决策者可以采取 最大最小策略以便降低风险,即在各种策略的 最小收益中,选择具有最大收益的策略。其代 价是放弃最优策略。
政府不干预
欧洲有关国家政府补贴后
空中客车
生产
不生产
波 生产 -10,-10 音
不生产 0,100
100,0 0,0
空中客车
生产
不生产
波 生产 -10,10 音
不生产 0,120
100,0 0,0
29
合作的诱惑
在类似囚徒的困境这样的博弈中,个体理性往往导 致集体的非理性。在有多个纳什均衡的博弈中, 参与者判断失误,或者某个参与者非理性行为, 都会导致双方的严重损失。因此,存在着通过合 作改善博弈结果的诱惑,这样可以使大家的收益 都得到改善。
7
结局 outcome(结果):指博弈的结果,指既定 策略组合条件下全部参与者所得收益的集合。
均衡 Equilibrium (均势):指达到稳定的策略 组合或结局。
博弈规则: 指参与者、策略、结局之间的联系。 它是由博弈的环境和参与者之间的相互影响决 定的。
8
博弈的例子
可口可乐与百事可乐(参与者)的价格决策: 双方都可以保持价格不变或提高价格(策略) 博弈目标和得失情况体现为利润多少(收益) 利润的大小取决于双方策略组合(收益函数) 博弈有四种策略组合,其(结局)表示为以下
全部相互了解即为完全信息博弈; 否则是不完全信息博弈
13
五、博弈的均衡概念
博弈方的不同策略将导致各种不同的均衡,而均 衡的特征又与博弈方的行为假设有密切关系。
首先分析静态的非合作的博弈,并且对博弈双方 的行为作出以下假设: ①假定博弈双方是理性的 ②假定博弈双方具有完全的信息 ③假定博弈双方独立地进行决策
收益矩阵
9
博弈的例子
参与者2 百事可乐
不涨价
涨价
参与者1
可口可乐
不涨价 涨价
10,10 -20,30
100,-30 140,35
博弈的标准模型 包括三个要素:参与者、每个参与者可以选择 的策略以及收益函数。
在两个参与者的有限博弈中,标准模型可以用收益矩阵表示。
10
四、博弈的分类
(一)合作博弈与非合作博弈(根据参与者之间能否通
例如,在上述广告博弈中,如果双方都不做广告, 比都做广告收益高。但这种合作难以自动实现。
30
31
合作的诱惑
对社会有害的合作,设法制止。 在囚徒困境博弈中,如 果两个囚徒可以形成攻守同盟,则罪犯得到好处,对 社会不利。例如在寡头厂商的定价博弈中,勾结定高 价对双方都有好处,但对社会不利,因此受到反垄断 法的严密监控。寡头厂商的价格博弈收益矩阵如下:
厂商之间的成本差别较大,需求和成本变化很快,难以 达成默契。
35
36
序列博弈
在重复博弈的情况下,厂商可能不仅考虑短期收 益,而且更重视长期利益。因此,为了维持长 期的垄断利润,厂商可能以牺牲短期利益为代 价把进入者驱逐出去。这种在博弈中采取一定 非理性行为的方法,形成进入威慑的另一种途 径,即建立不惜一切代价粗暴对待进入者的名 声,而不需要有具体的承诺。(实际上是把牺 牲短期利益作为承诺)
37
厂商2
高价
低价
厂商1
高价 低价
50,50 70,10
10,70
30,30
32
重复博弈和序列博弈
在现实经济社会,完全信息静态博弈的条件并 不经常可以得到满足。特别是在市场竞争中, 厂商之间的竞争不是一次性的,而是长期和反 复的。同时,厂商之间的行为往往是有先后次 序的,决策者可以先了解对手的行动,在充分 掌握信息的基础上,然后再决定自己的对策。 这种情况称为完全信息动态博弈。
抵赖 -20,0
-1,-1
囚徒困境说明,个人理性(最优)与集体理性(最优)
可能不一致。
如寡头之间的广告投入、产量控制等。
17
广告博弈的优势策略均衡?
广告博弈的得益矩阵
厂商2 厂商1
做广告
做广告 10, 5
不做广告 15, 0
不做广告 6 , 8
10, 2
18
博弈一方无优势策略
厂商2 厂商1
做广告
过谈判达成具有约束力的协议或合同来划分) 可以达成协议的为合作博弈cooperative game,合作博弈强调
集体理性和整体最优。如买卖双方讨价还价后成交。 不能达成协议的为非合作博弈non-cooperative game,非合作
博弈强调个体理性和局部最优。如寡头之间的竞争博弈, 双方的利益和目标有冲突,难以达成可以实施的协议,双 方都有欺骗和违约的冲动。
23
3、最大最小策略
博弈方2
博弈方1
守
进
1, 0
退
1, 2
攻
-600,0 4, 2
24
25
威胁信号?
公司之间经常相互发出信号以表明他们的意图、动机 和目标。有些信号是威胁性的。
例如,A公司宣布,如果谁挑起价格战,它将坚决奉 陪到底,并宣称其规模在本行业中名列前茅,最有降 价的实力。
是否所有的威胁都是可信的?
B公司
降价
不降价
A
公
降价
司
100,200
200,-100
不降价
600,1000
1000,700
A公司降价的威胁 可信吗?不可信。 如果A公司要让B 公司相信其威胁是 可信的,只有一个 途径:建立一种不 按牌理出牌的形象
26
27
28
贸易政策与国际竞争
一个国家的政府对本国战略性产业进行扶持,可 以影响国际竞争格局。
共6轮决策,第3轮分数x2,第6轮分数x4 总分最高者获胜
3
一、博弈论的基本概念
博弈是指具有不同利益和目标的多个行为主体共同参加 并相互影响的事态发展过程中的策略决策。
博弈论(Game Theory)也称对策论,它是一种分析博 弈过程和结果的数学方法,研究具有理性的多个行为 主体的决策和行动直接相互作用和影响时,事态发展 过程的决策和均衡问题。广泛应用于政治、军事、经 济、外交和日常生活的许多领域。
14
海滩定位问题
A
海 滩
400米
15
1、支配性策略均衡
• 支配性策略也称上策或优势策略 在博弈中,对有些参与者来说,不管对手采 取什么策略,他的策略都保持不变。这种不 取决于对手选择的最优策略称为支配性策略 (上策或优势策略)。
34
重复博弈
在现实经济运行中,寡头之间的价格默契并 不容易,主要原因有:
如果博弈重复是有限的,则最后一次博弈会采取低价策 略,理性的结果是抢先低价,一直到第一次博弈;但是, 只要以牙还牙的理性行为有一定折扣或(怀疑),合作 以避免价格战的结果仍然会出现。
厂商较多,使以牙还牙(对欺骗者进行报复和惩罚)难 以实现,合作就十分困难。
参与者Players (玩家): 即参加博弈过程的行为和决策 主体,也是利益主体。在一个博弈中,最少要有两个参 与者。
策略Strategies (战略或策略行为):即参与者在某个博 弈时点,根据其掌握的有关博弈信息而选择的决策变量 和行动计划,一个参与者的全部可行策略称为他的策略 空间。
收益Payoff(支付、得益)和收益函数: 收益是指在既定 策略组合条件下参与者的得失情况。每个参与者的收益 取决于全部参与者所采取的策略,称为收益函数。
11
博弈的分类
(二)静态博弈与动态博弈
(根据参与者选择策略的关系划分) • 参与者同时或独立选择策略的博弈是静态博弈。 • 参与者按照一定的次序选择策略,后选择者了解
先选择者的行动,这种博弈是动态博弈。
12
博弈的分类
(三)完全信息博弈与不完全信息博
(根据参与者对其他参与者的特征、策略空间、 收益函数等信息的了解程度划分)
做广告 10, 5
不做广告 15, 0
不做广告
6, 8
20, 2
19
不存在优势策略的夫妻之争
王先生W 张女士Z
看球赛(T)
看球赛 (T)
1,2
看电影 (F)
0,0
看电影(F) 0,0
3,1
20
2、纳什均衡
• 纳什均衡是在博弈一方既定的策略下,博弈的另一方 所能选择的最佳策略,并且没有改变策略的冲动。
4
二、特 点
参与者具有各自的目标: 参与者都是理性行为者; 参与者之间具有相关性; 事态发展的结果取决于全部参与自己的行动,因而是对策。
5
博弈论与优化论的不同
优化论是一种单方决策理论 博弈论所揭示的是一种多方决策理论
6
三、博弈的基本要素
第十章 博弈论
通过前面分析可知,寡头想达到垄断 的结果,需要进行合作,而合作往往 难以维持。其均衡是博弈的结果。 博弈论:研究人们在各种战略情况下 如何行事。
1
囚犯的两难处境
李四
坦白
抵赖
张三 坦白 -8,-8
抵赖 -20,0
0,-20 -1,-1
2
红与黑的游戏
MAX:profit
红,红 -3, -3 黑,黑 +3,+3 红,黑 +5,-5
• 优势策略(上策)均衡是不管博弈一方选择什么策略, 博弈的另一方所选择的策略都是最好的。
• 优势策略均衡是纳什均衡的特例,但是反过来纳什均 衡未必是优势策略均衡。
21
产品选择问题的纳什均衡
厂商 2 厂商1
咸
咸
-4, -4
甜
9, 9
甜
10, 10 -4, -4
22
3、最大最小策略
纳什均衡是建立在参与者理性行为基础上的,这 就使参与者在决策时面临可能出现某些非理性 行为的风险。为了降低风险,决策者可以采取 最大最小策略以便降低风险,即在各种策略的 最小收益中,选择具有最大收益的策略。其代 价是放弃最优策略。
政府不干预
欧洲有关国家政府补贴后
空中客车
生产
不生产
波 生产 -10,-10 音
不生产 0,100
100,0 0,0
空中客车
生产
不生产
波 生产 -10,10 音
不生产 0,120
100,0 0,0
29
合作的诱惑
在类似囚徒的困境这样的博弈中,个体理性往往导 致集体的非理性。在有多个纳什均衡的博弈中, 参与者判断失误,或者某个参与者非理性行为, 都会导致双方的严重损失。因此,存在着通过合 作改善博弈结果的诱惑,这样可以使大家的收益 都得到改善。
7
结局 outcome(结果):指博弈的结果,指既定 策略组合条件下全部参与者所得收益的集合。
均衡 Equilibrium (均势):指达到稳定的策略 组合或结局。
博弈规则: 指参与者、策略、结局之间的联系。 它是由博弈的环境和参与者之间的相互影响决 定的。
8
博弈的例子
可口可乐与百事可乐(参与者)的价格决策: 双方都可以保持价格不变或提高价格(策略) 博弈目标和得失情况体现为利润多少(收益) 利润的大小取决于双方策略组合(收益函数) 博弈有四种策略组合,其(结局)表示为以下
全部相互了解即为完全信息博弈; 否则是不完全信息博弈
13
五、博弈的均衡概念
博弈方的不同策略将导致各种不同的均衡,而均 衡的特征又与博弈方的行为假设有密切关系。
首先分析静态的非合作的博弈,并且对博弈双方 的行为作出以下假设: ①假定博弈双方是理性的 ②假定博弈双方具有完全的信息 ③假定博弈双方独立地进行决策
收益矩阵
9
博弈的例子
参与者2 百事可乐
不涨价
涨价
参与者1
可口可乐
不涨价 涨价
10,10 -20,30
100,-30 140,35
博弈的标准模型 包括三个要素:参与者、每个参与者可以选择 的策略以及收益函数。
在两个参与者的有限博弈中,标准模型可以用收益矩阵表示。
10
四、博弈的分类
(一)合作博弈与非合作博弈(根据参与者之间能否通
例如,在上述广告博弈中,如果双方都不做广告, 比都做广告收益高。但这种合作难以自动实现。
30
31
合作的诱惑
对社会有害的合作,设法制止。 在囚徒困境博弈中,如 果两个囚徒可以形成攻守同盟,则罪犯得到好处,对 社会不利。例如在寡头厂商的定价博弈中,勾结定高 价对双方都有好处,但对社会不利,因此受到反垄断 法的严密监控。寡头厂商的价格博弈收益矩阵如下:
厂商之间的成本差别较大,需求和成本变化很快,难以 达成默契。
35
36
序列博弈
在重复博弈的情况下,厂商可能不仅考虑短期收 益,而且更重视长期利益。因此,为了维持长 期的垄断利润,厂商可能以牺牲短期利益为代 价把进入者驱逐出去。这种在博弈中采取一定 非理性行为的方法,形成进入威慑的另一种途 径,即建立不惜一切代价粗暴对待进入者的名 声,而不需要有具体的承诺。(实际上是把牺 牲短期利益作为承诺)
37
厂商2
高价
低价
厂商1
高价 低价
50,50 70,10
10,70
30,30
32
重复博弈和序列博弈
在现实经济社会,完全信息静态博弈的条件并 不经常可以得到满足。特别是在市场竞争中, 厂商之间的竞争不是一次性的,而是长期和反 复的。同时,厂商之间的行为往往是有先后次 序的,决策者可以先了解对手的行动,在充分 掌握信息的基础上,然后再决定自己的对策。 这种情况称为完全信息动态博弈。
抵赖 -20,0
-1,-1
囚徒困境说明,个人理性(最优)与集体理性(最优)
可能不一致。
如寡头之间的广告投入、产量控制等。
17
广告博弈的优势策略均衡?
广告博弈的得益矩阵
厂商2 厂商1
做广告
做广告 10, 5
不做广告 15, 0
不做广告 6 , 8
10, 2
18
博弈一方无优势策略
厂商2 厂商1
做广告
过谈判达成具有约束力的协议或合同来划分) 可以达成协议的为合作博弈cooperative game,合作博弈强调
集体理性和整体最优。如买卖双方讨价还价后成交。 不能达成协议的为非合作博弈non-cooperative game,非合作
博弈强调个体理性和局部最优。如寡头之间的竞争博弈, 双方的利益和目标有冲突,难以达成可以实施的协议,双 方都有欺骗和违约的冲动。
23
3、最大最小策略
博弈方2
博弈方1
守
进
1, 0
退
1, 2
攻
-600,0 4, 2
24
25
威胁信号?
公司之间经常相互发出信号以表明他们的意图、动机 和目标。有些信号是威胁性的。
例如,A公司宣布,如果谁挑起价格战,它将坚决奉 陪到底,并宣称其规模在本行业中名列前茅,最有降 价的实力。
是否所有的威胁都是可信的?
B公司
降价
不降价
A
公
降价
司
100,200
200,-100
不降价
600,1000
1000,700
A公司降价的威胁 可信吗?不可信。 如果A公司要让B 公司相信其威胁是 可信的,只有一个 途径:建立一种不 按牌理出牌的形象
26
27
28
贸易政策与国际竞争
一个国家的政府对本国战略性产业进行扶持,可 以影响国际竞争格局。
共6轮决策,第3轮分数x2,第6轮分数x4 总分最高者获胜
3
一、博弈论的基本概念
博弈是指具有不同利益和目标的多个行为主体共同参加 并相互影响的事态发展过程中的策略决策。
博弈论(Game Theory)也称对策论,它是一种分析博 弈过程和结果的数学方法,研究具有理性的多个行为 主体的决策和行动直接相互作用和影响时,事态发展 过程的决策和均衡问题。广泛应用于政治、军事、经 济、外交和日常生活的许多领域。
14
海滩定位问题
A
海 滩
400米
15
1、支配性策略均衡
• 支配性策略也称上策或优势策略 在博弈中,对有些参与者来说,不管对手采 取什么策略,他的策略都保持不变。这种不 取决于对手选择的最优策略称为支配性策略 (上策或优势策略)。