动态博弈经典模型
博弈论 第 三 章 完全信息动态博弈讲解

房地产开发博弈
开发
A hA(1) 不开发
h表示信息集
N hN(1)
需求大
需求小
N hN(2)
需求大
需求小
B hB(1)
开发
不开发
B hB(2)
B hB(3)
开发
不开发 开发 不开发 开发
B hB(4)
不开发
(4,4)
(8,0) (-3,-3)
(1,0) (0,8) (0,0) (0,1) 单 位:百万元
定 义 一 个 展 开 式 博 弈 的 子 博 弈G 由 一 个 决 策 结x 和 所 有 该 决 策 结 的 后继结T(x)( 包 括终点结0 组 成, 它 满 足 下 列 条 件:⑴x 是 一 个 单 点 信 息 结即h(x)={x};⑵对于所有的 x′∈T(x),如果x″∈h(x′),则x″∈T(x)。
(3)
N
1/3
2/3
1
Y1
z1
1
x1
w1
(2,6) (5,6)
2
2
a2 (9,0)
b2 (0,3)
a2 (9,5)
b2 (0,3)
3.3 子 博 弈 与 子 博 弈 完 美
Nash 均衡在原则上适用所有的博弈,但对于预 测 参与人的行为来说,Nash均衡可能并不是 一个 合理的预测, 如房地产博弈:
A
开发
不开 发
A
开发
不开发
B
B
B
B
开发 不开发 开发 不开发 开发 不开发 开发
不开发
有了信息集的概念, 展开式表示也可以用来表 示静态博弈, 如“囚徒的困境 ”博弈可以表 示为:
1
坦白
2
数学建模博弈模型

博弈模型在实际问题中的应用前景
政策制定
01
利用博弈模型分析政策制定中的利益关系和策略选择,为政策
制定提供科学依据。
企业竞争策略
02
利用博弈模型分析企业竞争中的策略选择和预期行为,为企业
制定合理的竞争策略。
国际关系
03
利用博弈模型分析国际关系中的利益关系和冲突解决机制,为
国际关系管理提供理论支持。
THANKS
猎鹿博弈
总结词
描述两个猎人合作与竞争的关系,揭示了合作与背叛的平衡。
详细描述
在猎鹿博弈中,两个猎人一起打猎,猎物可以平分。如果一个猎人选择合作而另一个选择背叛,则背叛者可以独 吞猎物。但如果两个猎人都不合作,则都没有猎物可吃。最佳策略是合作,但个体理性可能导致两个猎人都不合 作,造成双输的结果。
03
智猪博弈
总结词
描述大猪与小猪在食槽竞争中的策略,揭示了合作与竞 争的平衡。
详细描述
在智猪博弈中,一个大猪和一个小猪共同生活在一个猪 圈里。每天都有一桶食物放在食槽中,大猪和小猪需要 竞争才能吃到食物。如果大猪和小猪同时到达食槽,大 猪会因为体型优势占据更多食物。但如果小猪先到食槽 等待,大猪到来时已经没有食物可吃。最佳策略是小猪 等待,大猪先吃,然后小猪再吃剩下的食物。
博弈模型的基本要素
参与者
在博弈中作出决策和行动的个体或组织。
策略
参与者为达到目标而采取的行动或决策。
支付
参与者从博弈中获得的收益或损失。
均衡
在博弈中,当所有参与者都选择最优策略时,达到的一种稳定状态。
博弈模型的建立过程
策略空间
确定每个参与者的所有可能采 取的策略。
均衡分析
通过分析收益函数和策略空间 ,找出博弈的均衡点。
15-斯塔克伯格模型

博弈论教学/双寡头垄断的斯塔克伯格模型出自MyKnowledgeBase< 博弈论教学Bread crumbs:教学工作 > 博弈论教学 > 博弈论教学/双寡头垄断的斯塔克伯格模型目录■1 一般模型■1.1 背景■1.2 博弈模型■1.3 后退归纳法分析■2 不变单位成本和线性逆需求函数的双寡头垄断斯塔克伯格模型■2.1 参数分析■2.2 后退归纳法求解最优反应函数■3 子博弈完美均衡的性质■4 模型推广■5 延伸阅读1 一般模型1.1 背景Stackelberg(1934)提出了一个双寡头垄断的动态博弈模型,其中领导者先行动,然后追随者行动。
1.个厂商生产同样的商品;厂商i的生产成本为;当总产量为时,产品出售价格为2.每个厂商的策略为产量;3.两个厂商相继行动:一个厂商选择它的产量,然后另一厂商在知道了第一个厂商已选择的产量后选择自己的产量。
1.2 博弈模型1.局中人:两个厂商2.终端历史:厂商所有产量序列的集合(非负数)3.局中人函数:,并且对所有的,有4.偏好:厂商关于终端历史的盈利是它的利润1.3 后退归纳法分析1.厂商1(博弈起点)的策略是一个产量;厂商2的策略是将厂商2的产量与厂商1的每个可能产量相关联的一个函数。
的任何产量,求厂商的产量为,厂商利润最大化的产量为的子博弈:在给定厂商2的策略下,求厂商1极大化自己利润的产量。
当厂商择产量,厂商2选择产量,则总产量为,价格为,厂的利润为。
利润达到最大值时的厂商1的产量记为给定了厂商1的均衡选择,厂商2的选择的产量为,那么子博弈完美均衡点为成本函数:线性逆需求函数:;, (,)的每一个产量,厂商有唯一的最优反应,为:,如果;,如果厂商2的策略(产量)是,厂商1的利润是:,厂商最大化时的产量,求导数得的最优产量为的利润为,厂商2的利润为注意区别古诺模型的同时行动:产量都为,利润都为二次成本函数的斯塔克伯格双寡头垄断博弈:,成立,以及对于所有的有,且对于有,求斯塔克伯格双寡头垄断博弈的子博弈完美均衡。
《动态博弈模型》课件

子博弈精炼纳什均 衡
在完全信息动态博弈中,子博 弈精炼纳什均衡是指通过剔除 不可置信威胁和承诺的策略, 得到的均衡结果。
不完全信息动态博弈
不完全信息
在不完全信息动态博弈中,至少有一个参与者不拥有关于博弈 的所有信息,包括其他参与者的类型、策略和支付函数。
贝叶斯纳什均衡
在不完全信息动态博弈中,贝叶斯纳什均衡是一个重要的概念, 它是指所有参与者在给定自己类型和概率分布的条件下,采取的
劳动力市场
经典动态博弈模型用于研究劳动力市场的工 资和就业问题,分析雇主和雇员之间的博弈 关系。
在政治学中的应用
选举博弈
经典动态博弈模型用于分析选举中的竞选策略,如候 选人如何制定竞选纲领、如何进行宣传等。
国际关系
该模型用于研究国家间的外交政策和国际合作,分析 各国在利益冲突下的博弈行为。
立法博弈
触发战略
在重复博弈中,触发战略是指一种报复机制,如果某个参与者在某个阶段采取了不合作 的策略,其他参与者会在未来的阶段采取报复措施。
04
动态博弈模型的求解方法
逆向归纳法
逆向归纳法是一种求解动态博弈的方法,通过逆向推理,从博弈的最后阶段开始分析,逐步向前推导 ,最终得出每个参与者的最优策略。
在求解过程中,逆向归纳法假设每个参与者都了解其他参与者的策略选择,并在此基础上选择自己的最 优策略。
02
经典动态博弈模型介绍
囚徒困境
总结词
描述两个囚犯因相互背叛而导致双方都不利的结果。
详细描述
囚徒困境是一个经典的动态博弈模型,描述了两个囚 犯因被警方逮捕而面临指控的情况。如果两个囚犯都 保持沉默,他们都将得到较轻的刑罚;但如果其中一 个囚犯背叛另一个,他将得到更轻的刑罚,而另一个 囚犯将得到更重的刑罚。然而,如果两个囚犯都背叛 彼此,他们都将得到更重的刑罚。因此,尽管合作是 最佳策略,但每个囚犯都有动机背叛对方,导致双方 都不利的结果。
博弈论3-4经典动态博弈模型

3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择,厂商2后选择。
21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间:[0,Q max ]中所有实数。
Q max 为不至于使价格降到亏本的最大限度的产量。
Q Q P P -==8)(价格函数:边际生产成本:无固定成本得益函数:221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
1 、第二阶段厂商2的选择目标:得益最大化。
求使自己得益最大化下的产量值,即最大化时的一阶条件:得益函数:2221226q q q q u --=用逆推归纳法进行分析:02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数:48两阶段动态博弈。
第一阶段,厂商1选择产量;第二阶段,厂商2选择产量。
2 、第一阶段厂商1的选择。
用逆推归纳法进行分析:12213q q -=厂商1可直接求出使自己得益最大化时的产量:厂商1知道2的决策思路:直接将上式代入厂商1的得益函数,得到:2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。
将之代入厂商2的反应函数,得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5,双方的得益别为4.5和2.25单位。
3*1=q 12213q q -=用逆推归纳法分析得出,该动态博弈的唯一的子博弈完美纳什均衡:厂商1在第一阶段生产3单位产量,厂商2第二阶段生产1.5单位产量。
十大经典博弈论模型

十大经典博弈论模型博弈论是一门研究决策者之间互动的学科,其应用范围广泛,涉及到经济、政治、生物学等领域。
在博弈论中,经典博弈论模型是基础和核心,以下是介绍十大经典博弈论模型:1. 囚徒困境博弈模型囚徒困境博弈模型是博弈论中最为著名的模型之一,也是最为典型的非合作博弈模型。
该模型主要讲述的是两个囚犯被抓后面临的选择问题,如果两个人都招供,那么都将受到较重的惩罚;如果两个人都不招供,那么都将受到轻微的惩罚;如果一个人招供而另一个人不招供,那么招供的人将受到宽大处理,而另一个人将受到较重的惩罚。
2. 零和博弈模型零和博弈模型是博弈论中最为简单的模型之一,其特点是参与者之间的利益完全相反,即一方获得利益就意味着另一方的利益受到损失。
在这种情况下,参与者之间的互动往往是竞争和对抗的。
3. 博弈树模型博弈树模型是一种用于描述博弈过程的图形模型,它可以清晰地展示出参与者在不同阶段的选择和决策,以及每个选择所带来的收益和风险。
4. 纳什均衡模型纳什均衡模型是博弈论中最为重要的概念之一,它指的是一个博弈中所有参与者都采取了最优策略的状态。
换句话说,如果所有参与者都遵循纳什均衡,那么任何一个人单方面改变策略都将无法获得更多的利益。
5. 最小最大化模型最小最大化模型是一种解决零和博弈问题的方法,其思想是在所有可能的情况中,选择让对手收益最小的情况,从而实现自己的最大化收益。
6. 帕累托最优解模型帕累托最优解模型是一种解决多人博弈问题的方法,其核心思想是通过合作和协商,使得所有参与者都能获得最大的收益,而不是只有某个人获得了最大的收益。
7. 博弈矩阵模型博弈矩阵模型是一种常用的博弈论分析工具,它可以清晰地展示出参与者在不同策略下的收益和风险,从而帮助参与者做出最优决策。
8. 拍卖模型拍卖模型是博弈论中的一个重要应用领域,其目的是通过竞价的方式,让参与者以最低的价格获得所需的商品或服务。
9. 逆向选择模型逆向选择模型是一种解决信息不对称问题的方法,其核心思想是通过知道对方的信息,来预测对方的行为和决策,从而做出最优策略。
第二章完全信息动态博弈篇章

i (q1, q2 ) qi ( P(Q) c),i 1,2
斯坦克尔伯的寡头竞争模型
用逆向归纳法求解,首先考虑给定q1的情况下,企业2 的最优选择。企业2的问题是:
Max 2 (q1 , q2 ) q2 (a q1 q2 c)
最优化一阶条件意味着:
轮流出价的讨价还价模型
一般来说,如果 0 i 1, i 1, 2均衡结果不 仅依赖于贴现因子的相对比率,而且依赖于博 弈时间长度T和谁在最后阶段出价。然而这种 依存关系随T的变大而变小;当T趋于无穷大时 ,我们得到“先动优势”:即如果 1 2 唯 一的均衡是 x 1 (1 ). 定理(Rubinstein 1982):在无限期轮流出价 博弈中,唯一的子博弈精炼纳什均衡结果是: 1 2 1 * * x (if 1 2 x ) 1 1 2 1
典型的旅行者困境收益矩阵 (仅考虑整数)
100 100 99 98 97 96 95 …… 5 4 3 2
100,100 101,97 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
99
97,101 99,99 100,96 99,95 98,94 97,93 …… 7,3 6,2 5,1 4,0
第三章 完全信息动态搏弈 -子博弈精炼纳什均衡
•
一 博弈扩展式表述
二 扩展式表述博弈的纳什均衡 三 子博弈精练纳什均衡 四 应用举例 斯坦克尔伯的寡头竞争模型
•
• •
轮流出价的讨价还价模型
囚徒的救赎 旅行者困境 五 重复博弈
轮流出价的讨价还价模型(1)
博弈论的几个经典模型

模型二、囚徒困境/非合作博 弈
囚徒困境可以用来说明许多现象。
寡头定价 拍卖出价 推销员的努力 政治上的讨价还价 军备竞赛等(冲突中出现两败俱伤的情况,
往往要考虑到囚徒困境)
*(纯策略)纳什均衡
问题与思考
• 什么是博弈论?试举两个你生活中的例子说明。
• 某年在荷兰召开了一次“合作及社会两难困境研讨 会”,与会者都是博弈论的专家。
基本术语
• 博弈涉及哪些内容呢?
博弈涉及至少两个独立的博弈参与者 (player)。
博弈涉及行动者存在着策略(strategy)选 择的可能,博弈论用策略空间来表示参与 者可以选择的策略。
参与者在不同策略组合下会得到一定的支 付(payoff)。
对于博弈参与者来说,存在着一博弈结果。
对于游戏设计者,这是一个最好的
模型二、囚徒困境/非合作博 弈
在博弈论中,含有占优战略均衡的 一个著名例子是由塔克给出的“囚徒困 境” (prisoners’dilemma)博弈模 型。该模型用一种特别的方式为我们讲 述了一个警察与小偷的故事。
模型二、囚徒困境/非合作博 假设:有两个小偷A弈和B联合犯事、私入
第四章 博弈论的几个经典模 型
讲授人 谭建国
引言
博 弈 论 又 被 称 为 对 策 论 ( Game Theory),按照2005年因对博弈论的贡献 而获得诺贝尔经济学奖的Robert Aumann 教授的说法,博弈论就是研究互动决策 的理论。所谓互动决策,即各行动方 (即局中人[player])的决策是相互影响 的,每个人在决策的时候必须将他人的 决策纳入自己的决策考虑之中,当然也 需要把别人对于自己的考虑也要纳入考 虑之中……在如此迭代考虑情形进行决
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
支付:政府 —— 社会福利 Welfare
消费者剩余
社会福利
本国企业的利润 政府的关税收入
2 2 1 i国政府 Wi 1 2 Q t e ( h e ) t i ie Wi 1 2 Qii ii tii e jj 1 2 (hii e jj ) 2 t e jj i i 2 2 2 2 1 1 W Q t e ( h e ) t 2 j je j国政府 W jj 1 2 Q jj jj t jj eii 1 2 (h jj eii ) 2 t eii j j 2 2
国内市场利润 国外市场利润
max e j [a (e j hi* ) c] ti e j
e j 0
1 (a e* c) h* j i 2 1 ( a h* c t ) e* j i i 2
四个方程联立
hi* 1 (a e* j c) 2 ei* 1 (a h* j c tj) 2 1 (a e* c) h* j i 2 1 ( a h* c t ) e* j i i 2
ei 0 hi 0
国内市场利润 国外市场利润
hi* 1 (a e* c) j 2 ei* 1 (a h* c tj) j 2
第二阶段企业的选择
j国企业的目标:
max h j [a (h j ei* ) c]
h j 0
h j ,e j 0
max j (t j , ti , h j , hi* , e j , ei* )
w j (t j , ti* )
[2(a c) t j ]2 18
(a c t j ) 2 9 t j (a c 2t j ) 3
(a c C:
ti 4(a c) 2ti 2(a c) 2ti (a c) 4ti 0 18 9 3
* * * * max wi (ti , t * , h , e , h j i i j , ej ) ti 0
wi 1 Qi 2 i ti e j 1 (hi e j ) 2 i ti e j 2 2 2 W j 1 Q j 2 j t j ei 1 (h*j *ei ) * * ) j t j ei ( h , e , h , e 2 2 将两国企业的均衡产量 i i j j 代入得:
4(a c) 2t j 18 2(a c) 2t j 9 (a c) 4t j 3 0
1 1 * 解得:h 3 (a c ti ) ei 3 (a c 2t j ) 1 1 * * h j (a c t j ) e j (a c 2ti ) 3 3
* i
ti tj为政府 在第一阶 段的实际 关税税率
第一阶段政府的选择
i国政府的目标:
两国企业的边际成本都为 c,且没有固定成本, 总成本为 Ci= c ( hi + ei )
企业i 对j 国出口,j 国的关税税率为 tj 企业i 的关税负担为 ei tj
最优关税 Optimum Tariff
参与者: 两国政府和两国企业 i , j 战略:关税税率 ti tj 和企业的产量hi ei hj ej 支付:企业 —— 利润
两阶段动态博弈的应用 —— 最优关税
W
C B
最优关税 Optimum tariff
使一国贸易条件改善 相对于其贸易量减少的负 面影响的净所得最大化的 税率。
A
0
t*
t
H
t
最优关税 Optimum Tariff
假设
两个国家 i / j , 每个国家有一个政府,选定一个关税 税率 ti tj
2 2 [2( a c ) t ] ( a c t ) i i wi (ti , t * ) j 18 9 2 (a c 2t * ) ti (a c 2ti ) j 9 3
第一阶段政府的选择
j国政府的目标:
* max w j (t j , ti* , hi* , ei* , h* , e j j) t j 0
第二阶段企业的选择
i国企业的目标:
max i (ti , t j , hi , h , ei , e )
hi , ei 0 * j * j
max hi [a (hi e* j ) c] max ei [a (ei h* j ) c ] t j ei
i国企业
i [a (hi e j )]hi [a (h j ei )]ei
c(hi ei ) eit j
j国企业
j [a (h j ei )]h j [a (hi e j )]e j
c(h j e j ) e j ti
最优关税 Optimum Tariff
每个国家有一个企业i / j, 产品都在国内和国外销售
每个国家的消费者都消费国内和国外产品
政府首先确定关税税率,企业再在既定关税水平上 进行产量选择
最优关税 Optimum Tariff
国家i 的市场需求为 P = a - Qi i 国企业生产hi 供内需,ei 供出口 i 国市场的总销售量为 hi + ej = Qi
wi 1 Qi 2 i ti e j 1 (hi e j ) 2 i ti e j 2 2 2 W j 1 Q j 2 j t j ei 1 (h*j *ei ) * * ) j t j ei ( h , e , h , e 2 2 将两国企业的均衡产量 i i j j 代入得: