博弈论完整课件[浙江大学]Game_Cha

合集下载

博弈论PPT课件

有i si 0, i si 1 si Si
这就是混合策略。
混合策略的纳什均衡定义
如果对于博弈中所有的游戏者i，对于所有的 σi∈Mi，都有ui﹙σ*﹚≥ui﹙σi，σ-i*﹚，则称 σ*就是一个混合策略的纳什均。
如何求混合策略的纳什均衡
猜硬币的博弈中解：设猜方猜正方的概率为p，猜反方的概率则为1－
无名氏（大众）定理
无名氏定理：在无穷次重复的由n个游戏者参与的博弈里，如果在每一次重复中博弈的行动集是有限的，则在满足下列三个条件时，在任何有限次重复中所观察到的任何行动组合都是某个子博弈完美均衡的惟一结果：
条件1：贴现因子接近于1；条件2：在每一次重复中，博弈结束的概率或等于0，或为非常小的一个正值；条件3：严格占优于一次性博弈中的最小最大收益组合的那个收益组合集是n维的。
博弈方
博弈方：独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变
博弈方数量对博弈结果和分析有影响根据博弈方数量分单人博弈、两人博弈、多人
博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略
策略：博弈中各博弈方的选择内容策略有定性定量、简单复杂之分不同博弈方之间不仅可选策略不同，而且可
游戏和经济等决策竞争较量的共同特征：规则、结果、策略选择，策略和利益相互依存，策略的关键作用
游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊朗、以色列和巴勒斯坦、中国和日本等等。
博弈的基本要素
博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行动(Actions) 博弈的次序(Order) 博弈方的收益(Payoffs) （或称支付，或得益）

博弈论完整版PPT课件

R3 3, 2 0, 4 4, 3 50, 1 会将C4从C的战略空间中剔除, 所以 R4 2, 93 0, 92 0, 91 100, 90 R不会选择R4；
2-阶理性： C相信R相信C是理性的，C会将R4从R的战略空间中剔除, 所以 C不会选择C1；
3-阶理性： R相信C相信R相信C是理性的， R会将C1从C的战略空间中剔除, R不会选择R1；
基本假设：完全竞争，完美信息
个人决策是在给定一个价格参数和收入的条件下最大化自己的效用，个人的效用与其他人无涉，所有其他人的行为都被总结在“价格”参数之中
一般均衡理论是整个经济学的理论基石和道义基础，市场机制是完美的，帕累托最优成立，平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立：
.
19
理性共识
0-阶理性共识：每个人都是理性的，但不知道其他人是否是理性的；
1-阶理性共识：每个人都是理性的，并且知道其他人也是理性的，但不知道其他人是否知道自己是理性的；
2-阶理性共识：每个人都是理性的，并且知道其
他人也是理性的，同时知道其他人也知道自己是
理性的；但不知道其他人是否知道自己知道他们
如果你预期我会选择X，我就真的会选择X。
如果参与人事前达成一个协议，在不存在外部强制的情况下，每个人都有积极性遵守这个协议，这个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定：
只有两个厂商面对相同的线形需求曲线，P(Q)=a－Q， Q=q1+q2 两厂商同时做决策；假定成本函数为C(qi)＝ciqi
劣策略：如果一个博弈中，某个参与人有占优策略，那么
该参与人的其他可选择策略就被称为“劣策略”。

精品课程《博弈论》PPT课件(全)

人博弈两人博弈有多种可能性，博弈方的利益方向可
能一致，也可以不一致
三、多人博弈
三个博弈方之间的博弈可能存在“破坏者”：其策略选择对自身的利
益并没有影响，但却会对其他博弈方的利益产生很大的，有时甚至是决定性的影响。申办奥运会是典型例子。多人博弈的表示有时与两人博弈不同，需要多个得益矩阵，或者只能用描述法
动态博弈、重复博弈。
静态博弈：所有博弈方同时或可看作同时选择策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈：各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场结构
重复博弈：同一个博弈反复进行所构成的博弈，提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时，有一夛，父亭乘了冩丢梨回宛，
陶谦吏亸叹孜癿时俳，又问亸：“亵绉泶孜癿觇
店看，佝觏为叴小梨刁算叾？”孔融回答该： “我丌
过觑了一次梨，哏哏単因此爱抋了我一辈子，社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨看俺
昤道徇成本，简直就昤一本万利唲！
阿克洛夫：买卖
主对于要交易的“旧车”存在信息不对称，买主通常不愿意出高价，这样持有好车的买主只好退出市场，市场上都剩下“坏车”，买主则越来越不愿意光顾，旧车市场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16

博弈论教学课件(全)

二、博弈论的经济学渊源
经济学的一些思想为博弈论提供了基础，其中最重要的就是所谓的“理性人”。
描述理性人的工具就是所谓的理性偏好。为了方便，我们又用效用函数（在博弈论中称为收益函数）来表示偏好。
构成博弈论基础的一个重要的经济定理就是所谓的理性选择原理：如果决策主体的偏好是理性的，那么（有限）选择集中就一定存在最优选择，这个选择可能是唯一的，也可能是多个。
定义2.1 博弈表达的基本式（或策略式）由博弈的参与者N，策略空间S和收益函数u三个要素组成，即G = {N, S, u}。
这里需要注意的是，完全信息静态博弈在多数情况下，策略就等同于行动，所以G={ A，u}。但严格来讲，策略并不是行动。
我们可以通过一个例子来加以说明。
[例1] 进攻与防守
对称博弈和对称均衡能够大大节省工作量，这也是博弈论中所举例子通常为对称博弈的原因。
对称博弈通俗说就是代表参与者身份的下标，在分析中可以省略掉而没有关系。
四、混合策略
博弈论里面最根本的问题是什么？就是均衡的存在性。如果均衡不存在，所有的工作都成了无用功，之所以引入混合策略，意义就在这里，因为如果仅仅限制在纯策略的范围内讨论博弈的话，均衡有可能是不存在的。
双方争夺一个据点，有两条进攻路线X和Y，攻方有两个军，而防守方也有两个军，只有当守方的兵力不少于攻方时，才能击退进攻，否则据点将会失守。
首先可知守方的防守方案（即策略）为(0,2)，(1,1)，(2,0)，即在X线路和Y线路驻扎军队数，同样可以到的攻方的进攻方案(0,2)，(1,1)和(2,0)。容易看出，行动并非策略，策略是行动方案。
需要注意的几个问题：
（1）表达同一个偏好的收益函数不唯一，但在单调变换下却是唯一的。

博弈论完整浙江大学GAMECha最新课件

博弈论完整[浙江大学]GAME_Cha 最新
下面给出有限次重复博弈的定义
Definition Given a stage game G,let G(T)(T＜∞) denote the finitely repeated game in which G is played T times, with the outcomes of all preceding plays observed before the next play begins. The payoffs for G(T) are simply the sum of the payoffs from the T stage games.
第一阶段的行动组合是(M,M),则第二阶段的行动组合将是(R,R);第一阶段的行动组合是(M,X)或(X， M)，则第二阶段的行动组合将是(P,P)或(Q,Q);第一阶段的行动组合博为弈论其完整[它浙江大，学]G则AME第_Cha二阶段还是(R,R)。
最新
参与人2 LM R P Q
L 4 , 4 5.5 , 4 3 , 3 3 , 3 3 , 3 参
行动组合 Stage 1 Stage 2
支付向量总支付平均支付
（A，B）（2，8）（1，4）（A，B）
（B，A）（5，5）（2.5，2.5）
（A，B）（5，5）（2.5，2.5）（B，A）
（B，A）（8，2）（4，1）
博弈论完整[浙江大学]GAME_Cha 最新
☺路径的支付采用平均支付与采用总支付相比的优点：平均支付可以与阶段博弈的支付相比较。
博弈论完整[浙江大学]GAME_Cha 最新
回忆第二章第四节的“有同时选择的两阶段动态博弈”。
两阶段囚徒困境其实属于这种类型博弈。无非这里的参与人3、4与参与人1、2是相同的，行动空间A3、A4 也与A1 、A2相同，并且总收益 μi(a1,a2, a3, a4)等于第一阶段结果(a1,a2）的收益与第二阶段结果 (a3, a4)的收益简单相加。 ☺在“有同时选择的两阶段动态博弈”中第二阶段参与人3和4的稳定行动依赖于第一阶段的可行结果(a1,a2)，表示为(a3*(a1,a2), a4*(a1,a2))，而不是简单的(a3*, a4*)(关税博弈中第二阶段企业的均衡产量依赖于博政弈论府完整第[浙江一大学阶]GAM段E_Ch所a 选择的关税）.

博弈论(浙江大学,汪淼军)

——以上两个定义是等价的，因为效用函数是战略线性组合
( ) UI (σ ) = ∑σi (Ci ) ⋅Ui σ −i , [ci ]
——所有参与人所有偏离都是无利于图的
5
3.纳什定理 ——任何一个有博弈都存在至少一个纳什均衡纳什均衡证明
——如果 S 是非空紧集凸集，F 是从 S 到 S 连续函数，则至少存在一个 X ，
8
a.一阶条件分析
qi ∈ arg max qi ×[a − c − qi − q j ] 一阶条件为：
a − c − 2qi − q j = 0
所以纳什均衡为： qi = q j = (a − c) / 3
b.剔除严格劣战略
qi
≤
a
− 2
c
⇒
qj
>
a−c 4
依次反复可得：
qi
=
qj
=
a
−c 3
(讨论)
x
A
y
B
x
A
x → y,
y A B
A
x'→ y'
17
3.相互转换 ..性别战
（足,足）（足,芭）（芭,足）（芭,芭）
性别战
足球 1,3 1,3 0,0 0,0
C2 芭蕾 0,0 3,1 0,0 3,1
..赌博博弈
C2
C1
M
P
Rr
0,0
1,-1
Rf
0.5,-0.5
0,0
Fr
-0.5,0.5
1,-1
a. c1 > c2
b. qi = a − pi + bi p j c.生产能力 K 受限， K < a / 2

博弈论全套课件

三. 经典的博弈模型
1、“囚徒的困境”
关于博弈论，流传最广的是一个叫做“囚徒困境 ” 的故事。这个博弈是 1950 年图克（Tucker）提出的，这个博弈模型提出后曾引发了大量的相关研究，也有许多关于“囚徒困境”的版本。“囚徒困境”对博弈论的发展起到了巨大的推动作用。可以说凡是讲博弈论，都会说到这个经典的博弈模型。
在过去二三十年中，博弈论已成为社会科学研究的一个重要方法。有人说，如果未来社会科学还有纯理论的话，那就是博弈论。无论是合作博弈还是非合作博弈都给我们提供了一种系统的分析方法，使人们在其命运取决于他人的行为时制定出相应的战略。特别是当许多相互依赖的因素共存，没有任何决策能独立于其它许多决策之外时，博弈论更是价值巨大。
最近十几年来，博弈论在经济学尤其是微观经济学中得到了广泛的运用, 博弈论在许多方面改写了微观经济学的基础,经济学家们已经把研究策略相互作用的博弈论当作最合适的分析工具来分析各类经济问题，诸如公共经济、国际贸易、自然资源、企业管理等。在现代经济学里，博弈论已经成为十分标准的分析工具。除经济学以外, 博弈论目前在生物学、管理学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。现在已经有愈来愈多的人开始关注、了解并学习博弈理论。
博弈论(Game Theory)是一种关于游戏的理论, 又叫做对策论, 是一门以数学为基础的、研究对抗冲突中最优解问题的学科。事实上，博弈论也正是衍生于古老的游戏，如象棋、围棋、扑克等。
博弈论作为一门学科，是在20世纪50～60 年代发展起来的，当非零和博弈理论、特别是不完全信息博弈理论获得充分发展时，才成为现实。到20世纪70年代，博弈论正式成为主流经济学研究的主要方法之一。1994年诺贝尔经济学奖同时授予了纳什、泽尔腾、海萨尼三位博弈论专家。2005年诺贝尔经济学奖又授予了美国经济学家托马斯．谢林（Thomas Schelling）和以色列经济学家罗伯特．奥曼（Robert Aumann），以表彰他们在合作博弈方面的巨大贡献。

《博弈论入门》课件

博弈论的研究方法与工具
了解博弈论的研究方法和工具对于深入理解和应用博弈论至关重要。
博弈论中的常见概念与术语
学习博弈论需要了解一些常见的概念和术语，例如博弈矩阵、纳什均衡、最优策略等。
博弈论的经典案例分析
通过分析博弈论的经典案例，我们可以更好地理解和应用博弈论的原理。
博弈论在实际决策中的应用
实际决策中经常涉及到多个参与者的利益博弈，博弈论可以帮助我们找到最优决策策略。
总结与展望
通用于实际生活和决策中。
《博弈论入门》PPT课件
博弈论是一门研究决策和策略的学科，适用于各种领域，从经济学到政治学，从生物学到计算机科学。
博弈论基础知识介绍
在这一部分中，我们将探讨博弈论的基本概念和原理，包括博弈模型、策略和解的概念。
博弈论的应用领域
博弈论在现实生活中有许多应用，包括经济学、政治学、社会学、生物学、医学等领域。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

的完美贝叶斯均衡（PBE）。Gibbons
可编辑ppt
9
PBE:Consider a strategy profile for the players, As well as beliefs over the nodes at all informa -tion sets.These are called a perfect Bayesian equilibrium(PBE) if:(1)each player’s strategy specifies optimal actions, given his beliefs and the strategies of the other players and (2)the beliefs are consistent with Bayes’ rule wherever possible.
A.因为原博弈本身不会成为原博弈的后续阶段，因此子博弈不能从原博弈的第一个节点开始，即原博弈不是自己的一个子博弈；
可编辑ppt
3
B.包含所有在初始节点之后的选择节点和终点，但不包含不跟在此初始节点之后的节点；
C.不分割任何的信息集。即如果一选择节点包含在一个子博弈中，则包含该节点的信息集中的所有节点都必须包含在该子博弈中。
可编辑ppt
7
要求3：在处于均衡路径之上的信息集中，推断由Bayes’ rule 及参与者的均衡策略给出.
推断被提高到和策略同等重要的地位。即：一个均衡不再只是由每个参与者的一个策略所构成，还包括了所有参与者在该他行动的每一个信息集中的一个推断.
克雷普斯Kreps和威尔逊Wilson 1982
其次，如果可能的话，运用贝叶斯公式(结合
参与人1的策略)计算q；否则就任意确
定q.
第三，给定q，计算确定参与人2的最优行为；
最后，检验参与人1的策略是否确实是针对参
与人2的策略的最优反应。If so,you have
可编辑ppt
10
理解PBE要注意以下两点：
在NE中，每一个参与人的策略必须是其他参与人策略的一个最优反应，于是没有参与人会选择严格劣策略。在PBE中，要求1和要求2事实上就是要保证没有参与人的策略是始于任何一个信息集的劣策略。
PBE使得参与人的推断明确化了。但这种均衡往往不能像求解SNE那样沿博弈树通过逆向推导而构建出来。求解步骤：P277
要求2：给定参与者的推断，参与者的策略必须
满足序贯理性（sequential rational）的要求。即
在每一信息集中应该行动的参与者（以及参与
者随后的策略），对于给定的该参与者在此信
可编辑ppt
5
息集中的推断，以及其他参与者随后的策略必须是最优反应。（“随后策略”是在达到给定的信息集之后，包括了其后可能发生的每一种情况的完全的行动计划）
如果一个博弈没有子博弈，则子博弈精炼的要求（参与人的策略在每一个子博弈中君构成NE的要求）自然就得到满足，从而在任何没有子博弈的博弈中，SNE=NE。
例子Gibbons P139可编辑ppt
2
(一)不完美信息动态博弈的子博弈
前文中—“由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一个部分”。这个定义实际上隐含了三个方面的含义：
对于前例，要求1和要求2的满足足以使我们排除不合理的均衡（R，R’）。
要求1和要求2只保证了参与人持有推断，并对给定的推断选择最优行动，但并没有明确这些推断是否是理性的。为进一步约束参与人的推断，需要区分处于均衡路径上
可编辑ppt
6
的信息集和不处于均衡路径上的信息集
定义(Definition):对于一个给定的扩展式博弈中给定的均衡，如果博弈根据均衡策略进行时将以正的概率达到某信息集，称此信息集处于均衡路径之上（on the equilibrium path）。反之，如果博弈根据均衡策略进行时，肯定不会达到某信息集，则称之为处于均衡路径之外的信息集（off the equilibrium path）.（其中均衡可以是NE 、SNE、BNE、PBE ）
Game Theory(5)
Dynamic Games of Incomplete Information
PERFECT
BAYESIAN EQUILIBRIUM
可编辑ppt
1
PBE<BNE <SNE<NE
在完全信息静态博弈中，有 PBE=BNE=SNE=NE 一、Introduction to PBE
可编辑ppt
8
要求1-3不仅包括了PBE的主要思想，而且还构成了它的定义。不过，在更为复杂的博弈中，为剔除不合理的均衡，还要引入进一步的要求。
要求4 对处于均衡路径之外的信息集，推断由Bayes’ rule 以及可能情况下的参与者的均衡策略决定。
Definition 满足要求1-4的策略和推断构成博弈
可编辑ppt
11
（三）关于判断形成的进一步解释
先验概率 Initial belief Bayes’Rule
后验概率 Updated belief
贝叶斯公式(conditional belief):
P(A | Bi) P(Bi) P(Bi|A)= 1
Σ
j=1
P(A | Bj) P(Bj)可编辑pptA和B两点针对所有类型的动态博弈，而C 是专门针对不完美信息动态博弈的。
可编辑ppt
4
（二）PBE的要求（Requirement）
要求1：在每一个信息集中，应该行动的参与者必须对博弈进行到该信息集中的每一个节点有一个推断（belief）。对于非单节信息集，推断是在信息集中不同节点的一个概率分布；对于单节点的信息集，参与者的推断就是到达此单一节点的概率为1。
12
☺拥有私人信息的参与人的纯策略类型：
Separating strategy:不同类型行为不同 NFGE 或 GFNE
Pooling strategy:不同类型行为相同 NFNE 或 GFGE
可编辑ppt
13
PBE的求解步骤：
首先，考虑参与人1（拥有私人信息一方）的
策略（pooling or separating）；