博弈论概述课件

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

11wenku.baidu.com
博弈的分类和均衡
行动次序
信息
静态
动态子博弈精练纳什均衡泽尔腾精炼贝叶斯均衡泽尔腾等
12
完全信息
纳什均衡纳什贝叶斯均衡海萨尼
不完全信息
第二节博弈的种类
一、完全信息静态博弈
(一)完全信息静态博弈定义所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。
29
三、动态博弈的表现形式—— “博弈树”
①结：结包括决策结和终点结。
②枝：博弈树上，枝是从一个决策结到其直接后续结的连线，每一个枝代表参与人的一个行动选择。在每一个枝旁标注该具体行动的代号。一般地，每个决策结下有多个枝，给出每次行动时参与人的行动空间，即此时有哪些行动可供选择。
③信息集：将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集。
8
(三)博弈的分类
根据参与人的多少，可将博弈分为两人博弈或多人博弈；
根据参与人是否合作，可将博弈分为合作博弈或非合作博弈；根据博弈结果的不同，又可分为零和博弈、常和博弈与变和博弈。
9
1、从行动的先后次序来分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动，或虽非同时但后行动者并不知道前行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。
27
第二节完全信息动态博弈
一、完全信息动态博弈定义完全信息动态博弈指的是各博弈方先后行动，后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈.
28
二、动态博弈的构成要素
(1)参与人集合:I:1，…，n;此外我们以后将用"代表虚拟的参与人——“自然”； (2)参与人的行动顺序:谁在什么时候行动； (3)参与人的行动空间:在每次行动时,参与人有些什么行动可供选择； (4)参与人的信息集:每次行动时,参与人知道些什么； (5)参与人的得益函数:在博弈结束后,每个参与人得到些什么； (6)外生事件(即“自然”的选择)的概率分布。
16
(三)博弈的得益矩阵表示
一个博弈被称为有限博弈，如果：第一，参与人的个数是有限的；
第二，每个参人可选择的策略个数是有限的。
有限博弈的策略式表达及其求解可以方便地用得益矩阵直观地给出。
17
著名的“囚徒困境”的例子
警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判一年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判10年徒刑；果两人都坦白认罪，则他们将被各判8年监禁。问：两个罪犯会如何选择（即是坦白还是抵赖）？
40,50 0,300
打击
-10,0 0,300
从这个例子中我们知道一个博弈可能有多个纳什均衡，而具体哪个均衡会实现，纳什均衡本身不能给出回答,任何有限博弈都存在至少一个纳什均衡，若是无限博弈则不一定。
26
几个博弈案例
1.智猪博弈（占优战略均衡） 2.性别之争（多重纳什均衡） 3.斗鸡博弈； 4.市场阻挠博弈
18
囚徒B 坦白囚徒A 不坦白
坦白不坦白
－8，－8
0，-10
-10，0
－1，－1
19
(四)纳什均衡
1、占优策略均衡。一般来说，由于每个参与人的得益是博弈中所有参与人的策略的函数，因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中，一个参与人的最优策略可能可以不依赖于其他参与人的策略选择，就是说，不论其他参与人选择什么策略，他的最优策略是唯一的，这样的最优策略被称为“占优策略”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。
5
三、博弈论的基本概念
(一)博弈论的定义
博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。
6
(二)博弈的组成要素
一个博弈一般由以下几个要素组成，包括：参与人、行动、信息、策略、得益、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)； 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策； 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排；
7
4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识； 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西； 6、均衡是所有参与人的最优策略或行动的组合；均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。上述要素中，参与人、行动、结果统称为博弈规则，博弈分析的目的就是使用博弈规则来决定均衡。
30
四、动态博弈的特点
1.动态博弈的策略特征：博弈方决策的内容也是决定博弈结果的关键，不是博弈方在单个阶段的行为，而是各博弈方在整个博弈中轮到选择的每个阶段，针对前面阶段的各种情况作出的相应选择和行为的完整计划，以及由不同博弈方的这种计划所构成的组合。这种计划就是博弈方的策略。
31
2.博弈方的非对策性
23
纳什均衡的正式定义
纳什均衡：有n个参与人的战略式表述博弈G＝｛S1 ，…，Sn ；u1, …， un｝，战略组合S*＝（S1*，…，Sn*）是一个纳什均衡，如果对于每一个i，Si* 是给定其他参与人S－i*＝（S1*,…，S-1*， Si+1*…，Sn* ）的情况下第i个参与人的最优战略，即：ui(si*,s-i*)≥ui(siα,s*) 对任意S α∈S ,和任意的 I都成立。 i i i
10
2、从参与人对其他参与人的各种特征信息的获得差异来分，博弈可分为完全信息博弈和不完全信息博弈。
完全信息指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息。将上述两个角度的划分结合起来，我们就得到四种不同类型的博弈，这就是：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈和不完全信息动态博弈。
20
在一个博弈里,如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人会选择劣策略。所以在囚徒困境博弈里，{坦白，坦白}是占优策略均衡。囚徒困境反映了一个深刻的问题,即个人理性与团体理性的冲突。这给我们一个启示,我们学习博弈论，也许更应该研究的是怎样设计一种制度,在满足个人理性的同时,去争取达到“集体理性”。
21
2、严格劣策略的重复剔除
重复剔除严格劣策略”的思路如下：首先找出某个参与人的严格劣策略(假定其存在)，把这个劣策略剔除掉，重新构造一个不包含已剔除策略的新的博弈；重复这个过程，一直到只剩下一个唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解，称为”重复剔除的占优均衡”。注意，上述表述中强调了“唯一”这个词。也就是说，如果重复剔除后剩下的策略组合不唯一，那么该博弈就不是可通过重复剔除劣策略求解的。 22
在信息的占有上，后行动者往往比先行动者更占优势。但所获得的收益不一定比先行动者多。这与单人决策是不同的。 3.策略的可置信性问题：策略是博弈方自己预先设定的，在各个博弈阶段针对各种情况所作的相应行为选择的计划，本身没有强制力，且实施起来有一个过程。在该过程中，根据自己的利益需要，他完全可以改变这个计划，从而存在“相机选择”，产生策略的可置信性问题。
4
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞； 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨，表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特· 奥曼和美国人托马斯· 谢林，以表彰他们在博弈论领域作出的贡献。
34
3.子博弈精炼纳什均衡求法——逆向归纳法求解
3
二、现代经济学与博弈论
从现代的观点来看，经济学是研究人的决策行为的学问。理性人是指有一个很好定义的偏好，在面临给定的约束条件下能最大化自己偏好的人，不考虑竞争对手的决策。价格理论有两个基本假定：1、市场参与人的数量足够多，从而市场是竞争性的；2、参与人之间不存在信息不对称问题（完全竞争、完全信息）。然而在现实生活中，这两个假设在许多情况下是不能被满足。
13
(二)博弈的策略式表达
在博弈论中,一个博弈可以用两种不同的方式来表达：一种是策略式表达:另一种是扩展式表达. 策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。
14
策略式表达又称为标准式表达，在这种表达中，所有参人同时选择自己的策略，所有参与人选择的策略一起决定每个参与人的得益。值得强调的是，这里参与人同时选择的是 “策略”,而不是“行动”。在静态博弈中,于参与人只选择一次,所以策略就等同于行动了。而在动态博弈中，策略是参与人在各个阶段的行动的全面计划。
15
更为准确地讲，战略式表述给出：
1 、博弈的参与人集合： i∈Γ ， Γ=(1,2,…， n)； 2、每个参与人的战略空间：Si i ＝ 1,2,3,…,n； 3、每个参与人的得益函数：ui(s1, …， si…，sn)，i＝1,2,3, …，n。用G＝｛S1，…，Sn；u1, …，un｝代表战略式表述博弈。
博弈论概述课件
1
第一节博弈论的基本概念
一、市场竞争中的博弈二、现代经济学与博弈论三、博弈论的基本概念
2
一、市场竞争中的博弈
在现实经济生活中，许多产业市场是寡头断市场。寡头垄断市场是指少数几家大厂商生产一个产业中的全部或大部分产品，从而形成对一个产业的控制的产业市场。在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。
3．纳什均衡
纳什均衡是完全信息静态博弈解的一般概念，构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略，即没有任何一个策略严格优于纳什均衡策略。当然，逆定理是不存在的。更为重要的是，许多不存在占优策略均衡或重复剔除的占优策略均衡的博弈,也存在纳什均衡。下面，我们给出纳什均衡的正式定义。
32
四、子博弈精炼纳什均衡—— 动态博弈的纳什均衡
1.意义：
“子博弈精炼纳什均衡”，用于区分动态博弈中的“合理纳什均衡”与“不合理纳什均衡”，将纳什均衡中包含有不可置信威胁策略的均衡剔除出去，就是说，使最后的均衡中不再包含有不可置信威胁策略的存在。
33
2.子博弈精炼纳什均衡的定义
子博弈：一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。子博弈精炼纳什均衡定义：对于扩展式博弈的策略组合S*=(S1*，…，Si*,…， Sn*) ，如果它是原博弈的纳什均衡；它在每一个子博弈上也都构成纳什均衡，则它是一个子博弈精炼纳什均衡。
24
指一组给定对手行为前提下对各博弈方存在的最佳选择；在纳什均衡状态下，只要其它参与者不变换策略选择，任何单个参与者不可能单方面通过变换策略来提高他的所获支付。
25
(五)纳什均衡的多重性
在两人的有限策略博弈中,我们还可以简单地用划线法来找出纳什均衡在位者进入者进入不进入默许