博弈论66

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

男
足球芭蕾
博弈论
策略型博弈的实例和解(性别战)
这个博弈中有两个纳什均衡：(足球，足球)和(芭蕾，芭蕾)。就是说，一方去足球场，另一方也会去足球场；类似地，一方去看芭蕾，另一方也会去看芭蕾。在实际生活中，也许是这一次看足球，下一次看芭蕾，如此循环，形成一种默契。这在实际生活中是指，两种互补的活动应该配合，尽管配合的方式可能有很多种。
博弈论
囚徒困境在经济学上的应用
一个非集体理性选择，如纳什均衡(坦白，坦白)，用经济学术语说，其中存在“帕累托改进”的机会。所谓帕累托改进就是说，它在不使另一部分人的境况变得更坏的前提下，至少能改进一部分人的境况。如果不存在帕累托改进的情况，便达到“帕累托最优”。这里，如果两人都选择抵赖，两人的境况都有所改进。所以，(坦白，坦白)不是帕累托最优。集体的理性选择应该是大家都抵赖。但是这个帕累托改进办不到。为什么？因为我们已经验证，(坦白，坦白)这个策略组合正是一个纳什均衡。在一个纳什均衡中，不会有人主动去打破这种格局的。
博弈论
概论
对策思想明确地应用于经济领域，始于Cournot (1838), Bertrand (1883), Edgeworth (1925)等人关于寡头竞争、产量与价格垄断、产品交易行为的研究。然而，作为一门学科的创立，则是以美国数学家冯.诺依曼(John Von Neumann)和经济学家奥斯卡. 摩根斯坦(Oskar Morgenstern)合著的《博弈论与经济行为》(The Game Theory and Economic Behavior) (1944)一书出版为标志，他们奠定和形成了这门学科的理论与方法论基础。
对囚徒B作同样分析：如果囚徒 A的策略是“坦白”，则他采取“坦白”策略为好；如果囚徒 A 的策略是“抵赖” , 他还是采取“坦白”策略好，所以囚徒B对囚徒A的最优反应也是“坦白”。两个最优反应形成了一个策略组合(坦白，坦白)，这就是一个纳什均衡。
博弈论
囚徒困境在经济学上的应用
纳什均衡只说明博弈的稳定性结局。
博弈论
囚徒困境在经济学上的应用
企业竞争而产生的广告资源浪费也是典型例子。如两家寡头竞争，经理们可选择策略是“多做广告” 和“少做广告”，各种策略组合的盈利矩阵如下表:
企业2 企业1
少做广告多做广告
少做广告 30，30 40，10
多做广告 10，40 20，20
企业1最优反应是多做广告，企业2最优反应也是多做广告，因此 ( 多做广告,多做广告 )是一个纳什均衡。这个纳什均衡的结果是大量资源消耗在广告上。
博弈论
目录
一、概念二、基本概念
三、策略型博弈的实例和解
四、纳什均衡五、穷徒困境在经济学上的应用
六、策略型博弈的实例和解（性别战）七、性别战在经济学上的应用八、优超解
九、最大最少策略
显然八盎司的冰淇淋比七盎司的要好。可是实证结果表明，在分别独立现在有两杯哈根达斯冰淇淋，一杯冰淇淋A有七盎司，装在五盎判断的前提条件下，也就是说，不能司的杯子中，一眼看上去似乎满满把这两杯冰淇淋放在一起让消费者进一杯、快要溢出来；另一杯冰淇淋 B是八盎司，但是装在了十盎司的行比较，绝大部分人反而愿意为实际杯子中，看上去似乎还没装满。那分量少的冰淇淋支付更多的钱。么，在你不知道两杯冰淇淋实际分量的情况下，你愿意为哪一份冰淇显然，人们是根据心理喜好，来决淋付更多的钱呢？？？定给不同的冰淇淋支付多少钱的。
* ' * ' ui (si* , s ) u ( s , s ) s i i i i i Si
纳什均衡的思想就是，博弈的理性结局是这样一种策略组合，其中每个局中人选择的策略都已是对其它局中人所选策略的最优反应，所以，谁也没有积极性去选择其它策略。因为每一个局中人均不能因为单方面改变自己的策略而获利，于是谁也没有兴趣主动打破这种均衡。
博弈论
囚徒困境在经济学上的应用
纳什均衡概念的局限性在于，在博弈中有可能纳什均衡不是唯一的。例：两家寡头价格竞争，经理可选择的策略是价格不变或涨价，收益矩阵如下所示：企业2 价格不变涨价价格不变 10，10 100，-30 企业1 涨价 -20，30 140，35
结果发现纳什均衡有两个： ( 价格不变，价格不变 ) 、 ( 涨价，涨价)。博弈中的实际结果取决于首先采取什么行动。如果先前的情况是价格不变，那么这一博奕的预期结果就是价格不变。另外，对有的博弈来说，也可能不存在纳什均衡。
博弈论
策略型博弈的实例和解(性别战)
性别战的例子中有两个纳什均衡，那么，究竟哪一个纳什均衡会实际发生？我们不知道。这里还有一个先动优势(firstmover advantage)，比如说，若男的先买票，两人就会出现在足球场，若女的买票，两人就会出现在芭蕾舞剧院。在囚徒博弈中，我们隐含地假定双方下弈者是同时实施其策略的。性别战中的先动优势表明了另一种类型的博弈，称为顺序性博弈 (sequential game)。在顺序性博弈中，有一名下弈者先博弈行动，然后另一名下弈者要做出反应。先下弈者有先动优势。性别战的例子也有很多应用。企业进入新的市场就是一种顺序性博弈。新企业首先决定是否进入，然后现有企业决定是不管它，还是阻止它的进入。
博弈论
策略型博弈的实例和解(囚徒困境)
例1. 囚徒困境(prisoner’s dilemma)
囚徒B 坦白囚徒A 坦白抵赖抵赖
-8，-8 0，-10 -10，0 -1，-1
博弈论
策略型博弈的实例和解(囚徒困境)
例1.
囚徒困境(prisoner’s dilemma)
这个例子可以看作是非合作博弈现象的一个抽象概括。它讲的是两个嫌疑犯被隔离审讯。他们面临的处境是：如果两人都坦白，各判刑8年；如果两人都抵赖，各判刑1年(或许证据不足)；如果一人坦白另一人抵赖，则坦白的放出去，不坦白的判刑10年，(“坦白从宽、抗拒从严”)。这里，两个囚徒就是两个局中人，每个局中人都有两个策略可供选择：坦白或抵赖。表中每一格的一对数字分别表示局中人不同策略组合的收益，第一个数字是囚徒A的收益，第二个数字是囚徒 B的收益。这种有限对策(局中人是有限个，每个局中人的策略数也是有限的)往往用矩阵形式表示。
博弈论
策略型博弈的实例和解(性别战)
例2.
性别战(battle of the sexes)
一男一女恋爱，有些业余活动要安排，或者去看足球比赛，或者去看芭蕾舞演出。男的偏好足球，女的则更喜欢芭蕾舞，但他们都宁愿在一起，不愿分开。下表给出收益矩阵：女足球 2，1 0，0 芭蕾 0 ，0 1 ，2
博弈论
Hale Waihona Puke Baidu
囚徒困境在经济学上的应用
那么，两个囚徒事先订好攻守同盟，两人都采取抵赖的策略，不是可以改善两人的境遇吗？但问题是，这个攻守同盟有没有意义？没有。原因在于(抵赖，抵赖)这个策略组合不是一个纳什均衡，没有人有积极性去遵守这个协议。一般地，假设博弈中的每个局中人事先达成一项协议，规定了各自的行为规则。如果局中人会自觉遵守这个协议，等于说这个协议构成了一个纳什均衡：给定别人遵守协议的情况下，自己的最好选择就是也遵守协议。相反，一个协议不构成纳什均衡时，它就不可能自动实施，因为至少有一个局中人会违背这个协议。所以，不满足纳什均衡要求的协议是没有意义的。
什么是博弈论？？？
“博弈”字面解就是“丰富多彩的对抗性游戏”。如石头、剪刀、布；鸽派与鹰派等。
博弈是指决策主体人在相互对抗中，对抗双方（或多方）相互依存的一系列策略和行动的过程集合。也可以说博弈就是利用人的主观能动性在多体之间相互作用时作出有利于自己判断的一种行为。
博弈论
概论
博弈论(the Game Theory) ,也就是运筹学中的对策论。对策思想最早产生于我国古代。早在两千多年的春秋时期，孙武在《孙子兵法》中论述的军事思想和治国策略，就蕴育了丰富和深刻的对策论思想。孙武的后代孙膑，为田忌谋划，巧胜齐王，这个著名的“田忌赛马”，就是典型的对策思想的成功运用。
让我们再回到囚徒困境本身。纳什均衡(坦白，坦白 ) 表明两人共同的集体选择，但是这个选择是否是理性的？理性选择是指使收益最大化的选择。如果两人都抵赖，各判刑 1 年，显然比坦白各判刑 8 年好。所以，纳什均衡(坦白，坦白)并不是一个集体理性选择。但它却是个人理性选择的一个组合。囚徒困境正是反映了一个深刻的问题，这就是个人理性与集体理性的矛盾。
博弈论
纳什均衡
在囚徒困境中，考虑囚徒A对他人的最优反应。如果给定囚徒B的策略是“坦白”，那么对囚徒A来说，采取“坦白” 策略得到的收益是 -8，采取“抵赖”策略得到的收益是 -10，显然“坦白”为好；同理，如果给定囚徒B的策略是“抵赖” ，对囚徒A来说，“坦白”也比“抵赖”好。因此，囚徒A对囚徒B的最优反应是“坦白”。
博弈论
策略型博弈的实例和解(囚徒困境) 例1. 囚徒困境(prisoner’s dilemma)
在对博弈局势进行描述后，博弈论分析就是要求出局中人进行策略选择的理性结局，或者说找出博弈问题的解。在非合作博奕中，有两种解的技术：一种是纳什均衡，一种是优超解。
博弈论
纳什均衡
定义1: 给定其它局中人的策略s，局中人i的最优反应记为s，是指能给他带来最大收益的策略，即
博弈论
基本概念
本次讨论博弈论模型的最基本表述方式---策略型表述，它主要用于表现静态对策。这里介绍策略型表述中的基本概念，明确有关术语的准确含义。
博弈论
基本概念
在策略型博弈论，一个对策有以下几种基本要素：
一．局中人(players)：
二．策略 (strategies)：即博奕的参与者，他们是博弈的决策主体行为。根据自己的利益要求决定自己的，记局中人为 i，局三．支付或收益 (payoffs): 即指每个局中人在对策中可以选择采用的行动方中人集合为{1,2,…,I}，即共有I个局中人。我们将某案，但这个方案必须是一个完整的行动，而不是行动是指一局博弈的得失。或者说是局中人从各种策个局中人以外的其它局中人称为“ i的对手”，记为-i 的某一步。每个局中人均有可供选择的多种策略。略组合中获得的效用，它是策略组合的函数。如果。局中人得失的总和为零，则称这种对策为零和对策；否则，称为非零和博弈。
ui (s , si ) ui (s , si ) s s
* i ' i ' i
* i
当每个局中人都选择了自己的最优反应策略，并且这些最优反应形成一个策略组合，便形成了纳什均衡。
博弈论
纳什均衡
定义2: 一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均衡是指，对于所有的 i,
博弈论
性别战在经济学上的应用
例：市场进入阻挠(entry deterrance)
以上的分析告诉我们，用经济学的观点来看，只有由满足个人理性选择的策略组成的集合才是均衡的，或者说只有纳什均衡才是稳定的。
博弈论
囚徒困境在经济学上的应用
看两个寡头合谋与价格卡特尔的情形，它也存在个人理性与集体理性的冲突。
在两个寡头合谋条件下的产量与价格决定，是基于两个寡头利润总和的最大化目标，而不是每个企业自己的利润最大化。因此这种最大化目标下的产量分配符合两家企业的共同利益，却不是使每家企业自己的利润最大化的产量，换言之，并不是每家企业自己的“最优反应”。所以，卡特尔产量分配不是一个纳什均衡。正因为此，卡特尔下一定会有违约冲动，卡特尔具有不稳定性。
博弈论
博弈论是一门内容广泛且复杂的学科，不仅是经济学，政治学、军事、外交、国际关系、公共选择，还有犯罪学等，都涉及到博奕论。实际上，很多人把博弈论看成数学的一个分支，博弈论的一个重要代表人物---纳什(Nash，曾获1994 年诺贝尔经济学奖，该年度的诺贝尔经济学奖授与了三位博弈论专家)，在1951年的一篇奠基性的文章就是发表在数学杂志上，而非在经济学杂志上。这里介绍的是限于博弈论在经济学中的应用。