博弈论 第一章
博弈论第一章

1完整信息静态博弈1.0 对策论研究的内容与根本形式对策论研究的内容对策论研究多个行为主体的决议问题。
对策论研究的形式博弈 (game),由多个行为主体组成的系统。
例Stackelberg modelCournot model博弈的种类参加者行动的时间与次序同时行动——静态博弈;先后行动——动向博弈。
参加者的信息多少信息同样——完整信息;信息不一样——不完整信息。
1.1 根本理论 : 博弈的标准式和纳什平衡例 1少儿游戏:“石头、剪刀、布〞。
博弈的准式表示(normal-form representation)(1) 参加人( player).n个参加人: 1, 2, ⋯, i, ⋯, n.(2)略 (strategy).一个参加人的略是他采纳的一个行。
参加人 i 的略: s i.参加人 i 的略空 : S i .略的一个合 : s ={s1,s2, ⋯, s n}.化表示: s-i ={ s1,⋯, s i -1, s i+1, ⋯ , s n }.(3)利润 (payoff).参加人i 的利润: u i= u i(s1,s2, ⋯, s n)n 个参加人博弈的准形式表示:G = {S1, S2,⋯S,n;u1, u2,⋯u,n}完整信息 (complete information) :每个参加人知道其余人的略空和利润。
静博弈(static game):全部的参加人同行。
每一个人行,不知道其余人的行。
例 1〔〕:博弈 {石、剪刀、布 } 的描绘:参加人:1,2。
略空:S1 = S2 = {石、剪刀、布 }利润:两人出手的函数u1 (石,石 ) = 0, u1 (石,剪刀 ) = 1, u1 (石,布 ) = -1⋯u2 (石,石 ) = 0, u2 (石,剪刀 ) = -1,u2 (石,布 ) = 1⋯⋯利润表:两个参加人,有限个略的博弈的表示方法。
P2石头剪刀布石头0 , 01,-1-1 ,1P剪刀-1,10 , 0 1 ,-11布 1 ,-1-1,10 , 0博弈的:可否知道每个参加人的略?例 2: 囚犯窘境 (The Prisoner ’s Dilemma)囚犯2缄默招认缄默-1 ,-1-9 ,0囚犯1招认0 ,-9-6 ,-6囚犯 1 的考:无方缄默是招,自己“招〞好于“缄默〞。
第一章 博弈论概述PPT课件

Game Theory and Information Economics 天津大学管理与经济学部
授课:XXX
1
第一章 博弈论概述 (Game Theory)
授课:XXX
2
一、博弈论的定义
又称对策论,是研究决策主体的行为发生直 接相互作用时的决策以及这种决策的均衡问 题的学科。
➢ 博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
授课:XXX
12
坦白 抵赖
➢ 博弈问题的基本要素
坦白
(1)局中人(Players)
抵赖
参与对抗的各方;不一定指自然人
若二人均不坦白,则只能因藏有枪支而被判刑1年; 若有一人坦白而另一个不坦白,则坦白者无罪释放,
不坦白者 被判刑10年; 若二人都坦白了,则同判8年。 此二人确系抢劫犯,请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8,-8 -10,0
抵赖 0,-10 -1,-1
授课:XXX
均衡解: 二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》,该影片获 得了2002年奥斯卡金像奖的四项大奖
授课:XXX
7
2002年 北京国际数学家大会(ICM)
授课:XXX
8
• 主演
罗素·克劳,Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课:XXX
9
1. 囚犯困境(Prisoners’ dilemma
博弈论-第一章

二、博弈的基本式
如何将博弈表示成一种便于研究和分析的 形式显然是很重要的。如果用参与者、策略 和收益函数来(科学)描述一个博弈,就称 为博弈表达的基本式。
三、博弈的扩展式
博弈的扩展式就是非常详细地描绘出一个 博弈的参与者、策略、行动顺序以及行动时 拥有的信息、可能的结果和收益等细节就称 为博弈的扩展式。
四、信息和顺序
完全信息和非完全信息,完全和非完全 判断的标准就是如果有些信息只有一部分 参与者知道,并不是所有的信息都是公共 信息,那么博弈就是非完全信息博弈。
静态博弈和动态博弈,静态和动态的区 别并不在于时间上是否同时,而是在信息 上的一种同时行动。
公共知识与一般信息的区别。
定义1.2 博弈论是专门研究博弈如何出现均衡的 规律的学科。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
第二节 博弈论的经济学渊源
博弈论与经济学存在着不解之缘,主要是 由于下面几个方面: (1)博弈论的核心问题是经济学最早提出并 加以系统研究的。 (2)博弈论理论发展主要是经济学的需要推 动的,也主要是由经济学家加以发展。 (3)博弈论中的主要问题基本上都涉及到经 济利益冲突问题。
定义1.1 博弈是指利益存在冲突的决策主体(个 人,企业,集团,政党,国家等等)在相互对抗 (或合作)中,对抗双方(或多方)相互依存的 一系列策略和行动的过程集合。
在定义1.1中,我们最需要注意的就是策略的相互 依存性。对于策略的相互依存性,传统的经济学 不是不想研究,而是缺乏有效的工具。从这个意 义上而言,博弈论正是为了解决这一问题而产生 的。也是从这个意义上讲,我们有了博弈论的定 义。
• • • •
1博弈论第一章

n n
n
厂商i的收益:
i 1
qi P( qi ) cqi qi [ P( qi ) c]
i 1
厂商i的收益不仅与自己既定成本和产量有关,还与 其他厂商的产量决策有关。
1.3.1 博弈中的参与人 1.3.2 博弈中的策略 1.3.3 博弈中的收益 1.3.4 博弈的过程 1.3.5 博弈的信息 1.3.6 参与人的能力和理性 1.3.7 博弈的分类
哲理:相生相克,以柔克刚
猜硬币方 正 面 反 面 1, -1 -1, 1 参 与 人 1 石 头 剪 子 布 石 头 0, 0 -1, 1 1, -1 参与人2 剪 子 1, -1 0, 0 -1, 1 布 -1, 1 1, -1 0, 0
盖 硬 币 方
正 面 反 面
-1, 1 1, -1
1.2.3 产量决策Cournot模型
4
2015/12/5
1.3.1 博弈中的参与人
参与人:独立决策、独立承担博弈结果的个 人或组织。只要在一个博弈中统一决策、统一行动、
统一承担结果,不管一个组织有多大,甚至大到一个国家 或多国,都可以作为一个参与人。囚徒困境中的警察、田 忌赛马中的孙膑都不是参与人。
一、单人博弈——只有一个参与人的博弈
严格地讲,单人博弈由于不存在其他参与人的反应和反 作用,因此不属于博弈论的研究对象。但是讨论单人 博弈会使理论更完整,为多人博弈提供基础和启示。 例一:单人迷宫 扩展型
入口 右 A B 0 出口(奖金M) 右 M
A,1
左 B,1
博弈规则面前参与人之间平等,不因参与 人之间权利、地位的差异而改变 参与人数量对博弈结果和分析有影响。根
两个囚徒的收益矩阵
博弈论教程

-5,-5
-10,0
0,-10
-1,-1
2.1.2 严格下策反复消去法(逐步剔除严格劣战略) 例
L M R
U M 8,3 2,1 5,1 8,4 6,2 3,6
D
3,0
9,6
2,8
可以预测该博弈的合理结局为(U,L),即参与人A
选择策略U,而参与人B选择策略L。
2.2 Nash 均 衡 2.2.1 Nash 均 衡 的 定 义 Nash 均衡是指这样的策略组合(或剖面): 为 了 极大化自己的收益(或效用), 每一个参与 人所 采取的策略一定应该是关于其他参与人 所采 取的策略的最佳反应. 因此没有一个参 与人会 轻率地偏离这个策略组合而使自己蒙 受损失。
博
弈
论
第一章 导论
1.1什么是博弈论(Game Theory) 1.1.1 从游戏到博弈
游戏都有一些共同的特点:
1.都具有一定的规则; 2.都有一个结果; 3.策略至关重要; 4.策略和利益有相互依存性
一、博弈论概述
1.1.1 博弈论的定义
博弈论研究的是人与人之间利益相互制约下策略选择时的 理性行为及相应结局。 豪尔绍尼(John C.Harsanyi)1994年诺贝尔经济学奖获 奖致词:博弈论是关于策略相互作用的理论。 博弈论研究人与人之间“斗智”的形式和后果,当人 们利益存在冲突时,每个人所获得的利益不仅取决于自己 所获取的行动,还依赖于其他人采取的行动,每个人都需 要针对对方的行为选择作出对自己最有利的反应。
定 义 在有n个参与人的博弈 G={S1,S2…Sn;u1,u2,…un)中,策略组合 s*=(s1 *,s2 *,…sn *)是一个Nash均衡,如果对于每一 个i, si*是给定其他参与人的选择: S-i*=(s1*,…si-1*,si+1*,…sn*)的情况下,第i个人的最 优策略,即 ui(si*,s-i*)≥ui(si,s-i*) ,对所有的i∈Γ 或者用另一种表示方式,si*是下述最大化问题的 解: si*∈arg ui(s1*,…si-1*,si,si+1*,…sn*),i=1,2,…n S *∈Si 因此,当且仅当没有一个参与人能从单方面背离 某个策略组合的预见中增加自己的得益时,这 个策略组合就是Nash均衡。
北京大学博弈论课件第1章-博弈论概述

第一章 POWERPOINT TEMPLATE
POWERPOINT TEMPLATE
二、博弈的分类
❖ 根据博弈参与者能否达成相互合作的和约束性协议
合作博弈(Cooperative Games) 非合作博弈(Non-Cooperative Games)
完全信息静态博弈(Static Game with Complete Information)
完全信息动态博弈( Dynamic Game with Complete Information)
第一节:博弈的定义和实例
❖ 博弈论(Game Theory)又名对策论 ❖ 博弈理论原本是运筹学的一个重要分支。 ❖ 目前博弈论已发展为一门备受关注的独立学科。 ❖ 博弈的定义
“博弈”指当两个或多个决策主体之间存在相互作用,任何一方 的决策策略(Strategy)都不能完全独立于其他各方策略时, 各方的决策过程及均衡问题。
20 世纪 70 年代,约翰 ·海萨尼(John Harsanyi)和莱因 哈德 ·泽尔腾(Reinhard Selten)等将不完全信息理论融入 到博弈论的研究中。
20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济 学、政治学、生物学、军事学、统计学等领域中。
博弈理论已成为当代经济学理论不可分割的重要组成部分。
如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑
博弈论第一章ppt课件
qj ( j k) 必须使(3)式极大化.于是,令
j 0 , j1,2,,n.
qj
n
于是有 a2bqj b qkc0
(4)
kj1
n
即 bjq acb qk, j1,2,,n (5)
k1 .
n
n
将这 n个式子相加得 b qj n(ac)nb qj
j1
j1
行业的总产量为
n j1
qj
n(ac) b(n1)
设市场需求为
n
pab(qj) a0,b0 j1
(2)
当然a >c(否则会有问题,后面可以看到),由
(1)与(2)两式易知企业 j 的利润为
.
n
j(q1,q2,qn)(ab qj)qjcqj (3) j1
所谓古诺均衡,便是存在一个产量:
q(q1 ,q2 ,,qn )使得每个企业的利润都达到
最大.即当所有别的企业的产量 qk 时q,k
.
1·2 应用举例 古诺(1838年)提出了纳什所定义的均衡(但 只是在特定的双头垄断模型中),但是他并没有 从理论上系统的定义均衡的意义.古诺的研究 被认为是最早的博弈论的经典文献之一. 此模型告诉我们; (1)如何对一个问题的非正式描述转化为一
个博弈的标准式表述; (2)如何通过计算解出博弈的纳什均衡; (3)重复剔除严格劣战略的步骤.
所选战略的函数,假定企业 的i 收益就是其利润
ui(si,sj)i(qi,qj)qi[a(qiqj)c]
i1 ,j2(i2,j1 )
.
一对战略 (s1, s如2)是纳什均衡,则对每个参与
者
i,s
i
应满足:
ui(si,sj)ui(si,sj) (NE)
第1篇 博弈论
囚徒A 囚徒A
坦白 抵赖
不管B 不管B坦白不 坦白, 坦白,我坦 白总是会少 坐一些牢
每一个人的结局不仅取决于自身的选择, 每一个人的结局不仅取决于自身的选择,同时也取决于对 手的选择
School of Mathematics and Computer Science
1.1.1 代表性博弈模型
虽然从两名囚犯共同利益看,最好的选择是合作,即同时 选择保持沉默,然而,由于猜忌,试图获得更大好处等竞 争性动机阻碍了它们达到更好的互利选择。 启示: 启示:个人理性决策常导致集体非理性结果(个人理性与集 体理性之间的矛盾)。 囚徒困境在双寡头垄断、公共产品的供给、军备竞赛等许 多经济学问题中有着广泛的应用。个人理性与集体理性的 矛盾说明了为什么社会中一些大家公认为好的改革却不能 实现,关键在于一项好的制度安排应符合纳什均衡。
小猪 按 等待 按 5,1 9,-1 等待 4,4 0,0
School of Mathematics and Computer Science
大猪
1.1.1 代表性博弈模型
市场中大企业与小企业:他们的关系就类似于 市场中大企业与小企业: 智猪博弈,大企业进行研究开发,为新产品做广告, 智猪博弈,大企业进行研究开发,为新产品做广告, 而对小企业来说,这些工作可能得不偿失,因此, 而对小企业来说,这些工作可能得不偿失,因此, 小企业就将精力放在模仿上, 小企业就将精力放在模仿上,或等大企业用广告打 开市场以后再出售廉价产品。 开市场以后再出售廉价产品。 股票市场中大户与散户:“散户跟大户” 股票市场中大户与散户: 散户跟大户” 股份公司中大股东与小股东:大股东投票, 股份公司中大股东与小股东:大股东投票,小 股东不投票的制度安排是一个均衡结果
博弈论(第一章)
博弈的表述方法的例题
例:囚徒困境博弈的集合表示:G=((坦白,不坦白), (坦 白,不坦白);(-5,-5),(0,-8),(-8, 0),(-1,-1)) 例:在两个公司竞争出售同一产品的博弈中,两个公司是两 个博弈方,两个公司的各自销售量q1,q2是策略空间,
两个公司的所获利润u1(q1,q2),u2(q1,q2)是得
①用损益矩阵表示 例1:故事齐威王与大将田忌赛马,赛马的规则是这样的,每次 双方各出三匹马,一对一比赛三场,每一场的输方要赔1000斤 铜给赢方,齐威王的三匹马和田忌的三匹马按实力都可以分为 上,中,下三等,但齐威王的上,中,下三匹马分别比田忌的 上,中,下三匹马略胜一筹,由于总是同等次的马进行比赛, 因此田忌都是连输三场。实际上,田忌的上马尽管不如齐威王 的上马,却比齐威王的中马和下马要好,而田忌的中马比齐威 王的下马要好一些。因此,田忌的谋士孙膑为田忌出了个主意, 用自己的下马对齐威王的上马,上马对齐威王的中马,中马对 齐威王的下马。这样,二胜一负,田忌反而能赢齐威王1000斤 铜,试写出其标准式表述。
你能否写出上述问题的矩阵形式?
(3)囚徒困境的应用
③ 假定你是一个公司的采购人员,考虑向两家供应商采 购100万只零件,每只零件的成本为6元。如果你分别 向两家供应商各订购50万只,则每个供应商就会把价 格定在10元。你可以设计一个采购策略,以便在两家 供应商之间制造出囚徒困境的情形,从而给自己带来 好处。如何取定这样的采购政策,并写出其矩阵的表 达形式。同时,考虑你的采购策略的使用条件是什么?
低价
80, 80 100, 20
20, 100 50, 50
(3)囚徒困境的应用
② 公共产品的供给也可以看作是一个囚徒困境问题,如 果大家都出钱兴办公用事业,所有的人福利都会增加。 问题是,如果我出钱你不出钱,我得不偿失,而如果 你出钱我不出钱,我可以占你的便宜。所以每个人的 最优选择都是“不出钱”,但是这种状态使得所有人 的福利得不到提高。
博弈论第一章 引言
第一章引言一、博弈的定义二、博弈的要素三、博弈的结构与分类四、博弈的发展历程五、主要应用领域一、博弈的定义博弈就是策略对抗,或策略起关键作用的游戏←博弈Game,博弈论Game Theory,Game即游戏、竞技←游戏和竞技等决策竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦一、博弈的定义一个非技术性定义定义:博弈就是一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
一、博弈的定义1、博弈论是研究决策主体的行为相互作用时的策略以及这种策略均衡问题的理论——张维迎《博弈论与信息经济学》2、博弈论可以定义为对理性决策者之间冲突与合作的数学模型的研究——R.B.Myerson(2007年诺奖得主)《博弈论——矛盾冲突分析》1991年开篇第一句话四个核心方面博弈的参加者(Player)——博弈方各博弈方的策略(Strategies)或行为(Actions)博弈的次序(Order)博弈方的得益(Payoffs)←1、博弈方和局中人:博弈中的决策主体,通过选择行动(或策略)以最大化自己的支付(效用、收益)。
可以是自然人,也可以是团体,比如企业、国家等←2、虚拟参与人(pseudo-player):又称“自然”(nature)指决定外生随机变量的概率分布机制。
比如,市场需求的大小,就业率的高低等等。
←3、策略(战略):相机行动方案(支配参与者在什么时候选择什么行动)。
注:a 战略是行动规则,而不是行动自身;b 静态博弈中,战略等同于行动;c 战略必须是完备的,它要给出参与人在每一种可想象到的情况下的行动选择,即使参与人并不预期这些情况会发生。
←4、支付(收益):参与者策略选择并实施后的结果,是参与人从博弈中获得多少的体现,与策略组合相对应。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 完全信息静态博弈1.0 对策论研究的内容与基本形式对策论研究的内容对策论研究多个行为主体的决策问题。
对策论研究的形式博弈(game),由多个行为主体构成的系统。
例Stackelberg modelCournot model博弈的类型参与者行动的时间与顺序同时行动——静态博弈;先后行动——动态博弈。
参与者的信息多少信息相同——完全信息;信息不同——不完全信息。
1.1 基本理论: 博弈的标准式和纳什均衡例1 儿童游戏:“石头、剪刀、布”。
博弈的标准式表示(normal-form representation)(1) 参与人( player).n 个参与人:1, 2, …, i, …, n.(2) 战略(strategy).一个参与人的战略是他采取的一个行动。
参与人i 的战略:s i.参与人i 的战略空间: S i.战略的一个组合: s ={s1,s2, …, s n}.简化表示:s-i ={ s1,…, s i -1,s i+1, …, s n }.(3) 收益(payoff).参与人i 的收益:u i= u i(s1,s2, …, s n)n个参与人博弈的标准形式表示:G = {S1, S2, …, S n;u1, u2, … , u n}完全信息(complete information):每个参与人知道其他人的战略空间和收益。
静态博弈(static game):所有的参与人同时行动。
每个人行动时,不知道其他人的行动。
例1(续):博弈{石头、剪刀、布} 的描述:参与人:1,2。
战略空间:S1 = S2 = {石头、剪刀、布}收益:两人出手的函数u1 (石头,石头) = 0,u1 (石头,剪刀) = 1,u1 (石头,布) = -1 …u2 (石头,石头) = 0,u2 (石头,剪刀) = -1,u2 (石头,布) = 1 ……收益表:两个参与人,有限个战略的博弈的表示方法。
P2石头剪刀布石头0 ,0 1 ,-1 -1 ,1P1剪刀-1 ,1 0 ,0 1 ,-1布 1 ,-1 -1 ,1 0 ,0博弈的问题:能否知道每个参与人选择的战略?例2: 囚徒困境(The Prisoner’s Dilemma)囚徒 2沉默招认沉默-1 ,-1 -9 ,0囚徒 1招认0 ,-9 -6 ,-6囚徒1的考虑:无论对方选沉默还是招认,自己选“招认”好于“沉默”。
囚徒2的考虑:无论对方选什么,“招认”好于“沉默”。
两人的选择: (招认,招认)。
定义:s i'是s i''的严格劣势战略(strictly dominated),如果:u i(s i',s-i) <u i(s i'',s-i)“沉默”是“招认”的严格劣战略例3:参与人2左中右上 1 ,01,3 3 ,0参与人1 中0, 2 0 ,1 6 ,0下0, 2 2, 4 5, 3参与人1: 没有严格劣战略。
参与人2: “右”严格劣于“中”考虑:重复剔除严格劣战略(iterated elimination of strictly dominated strategies)可预见的两人选择: (下, 中)。
例4: 图 1.1.4参与人2左中右上0 ,4 4,0 5 ,3参与人1 中4, 0 0 ,4 5 ,3下3, 5 3, 5 6, 6两人都没有严格劣战略。
两人会如何选择各自的战略?定义:s * = (s 1*,…,s n *)是一个纳什均衡(Nash equilibrium), 如果u i (s i *,s -i *) ≥ u i (s i ,s -i *)纳什均衡为最大化问题的解ii S s ∈max u i = u i (s 1*, …, s i , …, s n *)各例中的纳什均衡: 囚徒困境: (招认,招认) 例3: (下,中)例4( 图1. 1. 4): (下, 右).纳什均衡与重复剔除严格劣势战略的关系: 没有被剔除的唯一的战略组合是纳什均衡.如果战略是一个纳什均衡,它们在重复剔除严格劣势战略后留下.多个纳什均衡例5 性别战 (the battle of the Sexes)帕特 歌剧 拳击歌剧 2 ,1 0 ,0克里斯拳击 0 ,0 1 ,2纳什均衡: (歌剧,歌剧),(拳击,拳击)1.2 应用例 古诺双头垄断模型(Cournot Model of Duopoly )二个企业,生产产量: q 1, q 2市场需求: P = a – Q , Q = q 1 + q 2 企业成本: C i (q i ) = cq i , i = 1, 2.企业利润:πi (q 1, q 2) = Pq i – C i (q i ) = (a – (q 1 + q 2))q i – cq i , 博弈的描述:参与人:企业1,企业2 战略:产量 q i 收益:πi (q 1, q 2) 企业 i 选择产量求ii S s ∈max πi (s i , , s j *):一阶条件11dq d π = a – c – 2q 1 – q 2* = 0 和22dq d π = a – c –q 1* –2q 2 = 0 厂商选择自己利润最大的产量q 1 =22q c a -- q 2 =21q c a -- 解纳什均衡得q 1* = q 2* =3ca -利润π1 = π2 = ( a – c – (3c a -+3c a -))3ca - = 9)(2c a -当 u i 是可微分的时候 , 纳什均衡为下列方程组的的解:in i s s s s u ∂∂),...,,(21= 0, i = 1,…, n思考:用重复剔除严格劣势战略求纳什均衡 比较:如果两个厂商生产q 1 = q 2 =4ca - 利润π1 =π2 = ( a – c – (4c a -+4c a -))4ca - = 8)(2c a -例 贝特兰德双头垄断模型(Bertrand Model of Duopoly ) 两个企业生产有差别的商品。
消费者对企业 i 的需求q i (p i , p j ) = a – p i + bp j , 成本: C i (q i ) = cq i , i = 1, 2. 战略 s i : p i ≥ 0收益: πi (p i , p j ) = (a – p i + bp j )( p i – c )纳什均衡 (p 1*, p 2*) 满足max πi (p i , p j *) = max (a – p i + bp j *)( p i – c )解得 p 1* = p 2* = bca -+2例 最后要价仲裁 (Final-offer Arbitration)一个企业和一个工会,通过一个仲裁人决定工资。
企业和工会同时提出工资: w f, w u仲裁人有一个标准:x,选择双方提议中比较靠近x的提议:如果x < ( w f + w u )/2,则w f如果x > ( w f + w u )/2,则w uw f(w f + w u )/2x w u企业和工会不知道x,但知道x的分布函数F(x)和密度函数f(x)。
分析w f 被选择的概率:Prob {x <2ufww+} = F⎪⎪⎭⎫⎝⎛+2ufwww u被选择的概率:Prob{ x >2ufww+} = 1 –F⎪⎪⎭⎫⎝⎛+2ufww期望工资Ew = w f F⎪⎪⎭⎫⎝⎛+2ufww+ w u 1 –F⎪⎪⎭⎫⎝⎛+2ufwww f* 满足fwm in w f F⎪⎪⎭⎫⎝⎛+2*ufww+ w u* 1 –F⎪⎪⎭⎫⎝⎛+2*ufwww u* 满足uwmax w f*F⎪⎪⎭⎫⎝⎛+2*ufww+ w u 1 –F⎪⎪⎭⎫⎝⎛+2*ufww由一阶条件F⎪⎪⎭⎫⎝⎛+2ufww+21wf f ⎪⎪⎭⎫⎝⎛+2ufww-21wu f ⎪⎪⎭⎫⎝⎛+2ufww= 021wf f ⎪⎪⎭⎫⎝⎛+2ufww+ 1 - F⎪⎪⎭⎫⎝⎛+2ufww-21wu f ⎪⎪⎭⎫⎝⎛+2ufww= 0 由此解出工资的均衡提议。
两式相减F⎪⎪⎭⎫⎝⎛+2ufww=21两式相加w u*f ⎪⎪⎭⎫⎝⎛+2ufww–w f*f ⎪⎪⎭⎫⎝⎛+2ufww= 1如果x为正态分布: x ~ N(m, σ2)2**ufww+= mw u* –w f*=)(1mf= 22πσ,纳什均衡w u* = m +2/2πσ, w f* = m–2/2πσ例公共财产问题一个村庄,有n个村民,在公共草地上放羊。
村民i放牧的羊数:g i全村的羊总数:G = g1+ ... + g n养一只羊的(私人)成本为c,一只羊的价值为v(G)当G < G max, v(G) > 0, v'(G) < 0, v''(G) < 0当G > G max , v (G ) = 0每个村民选择养羊数量使自己收益最大g i v (G ) – cg i 一阶条件v (G ) + g i v ' (G ) – c = 0, i = 1,..., n 将n 个等式相加得到nv (G ) + G v ' (G ) – nc = 0 即纳什均衡G 1满足v (G 1) +nG 1v ' (G 1) – c = 0 全村在总收益最大的放牧数G 2满足max G 2 v (G 2) – cG 2 一阶条件v (G 2) + G 2 v ' (G 2) – c = 0 G 1与 G 2哪一个大? G1大vv (G ) O G max GG v ' (G )/nv' (G)G v' (G)决策问题:在条件变差时, 收益上升还是下降?在通常的(一人)决策中,如果有几个选择,决策者选择收益最大的一个。
如果外界条件改变,使他的一个或几个收益下降,则它无论怎样选择,都不会使收益比原来更大。
例在一块田里选择种植的(纯)收入:棉花3000元花生3700元玉米3500元如果成本上升,收入变为棉花3000元花生3200元玉米3400元人决策收益通常下降例在多人决策时的收益下降与增加(1)初始时参与人 2T1T2S15,48,3参与人1S2 4 ,3 6 ,5均衡为(S1,T1),参与人1的收益为5。
(2)外界条件使参与人1在选择S1时的收益下降参与人2T1T2S13,45,2参与人1S24, 3 6,5均衡变为(S2,T2)参与人1的收益为6。
多人决策时,收益可能上升。
1.3 混合战略和均衡的存在例1 儿童游戏:“石头、剪刀、布”不存在纳什均衡。
如何选择战略?例6 猜硬币(Matching Pennies)参与人2正面反面正面-1,1 1,-1参与人1反面1,-1 -1,1也不存在纳什均衡。