1 完全信息静态博弈1

合集下载

第11章-博弈论教材全篇

第11章-博弈论教材全篇

田忌
齐王 b1 b2 b3 b4 b5 b6
a1
3 1 1 1 1 1
a2
1 3 1 1 1 1
a3
1 1 3 1 1 1
a4 1 1 1 3 1 1
a5
1 1 1 1 3 1
a6
1 1 1 1 1 3
2-2 具有鞍点的博弈
通过下面的例3说明,什么是局中人的最优纯策略, 如何求出这个纯策略以及博弈解和博弈值的概念。
博弈的三个要素的矩阵表示(局中人A的收益)
局中人B
局中人A

a1
a2

am
b1
c11 c21
cm1

b2
c12 c22
cm 2

bn
c1n c2 n
cmn
局中人A的收益函数可用如下的矩阵表示:
c11
A
c21
cm1
c12 c22
cm 2
c1n c2n
cmn
二人零和博弈也称为矩阵博弈。
博弈论的研究建立在下述假设前提下:即参与博弈 的各局中人都是理性的。
“博弈中一个理性的决策必定建立在预测其他局中人 的反应之上。一个局中人将自己置身于其他局中人的 位置,并为他着想从而预测其他局中人将选择的行为, 在这个基础上该局中人决定自己最理想的行动。”
博弈的三个要素,即局中人,策略集和收益函数 构成了博弈信息,根据不同信息可对博弈做如下 分类:
同样乙方应从收益表中每列找出最大正数(恰为乙 方输掉的数值),为了减少损失,应从这些数字中 求出最小数,它所对应的列策略为乙方的最优纯策 略。
计算过程如下:
对局中人甲,先从每一行中求出最小值
min6,1, 8 8,min3, 2,6 2, min3,0, 4 3,再求出其中的最大值 max8, 2, 3 2。数字2对应的行策略

第一章 完全信息静态博弈

第一章 完全信息静态博弈
规定参与人在什么时候选择什么行动。
一般地,用si表示第i个参与人的一个特定战略,Si={si} 表示第i个参与人的所有可选择的战略的集合 (strategy set)。如果n个参与人每人选择一个战略, n维向量s=(s1,…, si, …sn)称为一个战略组合 ( strategy profile)。
29
2.数学描述
令si’和si’’是参与人i可选择的两个战略 s S , s S
' i i '' i i
如果对于任意的其他参与人的战略组合s-i ,参与人i 从选择si’得到的支付严格小于从选择si’’得到的支付, 即
u (s , s ) u (s , s )si
' i i i '' i i i
囚徒 2 坦 白 坦 白 囚 坦 白 徒 1 抵赖 不坦白 -8, -8 -10, 0 抵赖 不坦白 0, -10 -1, -1
囚徒1:坦白 囚徒2:坦白
两个嫌疑犯的支付矩阵 两个罪犯的支付矩阵
22
1.2纳什均衡
2.占优战略
一般地, 如果对应所有的s-i ,si*是i的严格最优选 择,即:
u (s , s ) u (s , s )
11
6.结果(outcome)
结果是博弈分析者感兴趣的所有东西,如均衡战略组
合,均衡行动组合,均衡支付组合等。
7.均衡(equilibrium)
均衡是所有参与人的最优战略的组合,记为
s*=(s1*,…, si*, …sn*),其中, si*是第i个参与人在均 衡情况下的最优战略,它是i的所有可能的战略中使ui 或Eui最大化的战略。
33
关于智猪博弈的讨论
(1)现实中的例子 小股东搭大股东的便车、股市上的“跟庄”、小 企业对大企业的模仿,公共产品的供给,经济改 革当中存在的问题等都是智猪博弈。 (2)可否改变智猪博弈的结局?

西经第八讲.完全信息静态博弈.ppt

西经第八讲.完全信息静态博弈.ppt

重复剔除劣策略
• 在海战博弈中,将军K认为将军I会选择北, 因为这是弱占优策略,因此,将军K在考虑 中就放弃了I会选择南这个想法。从而博弈 成为:
将军I

K将军

2,-2

1,-1
重复剔除劣策略
• 此时,将军K就有了一个强占优策略-北。 • 因此,策略组合(北,北)就是重复占优
均衡。
重复剔除劣策略
• 剔除严格劣策略与剔除弱被占优策略之间 存在两个区别。
– 其次,剔除弱被占优策略存在多均衡问题。如 果存在占优策略均衡,那么就一定是唯一的。 如果是重复剔除严格劣策略,均衡存在的时候 也一定是唯一的。剔除弱被占优策略就可能存 在多均衡,因为剔除的顺序就很重要。考虑下 面的博弈:
重复剔除劣策略

c1
博弈规则
• 参与人 • 行动 • 支付 • 信息
– 知道对手的支付,但是不知道对手的行动
博弈的标准型表示
• 例如双变量矩阵
囚徒2
沉默 招认
囚徒1 沉默 -1,-1 -9,0
招认 0,-9 -6,-6
求解博弈
• 策略
– 策略与行动不可区分
• 均衡概念
– 占优策略 – 重复剔除严格劣策略 – 纳什均衡
纳什均衡
建模者困境

抵赖
坦白
抵赖 0,0
-10,0

坦白 0,-10
-8,-8
纳什均衡
• (坦白、坦白)是弱占优均衡,也是重复 剔除均衡,也是强纳什均衡。
• 不过,(抵赖、抵赖)是另一个纳什均衡。 这个结果没有上面的均衡强,但是是帕累 托最优。
• 均衡精炼:向基本的均衡概念增加限制, 直到仅仅剩下一个均衡为止。Fra bibliotek纳什均衡

第一章 完全信息静态博弈(博弈论与信息经济学-山西财经大学 景普秋)

第一章 完全信息静态博弈(博弈论与信息经济学-山西财经大学 景普秋)

导论
四、主要参考文献







张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。 Roger B. Myerson 著: Game Theory(原文版、译文 版),中国经济出版社,2001年版。 王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。 艾里克 .拉斯缪森( Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。 因内思· 马可-斯达德勒,J.大卫· 佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。 施锡铨编著,《博弈论》上海财大出版社,2000年版。 谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。 谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。

零和博弈与非零和博弈
(zero-sum game and non-zero-sum game)
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为零,这个博 弈就叫零和博弈; 相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为零, 这个博弈就叫非零和博弈。 零和博弈是利益对抗程度最高的博弈。
迈克尔· 斯彭斯 1948年生于美国的 新泽西,1972年获 美国哈佛大学博士 头衔,现兼任美国 哈佛和斯坦福两所 大学的教授。
约瑟夫· 斯蒂格利茨, 1943年生于美国的 印第安纳州,1967 年获美国麻省理工 学院博士头衔,曾 担任世界银行的首 席经济学家,现任 美国哥伦比亚大学 经济学教授
乔治· 阿克尔洛夫 1940年生于美国的 纽黑文,1966年获 美国麻省理工学院 博士头衔,现为美 国加利福尼亚州大 学经济学教授。

完全信息静态博弈

完全信息静态博弈

三 纳什均衡
n 纳什均衡与占优战略均衡及重复剔除的占优均 衡:
n (1)每一个占优战略均衡及重复剔除的占优均衡一定 是纳什均衡,但并非每一个纳什均衡都是占优战略均 衡或重复剔除的占优均衡;
n (2)纳什均衡一定是在重复剔除严格劣战略过程中没 有被剔除掉的战略组合,但没有被剔除掉的组合不一 定是纳什均衡,除非它是唯一的(不适用于严格弱劣 战略的情况)
第二章 完全信息静态信息博弈-纳什均衡
n 一 占优战略均衡 n 二 重复剔除的占优均衡 n 三 纳什均衡 n 四 混合战略纳什均衡 n 五 纳什均衡存在性及相关讨论 n 六 纳什均衡应用举例
一 占优战略均衡
n 完全信息静态博弈 ü 完全信息:每个参与人对所有其他参与人的特
征(包括战略空间、支付函数等)完全了解 ü 静态:所有参与人同时选择行动且只选择一次。 ü 同时:只要每个参与人在选择自己的行动时不
四 混合战略纳什均衡
n 社会福利博弈
政府
流浪汉
寻找工作 流浪
2 救济 3,
1 不救济 -1,
3 -1,
0 0,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
猜谜游戏
v两个儿童各 拿一枚硬币,
v若同时正面 朝上或朝下, A给B 1分钱,
v若只有一面 朝上,B给A 1分钱。
零和博弈
博弈参与者有 输有赢,但结 果永远是0。
正面 反面
正面
反面
1 -1,
-1 1,
-1 1,
1 -1,
没有一个战略组合构成纳什均衡
四 混合战略纳什均衡
n 警察与小偷
1万元
酒馆 东边
小偷
警察
警察与小偷的最优策略各是什么?

1 完全信息静态博弈

1  完全信息静态博弈

1.4.3委托-代理关系中被设计的囚徒困境


囚徒困境对于人们来说是糟糕的,是应当竭力避免的? 在一些委托-代理关系中,故意创造出代理人之间的囚徒困 境有时对委托人有好处。这样的囚徒困境对于效率来说是 一种促进。 委托-代理关系:通常的含义是委托人请代理人代理某件事 情。其中的关键问题是二者利益不一致,并且委托人与代 理人之间存在信息不对称。为此,需要设计一种制度 (system)或机制(mechanism) ,使代理人在追求自己利益的 同时也最大化委托人的利益,如何设计这样的制度就是信 息经济学研究的问题。
1 完全信息静态博弈



博弈论的基本概念及战略式表述 纳什均衡 纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性与多重性
1.1 博弈论基本概念I
参与人:博弈中的决策主体,i=1,2,·,n · · 虚拟参与人:自然N,表示博弈面临的环境或外生 条件。 行动:ai表示第i个参与人的一个特定行动 Ai={ai}表示可供i选择的所有行动的集合。如, {坦白,抵赖}。 n人博弈中,n个参与人行动的有 序集a称为“行动组合”。如(坦白,坦白), (坦白,抵赖),(抵赖,坦白),(抵赖,抵 赖) 信息:参与人有关博弈的知识,特别是关于“自
供应商 B 8.5 10 供应商 A 8.5 10 125,125 0,250 250,0 200,200
1.5 重复剔除的占优均衡
智猪博弈(Boxed Pigs) : 一头大猪和一只小猪生活在同一猪圈里,共用一食槽。食槽的 一端有一个开关,猪用嘴一拱,食槽的另一端会掉下包子。假 定按一下会掉下10个包子,而跑去按开关的猪会耗费2个包子 的能量。如果小猪按开关,大猪先吃,等小猪按完跑过来时, 大猪会吃掉8个包子,小猪只能吃到2个;如果大猪先按开关, 按完后跑过来,小猪会吃掉4个包子,大猪可以吃到6个;如果 都不去按开关,就会被一起饿死。 小猪 战略式描述 按 等 按 6,0 4,4 大猪 10,-2 0,0 等

完全信息静态博弈教学课件


完全信息静态博弈的解决方法
1
纳什均衡
纳什均衡是指在某个策略配置下,没有参与者希望通过改变自己的策略来获得更多的收益。
2
完美均衡
完美均衡是指在完全信息静态博弈中,每个参与者都做出了最优策略,并且没有其他可行的 更优策略。
3
计算方法
我们将学习计算纳什均衡和完美均衡的方法,并通过案例演示应用技巧。
案例讲解和应用பைடு நூலகம்
完全信息博弈
完全信息博弈是指所有参与者都清楚地知道博弈的规则、对手的策略和每个参与者的收益函数。 我们将探讨完全信息博弈的特点,并了解如何在这种情况下进行决策和制定最优策略。
静态博弈
静态博弈是指所有参与者一次性做出决策,没有机会进行反复决策。 我们将学习静态博弈的概念和分类,为后续的解决方法打下基础。
国际象棋中的博弈
我们将用国际象棋为例,讲解完 全信息静态博弈的应用和分析过 程。
谈判中的博弈
探讨在谈判中的决策制定者之间 如何利用博弈论分析对方策略, 并制定最优的谈判策略。
拍卖中的博弈
了解不同类型的拍卖博弈以及竞 拍者如何制定最佳出价策略。
完全信息静态博弈教学课 件PPT
博弈论是研究决策制定者之间相互影响的数学模型。本课件将介绍完全信息 静态博弈的定义、特点以及解决方法,并通过案例讲解和应用帮助理解。
什么是博弈论?
博弈论研究经济和社会决策制定者之间的相互关系和互动方式。它提供了一种分析和预测决策结果的工具。 我们将深入探讨博弈论的应用和它在现实生活中的重要性。

完全信息静态博弈论模型

完全信息静态博弈论模型引言:博弈论是研究决策制定者在不同利益冲突场景下的行为和策略选择的数学模型。

在博弈论中,静态博弈是指参与者在同一时间点做出决策的情况。

完全信息表示每个参与者对于其他参与者的行为和策略选择都有完全的了解。

本文将介绍完全信息静态博弈论模型的基本概念、解决方法以及应用领域。

一、基本概念1.1 参与者完全信息静态博弈中,有两个或多个参与者,每个参与者可以是个体、团体或国家等。

参与者通过制定决策来追求自身的利益。

1.2 策略每个参与者在博弈中可以选择的行动方案称为策略。

策略可以是纯策略,即只选择一个确定的行动;也可以是混合策略,即以一定概率选择不同的行动。

1.3 支付函数支付函数是衡量参与者在不同策略组合下所获得效用或利益的函数。

支付函数可以表示为参与者的收益、成本或效用。

1.4 纳什均衡纳什均衡是指在博弈中,每个参与者选择的策略组合使得没有参与者有动机改变自己的策略。

换言之,每个参与者都在给定其他参与者的策略下做出最优的决策。

二、解决方法2.1 支付矩阵为了描述参与者之间的策略选择和支付函数之间的关系,可以使用支付矩阵。

支付矩阵是一个二维矩阵,行表示一个参与者的策略选择,列表示其他参与者的策略选择,每个元素表示对应策略组合下的支付函数。

2.2 最优响应最优响应是指在其他参与者的策略下,参与者能够选择的最优策略。

通过计算每个参与者的最优响应,可以找到纳什均衡。

2.3 前瞻性在完全信息静态博弈中,参与者可以通过推断其他参与者的策略和支付函数来做出决策。

前瞻性是指参与者能够预测其他参与者的行为并做出相应的反应。

三、应用领域完全信息静态博弈论模型广泛应用于经济学、政治学、生物学等领域。

3.1 经济学博弈论在经济学中有广泛应用,如市场竞争、定价策略、拍卖等。

完全信息静态博弈模型可以帮助分析参与者的决策行为,预测市场的走势和结果。

3.2 政治学在政治学中,博弈论可以用于分析选举、政策制定和国际关系等问题。

博弈论与信息经济学-1完全信息静态博弈


完全信息 不完全信息
静态
动态
完全信息静态博弈 纳什均衡
纳什(1950,1951)
完全信息动态博弈 子博弈精炼纳什均衡
泽尔腾(1965)
不完全信息动态博弈
不完全信息静态博弈
精炼贝叶斯纳什均衡
贝叶斯纳什均衡
泽尔腾(1975)
海萨尼(1967-1968) Kreps和Wilson(1982)
Fudenberg和Tirole (1991)
博弈论与信息经济学
第一章 完全信息静态博弈
博弈论概述:发展历程
1838年库诺特(Cournot)寡头竞争模型(数量战) 1883年伯川德(Bertrand)寡头竞争模型(价格战) 1944年冯诺依曼和摩根斯坦发表《博弈论和经济行为》 1950年纳什(Nash)提出了纳什均衡的概念。 1965年泽尔腾(Selten)提出了子博弈精炼纳什均衡的
共同知识指“所有参与人知道,所有参 与人知道所有参与人知道,所有参与人 知道所有参与人知道所有参与人知 道…”。
在博弈论中,一般假定参与人的行动空 间Ai和行动顺序是共同知识。
一个关于共同知识的小游戏
A还是B? 两个人的推理过程: 我看到你身上的A,如果我身上是B的话。
因为我们俩至少有一个人身上是A,因此 你因此判断自己身上的是A。但是由于你 没有说,因此我可以断定自己身上是A。
如果n个参与人每人从自己的Si中选择一个策略si, 则向量s=( s1,s2,…,si,…, sn)是一个策略组合 (strategy profile),参与人i之外的其他参与人的策略 组合可记为s-i=( s1,s2,…,si-1 ,si+1 ,…, sn)。
注意:
1. 策略与行动是两个不同的概念,策略是行 动的规则(告诉参与者在什么情况下应该做什 么)而不是行动本身。回顾上章提到的父亲和 女儿的博弈。

博弈论(完全信息静态博弈)


一致预测性是纳什均衡的本质属性,
纳什均衡是稳定的和自我强制的.
二、纯策略NE的求法
1.反复删除严格劣策略 (iterated

elimination of strictly dominated strategies)
严格占优策略 (Strictly Dominant Strategies)

ˆ 不管其他局中人选择怎样的策略, s i 始终是局中 人i 的最优反应。

严格劣策略
局中人2
L U 3,0 1,-1 2,4 M 0,-5 -3,3 4,1 R 0,-4 -2,4 -1,8
局中人1
C D

重复剔除严格劣策略均衡
局中人2
L M R
U
3,0
1,-1 2,4
0,-5
-3,3 4,1
0,-4
-2,4 -1,8
局中人1
C D
S10 S1 {U , C, D}
a11 ... a1n b11 ... b1n A ... ... ... ,B ... ... ... am1 ... amn bm1 ... bmn


可称为双矩阵博弈。 若 A=-B,则称为零和博弈,二人有限零和博弈 可用一个矩阵表示,也称为矩阵博弈。 矩阵博弈的均衡
二、若干例子
1. 俾斯麦海之战(1943)-(p14)
日军上将木村:将日军运送到新西兰 美军上将肯尼:轰炸日军运输船
木村 北线(短) 南线(长) 肯尼 北线 南线 2,-2 1, -1 2,-2 3, -3
例3:智猪博弈(p18)
猪圈有一头大猪、一头小猪,按一下按钮会有 10个单位的饲料,但按按钮要2个成本。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.行动(actions or moves)
行动是参与人在博弈的某个时点的决策变量 一般地,我们用ai表示第i个参与人的一个特定行动, Ai={ai}表示供i选择的所有行动的集合(action set)。在n人 博弈中,n个参与人的行动的有序集a=(a1,…,ai,…an)称为 “行动组合”(action profile),其中的第i个ai是第i个参与 人的行动。
* *
在这个例子中,参与人A有两个 参与人A 战略:SA=(U,D),参与人B有三个战略: SB=(L,M,R)。A的战略中没有一个严格 优于另一个:如果B选择L或M,U是最 优的(1>0),但如果B选择R,D是最优 的(2>0)。然而,对B来说,M严格优于 R,故理性的参与人B不会选择R。如果 参与人A 参与人A知道参与人B是的,R被剔除, A将选择自己的战略,似乎面对的是如 表1.4(b)所代表的博弈。在这个新的中, U严格优于D。这样,如果B知道A是理 性的,并且B知道A知道B是理性的(从 而B知道1.4表(b)是适用的),D将被从 参与人A 其战略中剔除,我们行到如表1.4(C)所 示的博弈。这个博弈实际上是一个单人 决策问题,M严格地LL将被剔除。这样, (U,M)是剩下的唯一的战略组合。
完全的概念。
完美信息(perfect information)是指一个参与人对其他参与人(包括虚拟参与
人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值;
完全信息(complete information)是指自然不首先行动或自然的初始行动被
所有参与人准确观察到的情况,即没有事前的不确定性。
4.战略(strategies);
战略是参与人在给定信息集的情况下的行动规则,它规定 参与人在什么时候选择什么行动。
一般地,我们用si表示第i个参与人的一个特定战略,Si={si}代表第i个 参与人的所有可选择的战略的集合(strategy set)。如果n个参与人 每人选择一个战略,n维向量s=(s1…,si,…sn)称为一个战略组合 (strategy profile),其中si第i个参与人选择的战略。 战略与行动是两个不同的概念,战略是行动的规则而不是行动本身。 在静态博弈中,战略和行动是相同的。 作为一种规则,战略必须是完备的。
s
称为相对于
江西财经大学 陶长琪
重复剔除的占优均衡:战略组合 s * ( s1 , , s n ) 称为重复剔除的占优均衡,如果 重复剔除劣战略后剩下的唯一的战略组合。如果这种唯一的战略组合是存在的,我们说 该博弈是重复剔除占优可解的(dominance solvable)。 参与人B 一个抽象的例子: L M R
8000,0 0,0
(a)高需求情况 开发商B 开发 不开发
开发商A 开发 不开发 -3000,-3000 0,1000 1000,0 0,0
(b)低需求情况
博弈论与信息经济学 江西财经大学 陶长琪
1.2纳什均衡
完全静态博弈是一种最简单的博弈,在这种博弈中, 由于每个人是在不知其他人行动的情况下选择自 己的行动,战略和行动实际上是一回事。 博弈分析的目的是预测博弈的均衡结果,即给定每 个参与人都是理性的(rational)。纳什均衡是完全 信息静态博弈解的一般概念,也是所有其他类型 博弈解的基本要求。
1.2.2 重复剔除 占优均衡
在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合 理的预测,但在绝大多数博弈中,占优战略均衡是不存在的。尽管 如此,在有些博弈中,我们仍可以应用占优的逻辑找出均衡。
博弈论与信息经济学 江西财经大学 陶长琪
在“智猪博弈”的例子中。显然,这个博弈没有占优战略均衡,所以不能应用占 优战略找出均衡。 会选择“等待”。再假定 按 大猪知道小猪是理性的,那么大猪的最优选择只能是 大猪 “按”。这是一个“多劳不多得,少劳不少得”的均 等待 衡。 以上实际上是应用了“重复剔除严格劣战略”的思路 按 等待
“共同知识”( common knowledge)
指的是“所有参与人知道所有参与人知道,所有参与人知道所有参与人知道 所有参与人知道……”的知识。
博弈论与信息经济学 江西财经大学 陶长琪
在现实有许多博弈中,即使所有参与人“共同”享 有某种知识,每个参与人也许并不知道其他参与人 知道这些知识,或者并不知道其他人知道自己拥有 这些知识。
博弈论与信息经济学 江西财经大学 陶长琪
1.2.1占优战略均衡
一个参与人的最优战略可能并不依赖于其他参与 人的战略选择,就是 说,不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最 优战略被称为“占优战略”(dominant strategy).
例如,“囚徒困境”。 一般地,s*i称为参与人i的(严格)占 优战略,如果对应所有的s-i,s*i是i的 严格最优选择,即: 坦白
博弈论与信息经济学 江西财经大学 陶长琪
1.1博弈论的基本概念及战略式表述
1.1.1基本概念
引例:“房地产开发博弈”
你(开发商A )在考虑是否要在北京的某一地段开 发一栋新的写字楼。你面临的选择是开发或者不开发。如 果决定开发,你必须投入1亿资金;如果决定不开发,你 的资金投入为0。开发商B也面临与你同样的决策问题。 假定,如果市场上有两栋楼出售,需求大时,每栋售 价达1.4亿元,需求小时,售价为7千万;如果市场上只有 一栋楼出售,需求大时售价为1.8亿,需求小时为1.1亿, 这样,有以下8种可能的结果:
博弈论与信息经济学 江西财经大学 陶长琪
1.需求大,你开发,他不开 发;你的利润为8千万, 他的利润为0。 2.需求大,你不开发,他开 发;你的利润为0,他的 利润为8千万。 3.需求大,你开发,他也开 发;你和他的利润各为4 千万。 4.需求大,你不开发,他不 开发;你和他的利润为0。
5.需求小,你开发,他不开发; 你的利润为1千万,他的利润 为0。 6,需求小,你不开发,他开发; 你的利润为0,他的利润为1 千万。 7.需求小,你开发,他也开发; 你和他的利润各为-3千万。 8.需求小,你不开发,他不开 发;你和他的利润都为0。
3,1
2,4
7,-1,
0,0
定义:令 s 和 s 任意的其他参与人的战略组合 '' 从选择 s 得到的支付,即:
i
' i
' i
'' si' 是参与人i可选择的两个战略(即 i
s i
u i ( si' , s i ) u i ( si'' , s i )s i
,参与 人从选择 s 得到的支付严格小于 i
博弈论的基本概念包括:参与人、行动、信息、战略、支付 (效用)、结果和均衡 其中 参与人、战略和支付是描述一个博弈所需要的最少的要素, 而行动和信息是其“积木”。参与人、行动和结果统称为“博 弈 规则”(the rules of the game ).
博弈论与信息经济学 江西财经大学 陶长琪
1.参与人(players)
定义: s

s i'is strictly dominated by s i'' ),如果对于所有 s i , ui ( si , s i ) ui ( si'' , s i ) ,且对于某些s i 严格不等式成立。s i''
' s i博弈论与信息经济学 的弱占优战略。
'' ' 弱劣于战略 i ( i '
一个博弈被称为有限博弈(finite game)
如果
第一、参与 人的个数是有限的;第二、每个参与人可选择的战略是有限的
两人有限博弈的 战略式表述可以 用矩阵表来直观 地给出。表1.1是 房地产开发博弈 中开发商A和B 同时行动博弈的 战略式表述
开发商B 开发 不开发
开发商A 开发 不开发
4000,4000 0,8000
博弈论与信息经济学 江西财经大学 陶长琪
6.结果(outcome):结果是博弈分析者所感 兴趣的所有东西,如均衡战略组合,均衡 行动组合,均衡支付组合等。 7.均衡(equilibrium):均衡是所有参与人的 最优战略的组合,一般记为 s*=(s*1,…,s*i ,…,s*n)
其中,s*i是第i个参与人在均衡情况下的最优战略,它是i的所 有可能战略中ui或Eui最大化的战略。
博弈论与信息经济学 江西财经大学 陶长琪
定义:
在博弈的战略式表述中,如果对于所有的i,s*i是i的占优战略, * * * 那么,战略组合 s ( s1 , , s n ) 称为占优战略均衡(dominant-strategy equilibrium)。 占优战略均衡只要求每个参与人是理性的,而并不要求每个参与人知 道其他参与人是理性的(也就是说,不要求“理性”是共同知识)。 囚徒困境反映了一个深刻的问题,即个人与团体理性的冲突。这是 合作博弈与非合作博弈的区别。
第一篇
非合作博弈理论
1. 2.
3.
4.
完全信息静态博弈 完全信息动态博弈 不完全信息静态博弈 不完全信息动态博弈
博弈论与信息经济学 江西财经大学 陶长琪
1.完全信息静态博弈
1.1博弈论的基本概念及战略式表述 1.2纳什均衡 1.3纳什均衡应用举例 1.4混合战略纳什均衡 1.5纳什均衡的存在性和多重性的讨论
Si , si'' Si )。如果对于 '
s i'' ( s i'is strictly dominated by s i'')。通常, 我们说战略 s 严格劣于战略 ' s i'' si s i' 称为相对于 的劣战略;对应地, 称为相对于 的占优战略。占优战 s i'' 略均衡中的占优战略 是相对于所有 的占优战略。 s i* si' si*
相关文档
最新文档