博弈论基础PPT精品课程课件全册课件汇总
合集下载
博弈论基础PPT精品课程课件全册课件汇总

自己处于c还是d。即K缺乏信息。 P
c
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
参与人对于结果的偏好性。K是否更希望博弈
终止点f而不是h上结束?
我们必须知道参与人关心什么,才能将终止
点根据每个参与人的偏好排列。通常用数字
表述参与人的偏好排序最为简便。这也称为
1 概述
这个理论在许多方面都是有用的。 首先,它提供了一种语言。 其次,它提供了应该框架,能够指导我们建立策略环 境模型。 其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。
在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
支付(payoff),或者效用(utilities)。
P
c
P
E
N
K
L
a
b
P
N
d
K
S
N
R’ K
e N’
0,140
80,0
0,0
40,110 13,120
2 扩展型
我们引入一些数学符号来考察博弈。
我们来看看一个市场博弈,两个厂商通过选择高价或者低价进行 竞争。
我们用参与人i表示任何一个参与人的数字代码。即在一个有n个 参与人的博弈中,i=1,2,…,n。 在某些博弈中,一个参与人可以在无限多个行动中进行选择。
博弈论基础-A-xjh(共48张PPT)

行动所组成的有序集。
例如:
—— 出门:带伞 或 不带伞 —— 打牌:出牌
信息(information)指局中人在博弈中的知识,特别是有 关其他局中人(竞争者或对手)的特征和行动的知识。
一般地,信息是以信息集(information set)的概念来模型 化的。可以将局中人的信息集看成是其在特定时点对于不同变 量的取值的了解程度。
评论2:在重复博弈中,以往的经历或做法通常就确局定了中聚人点的B位置。
通零俗和地 博说弈,指博在弈博结弈果中总一和组为局零中的人博所弈得称到为的零支左和付博(弈或。收益)恰好是另右一组局中人的损失。
——对产品的了解
(三)划分博弈的主要概上念
2, 1
完 全 信 息——如“石头、剪刀、布”游戏
0, 0
局中人A 完 备 信 息——“石头、剪刀、布”游戏中,你知道对方40%出石头,30%出布,30%出剪刀
林自由大学、比勒菲尔特大学和波恩大学。其主要贡献 是在博弈论中引入了动态分析。
1920年Harsanyi出生于匈牙利,1947年获布达佩斯大学博士 学位,后到 ,1954年获斯坦福大学博士学位,曾先后任教于澳 大利亚国立大学、加州伯克利分校。于2000年去世。他的贡献是 将不完全信息引入了博弈论的研究。
S4=。可以选择的花的品种为3种。
不同的花在不同的气候条件下的收成为:
天气
S1
S2
S3
S4
品种
A1
12
10
9
0
A2
8
8
4
4
A3
161232概率0.2
例如:
出门 ——对天气的判断
打牌
——对其他人的判断 装修
——对产品的了解
例如:
—— 出门:带伞 或 不带伞 —— 打牌:出牌
信息(information)指局中人在博弈中的知识,特别是有 关其他局中人(竞争者或对手)的特征和行动的知识。
一般地,信息是以信息集(information set)的概念来模型 化的。可以将局中人的信息集看成是其在特定时点对于不同变 量的取值的了解程度。
评论2:在重复博弈中,以往的经历或做法通常就确局定了中聚人点的B位置。
通零俗和地 博说弈,指博在弈博结弈果中总一和组为局零中的人博所弈得称到为的零支左和付博(弈或。收益)恰好是另右一组局中人的损失。
——对产品的了解
(三)划分博弈的主要概上念
2, 1
完 全 信 息——如“石头、剪刀、布”游戏
0, 0
局中人A 完 备 信 息——“石头、剪刀、布”游戏中,你知道对方40%出石头,30%出布,30%出剪刀
林自由大学、比勒菲尔特大学和波恩大学。其主要贡献 是在博弈论中引入了动态分析。
1920年Harsanyi出生于匈牙利,1947年获布达佩斯大学博士 学位,后到 ,1954年获斯坦福大学博士学位,曾先后任教于澳 大利亚国立大学、加州伯克利分校。于2000年去世。他的贡献是 将不完全信息引入了博弈论的研究。
S4=。可以选择的花的品种为3种。
不同的花在不同的气候条件下的收成为:
天气
S1
S2
S3
S4
品种
A1
12
10
9
0
A2
8
8
4
4
A3
161232概率0.2
例如:
出门 ——对天气的判断
打牌
——对其他人的判断 装修
——对产品的了解
《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
第十章博弈论初步-PPT精品

▪ 1、纳什均衡的定义:
▪ 设 s(s1, .., .sn)是n人博弈G={ ; S1, .., . Sn u1,.., . un } 的一个策略组合。如果对于每个局中人 i , ui(s1 , ., .s .i 1 , si , si 1 , ., .s .n )≥ ui(s1 , ., .s .i 1 , si, si 1 , ., .s .n )
第十章 博弈论初步 Game Theory
博弈论概述 纳什均衡 序贯博弈与重复博弈 进入威慑
第一节 博弈论概述
▪ 什么是博弈? ▪ 拍卖金钱 ▪ 海盗博弈 ▪ 田忌赛马 ▪ 围棋和象棋
齐王
田忌
上
中
下
上 赢,输 赢,输 赢,输
中 输,赢 赢,输 赢,输
下 输,赢 输,赢 赢,输
一、博弈的基本要素
ui(si,si) ≥ ui(si,si) 对于所有si Si 都成立,则我们称策略组合
s(s1, .., .sn)
是该博弈的一个纳什均衡。
▪ 纳什简介: ▪ 约翰·纳什生于1928年6月13日。父亲是电子工程师
与教师,第一次世界大战的老兵。纳什小时孤独内 向。纳什的数学天分大约在14岁开始展现。他在普 林斯顿大学读博士时刚刚二十出头,但他的一篇关 于非合作博弈的博士论文和其他相关文章,确立了 他博弈论大师的地位。在20世纪50年代末,他已是 闻名世界的科学家了。 ▪ 然而,30岁的时候,纳什和他惟一儿子都罹患精神 分裂症。半个世纪之后,在他妻子(艾利西亚—— —麻省理工学院物理系毕业生)的精心照料下,和 她的儿子一样,纳什教授渐渐康复,并在1994年获 得诺贝尔经济学奖。 ▪ 影片《美丽心灵》是一部以纳什的生平经历为基础 而创作的人物传记片。该片荣获2019年奥斯卡金像 奖。
博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
精品课程《博弈论》PPT课件(全)

人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
博弈论基础知识.ppt

–
The theory of rational choice
–
The action chosen by a decision-maker is at least as good, according to her preferences, as every other available action.
第一讲( 第一讲(续) 博弈论基础知识
The theory of rational choice
Actions Preferences and payoff functions
epresents a decision-maker’s preferences if, for any actions a in A and b in A, u(a)>u(b) if and only if the decision-maker prefers a to b. – A decision-maker’s preferences convey only ordinal information.
Conditional probability and Bayes’s rule
– –
Conditional probability and Bayes’s rule
条件概率: P ( B | A) = P ( AB ) P ( A)
全概率公式:设试验 E的样本空间为 S, A为 E的事件, B1, B2, Bn为 S的一个划分, P ( Bi ) > ( i = 1, 2,⋯ , n), 0 则: P ( A) = P ( A | B1 ) P ( B1 ) + P ( A | B2 ) P ( B2 ) + ⋯ + P ( A | Bn ) P ( Bn ) 贝叶斯公式: P ( Bi | A) = P ( A | Bi ) P ( Bi )
The theory of rational choice
–
The action chosen by a decision-maker is at least as good, according to her preferences, as every other available action.
第一讲( 第一讲(续) 博弈论基础知识
The theory of rational choice
Actions Preferences and payoff functions
epresents a decision-maker’s preferences if, for any actions a in A and b in A, u(a)>u(b) if and only if the decision-maker prefers a to b. – A decision-maker’s preferences convey only ordinal information.
Conditional probability and Bayes’s rule
– –
Conditional probability and Bayes’s rule
条件概率: P ( B | A) = P ( AB ) P ( A)
全概率公式:设试验 E的样本空间为 S, A为 E的事件, B1, B2, Bn为 S的一个划分, P ( Bi ) > ( i = 1, 2,⋯ , n), 0 则: P ( A) = P ( A | B1 ) P ( B1 ) + P ( A | B2 ) P ( B2 ) + ⋯ + P ( A | Bn ) P ( Bn ) 贝叶斯公式: P ( Bi | A) = P ( A | Bi ) P ( Bi )
博弈论最全完整ppt 讲解

完全信息
纳什均衡(NE)
子博弈完美纳什 均衡(SPNE)
不完全信息
贝氏纳什均衡 (BNE)
完美贝氏纳什均衡 (PBNE)及序贯均 衡(SE)
静态博弈与动态博弈
(static games and dynamic games)
同时决策或者同时行动的博弈属于静态 博弈;先后或序贯决策或者行动的博弈, 属于动态博弈
如果一个博弈在所有各种对局下全体参 与人之得益总和总是保持为一个常数, 这个博弈就叫常和博弈;
相反,如果一个博弈在所有各种对局下 全体参与人之得益总和不总是保持为一 个常数,这个博弈就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
威廉·维克瑞, 1914-1996, 生于美国
詹姆斯·莫里斯 1936年生于英国
2001年诺贝尔经济学奖获得者
三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进 行分析”领域做出了重要贡献。
即使决策或行动有先后,但只要局中人 在决策时都还不知道对手的决策或者行 动是什么,也算是静态博弈
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在数学上,有几种方法描述一个博弈:
1 博弈有一组参与人;
2 对于参与人可能采取的行动的完整描述(即它们的 可行行动集); 3 对于参与人采取行动时,所知信息的描述; 4 对于参与人的行为将如何导致博弈结果的规定;
5 对于参与人对结果偏好的定义。
2 扩展型
迪斯尼工作室的《虫子的一生》和梦工场的《蚂蚁》。
我们要学会了解在策略环境下,人们实际上是如何采 取行动的,以及他们应该怎样采取行动。
相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。 这种系统的研究形成了应该策略互动的理论。
1 概述
这个理论在许多方面都是有用的。
首先,它提供了一种语言。
其次,它提供了应该框架,能够指导我们建立策略环 境模型。
1 概述
在所有社会,人们经常互动。
有时,互动是合作,其他的时候,互动是竞争。
在这两种情况下,都可以用一个术语,即相互依赖性 来表示一个人的行为对另外一个人的福利造成的影响 。 相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。
1 概述
策略对于社会的运行来说,是非常基本的。
导言
1.1 什么是博弈论?
博弈论帮助我们理解,决策者互动的情形。
Creates a double record of bank transactions.
Bank reconciliation.
Movie Movie Cricket 2,1 0,0 Cricket 0,0 1,2
2 扩展型
2 扩展型
1 概述
还有2001年获奖的米歇尔 斯彭斯,约瑟夫斯蒂克利 茨和乔治阿克洛夫。
1 概述
目前,博弈论被许多来自不同领域的专业人士使用, 这些领域包括经济学、政治学、法律、生物、国际关 系哲学以及数学。 事实上,大多数情形即包含了冲突元素,也包含了合 作的元素。我们对博弈的组成要有一个广义的理解。 简而言之,博弈是策略环境的正式描述。因此,博弈 论是研究相互依赖情形的正式的方法论。这里,“正 式”是指一种以数学化的精确,以及逻辑上的一致见 长的结构。 利用正确的理论工具,我们可以研究各种情况下的行 为,从而更好地理解经济中的相互作用。
R’
f
K
P h l e N’ N P g
a称为初始点,a,b,c,d,e称为决策点。f,g,h,l,m c 称为终止点。表示博弈的结果。
P E K a S L N K d b
Nmຫໍສະໝຸດ 扩展型我们用信息集来定义参与人在博弈中的决策节点 所拥有的信息。有一些信息集只包括一个节点, 例如在节点a,b。节点c,d则包含在一个信息集中 。每个信息集只能做出一个决策。 而正如在故事中所说的,双方都不知道对方是否 制作影片之前,决定制作自己的影片。虚线表示 P K知道自己处于这两个节点之一,但是不能区分 c 自己处于c还是d。即K缺乏信息。 P
P E K a S L N K N m d b R’ f
K
P c N P h l e N’ g
2 扩展型
我们可以用一个树状结构表示两个公司之间 的互动。树状结构由节点和分支组成。节点 表示事件的发生点,分支表示可以选择的不 同的行为方案。我们用实心圆表示节点,用 连接节点的箭头表示分支。这个树状结构称 为扩展型表述。
精品课程
PPT内容可自行编辑
博弈论基础
授课人:XX XX
参考书
《策略博弈》2th,阿维纳什 迪克西特,苏珊 斯克丝 《策略:博弈论导论》。乔尔 沃森 《博弈论基础》罗伯特 吉本斯
《博弈入门》马丁 奥斯本
研究生: 《博弈论》D. 弗登博格,让 梯若尔 《博弈论》R. 迈尔森 《博弈论教程》M. 奥斯本,A. 鲁宾斯坦
其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
这个理论在许多方面都是有用的。
首先,它提供了一种语言。
其次,它提供了应该框架,能够指导我们建立策略环 境模型。
其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。 在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
卡曾伯格被迪斯尼的老板艾斯纳从派拉蒙招贤,以重 振迪斯尼动画部。
卡氏于1994年8月辞职。不久,艾斯纳接受了提议, 于是《虫子的一生》进入了制作阶段。 大概同时,卡氏与斯皮尔伯格等组建了梦工场。开始 制作《蚂蚁》。 两个工作室是在决定制作两部影片之后,才得知对方 的决定的。
2 扩展型
迪斯尼准备在1998年感恩节期间,发行《虫子的一生 》。而这正是梦工场原定《埃及艳后》的上映时间。 梦工场于是决定,把〉埃及艳后〉推迟到圣诞节。争 取在《虫子的一生》上映之前,让《蚂蚁》上映。
接下去的几十年中,数学 家和经济学家丰富了它的 基础,逐步打造了社会科 学最强大和最有影响力的 工具箱之一。
1 概述
1994年诺贝尔奖颁给了, 在20世纪50-70年代对博 弈论做出了重大贡献的3 位经济学家:约翰· 纳什, 约翰· 海萨尼和莱茵哈特· 泽尔腾。
1 概述
接着荣膺诺贝尔经济学奖 金桂冠的经济学家有,诸 如信息和合约方面的专家威廉维克里和詹姆斯米利 斯(1996年)。
1 概述
在19世纪的前10年,古诺 对寡头模型的均衡进行了 研究。 而埃奇沃思解决了交易经 济中的议价问题。
1 概述
1913年,关于博弈的第一 个定理(关于象棋游戏的 结论)被泽梅罗证明。 接着,博雷尔开创性地提 出了“策略”的概念。
1 概述
博弈论发展的关键事件是 1944年冯诺依曼和奥斯卡 摩根斯坦的著作《博弈论 和经济行为》的出版。此 书奠定了该领域的基石。
最后,《蚂蚁》为梦工场创造了超过0.9亿美元的利 润,而《虫子的一生》确保了超过1.6亿美元的利润。
2 扩展型
让我们用一个数学模型讲述这个故事。为了 把它转化成数学的抽象语言,我们必须对故 事进行适当的简化和程式化。我们的目标应 该是从中分析得出一两个策略要素。 这可以帮助我们从理论学者的角度,理解这 个决策环境。
1 博弈有一组参与人;
2 对于参与人可能采取的行动的完整描述(即它们的 可行行动集); 3 对于参与人采取行动时,所知信息的描述; 4 对于参与人的行为将如何导致博弈结果的规定;
5 对于参与人对结果偏好的定义。
2 扩展型
迪斯尼工作室的《虫子的一生》和梦工场的《蚂蚁》。
我们要学会了解在策略环境下,人们实际上是如何采 取行动的,以及他们应该怎样采取行动。
相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。 这种系统的研究形成了应该策略互动的理论。
1 概述
这个理论在许多方面都是有用的。
首先,它提供了一种语言。
其次,它提供了应该框架,能够指导我们建立策略环 境模型。
1 概述
在所有社会,人们经常互动。
有时,互动是合作,其他的时候,互动是竞争。
在这两种情况下,都可以用一个术语,即相互依赖性 来表示一个人的行为对另外一个人的福利造成的影响 。 相互依赖的情形可称为策略环境。因为人们为了确定 所采取的最优行动,必须考虑他周围的其他人会怎样 选择行动。
1 概述
策略对于社会的运行来说,是非常基本的。
导言
1.1 什么是博弈论?
博弈论帮助我们理解,决策者互动的情形。
Creates a double record of bank transactions.
Bank reconciliation.
Movie Movie Cricket 2,1 0,0 Cricket 0,0 1,2
2 扩展型
2 扩展型
1 概述
还有2001年获奖的米歇尔 斯彭斯,约瑟夫斯蒂克利 茨和乔治阿克洛夫。
1 概述
目前,博弈论被许多来自不同领域的专业人士使用, 这些领域包括经济学、政治学、法律、生物、国际关 系哲学以及数学。 事实上,大多数情形即包含了冲突元素,也包含了合 作的元素。我们对博弈的组成要有一个广义的理解。 简而言之,博弈是策略环境的正式描述。因此,博弈 论是研究相互依赖情形的正式的方法论。这里,“正 式”是指一种以数学化的精确,以及逻辑上的一致见 长的结构。 利用正确的理论工具,我们可以研究各种情况下的行 为,从而更好地理解经济中的相互作用。
R’
f
K
P h l e N’ N P g
a称为初始点,a,b,c,d,e称为决策点。f,g,h,l,m c 称为终止点。表示博弈的结果。
P E K a S L N K d b
Nmຫໍສະໝຸດ 扩展型我们用信息集来定义参与人在博弈中的决策节点 所拥有的信息。有一些信息集只包括一个节点, 例如在节点a,b。节点c,d则包含在一个信息集中 。每个信息集只能做出一个决策。 而正如在故事中所说的,双方都不知道对方是否 制作影片之前,决定制作自己的影片。虚线表示 P K知道自己处于这两个节点之一,但是不能区分 c 自己处于c还是d。即K缺乏信息。 P
P E K a S L N K N m d b R’ f
K
P c N P h l e N’ g
2 扩展型
我们可以用一个树状结构表示两个公司之间 的互动。树状结构由节点和分支组成。节点 表示事件的发生点,分支表示可以选择的不 同的行为方案。我们用实心圆表示节点,用 连接节点的箭头表示分支。这个树状结构称 为扩展型表述。
精品课程
PPT内容可自行编辑
博弈论基础
授课人:XX XX
参考书
《策略博弈》2th,阿维纳什 迪克西特,苏珊 斯克丝 《策略:博弈论导论》。乔尔 沃森 《博弈论基础》罗伯特 吉本斯
《博弈入门》马丁 奥斯本
研究生: 《博弈论》D. 弗登博格,让 梯若尔 《博弈论》R. 迈尔森 《博弈论教程》M. 奥斯本,A. 鲁宾斯坦
其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
这个理论在许多方面都是有用的。
首先,它提供了一种语言。
其次,它提供了应该框架,能够指导我们建立策略环 境模型。
其三,它有助于我们追朔,对行为假设的逻辑推理过 程。
1 概述
好几百年前,数学家就开 始研究室内游戏,试图构 造最优的游戏策略。 在1713年,沃尔德格雷夫 就某种纸牌游戏的解决方 法,与他的同事德莫特和 贝努利进行交流。沃尔德 格雷夫的解决方法,与现 代理论的结论相一致。
卡曾伯格被迪斯尼的老板艾斯纳从派拉蒙招贤,以重 振迪斯尼动画部。
卡氏于1994年8月辞职。不久,艾斯纳接受了提议, 于是《虫子的一生》进入了制作阶段。 大概同时,卡氏与斯皮尔伯格等组建了梦工场。开始 制作《蚂蚁》。 两个工作室是在决定制作两部影片之后,才得知对方 的决定的。
2 扩展型
迪斯尼准备在1998年感恩节期间,发行《虫子的一生 》。而这正是梦工场原定《埃及艳后》的上映时间。 梦工场于是决定,把〉埃及艳后〉推迟到圣诞节。争 取在《虫子的一生》上映之前,让《蚂蚁》上映。
接下去的几十年中,数学 家和经济学家丰富了它的 基础,逐步打造了社会科 学最强大和最有影响力的 工具箱之一。
1 概述
1994年诺贝尔奖颁给了, 在20世纪50-70年代对博 弈论做出了重大贡献的3 位经济学家:约翰· 纳什, 约翰· 海萨尼和莱茵哈特· 泽尔腾。
1 概述
接着荣膺诺贝尔经济学奖 金桂冠的经济学家有,诸 如信息和合约方面的专家威廉维克里和詹姆斯米利 斯(1996年)。
1 概述
在19世纪的前10年,古诺 对寡头模型的均衡进行了 研究。 而埃奇沃思解决了交易经 济中的议价问题。
1 概述
1913年,关于博弈的第一 个定理(关于象棋游戏的 结论)被泽梅罗证明。 接着,博雷尔开创性地提 出了“策略”的概念。
1 概述
博弈论发展的关键事件是 1944年冯诺依曼和奥斯卡 摩根斯坦的著作《博弈论 和经济行为》的出版。此 书奠定了该领域的基石。
最后,《蚂蚁》为梦工场创造了超过0.9亿美元的利 润,而《虫子的一生》确保了超过1.6亿美元的利润。
2 扩展型
让我们用一个数学模型讲述这个故事。为了 把它转化成数学的抽象语言,我们必须对故 事进行适当的简化和程式化。我们的目标应 该是从中分析得出一两个策略要素。 这可以帮助我们从理论学者的角度,理解这 个决策环境。