南开大学 博弈论简介ppt课件
合集下载
第一章 博弈论概述PPT课件

博弈论与信息经济学
Game Theory and Information Economics 天津大学管理与经济学部
授课:XXX
1
第一章 博弈论概述 (Game Theory)
授课:XXX
2
一、博弈论的定义
又称对策论,是研究决策主体的行为发生直 接相互作用时的决策以及这种决策的均衡问 题的学科。
➢ 博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
授课:XXX
12
坦白 抵赖
➢ 博弈问题的基本要素
坦白
(1)局中人(Players)
抵赖
参与对抗的各方;不一定指自然人
若二人均不坦白,则只能因藏有枪支而被判刑1年; 若有一人坦白而另一个不坦白,则坦白者无罪释放,
不坦白者 被判刑10年; 若二人都坦白了,则同判8年。 此二人确系抢劫犯,请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8,-8 -10,0
抵赖 0,-10 -1,-1
授课:XXX
均衡解: 二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》,该影片获 得了2002年奥斯卡金像奖的四项大奖
授课:XXX
7
2002年 北京国际数学家大会(ICM)
授课:XXX
8
• 主演
罗素·克劳,Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课:XXX
9
1. 囚犯困境(Prisoners’ dilemma
Game Theory and Information Economics 天津大学管理与经济学部
授课:XXX
1
第一章 博弈论概述 (Game Theory)
授课:XXX
2
一、博弈论的定义
又称对策论,是研究决策主体的行为发生直 接相互作用时的决策以及这种决策的均衡问 题的学科。
➢ 博弈分析的基本假设 (1)个人理性 假设当事人在决策时能够充分考虑他所面临 的局势,并能做出合乎理性的选择。
(2)最大化自己的收益 假设当事人在决策时通常选择使自己收益最
大化的策略。
授课:XXX
12
坦白 抵赖
➢ 博弈问题的基本要素
坦白
(1)局中人(Players)
抵赖
参与对抗的各方;不一定指自然人
若二人均不坦白,则只能因藏有枪支而被判刑1年; 若有一人坦白而另一个不坦白,则坦白者无罪释放,
不坦白者 被判刑10年; 若二人都坦白了,则同判8年。 此二人确系抢劫犯,请分析他们的抉择。
Ⅱ
坦白
Ⅰ
抵赖
坦白 -8,-8 -10,0
抵赖 0,-10 -1,-1
授课:XXX
均衡解: 二人均坦白
11
相关概念介绍
他的故事被好莱坞拍成了电影《美丽心灵》,该影片获 得了2002年奥斯卡金像奖的四项大奖
授课:XXX
7
2002年 北京国际数学家大会(ICM)
授课:XXX
8
• 主演
罗素·克劳,Russell Crowe
詹妮弗·康纳利, Jennifer Connelly
授课:XXX
9
1. 囚犯困境(Prisoners’ dilemma
博弈论简介PPT

1.3博弈论的理论体系
核心是策略选择
非合作博弈理论
博 弈 论
承诺的强制力不同 不 完 全 信 息 静 态 博 弈 不 完 全 信 息 动 态 博 弈
合作博弈理论
完 全 信 息 静 态 博 弈
完 全 信 息 动 态 博 弈
核心是利益分配
二、完全信息静态博弈
在博弈论中由抽象出来现实博弈中的最基本要素所构成的模型就 是所谓的策略型,或称标准型博弈。是整个博弈论的基石
多种定义:
(1)以严格的数学模型对人类斗智现象进行规范描述,并加 以数学分析。 (2)博弈论是关于策略相互作用的理论,就是说,它是关于 社会形势中理性行为的理论,其中每个局中人对自己行动的选择必须 以他对其他局中人将如何反应的判断为基础。——豪尔绍尼,1994诺 贝尔经济学奖得主 (3)博弈论研究的是人与人之间利益相互制约下策略选择时 的理性行为及相应结局。
引入市场进入博弈事例:
一种行业有两个相关企业,一个是垄断者(局中人1),另一个 是潜在的进入者(局中人2),局中人1决定是否建立一个新工厂, 而同时局中人 2决定是否进入这一行业。其中存在着不完全信息,局 中人2不知道局中人1的建厂成本是3还是1,而局中人1知道自己的成 本。这样形成的不完全信息博弈局势如下图。
豪尔 绍尼 转换
3.2联合概率分布实例
内容:
两个企业在一种产品市场竞争,它们彼此不清楚对方对 于相关事务的真实力量,而只知道自己的力量,双方力量的 不同会导致双方使用策略不变的情况下最终结局的不同。这 种局势的简化描述为:双方均有两种类型,即力量的强与 弱。
联合概率分布:
强 强 弱 0.3 0.1 弱 0.2 0.4
如果企业1为“强”类型,那么它对企业2的类型判断依据贝叶斯推断 原则有:企业2为“强”类型的概率为0.3/(0.3+0.2)=0.6;企业2为 “弱”类型的概率为0.2/(0.3+0.2)=0.4.而当企业1为“弱”时,它对企业2 类型的主观判断为企业2为强与弱的概率分别为0.2和0.8。以此类推。
《博弈论》课程ppt课件

10
图1 进攻与防守的基本式 G={N, S, u},其中N=(1,2), Si={(0,2),(1,1),(2,0)},ui (s1, s2) = ri,i = 1, 2。
守方 (0,2) (1,1) (2,0)
(0,2)
攻方 (1,1)
失败,成功
成功,失败
成功,失败
失败,成功
成功,失败
成功,失败
《博弈论》课程
(一)什么是博弈论
我们首先看几个例子。 例1 石头、剪刀、布
猪八戒
石头 石头 孙悟空 剪刀 布 未定,未定 找水,休息 休息,找水 剪刀 休息,找水 未定,未定 找水,休息 布 找水,休息 休息,找水 未定,未定
2
例2 诺曼底登陆
德军
加来设防 加来登陆 盟军
诺曼底登陆 成功,失败
诺曼பைடு நூலகம்设防 成功,失败
9
例4 进攻与防守 双方争夺一个据点,有两条进攻路线X和Y, 攻方有两个军,而防守方也有两个军,只有 当守方的兵力不少于攻方时,才能击退进攻, 否则据点将会失守。首先可知守方的防守方 案(即策略)为(0,2),(1,1),(2,0),即在X 线路和Y线路驻扎军队数,同样可以到的攻 方的进攻方案(0,2),(1,1)和(2,0)。容易看出, 行动并非策略,策略是行动方案。
正是由于博弈论将博弈如何出现均衡列为核心, 因而博弈论对于各门社会科学而言,就具有了方 法论意义,成为各门学科的有力分析工具。
6
(二)博弈表达的科学式
(1)博弈的策略式
如何将博弈表示成一种便于研究和分析的形式显然 是很重要的。如果用参与者、策略和收益函数来 科学地描述一个博弈,就称为博弈表达的策略式 (或基本式、标准式)。
博弈论及经典案例简介PPT课件

⑶ 上策均衡是纳什均衡的一种特殊情况,但纳什均 衡却不一定是上策均衡。
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。 合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之。虽与之俱学, 弗若之矣。为是其智弗若 与?吾曰:非然也。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。
13
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形成了别具风情的博弈文化
-
纳什均衡的意义
21
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。 合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。
– 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
-
博弈论研究对象 10
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
-
博弈论的产生和发展 12
1. 博弈在中国
-
《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之。虽与之俱学, 弗若之矣。为是其智弗若 与?吾曰:非然也。
其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作 博弈理论的重大发展,甚至可以说是一场革命。
-
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。
13
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形成了别具风情的博弈文化
大学课程《博弈论及其应用》PPT课件:第一章

2021/11/19
• 博弈方:两个嫌疑犯A和 B。 • 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 • 收益:对应于每种策略组合,有相应的收益结果。 • 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种
情况(括号中前面是A的策略,后面是B的策略)。 • 每个策略组合对应下的A的结果,从优到劣,依次为: • (坦白,不坦白),结果是A被释放; • (不坦白,不坦白),A被判刑1年; • (坦白,坦白),各被判5年; • (不坦白,坦白),A被判8年。 • 同理,每个策略组合对应下的B的结果,从优到劣,依次为: • (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦
第一章 博弈概述
2021/11/19
第一节 海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有 月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩 的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商 贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等 。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在 沙滩上应该如何分布两个小商贩的位置呢?
• A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。
• 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择 ,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而 你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最 坏的策略。
2021/11/19
第三节 博弈论是什么
• 博弈论:就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素: • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌 疑犯面临的同样的动机。
• 博弈方:两个嫌疑犯A和 B。 • 策略: 每个嫌疑犯的行动集是(坦白,不坦白)。 • 收益:对应于每种策略组合,有相应的收益结果。 • 策略组合:嫌疑犯A和B从可以选择的策略中选择并实施,有四种
情况(括号中前面是A的策略,后面是B的策略)。 • 每个策略组合对应下的A的结果,从优到劣,依次为: • (坦白,不坦白),结果是A被释放; • (不坦白,不坦白),A被判刑1年; • (坦白,坦白),各被判5年; • (不坦白,坦白),A被判8年。 • 同理,每个策略组合对应下的B的结果,从优到劣,依次为: • (不坦白,坦白)、(不坦白,不坦白)、(坦白,坦白)、(坦白,不坦
第一章 博弈概述
2021/11/19
第一节 海滩占位问题
我们来到海滩。夏天很多游客喜欢在在海边晒太阳,游泳。海滩有 月牙形,弧形,绵延数公里。为了研究问题方便,我们姑且把海滩 的长度抽象定为1,[0,1]区间就表示海滩的长度。 A和B是两个小商 贩,出售无差异的补给品,同质同价,同一品牌的矿泉水,面包等 。“*”表示游客均匀的分布在海滩上,游客就近购买补给品。在 沙滩上应该如何分布两个小商贩的位置呢?
• A猎兔,B猎兔,鹿逃掉,A收益一只兔子,B收益一只兔子。
• 可见,每个猎人的期望,不能由自己决定,要看对方的策略选择 ,是能够捉得到鹿,依赖对方的选择,如果对方选择捉兔子,而 你选择猎鹿,这个策略组合,对你而言,是最差的选择,也是最 坏的策略。
2021/11/19
第三节 博弈论是什么
• 博弈论:就是关于包含相互依存情况中理性行为的研究。 • 博弈的三要素: • 博弈方----参与博弈但利益不完全一致者。有二人博弈与多人博弈
的故事,它的重要性在大量情形中体现,参与者面临着与故事中嫌 疑犯面临的同样的动机。
博弈论完整版PPT课件

ac 3
纳什均衡利润为:
Π1NE
Πቤተ መጻሕፍቲ ባይዱ
NE 2
(a c)2 9
.
31
q2 a-c
(a-c)/2 (a-c)/3
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
国外经济学教科书改写,加入大量博弈论内容
博弈论进入主流经济学,反映了:
经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设
经济学的研究对象越来越转向人与人之间行为的相互影响和作用
经济学越来越重视对信息的研究
传统微观经济学的工具是数学(微积分、线性代数、统计学),而
博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异
不完全信息
静态
纳什均衡
(纳什)
贝叶斯纳什均衡
(海萨尼)
.
动态
子博弈精练纳什均衡
(泽尔腾)
精练叶贝斯纳什均衡
(泽尔腾等)
9
博弈的分类
根据参与人是否合作
根据参与人的多少
根据博弈结果
根据行动的先后次序
两人博弈 多人博弈
静态博弈 动态博弈
合作博弈 非合作博弈
零和博弈 常和博弈 变和博弈
根据参与人对其他参与人的
4-阶理性:C相信R相信C相信R相信C是理性的,C会将R1从R的战略空间 中剔除, C不会选择C3;
5-阶理性:R相信C相信R相信C相信R相信C是理性的,R会将C3从C的战
精品课程《博弈论》PPT课件(全)

人博弈 两人博弈有多种可能性,博弈方的利益方向可
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
能一致,也可以不一致
三、多人博弈
三个博弈方之间的博弈 可能存在“破坏者”:其策略选择对自身的利
益并没有影响,但却会对其他博弈方的利益产 生很大的,有时甚至是决定性的影响。申办奥 运会是典型例子。 多人博弈的表示有时与两人博弈不同,需要多 个得益矩阵,或者只能用描述法
动态博弈、重复博弈。
静态博弈:所有博弈方同时或可看作同时选择 策略的博弈 —田忌赛马、猜硬币、古诺模型
动态博弈:各博弈方的选择和行动又先后次序 且后选择、后行动的博弈方在自己选择、行 动之前可以看到其他博弈方的选择和行动 —弈棋、市场进入、领导——追随型市场 结构
重复博弈:同一个博弈反复进行所构成的博弈, 提供了实现更有效略博弈结果的新可能 —长期客户、长期合同、信誉问题
博弈论
孔融四届时,有一夛,父亭乘了冩丢梨回宛,
陶谦吏亸叹孜癿时俳,又问亸:“亵绉泶孜癿 觇
店看,佝觏为叴小梨刁算叾?”孔融回答该: “我丌
过觑了一次梨,哏哏単因此爱抋了我一辈子, 社伕
乔绎了我杳高癿荣觋。奝杸抂觑出癿遲丢多梨 看俺
昤道徇成本,简直就昤一本万利唲!
阿克洛夫:买卖
主对于要交易的“旧 车”存在信息不对称, 买主通常不愿意出高 价,这样持有好车的 买主只好退出市场, 市场上都剩下“坏 车”,买主则越来越 不愿意光顾,旧车市 场萎缩直至消失。
20 (q1 q2 q3)
0
i P qi [20 q1 q2 q3 ] qi
No Q 20
Q 20
Image
q1
q2
q3
P
1
2
3
4
8
6
2
8
16
《博弈论的基本概念》课件

智猪博弈
• 总结词:描述大猪和小猪在食槽附近争夺食物的策略博弈。
• 详细描述:在智猪博弈中,一个大猪和一个小猪共同生活在一个猪圈里,食槽位于猪圈的一端。每次食物被放入食槽时 ,大猪和小猪都有两种选择:冲向食槽或继续等待。如果大猪选择冲向食槽,小猪的最佳策略是等待,因为大猪吃掉大 部分食物后,小猪可以享用剩余的食物。相反,如果小猪选择冲向食槽,大猪的最佳策略也是等待,因为小猪可能无法 抢到任何食物。因此,无论大猪如何选择,小猪的最佳策略都是等待;同样地,无论小猪如何选择,大猪的最佳策略也 是等待。
合作博弈
特征
强调合作、协议和联盟,目标是实现共同利益。
应用领域
国际关系、商业合作、团队协作等。
非合作博弈
特征
强调竞争、自利和策略互动,目标是实现个人利益。
应用领域
市场竞争、个人决策、政治选举等。
动态博弈
特征
强调行动的顺序和信息传递,策略和 行动需考虑时间因素。
应用领域
商业竞争、投资决策、谈判策略等。
《博弈论的基本概念》ppt课件
目录
• 博弈论简介 • 博弈论的基本类型 • 博弈论的基本概念 • 博弈论的经典案例 • 博弈论的未来发展
01
博弈论简介
博弈论的定义
01
博弈论:研究决策主体在相互影 响、相互作用的环境中如何进行 决策,以及这种决策的均衡结果 的学科。
02
博弈论强调参与者之间的互动关 系,通过数学模型和理论分析来 研究策略选择和均衡结果。
应用领域:拍卖机制设计、保险市场 分析、医疗资源分配等。
03
博弈论的基本概念
参与者
01
02
03
参与者
在博弈中,参与者是决策 的主体,可以是个人或组 织。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论简介
ppt课件
1
第一节 博弈论的基本概念
一、市场竞争中的博弈 二、现代经济学与博弈论 三、博弈论的基本概念
ppt课件
2
一、市场竞争中的博弈
在现实经济生活中,许多产业市场是寡 头断市场。寡头垄断市场是指少数几家大厂 商生产一个产业中的全部或大部分产品,从 而形成对一个产业的控制的产业市场。
在分析寡头垄断市场中的企业决策行为 时,就必须把各种决策者之间的策略相互作 用纳入到经济模型中,这就是一种博弈分析。
3、每个参与人的得益函数:ui(s1, …, si…,sn),i=1,2,3, …,n。
用G={S1,…,Sn;u1, …,un}代表战 略式表述博弈。
ppt课件
16
(三)博弈的得益矩阵表示
一个博弈被称为有限博弈,如果:第一,参与人 的个数是有限的; 第二,每个参人可选择的策略个数是有限的。 有限博弈的策略式表达及其求解可以方便地用得益 矩阵直观地给出。
ppt课件
12
第二节 博弈的种类
一、完全信息静态博弈 (一)完全信息静态博弈定义
所谓完全信息静态博弈指的是各博弈方同 时决策,或者决策行动虽有先后,但后行动者 不知道先行动者的具体行动是什么且各博弈方 对博弈中各种策略组合情况下所有参与人相应 的得益都完全了解的博弈。
ppt课件
13
(二)博弈的策略式表达
在博弈论中,一个博弈可以用两种不同 的方式来表达: 一种是策略式表达:另一种是扩展式表达. 策略式表达更适合于静态博弈,而扩展式 表达更适合于讨论动态博弈。
ppt课件
14
策略式表达又称为标准式表达,在这种表 达中,所有参人同时选择自己的策略,所有参 与人选择的策略一起决定每个参与人的得益。
值得强调的是,这里参与人同时选择的是 “策略”,而不是“行动”。
然而在现实生活中,这两个假设在许多情况下 是不能被满足。
ppt课件
4
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、 泽尔腾和海萨尼。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里 斯、维克瑞; 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰 他们在柠檬市场、信号传递和信号甄别等非对称信息 理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特·奥 曼和美国人托马斯·谢林,以表彰他们在博弈论领域 作出的贡献。
动态博弈指的是参与人的行动有先后顺序, 且后行动者能够观察到先行动者所选择的 行动的博弈。
ppt课件
10
2、从参与人对其他参与人的各种特征信息 的获得差异来分,博弈可分为完全信息博弈和不 完全信息博弈。
完全信息指的是每一个参与人对所有其他参 与人的特征,如策略集合及得益函数都有准确完 备的知识;否则就是不完全信息。
将上述两个角度的划分结合起来,我们就得 到四种不同类型的博弈,这就是:完全信息静态 博弈,完全信息动态博弈,不完全信息静态博弈 和不完全信息动态博弈。
ppt课件
11
博弈的分类和均衡
行动次序
信息
静态
完全信息
纳什均衡 纳什
动态
子博弈精练 纳什均衡 泽尔腾
不完全信息
贝叶斯均衡 精炼贝叶斯均衡
海萨尼
泽尔腾等
5、得益是参与人在博弈结束后从博弈中获得 的效用,一般是所有参与人的策略或行动的函数, 这是每个参与人最关心的东西;
6、均衡是所有参与人的最优策略或行动的组 合;均衡结果是指博弈结束后博弈分析者感兴趣 的一些要素的集合,如在各参与人的均衡策略作 用下,各参与人最终的行动或效用集合。
上述要素中,参与人、行动、结果统称为博 弈规则,博弈分析的目的就是使用博弈规则来决 定均衡。
ppt课件
17
著名的“囚徒困境”的例
子
警察抓住了两个罪犯,但是警察局却缺乏足 够的证据指证他们所犯的罪行。如果罪犯中至少 有一人供认犯罪,就能确认罪名成立。为了得到 所需的口供,警察将这两名罪犯分别关押防止他 们串供或结成攻守同盟,并分别跟他们讲清了他 们的处境和面临的选择:如果他们两人都拒不认 罪,则他们会被以较轻的妨碍公务罪各判一年徒 刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;果两人都坦白认 罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
在静态博弈中,于参与人只选择一次,所以 策略就等同于行动了。而在动态博弈中,策略 是参与人在各个阶段的行动的全面计划。
ppt课件
15
更为准确地讲,战略式表述给出:
1 、 博 弈 的 参 与 人 集 合 : i∈Γ , Γ=(1,2,…, n);
2、每个参与人的战略空间:Si 1,2,3,…,n;
i=
ppt课件
8
(三)博弈的分类
根据参与人的多少,可将博弈分为两人博弈 或多人博弈;
根据参与人是否合作,可将博弈分为合作博 弈或非合作博弈;
根据博弈结果的不同,又可分为零和博弈、 常和博弈与变和博弈。
ppt课件
9
1、从行动的先后次序来分,博弈可以
分为静态博弈和动态博弈。
静态博弈指在博弈中,参与人同时选择行 动,或虽非同时但后行动者并不知道前行 动者采取了什么具体行动;
ppt课件
3
二、现代经济学与博弈论
从现代的观点来看,经济学是研究人的决策 行为的学问。
理性人是指有一个很好定义的偏好,在面临给 定的约束条件下能最大化自己偏好的人,不考虑竞 争对手的决策。
价格理论有两个基本假定:1、市场参与人的 数量足够多,从而市场是竞争性的;2、参与人之 间不存在信息不对称问题(完全竞争、完全信息)。
1、参与人指的是博弈中选择行动以最大化自 己效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选 择时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博 弈进程中,什么情况下选择什么行动的预先安排;
ppt课件
7
4、信息指的是参与人在博弈中所知道的关于 自己以及其他参与人的行动、策略及其得益函数 等知识;
ppt课件
5
三、博弈论的基本概念
(一)博弈论的定义
博弈论,英文为Game theory,是研究相 互依赖、相互影响的决策主体的理性决策行为 以及这些决策的均衡结果的理论。 一些相互依赖、相互影响的决策行为及其结果 的组合称为博弈(Game)。
ppt课件
6
(二)博弈的组成要素
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。
ppt课件
1
第一节 博弈论的基本概念
一、市场竞争中的博弈 二、现代经济学与博弈论 三、博弈论的基本概念
ppt课件
2
一、市场竞争中的博弈
在现实经济生活中,许多产业市场是寡 头断市场。寡头垄断市场是指少数几家大厂 商生产一个产业中的全部或大部分产品,从 而形成对一个产业的控制的产业市场。
在分析寡头垄断市场中的企业决策行为 时,就必须把各种决策者之间的策略相互作 用纳入到经济模型中,这就是一种博弈分析。
3、每个参与人的得益函数:ui(s1, …, si…,sn),i=1,2,3, …,n。
用G={S1,…,Sn;u1, …,un}代表战 略式表述博弈。
ppt课件
16
(三)博弈的得益矩阵表示
一个博弈被称为有限博弈,如果:第一,参与人 的个数是有限的; 第二,每个参人可选择的策略个数是有限的。 有限博弈的策略式表达及其求解可以方便地用得益 矩阵直观地给出。
ppt课件
12
第二节 博弈的种类
一、完全信息静态博弈 (一)完全信息静态博弈定义
所谓完全信息静态博弈指的是各博弈方同 时决策,或者决策行动虽有先后,但后行动者 不知道先行动者的具体行动是什么且各博弈方 对博弈中各种策略组合情况下所有参与人相应 的得益都完全了解的博弈。
ppt课件
13
(二)博弈的策略式表达
在博弈论中,一个博弈可以用两种不同 的方式来表达: 一种是策略式表达:另一种是扩展式表达. 策略式表达更适合于静态博弈,而扩展式 表达更适合于讨论动态博弈。
ppt课件
14
策略式表达又称为标准式表达,在这种表 达中,所有参人同时选择自己的策略,所有参 与人选择的策略一起决定每个参与人的得益。
值得强调的是,这里参与人同时选择的是 “策略”,而不是“行动”。
然而在现实生活中,这两个假设在许多情况下 是不能被满足。
ppt课件
4
1994年诺贝尔经济学奖授予了三位博弈论专家纳什、 泽尔腾和海萨尼。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里 斯、维克瑞; 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰 他们在柠檬市场、信号传递和信号甄别等非对称信息 理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特·奥 曼和美国人托马斯·谢林,以表彰他们在博弈论领域 作出的贡献。
动态博弈指的是参与人的行动有先后顺序, 且后行动者能够观察到先行动者所选择的 行动的博弈。
ppt课件
10
2、从参与人对其他参与人的各种特征信息 的获得差异来分,博弈可分为完全信息博弈和不 完全信息博弈。
完全信息指的是每一个参与人对所有其他参 与人的特征,如策略集合及得益函数都有准确完 备的知识;否则就是不完全信息。
将上述两个角度的划分结合起来,我们就得 到四种不同类型的博弈,这就是:完全信息静态 博弈,完全信息动态博弈,不完全信息静态博弈 和不完全信息动态博弈。
ppt课件
11
博弈的分类和均衡
行动次序
信息
静态
完全信息
纳什均衡 纳什
动态
子博弈精练 纳什均衡 泽尔腾
不完全信息
贝叶斯均衡 精炼贝叶斯均衡
海萨尼
泽尔腾等
5、得益是参与人在博弈结束后从博弈中获得 的效用,一般是所有参与人的策略或行动的函数, 这是每个参与人最关心的东西;
6、均衡是所有参与人的最优策略或行动的组 合;均衡结果是指博弈结束后博弈分析者感兴趣 的一些要素的集合,如在各参与人的均衡策略作 用下,各参与人最终的行动或效用集合。
上述要素中,参与人、行动、结果统称为博 弈规则,博弈分析的目的就是使用博弈规则来决 定均衡。
ppt课件
17
著名的“囚徒困境”的例
子
警察抓住了两个罪犯,但是警察局却缺乏足 够的证据指证他们所犯的罪行。如果罪犯中至少 有一人供认犯罪,就能确认罪名成立。为了得到 所需的口供,警察将这两名罪犯分别关押防止他 们串供或结成攻守同盟,并分别跟他们讲清了他 们的处境和面临的选择:如果他们两人都拒不认 罪,则他们会被以较轻的妨碍公务罪各判一年徒 刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;果两人都坦白认 罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
在静态博弈中,于参与人只选择一次,所以 策略就等同于行动了。而在动态博弈中,策略 是参与人在各个阶段的行动的全面计划。
ppt课件
15
更为准确地讲,战略式表述给出:
1 、 博 弈 的 参 与 人 集 合 : i∈Γ , Γ=(1,2,…, n);
2、每个参与人的战略空间:Si 1,2,3,…,n;
i=
ppt课件
8
(三)博弈的分类
根据参与人的多少,可将博弈分为两人博弈 或多人博弈;
根据参与人是否合作,可将博弈分为合作博 弈或非合作博弈;
根据博弈结果的不同,又可分为零和博弈、 常和博弈与变和博弈。
ppt课件
9
1、从行动的先后次序来分,博弈可以
分为静态博弈和动态博弈。
静态博弈指在博弈中,参与人同时选择行 动,或虽非同时但后行动者并不知道前行 动者采取了什么具体行动;
ppt课件
3
二、现代经济学与博弈论
从现代的观点来看,经济学是研究人的决策 行为的学问。
理性人是指有一个很好定义的偏好,在面临给 定的约束条件下能最大化自己偏好的人,不考虑竞 争对手的决策。
价格理论有两个基本假定:1、市场参与人的 数量足够多,从而市场是竞争性的;2、参与人之 间不存在信息不对称问题(完全竞争、完全信息)。
1、参与人指的是博弈中选择行动以最大化自 己效用的决策主体(可以是个人,也可以是团体);
2、行动是指参与人在博弈进程中轮到自己选 择时所作的某个具体决策;
3、策略是指参与人选择行动的规则,即在博 弈进程中,什么情况下选择什么行动的预先安排;
ppt课件
7
4、信息指的是参与人在博弈中所知道的关于 自己以及其他参与人的行动、策略及其得益函数 等知识;
ppt课件
5
三、博弈论的基本概念
(一)博弈论的定义
博弈论,英文为Game theory,是研究相 互依赖、相互影响的决策主体的理性决策行为 以及这些决策的均衡结果的理论。 一些相互依赖、相互影响的决策行为及其结果 的组合称为博弈(Game)。
ppt课件
6
(二)博弈的组成要素
一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。