运筹学博弈论
运筹学博弈论

i a 2 1 3 a c 1 3 a c c 1 3 a c 9 1 a c 2
产量博弈的古诺模型是一种囚徒困境,无法实现 博弈方总体和各个博弈方各自最大利益的结论,对 于市场经济组织、管理,对于产业组织和社会经济 制度的效率判断,都具有非常重要的意义。说明对 市场的管理,政府对市场的调控和监管都是必须的。
纳什均衡(Nash Equilibrium)
通俗地说,纳什均衡的含义 就是:
给定你的策略,我的策略是 最好的策略;给定我的策略, 你的策略也是你的最好的策 略。即双方在给定的策略下 不愿意调整自己的策略。
1. 纯战略Nash均衡
策略空间:每个博弈方的全部可选策略的集合 S1,Sn
博弈方 i的第 j个策略: si j Si 博弈方 i的得益:u i
每个参与人都想猜透对方的战略,而每个参与人又 不愿意让对方猜透自己的战略。
这种博弈的类型是什么?如何找到均衡?
请举一些这样的例子:
✓石头、剪子、布游戏 ✓老虎、杠子、鸡、虫子游戏 ✓扑克游戏 ✓橄榄球赛 ✓战争中
大猪先到:大猪吃到9个单位,小猪吃到1个单位; 小猪先到:小猪吃到4个单位,大猪吃到6个单位; 同时到达:大猪吃到7个单位,小猪吃到3个单位。
局中人:大猪和小猪 行动:按按钮吃东西
小猪
按
不按
大
猪
按 (5, 1) (4, 4)
不按 (9, -1) (0, 0)
24
大猪 按 等待
小猪的上策
寡头产量竞争——以两厂商产量竞争为例 Qq1 q2 PP(Q) aQ
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ a ( q 1 q 2 ) c ]1q
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ a ( q 1 q 2 ) c ]2q
博弈论介绍

•
为什么博弈论在经济学领域会产生如此大的影响呢?这 是因为博弈论改变了传统微观经济学的某些基本假设,从 一个独特的视角帮助我们更加深刻地理解和把握经济现象, 并指导更加有效的经济政策制订。博弈论作为现代经济学 的前沿领域,已成为占据主流的基本分析工具。
一、博弈论的基本概念
博弈论,英文为Game theory,是研究相互依赖、相互影响的 决策主体的理性决策行为以及这些决策的均衡结果的理论。 • 这些相互依赖、相互影响的决策行为及其结果的组合称为博 弈(Game)。
行动次序
信息
静态 纳什均衡 纳什 贝叶斯均衡 海萨尼
动态 子博弈精练 纳什均衡 泽尔腾 精炼贝叶斯均衡 泽尔腾等
完全信息
不完全信息
二、博弈的种类
• 一、完全信息静态博弈 • (一)完全信息静态博弈定义 • 所谓完全信息静态博弈指的是各博弈方同时决策,或者决 策行动虽有先后,但后行动者不知道先行动者的具体行动 是什么且各博弈方对博弈中各种策略组合情况下所有参与 人相应的得益都完全了解的博弈。 • 在博弈论中,一个博弈可以用两种不同的方式来表达: • 一种是策略式表达:另一种是扩展式表达.策略式表达更适 合于静态博弈,而扩展式表达更适合于讨论动态博弈。
•性别战(battle of sexes) 女 足球 男 足球 芭蕾 2,1 0,0 芭蕾 0,0 1,2
• 斗鸡博弈(chicken game)(胆小鬼博弈)
B 进 退
A
进 退
-3,-3
0,2
2,0
0,0
• 进入阻挠(entry deterrance) 在位者 默许 斗争
进入者
进入 不进入
40,50
0,300
-10,0
0,300
运筹学博弈论

不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
精品
智猪博弈(大小猪博弈)
精品
5. 2001年诺贝尔经济 学奖得主:迈克尔 ·斯 宾塞:在不对称信息市 场分析方面所做出开创 性研究。
精品
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
精品
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
精品
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
精品
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
博弈论的定义与应用

博弈论博弈论的概念 博弈论有被称为对策论(Games Theory),是研究具有斗争或竞争性 质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。
博弈论的发展 博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。
博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。
1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正是诞生。
1944年,冯·诺意曼摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。
谈到博弈论就不能忽略博弈论天才纳什,纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。
此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。
今天博弈论已发展成一门较完善的的学科。
博弈论的基本概念 博弈要素 (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。
只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。
(2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。
如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(3)得失:一局博弈结局时的结果称为得失。
每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。
所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。
《运筹学》ch12博弈论

1的最优 策略(行)
目录
博弈论的基本概念 纯策略矩阵博弈
混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)
基本概念
设矩阵博弈G {S1, S2 , A} 的支付矩阵是 A (aij )mn ,其中S1 {A1, , Am}
S2 {B1, , Bn }
多人非合作博弈
(1)局中人集合 I {1, , n} ; (2)每个局中人i有一个纯策略的有限集:
Si
{s(i)} {s1i , s2i ,
,
si mi
}
i 1, , n
Hale Waihona Puke (3)每个局中人i有一个支付函数u i ,i 1, , n 。
记为此博弈为G {I , Si ,ui }。
第十二章 博弈论
教学要求:
了解博弈论的基本分析方法 掌握二人零和博弈模型和求解方法 会运用该模型分析一些经济和管理问题
目录
博弈论的基本概念 纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
目录
博弈论的基本概念
纯策略矩阵博弈 混合策略矩阵博弈 其它类型博弈简介(多人博弈、非零和博弈)
同越理小,越若好局,中所人以,2选局择中策人略2可B j以,选则择他至B j ,多使失他去失m1ia去mx a的ij 。不因大局于中1m ji人nm m21i希amx望aij aij
鞍点:如果存在 i*, j* 使支付矩阵 (aij ) 的元素满足:
max
1im
min
1 jn
动态博弈 微分博弈
最常见
目录
博弈论的基本概念
运筹学第13章博弈论

动态博弈(dynamic game) 指局中人的行动有先后顺序,且后行动者能 够观察到先行动者所选择的行动。
“石头、剪刀、布”的游戏;
下棋、打牌等游戏。
运筹学第13章博弈论
第1节 博弈论概论│博弈分类
1.2.2 博弈分类详解
完全信息博弈(completeⅠinformation)
将各博弈方都完全了解所有博弈方各种情况 下得益的博弈称为“完全信息博弈” 。
运筹学第13章博弈论
第1节 博弈论概论│什么是博弈论
1.1.2 引例 囚徒困境是图克(Tucker)1950年提出的,该博弈是博弈论最经典、著名的博弈。该博弈本身
讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题。
坦白
囚徒 B
不坦白
囚徒 A
坦白 不坦白
-5, -5 -10, -1
运筹学第13章博弈论
第1节 博弈论概论│什么是博弈论
1.1.5 博弈论的基本概念
博弈方的得益(Payoffs)
博弈的参加者(Player)
四个核心
各博弈方的策略(Strategies) 或行为(Actions)
博弈的次序(Order)
运筹学第13章博弈论
2 博弈的分类
运筹学第13章博弈论
第1节 博弈论概论│博弈分类
1.2.2 博弈分类详解
零和博弈
在博弈中一组局中人所得到的支付(或收益) 恰好是另一组局中人的损失。通俗地说,博 弈结果总和为零的博弈称为零和博弈。
非零和博弈 非零和博弈指所有局中人的支付(或收益) 的代数和不为零。为正或为负。
赢钱与输钱为零和博弈;
工会与厂方达成增加工资的协议双方获得“双 赢”。反之,罢工导致“两败俱伤”。
第九章-运筹学博弈论

乙 石头 布
甲
石头
0
-1
布
1
0
剪刀
-1
1
剪刀
1 -1 0
21
例2 写出齐王和田忌赛马中齐王的收益矩阵. 赢一场得一千金.
解:
S1 a1,a2,a3,a4,a5,a6,S2 b1,b2,b3,b4,b5,b6
a1 (上,中,下),a2 (上,下,中),a3 (中,上,下), a4 (中,下,上),a5 (下,中,上),a6 (下,上,中). S2中的各策 S1对 略应 与的策.略相同
史密斯(Vernon L. Smith)
获奖理由:在心理和实验经济学研究方面做出了开创性工
作。
2001年 三位美国学者乔治-阿克尔洛夫(George A.
Akerlof)、迈克尔-斯彭斯(Michael Spence)和约瑟夫-斯
蒂格利茨(Joseph E. Stiglitz)
获奖理由:在“对充满不对称信息市场进行分析”领域
11
1986年 美国人詹姆斯-布坎南(James M. Buchanan Jr.)
获奖理由:将政治决策的分析同经济理论结 合起来,使经济分析扩大和应用到社会,政治法 规的选择
1985年 意大利人弗兰科-莫迪利安尼 (Franco Modigliani)
获奖理由:第一个提出储蓄的生命周期假 设,这一假设在研究家庭和企业储蓄中得到了 广泛应用。
完全信息是指所有局中人对其他局中人各自策略 集以及不同局势下的收益函数都有完全的了解.
18
博弈的三个要素的矩阵表示(局中人A的收益)
局中人B
局中人A
策 a1 a2
略
am
b 1
c11 c 21
运筹学博弈论 PPT

6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的 囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的均衡。
囚徒困境( Prisoners’Dilemma )
运筹学博弈论
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年 , 冯 ·诺 依 曼 和 摩 根斯顿发表《博弈论和经 济行为》的一书,
标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战 略均衡”(iterated dominance equilibrium).
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和 策略型两种,一般用策略型模型描述完全信息静态 博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) :独立决策、独立承 担博弈结果的个人或组织
博弈规则面前博弈方之间平等,不因博弈方 之间权利、地位的差异而改变
标志着博弈论作为一门独立科学的开始,也 标志着新古典经济学进入了一个新的发展阶 段。
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经 济学奖得主:詹姆 斯·莫里 斯:主要贡 献:不对称信息条 件下的激励理论
5. 2001年诺贝尔经济学 奖 得 主: 迈 克尔 ·斯 宾 塞:在不对称信息市场 分析方面所做出开创性
研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗,或策略有关键作用的游戏
博弈Game,博弈论Game Theory,Game即游戏、竞技 游戏和经济等决策竞争较量的共同特征:规则、结果、策
略选择,策略和利益相互依存,策略的关键作用 游戏——下棋、猜大小 经济——寡头产量决策、市场阻入、投标拍卖 政治、军事——美国和伊拉克、以色列和巴勒斯坦
博弈论:博弈论就是系统研究具有上述特征的博弈问 题,寻求各博弈方合理选择战略情况下博弈的解,并 对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈 纳什均衡
代表人物:纳什(1950,1951)
不完全信息
不完全信息静态博弈 贝叶斯纳什均衡
代表人物:海萨尼(1967-1968)
动态
完全信息动态博弈 子博弈精炼纳什均衡 代表人物:泽尔腾(1965)
不完全信息动态博弈 精炼贝叶斯纳什均衡 代表人物:泽尔腾(1975) 克瑞普斯和威尔逊(1982) 费登伯格和泰勒尔(1991)
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡
囚徒困境
坦白是B的 占优战略
坦白
囚徒 B
抵赖
坦白是A的
囚徒A 占优战略
坦白
抵赖
-5,-5 0,-8
-8,0 -1,-1
占优策略(上策)均衡
占优策略(上策)通俗来说是:
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策 略组合所构成的0.2完全信息静态博弈
第一节 博弈论概述
一、博弈论的产生和发展
1. 博弈在中国 田忌赛马博弈
华容道博弈
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作 1943年,冯·诺依曼和摩根斯顿发表《博 弈论和经济行为》的一书,
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多 人博弈等。最常见的是两人博弈,单人博弈 是退化的博弈
策略或战略(strategies) :博弈中各博弈方 的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同,而且可选策 略数量也可不同
有限博弈:每个博弈方的策略数都是有限的
定义:博弈就是参与人(可能是个人,也可能是团体, 如国家、企业、国际组织等)在一定得规则下,同时 或先或后,一次或多次,从各自允许选择的行动或战 略中进行选择并加以实施,而取得相应结果(支付函 数)的过程。
都有一定的规则 都有一个结果 策略至关重要,游戏者不同的策略选择常会带来不同的游戏
结果 策略和利益有相互依存性
无限博弈:至少有某些博弈方的策略有无限多个
支付函数(Payoffs function) :各博弈方从博弈 中所获得的利益。
得益对应博弈的结果,也就是各博弈方策略的组 合
得益是各博弈方追求的根本目标及行为和判断的 主要依据
根据得益的博弈分类:零和博弈、常和博弈、变 和博弈
例10.1 囚徒困境博弈
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略,将它剔除 掉,重新构造一个不包括已剔除战略的新的博弈; 然后继续剔除这个新的博弈中某一参与人的严格劣 战略;重复进行这一过程,直到剩下唯一的参与人 战略组合为止。这个唯一剩下的参与人战略组合, 就是这个博弈的均衡解,称为“重复剔除的占优战略 均衡”(iterated dominance equilibrium).
囚徒的困境是图克(Tucker)1950年提出的 该博弈是博弈论最经典、著名的博弈 该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人 入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双 方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称“背叛”对方), 而对方保持沉默,此人将即时获释,沉默者将判监8年。 若二人都保持沉默(相关术语称互相“合作”),则二人同 样判监1年。 若二人都互相检举(互相“背叛”),则二人同样判监5年。
囚徒困境( Prisoners’Dilemma )
只达到效率很差的个体理性解,没有实现团体 理性解。 前者是稳定的,是自动实施的;尽管团体理性 解对大家都好,但它是不能自动实施的,需要改变 条件。
提示:该博弈揭示了个体理性与团体理性之间的矛 盾。——从个体利益出发的行为往往不能实现团体的 最大利益,同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个 体的最大利益,甚至得到相当差的结果。
智猪博弈(大小猪博弈)
智猪博弈:假设猪圈里有两头猪,一头大猪,一头小猪, 猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制 猪食的供应。按一下按钮。将有10个单位的猪食进入猪食 槽,供两头猪食用。两头猪面临选择的策略有两个:自己 去按按钮或等待另一头猪去按按钮。如果某一头猪作出自 己去按按钮的选择,它必须付出如下代价:第一,它需要 收益相当于2个单位的成本;第二,由于猪食槽远离猪食, 它将比另一头猪后到猪食槽,从而减少吃食的数量。