运筹学博弈论

合集下载

运筹学博弈论

i a 2 1 3 a c 1 3 a c c 1 3 a c 9 1 a c 2
产量博弈的古诺模型是一种囚徒困境，无法实现博弈方总体和各个博弈方各自最大利益的结论，对于市场经济组织、管理，对于产业组织和社会经济制度的效率判断，都具有非常重要的意义。说明对市场的管理，政府对市场的调控和监管都是必须的。
纳什均衡(Nash Equilibrium)
通俗地说，纳什均衡的含义就是：
给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。
1. 纯战略Nash均衡
策略空间：每个博弈方的全部可选策略的集合 S1,Sn
博弈方 i的第 j个策略： si j Si 博弈方 i的得益：u i
每个参与人都想猜透对方的战略，而每个参与人又不愿意让对方猜透自己的战略。
这种博弈的类型是什么？如何找到均衡？
请举一些这样的例子：
✓石头、剪子、布游戏 ✓老虎、杠子、鸡、虫子游戏 ✓扑克游戏 ✓橄榄球赛 ✓战争中
大猪先到：大猪吃到9个单位，小猪吃到1个单位；小猪先到：小猪吃到4个单位，大猪吃到6个单位；同时到达：大猪吃到7个单位，小猪吃到3个单位。
局中人：大猪和小猪行动：按按钮吃东西
小猪
按
不按
大
猪
按 (5, 1) (4, 4)
不按 (9, -1) (0, 0)
24
大猪按等待
小猪的上策
寡头产量竞争——以两厂商产量竞争为例 Qq1 q2 PP(Q) aQ
u 1 q 1 P ( Q ) c 1 q 1 q 1 [ a ( q 1 q 2 ) c ]1q
u 2 q 2 P ( Q ) c 2 q 2 q 2 [ a ( q 1 q 2 ) c ]2q

博弈论介绍

•
为什么博弈论在经济学领域会产生如此大的影响呢？这是因为博弈论改变了传统微观经济学的某些基本假设，从一个独特的视角帮助我们更加深刻地理解和把握经济现象，并指导更加有效的经济政策制订。博弈论作为现代经济学的前沿领域，已成为占据主流的基本分析工具。
一、博弈论的基本概念
博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。 • 这些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。
行动次序
信息
静态纳什均衡纳什贝叶斯均衡海萨尼
动态子博弈精练纳什均衡泽尔腾精炼贝叶斯均衡泽尔腾等
完全信息
不完全信息
二、博弈的种类
• 一、完全信息静态博弈 • (一)完全信息静态博弈定义 • 所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。 • 在博弈论中,一个博弈可以用两种不同的方式来表达： • 一种是策略式表达:另一种是扩展式表达.策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。
•性别战(battle of sexes) 女足球男足球芭蕾 2，1 0，0 芭蕾 0，0 1，2
• 斗鸡博弈(chicken game)(胆小鬼博弈)
B 进退
A
进退
-3，-3
0，2
2，0
0，0
• 进入阻挠(entry deterrance) 在位者默许斗争
进入者
进入不进入
40，50
0，300
-10，0
0，300

运筹学博弈论

代表人物：纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡
代表人物：海萨尼（1967-1968）
动态
完全信息动态博弈子博弈精炼纳什均衡代表人物：泽尔腾（1965）
不完全信息动态博弈精炼贝叶斯纳什均衡代表人物：泽尔腾（1975）克瑞普斯和威尔逊（1982）费登伯格和泰勒尔（1991）
精品
智猪博弈（大小猪博弈）
精品
5. 2001年诺贝尔经济学奖得主：迈克尔 ·斯宾塞：在不对称信息市场分析方面所做出开创性研究。
精品
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
精品
10.1.2 博弈及博弈论
博弈就是策略对抗，或策略有关键作用的游戏
博弈Game，博弈论Game Theory，Game即游戏、竞技游戏和经济等决策竞争较量的共同特征：规则、结果、策
略选择，策略和利益相互依存，策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦
精品
定义：博弈就是参与人（可能是个人，也可能是团体，如国家、企业、国际组织等）在一定得规则下，同时或先或后，一次或多次，从各自允许选择的行动或战略中进行选择并加以实施，而取得相应结果（支付函数）的过程。
精品
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略，将它剔除掉，重新构造一个不包括已剔除战略的新的博弈；然后继续剔除这个新的博弈中某一参与人的严格劣战略；重复进行这一过程，直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人战略组合，就是这个博弈的均衡解，称为“重复剔除的占优战略均衡”(iterated dominance equilibrium).

博弈论的定义与应用

博弈论博弈论的概念博弈论有被称为对策论（Games Theory),是研究具有斗争或竞争性质现象的理论和方法，它既是现代数学的一个新分支，也是运筹学的一个重要学科。

博弈论的发展博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。

博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。

1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正是诞生。

1944年，冯·诺意曼摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。

谈到博弈论就不能忽略博弈论天才纳什，纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。

此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。

今天博弈论已发展成一门较完善的的学科。

博弈论的基本概念博弈要素 (1)局中人：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。

只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。

(2)策略：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。

(3)得失：一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。

所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。

《运筹学》ch12博弈论

1的最优策略（行）
目录
博弈论的基本概念纯策略矩阵博弈
混合策略矩阵博弈
其它类型博弈简介(多人博弈、非零和博弈)
基本概念
设矩阵博弈G {S1, S2 , A} 的支付矩阵是 A (aij )mn ，其中S1 {A1, , Am}
S2 {B1, , Bn }
多人非合作博弈
（1）局中人集合 I {1, , n} ；（2）每个局中人i有一个纯策略的有限集：
Si
{s(i)} {s1i , s2i ,
,
si mi
}
i 1, , n
Hale Waihona Puke （3）每个局中人i有一个支付函数u i ，i 1, , n 。
记为此博弈为G {I , Si ,ui }。
第十二章博弈论
教学要求：
了解博弈论的基本分析方法掌握二人零和博弈模型和求解方法会运用该模型分析一些经济和管理问题
目录
博弈论的基本概念纯策略矩阵博弈混合策略矩阵博弈其它类型博弈简介(多人博弈、非零和博弈)
目录
博弈论的基本概念
纯策略矩阵博弈混合策略矩阵博弈其它类型博弈简介(多人博弈、非零和博弈)
同越理小，越若好局，中所人以，2选局择中策人略2可B j以，选则择他至B j ，多使失他去失m1ia去mx a的ij 。不因大局于中1m ji人nm m21i希amx望aij aij
鞍点：如果存在 i*, j* 使支付矩阵 (aij ) 的元素满足：
max
1im
min
1 jn

动态博弈微分博弈
最常见
目录
博弈论的基本概念

运筹学第13章博弈论

动态博弈（dynamic game）指局中人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。
“石头、剪刀、布”的游戏；
下棋、打牌等游戏。
运筹学第13章博弈论
第1节博弈论概论│博弈分类
1.2.2 博弈分类详解
完全信息博弈(completeⅠinformation)
将各博弈方都完全了解所有博弈方各种情况下得益的博弈称为“完全信息博弈” 。
运筹学第13章博弈论
第1节博弈论概论│什么是博弈论
1.1.2 引例囚徒困境是图克（Tucker）1950年提出的，该博弈是博弈论最经典、著名的博弈。该博弈本身
讲的是一个法律刑侦或犯罪学方面的问题，但可以扩展到许多经济问题，以及各种社会问题。
坦白
囚徒 B
不坦白
囚徒 A
坦白不坦白
-5, -5 -10, -1
运筹学第13章博弈论
第1节博弈论概论│什么是博弈论
1.1.5 博弈论的基本概念
博弈方的得益(Payoffs)
博弈的参加者(Player)
四个核心
各博弈方的策略(Strategies) 或行为(Actions)
博弈的次序(Order)
运筹学第13章博弈论
2 博弈的分类
运筹学第13章博弈论
第1节博弈论概论│博弈分类
1.2.2 博弈分类详解
零和博弈
在博弈中一组局中人所得到的支付（或收益）恰好是另一组局中人的损失。通俗地说，博弈结果总和为零的博弈称为零和博弈。
非零和博弈非零和博弈指所有局中人的支付（或收益）的代数和不为零。为正或为负。
赢钱与输钱为零和博弈；
工会与厂方达成增加工资的协议双方获得“双赢”。反之，罢工导致“两败俱伤”。

第九章-运筹学博弈论

乙石头布
甲
石头
0
-1
布
1
0
剪刀
-1
1
剪刀
1 -1 0
21
例2 写出齐王和田忌赛马中齐王的收益矩阵. 赢一场得一千金.
解:
S1 a1,a2,a3,a4,a5,a6,S2 b1,b2,b3,b4,b5,b6
a1 (上,中,下),a2 (上,下,中),a3 (中,上,下), a4 (中,下,上),a5 (下,中,上),a6 (下,上,中). S2中的各策 S1对略应与的策.略相同
史密斯(Vernon L. Smith)
获奖理由:在心理和实验经济学研究方面做出了开创性工
作。
2001年三位美国学者乔治-阿克尔洛夫(George A.
Akerlof)、迈克尔-斯彭斯(Michael Spence)和约瑟夫-斯
蒂格利茨(Joseph E. Stiglitz)
获奖理由：在“对充满不对称信息市场进行分析”领域
11
1986年美国人詹姆斯-布坎南(James M. Buchanan Jr.)
获奖理由:将政治决策的分析同经济理论结合起来,使经济分析扩大和应用到社会,政治法规的选择
1985年意大利人弗兰科-莫迪利安尼 (Franco Modigliani)
获奖理由：第一个提出储蓄的生命周期假设，这一假设在研究家庭和企业储蓄中得到了广泛应用。
完全信息是指所有局中人对其他局中人各自策略集以及不同局势下的收益函数都有完全的了解.
18
博弈的三个要素的矩阵表示(局中人A的收益)
局中人B
局中人A
策 a1 a2
略
am
b 1
c11 c 21

运筹学博弈论 PPT

性研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗，或策略有关键作用的游戏
博弈Game，博弈论Game Theory，Game即游戏、竞技游戏和经济等决策竞争较量的共同特征：规则、结果、策
略选择，策略和利益相互依存，策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦
囚徒困境
坦白是B的占优战略
坦白
囚徒 B
抵赖
坦白
坦白是A的囚徒A 占优战略
抵赖
占优策略(上策)均衡
占优策略(上策)通俗来说是：
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策略组合所构成的均衡。
囚徒困境（ Prisoners’Dilemma ）
运筹学博弈论
第一节博弈论概述
一、博弈论的产生和发展
1. 博弈在中国田忌赛马Байду номын сангаас弈
华容道博弈
从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年，冯 ·诺依曼和摩根斯顿发表《博弈论和经济行为》的一书，
标志着博弈论作为一门独立科学的开始，也标志着新古典经济学进入了一个新的发展阶段。
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略，将它剔除掉，重新构造一个不包括已剔除战略的新的博弈；然后继续剔除这个新的博弈中某一参与人的严格劣战略；重复进行这一过程，直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人战略组合，就是这个博弈的均衡解，称为“重复剔除的占优战略均衡”(iterated dominance equilibrium).

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

10.2.1 策略型博弈模型及占优战略博弈
非合作博弈模型从模型自身形式上可分为扩展型和策略型两种，一般用策略型模型描述完全信息静态博弈模型。
构成策略型博弈模型的三个要素: 局中人、策略、支付函数
参与人或局中人(Players) ：独立决策、独立承担博弈结果的个人或组织
博弈规则面前博弈方之间平等，不因博弈方之间权利、地位的差异而改变
标志着博弈论作为一门独立科学的开始，也标志着新古典经济学进入了一个新的发展阶段。
3. 1994年三位获诺奖的博弈论学者
John Nash
John Harsany
Leihaden Selten
4. 1996年诺贝尔经济学奖得主：詹姆斯·莫里斯：主要贡献：不对称信息条件下的激励理论
5. 2001年诺贝尔经济学奖得主：迈克尔 ·斯宾塞：在不对称信息市场分析方面所做出开创性
研究。
6. 2005年二位获诺奖的博弈论学者
Robert Aumann
Thomas Shelling
10.1.2 博弈及博弈论
博弈就是策略对抗，或策略有关键作用的游戏
博弈Game，博弈论Game Theory，Game即游戏、竞技游戏和经济等决策竞争较量的共同特征：规则、结果、策
略选择，策略和利益相互依存，策略的关键作用游戏——下棋、猜大小经济——寡头产量决策、市场阻入、投标拍卖政治、军事——美国和伊拉克、以色列和巴勒斯坦
博弈论：博弈论就是系统研究具有上述特征的博弈问题，寻求各博弈方合理选择战略情况下博弈的解，并对这些解进行讨论分析的理论。
博弈的分类及对应的均衡概念
完全信息
静态
完全信息静态博弈纳什均衡
代表人物：纳什（1950，1951）
不完全信息
不完全信息静态博弈贝叶斯纳什均衡
代表人物：海萨尼（1967-1968）
动态
完全信息动态博弈子博弈精炼纳什均衡代表人物：泽尔腾（1965）
不完全信息动态博弈精炼贝叶斯纳什均衡代表人物：泽尔腾（1975）克瑞普斯和威尔逊（1982）费登伯格和泰勒尔（1991）
10.2 完全信息静态博弈
10.2.1 策略型博弈模型及占优战略博弈 10.2.2 重复剔除的占优战略博弈 10.2.3 纳什均衡
囚徒困境
坦白是B的占优战略
坦白
囚徒 B
抵赖
坦白是A的
囚徒A 占优战略
坦白
抵赖
-5，-5 0，-8
-8，0 -1，-1
占优策略(上策)均衡
占优策略(上策)通俗来说是：
• “我所做的是不管你做什么我所能做的最好的” • “你所做的是不管我做什么你所能做的最好的”
占优策略均衡指博弈中的所有参与者的占优策略组合所构成的0.2完全信息静态博弈
第一节博弈论概述
一、博弈论的产生和发展
1. 博弈在中国田忌赛马博弈
华容道博弈
从孙子兵法到三十六计从田忌赛马到孙庞斗智从运筹帷幄到韬光养晦从曹刿论战到论持久战
2. 博弈论的开山之作 1943年，冯·诺依曼和摩根斯顿发表《博弈论和经济行为》的一书，
博弈方数量对博弈结果和分析有影响
根据博弈方数量分单人博弈、两人博弈、多人博弈等。最常见的是两人博弈，单人博弈是退化的博弈
策略或战略（strategies）：博弈中各博弈方的选择内容。
策略有定性定量、简单复杂之分
不同博弈方之间不仅可选策略不同，而且可选策略数量也可不同
有限博弈：每个博弈方的策略数都是有限的
定义：博弈就是参与人（可能是个人，也可能是团体，如国家、企业、国际组织等）在一定得规则下，同时或先或后，一次或多次，从各自允许选择的行动或战略中进行选择并加以实施，而取得相应结果（支付函数）的过程。
都有一定的规则都有一个结果策略至关重要，游戏者不同的策略选择常会带来不同的游戏
结果策略和利益有相互依存性
无限博弈：至少有某些博弈方的策略有无限多个
支付函数(Payoffs function) ：各博弈方从博弈中所获得的利益。
得益对应博弈的结果，也就是各博弈方策略的组合
得益是各博弈方追求的根本目标及行为和判断的主要依据
根据得益的博弈分类：零和博弈、常和博弈、变和博弈
例10.1 囚徒困境博弈
10.2.2 重复剔除的占优战略均衡
首先找出某一博弈参与人的严格劣战略，将它剔除掉，重新构造一个不包括已剔除战略的新的博弈；然后继续剔除这个新的博弈中某一参与人的严格劣战略；重复进行这一过程，直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人战略组合，就是这个博弈的均衡解，称为“重复剔除的占优战略均衡”(iterated dominance equilibrium).
囚徒的困境是图克（Tucker）1950年提出的该博弈是博弈论最经典、著名的博弈该博弈本身讲的是一个法律刑侦或犯罪学方面
的问题，但可以扩展到许多经济问题，以及各种社会问题，可以揭示市场经济的根本缺陷
基本模型
经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监8年。若二人都保持沉默（相关术语称互相“合作”），则二人同样判监1年。若二人都互相检举（互相“背叛”），则二人同样判监5年。
囚徒困境（ Prisoners’Dilemma ）
只达到效率很差的个体理性解，没有实现团体理性解。前者是稳定的，是自动实施的；尽管团体理性解对大家都好，但它是不能自动实施的，需要改变条件。
提示：该博弈揭示了个体理性与团体理性之间的矛盾。——从个体利益出发的行为往往不能实现团体的最大利益，同时也揭示了个体理性本身的内在矛盾— —从个体利益出发的行为最终也不一定能真正实现个体的最大利益，甚至得到相当差的结果。
智猪博弈（大小猪博弈）
智猪博弈：假设猪圈里有两头猪，一头大猪，一头小猪，猪圈的一端有一个猪食槽，另一端安装了一个按钮，控制猪食的供应。按一下按钮。将有10个单位的猪食进入猪食槽，供两头猪食用。两头猪面临选择的策略有两个：自己去按按钮或等待另一头猪去按按钮。如果某一头猪作出自己去按按钮的选择，它必须付出如下代价：第一，它需要收益相当于2个单位的成本；第二，由于猪食槽远离猪食，它将比另一头猪后到猪食槽，从而减少吃食的数量。