博弈论第讲

博弈论蒋文华浙江大学

第一讲、博弈论概述献给诸位知人者智，自知者明；胜人者力，自胜者强；小胜者术，大胜者德。

第一章何为“博弈”博：博览全局弈：对弈棋局→谋定而动是指在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。

第一节从一个简单的故事说起博弈时要搞清楚对手是谁！博弈时要搞清楚和别人比什么！行为选择既跟对手的情况有关，又跟所遇到的外部环境的变化有关。

特别提示：博弈既可以是竞争，也可以是合作！特别提示：博弈，必须学会换位思考！特别提示：博弈，只需领先一步，高人一筹！博弈就是你中有我，我中有你。

由于直接相互作用（互动），每个博弈参与者的得益不仅取决于自己的策略（行动），还取决于其他参与者的策略（行动）。

博弈的核心在于整体思维基础上的理性换位思考，用他人的得益去推测他人的策略（行动），从而选择最有利于自己的策略（行动）。

特别提示：站在别人的立场上想一想，就是为自己未来的遭遇着想。

——米兰·昆德拉特别提示：如果因为对方眼中的你的傻，而让对方更愿意和你合作，何乐而不为呢？（大智若愚）特别提示：请不要在一个充分竞争的市场去追求成功！特别提示：选对市场（对手）比选对策略更重要！特别提示：在博弈之前，博弈就已经开始了！第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋，法于用兵，怯者无功，贪者先亡。

----汉代刘向，《围棋赋》二、西方的理解game(规则)费厄泼赖（fair play）第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则（制度）的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量，是一个产量竞争模型。

二、伯川德模型该模型与古诺模型的不同之处在于，企业把其产品的价格而不是产量作为竞争手段和决策变量，通过制定一个最优的销售价格来实现利润最大化。

大学mooc博弈论(首师大)满分章节测验答案

第一讲认识博弈论1单选(10分)博弈论的基本要素以下内容，除了（）。

A.策略与策略集B.均衡C.支付与支付函数D.局中人正确答案：B你选对了2单选(10分)博弈论的基本假设是强调（）。

A.均衡状态B.利益最大化C.个人理性D.集体理性正确答案：C你选对了3单选(10分)哪种表述模型更适合表示二人博弈（）。

A.特征函数式B.标准式C.扩展式D.以上都不适合正确答案：B你选对了4单选(10分)根据人们行动为相互作用时，参与人能否达成一个具有约束力的协议，可将博弈分为( )。

A.静态博弈与动态博弈B.常和博弈与非常和博弈C.完全信息博弈与不完全信息博弈D.合作博弈与非合作博弈正确答案：D你选对了5单选(10分)“要想在现代社会做一个有文化的人，你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。

A.1994年诺贝尔经济学奖获得者John·NashB.2012年诺贝尔经济学奖获得者Lloyd S. ShapleyC.2005年诺贝尔经济学奖获得者Robert·AumannD.1970年诺贝尔经济学奖获得者Paul A. Samuelson正确答案：D你选对了6多选(15分)博弈论的研究特点包括（）。

A.博弈论存在信息的对称性B.博弈论涉及的决策者至少为两人C.博弈论存在信息的不对称性D.博弈论需要考虑其他决策者的决策对自身利益的影响正确答案：B、C、D你选对了7多选(15分)“囚徒困境”反映了（）。

A.“看不见的手”是有力的，但不是万能的B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的C.个体理性与集体理性的冲突D.以自我利益为目标的“理性”行为，最终导致了两个囚徒得到相对较劣的收益正确答案：A、B、C、D你选对了8判断(5分)博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。

正确答案：√你选对了9判断(5分)博弈论是单向的理性决策。

博弈论期中复习大纲知识讲解

博弈论期中复习大纲博弈论第一讲——第五讲复习大纲第一讲博弈的基本规则1、博弈论的假定是：人是理性的。

2、博弈论关注的是：意识到其行动将相互影响的决策者们的行为。

3、一个博弈可以根据参与人行动的先后顺序划分为静态博弈（一次性博弈）和动态博弈（序贯博弈）。

4、博弈论可分为合作博弈和非合作博弈：若参与人之间能达成有约束力的协议，则该博弈称为合作博弈，否则为非合作博弈。

合作博弈强调的是团体理性和效率、公正、公平；非合作博弈强调的是个人理性、个人最优决策，其结果可能是有效率的，也可能是无效率的。

5、博弈论的基本概念包括（1）参与人：是指作决策的个体（可能是个人也可能是团体，如国家、企业）。

每个参与人的目标都是通过选择行动来最大化自身的效用。

（虚拟参与人：自然是一个虚拟参与人，它在博弈的特定时点上以特定的概率随机选择行动。

）（2）信息：参与人在特定的时点对不同变量取值的了解。

（3）信息集：参与人的信息集还包括对已发生的行动的了解，因此，信息集随着博弈进程的变化而变化。

（4）策略：策略是参与人选择行动的规则，它告诉参与人在什么时候选择什么行动。

【注意：参与人想采取的行动取决于自然和其他参与人过去的行动，所以策略的概念不可或缺。

参与人的策略是一个关于其行动程序的完备集合，它告诉参与人在每种可预见的情况下选择什么行动，即使参与人并不预期那种情况真的会出现。

策略与行动的不同之处在于策略是不可观测的。

】（5）行动：行动是参与人的行动变量。

（6）支付函数：支付函数是参与人从博弈中获得的（期望）效用水平，它是所有参与人策略或行动的函数，是每个参与人真正关心的东西。

（7）结果：是指博弈论分析者感兴趣的要素的集合。

（8）均衡：是所有参与人与人的最有策略或行动的组合。

参与人、行动、结果统称为博弈规则；博弈分析的目的是使用博弈规则决定均衡。

（9）均衡策略：（Equilibrium strategies ）是指由博弈中的n 个参与人在最大化各自支付时所选取的策略。

《产业经济学》第五章--(博弈1)讲解

在上述“囚徒困境”的例子中，每个囚徒都有两种可选择的策略：坦白或抵赖。显然不论同伙选择什么策略，每个囚徒的最优策略是 “坦白”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。
在一个博弈里，如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人选择劣策略。所以在“囚徒困境”博弈里，“坦白、坦白”是占优策略均衡。
第五章博弈
第一节博弈论的基本概念与应用
一、博弈论的定义博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈。博弈论研究的是存在相互外部效应条件下的主体的决策问题。
在寡头垄断的市场上，只有少数几家厂商在相互竞争，寡头们面对的市场环境或者说竞争对手的行为将随着他们本身的决策行为而变动，即寡头们的决策是相互作用的，每个企业的得益和利润不仅取决于自身的决策，也取决于其他厂商的决策。寡头厂商之间可能有激烈的竞争，这些竞争涉及价格、产量、广告、投资等许多方面的决策，在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。
1．从行动的先后次序来划分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。
2．从参与人对其他参与人的各种特征信息的获得差异来划分，博弈可分为完全信息博弈和不完全信息博弈。完全信息博弈指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息博弈。

博弈论讲义-概述1

第一章概述-人生处处皆博弈
注意两点：注意两点： 1、是两个或两个以上参与者之间的对策论当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章概述-人生处处皆博弈
2、理性人假设理性人是指一个很好定义的偏好，在面临定的约束条件下最大化自己的偏好。博弈论说起来有些绕嘴，但理解起来很好理解，那就是每个对弈者在决定采取哪种行动时，不但要根据自身的利益的利益和目的行事，而且要考虑到他的决策行为对其他人可能的影响，通过选择最佳行动计划，来寻求收益或效用的最大化。
参与人
ห้องสมุดไป่ตู้
第一章概述-人生处处皆博弈-基本概念
博弈论的基本概念包括：参与人：博弈论中选择行动以最大化自己效用的决策主体；参与人：博弈论中选择行动以最大化自己效用的决策主体；行动：行动：参与人的决策变量战略：战略：参与人选择行动的规则信息：参与人在博弈中的知识，特别是有关其他参与人的特征和行动的知识支付函数：支付函数：参与人从博弈中获得的效用水平结果：博弈分析真正感兴趣的要素的集合均衡：均衡：所有参与人的最优战略的组合参与人、行动、结果称为博弈规则；博弈分析的目的是使用博弈规则决定均衡。
完全信息静态博弈纳什均衡
第一章概述-人生处处皆博弈
纳什（1950，1951）
分析：上述博弈属于何种类型的博弈？
囚徒困境坦白
囚徒 B 囚徒A
抵赖
坦白抵赖行动
-8，-8 -10，0
0，-10 -1，-1
支付函数
完全信息静态博弈纳什均衡
纳什（1950，1951）
第一章概述-人生处处皆博弈-智猪博弈
第一章概述-人生处处皆博弈-囚徒困境亚当斯密在1776年发表的经典之作《原富》中认为：亚当斯密在1776年发表的经典之作《原富》中认为： 1776年发表的经典之作

管理经济学10博弈论详解

定义1: 给定其它局中人的策略s，局中人i的最优反应记为s，是指能给他带来最大收益的策略，即
ui (s , si ) ui (s , si ) s s
* i ' i ' i
* i
当每个局中人都选择了自己的最优反应策略，并且这些最优反应形成一个策略组合，便形成了纳什均衡。
博弈论和对策行为
设局中人a使用混合策略x局中人b使用最优混合策略y这时局中人b的期望支付若局中人b使用某种混合策略而局中人a使用最优混合策略这时局中人a的收益的期望值为博弈论和对策行为混合策略和重复性博弈这说明当局中人a使用最优策略时不管局中人b使用何种策略他的收入的期望值不变从而保持有利的竞争地位
10 讲
博奕论和对策行为
博弈论和对策行为
策略型博弈的实例和解(性别战)
例2. 性别战(battle of the sexes)
一男一女恋爱，有些业余活动要安排，或者去看足球比赛，或者去看芭蕾舞演出。男的偏好足球，女的则更喜欢芭蕾舞，但他们都宁愿在一起，不愿分开。下表给出收益矩阵：女足球芭蕾足球 2，1 0，0 男芭蕾 0，0 1，2
纳什均衡
定义2: 一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均衡是指，对于所有的 i,
ui (s , s ) ui (s , s ) s Si
* i * i ' i * i ' i
纳什均衡的思想就是，博奕的理性结局是这样一种策略组合，其中每个局中人选择的策略都已是对其它局中人所选策略的最优反应，所以，谁也没有积极性去选择其它策略。因为每一个局中人均不能因为单方面改变自己的策略而获利，于是谁也没有兴趣主动打破这种均衡。

《博弈论》精品讲义

指定n个局中人，以及他们各自的纯策略空间
Si,i1 ,2, ,n
和这些局中人各自的支付（盈利）函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为：
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明公正無私
7
➢长街上的超市（海滩占位模型）
＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然？
✓其它相似情形：旅行社的热门路线；黄金时间的电视节目；总统竞选。
博弈论20092009
正大光明公正無私
8
➢狩猎与投资狩猎：
两个猎人围住一头鹿，各卡住两个关口中的一个，齐心协力即可成功获得并平分猎物。此时有一群兔子跑过，任何一人去抓兔子必可成功，但鹿会跑掉。
博弈论20092009
正大光明公正無私
20
策略型表述：（两人有限博弈；Fra bibliotek阵形式）高需求情况
B
A
低需求情况？
博弈论20092009
正大光明公正無私
21
➢房地产博弈分析
假设：同时决策；市场需求双方已知
若市场需求大，双方开发，各得0.4万元。若市场需求小，依赖于对方行动。若市场不确定，依赖对市场的判断及对方行动。
博弈论20092009
正大光明公正無私
23
4.博弈练习
➢游戏一：心灵感应两个人一组，独立写出1至10之间的任
意5个数。如果不重复则得奖；否则受罚。获胜的秘诀是什么？
博弈论20092009

博弈论讲义

L(A)=2rc+1(1-r)(1-c) dL(A)/dr =3c-1=0 L(B)=rc+2(1-r)(1-c) dL(B)/dc =3r-2=0 r=2/3 c=1/3
A:(2/3,1/3),B:(1/3,2/3)是本博弈的混合策略纳什均衡
完全信息动态博弈
参与人先后行动每个参与人对每个参与人的得益具有完全信息博弈树参与人的行动顺序（when to move，谁在什么时候行动）参与人的信息集（what known，每次行动时参与人知道些什么）
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
Player B L,L
3 U, 5 Player A 2 D, 5
R,1-L
(1,2)
(0,5)
(0,4)
(3,2)
如果A 选U,其期望收益为
1 L 0 (1 L ) L .
策略组合
策略组合：（s1，…，si，…，sn） ui＝ui（s1，…，si，…sn）一个参与人的支付不仅取决于自己的策略选择，而且取决于其他参与人的策略选择 Max ui＝ui（s1，…，si，…sn）
囚徒困境博弈的标准式表述
B
抵赖坦白
抵赖
－1，－1 0，－10
－10，0 －8，－8
ui ( s ,...,s ) 0 si
* 1 * n
囚徒困境的纳什均衡
(坦白,坦白)构成本博弈的纳什均衡
抵赖
B
坦白
抵赖
－1，－1 0，－10
－10，0 －8 －8
A