博弈论(复旦大学 王永钦)

合集下载

复旦大学经济博弈论课件--经济博弈论242页PPT

复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略

博弈论_读后感

博弈论_读后感

重复博博弈, 是 重复 次的重复博弈, ,如果 有唯一的纳什均衡,那么重复博弈 的唯一的子博弈精练纳什均衡结果,是阶段博弈 的纳什均衡重复 次,即在每个阶段博弈出现的都是一次性博弈的那个均衡结果。
对于无限次重复的囚徒困境博弈,存在触发策略,两个着名的触发策略分别是冷酷策略和礼尚往来策略。冷酷策略:指双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛,这个策略之所以冷酷,是因为任何局中人的一次性背叛将触犯永远的不合作。礼尚往来策略:开始的时候和冷酷策略一样,即双方都选择合作,在以后的每个阶段,如果你的对手在最近的一次博弈采取合作策略或者在最近联系k次策略中都选择合作策略,则你继续合作,如果你的对手在上一个阶段的博弈中采取背叛策略,则你在下一阶段博弈中采取背叛策略报复,或者在以后k次策略中选择背叛进行报复。
序贯决策博弈
序贯决策博弈的一个重要特征是总有一个局中人率先采取行动,因此衍生出先动优势和后动优势。先动优势:虽然双方都得到好处,但是先决策先行动的一方得益多一些(比如情侣博弈)。后动优势:虽然双方都得到好处,但是后决策后行动的一方得益多一些(比如分蛋糕、产品定价)。在这一节中,要准确把握了先动优势和后动优势的概念,摒弃先动者得益大于后动者得益即为先动优势和后动者得益大于先动者得益即为后动优势的观念。
混合策略纳什均衡:是指给定对方选择该相对最优混合策略的条件下,能使局中人自身的期望支付达到最大的混合策略,必须满足的条件如下:
利用反应函数法和直线交叉法,寻找同时决策有限博弈的混合策略纳什均衡。当存在多重纳什均衡时,需要用帕累托优势标准或者风险优势标准来筛选。
帕累托效率标准:经济的效率体现在配置社会资源以及改善人们的情况,主要看资源是否被充分利用,要想再改善某个人的利益,就必须损害其他局中人的利益,这时候就说一个经济已经实现了帕累托效率,相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未被充分利用,就不能说经济已达到帕累托最优。

博弈论 SPE 复旦大学 王永钦PPT课件

博弈论 SPE 复旦大学 王永钦PPT课件

Player H
1
T
HH -1 , 1
1 , -1
Player 2
HT
TH
-1 , 1 1 , -1
-1 , 1 1 , -1
TT 1 , -1 -1 rium
• The set of Nash equilibria in a dynamic game of complete information is the set of Nash equilibria of its normal-form.
8
Game tree
• If a node x is a
successor of another
node y then y is called a predecessor of x.
• In a game tree, any node other than the root has a unique predecessor.
Definition: extensive-form representation
• The extensive-form representation of a game specifies:
➢ the players in the game ➢ when each player has the move ➢ what each player can do at each of his or her
• Player 2’s strategies
➢H if player 1 plays H, H if player 1 plays T ➢H if player 1 plays H, T if player 1 plays T ➢T if player 1 plays H, H if player 1 plays T ➢T if player 1 plays H, T if player 1 plays T

基于博弈论的组合赋权评价方法研究

基于博弈论的组合赋权评价方法研究

基于博弈论的组合赋权评价方法研究全文共四篇示例,供读者参考第一篇示例:基于博弈论的组合赋权评价方法研究一、引言随着社会的发展和经济的不断增长,人们对于如何进行合理有效的评价和决策变得越来越重要。

组合赋权评价方法是一种常用的评价方法,其可以通过对各项指标进行加权,从而得到综合评价结果。

在现实生活中,由于各种因素的复杂性和变化性,传统的组合赋权评价方法可能存在一定的局限性。

如何利用博弈论的思想和方法来改进组合赋权评价方法成为了研究的一个热点问题。

二、博弈论的基本原理博弈论是研究冲突和合作的一种数学分支,它的基本原理是假设存在多个决策者,这些决策者之间存在利益冲突或者合作的关系。

在博弈过程中,每个决策者都会根据自身利益和对其他决策者的评价来进行决策。

博弈论通过建立数学模型来描述决策者之间的关系,并得出最优的决策方案。

基于博弈论的组合赋权评价方法可以将决策者看作是各项指标,他们之间存在着相互影响和相互制约的关系。

通过建立博弈模型,可以考虑到不同指标之间的关联性,从而更加客观和全面地评价事物的综合价值。

1.建立博弈模型在建立博弈模型时,首先需要确定各项指标之间的关系以及各指标的重要性。

可以利用专家咨询、数据分析等方法来确定各项指标的权重。

然后,利用博弈论的方法来描述不同指标之间的博弈关系,分析各指标之间的影响和制约关系。

2.求解最优解在得到博弈模型后,可以通过博弈论的求解方法来求解最优解。

通过分析各个决策者的策略和利益,可以确定最优的权重分配方案,从而得出最优的评价结果。

四、实例分析为了说明基于博弈论的组合赋权评价方法的有效性,我们以某公司的绩效评价为例进行分析。

假设该公司的绩效评价包括财务绩效、客户满意度、员工满意度和社会责任等四个指标,我们可以建立一个博弈模型来评价公司的绩效。

我们确定四个指标的权重分别为0.3、0.2、0.3和0.2。

然后,我们利用博弈论的方法来描述这四个指标之间的博弈关系。

我们发现,财务绩效和客户满意度存在正相关的关系,员工满意度和社会责任存在正相关的关系,但财务绩效和员工满意度之间存在负相关的关系。

博弈论讲义-概述1

博弈论讲义-概述1

第一章 概述-人生处处皆博弈
注意两点: 注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 概述-人生处处皆博弈
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
参与人
ห้องสมุดไป่ตู้
第一章 概述-人生处处皆博弈-基本概念
博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动: 行动:参与人的决策变量 战略: 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数: 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡: 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
完全信息静态博弈 纳什均衡
第一章 概述-人生处处皆博弈
纳什(1950,1951)
分析:上述博弈属于何种类型的博弈?
囚徒困境 坦白
囚徒 B 囚徒A
抵赖
坦白 抵赖 行动
-8,-8 -10,0
0,-10 -1,-1
支付函数
完全信息静态博弈 纳什均衡
纳什(1950,1951)
第一章 概述-人生处处皆博弈-智猪博弈
第一章 概述-人生处处皆博弈-囚徒困境 亚当斯密在1776年发表的经典之作《原富》中认为: 亚当斯密在1776年发表的经典之作《原富》中认为: 1776年发表的经典之作

复旦大学经济博弈论课件--经济博弈论536页

复旦大学经济博弈论课件--经济博弈论536页
以采用“同意”策略类型博弈方的比例为例,其 动态变化速度可用下列微分方程反映:
d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型

博弈论讲义

博弈论讲义

1.4.2博弈论的形成
冯.诺伊曼和摩根斯坦《博弈论和经济行为》 Theory of Games and Economic Behavior 1944 引进扩展形(extensive form)表示和正规形 (normal form)或称策略形(strategy form)、 矩阵形(matrix form)表示 提出稳定集(stable sets)解概念 正式提出创造博弈论一般理论的主意 给出博弈论研究的一般框架、概念术语和表述 方法
一、基本模型
囚徒 2 坦 白 囚 坦 白 徒 1 不坦白 囚徒1:坦白 囚徒2:坦白 -5, -5 -8, 0 不坦白 0, -8 -1, -1
两个罪犯的得益矩阵
二、双寡头削价竞争
寡头2 高 价 寡 头 1 高 价 低 价 100,100 150,20 低 价 20,105 70,70
双寡头的得益矩阵
1.3.3 博弈中的得益
得益:各博弈方从博弈中所获得的利益 得益对应博弈的结果,也就是各博弈方策 略的组合 得益是各博弈方追求的根本目标及行为和 判断的主要依据 根据得益的博弈分类:零和博弈、常和博 弈、变和博弈



零和博弈:也称“严格竞争博弈”。博弈方之 间利益始终对立,偏好通常不同 —猜硬币,田忌赛马,石头-剪刀-布 常和博弈:博弈方之间利益的总和为常数。博 弈方之间的利益是对立的且是竞争关系 —分配固定数额的奖金、利润,遗产官司 变和博弈:零和博弈和常和博弈以外的所有博 弈。合作利益存在,博弈效率问题的重要性。 —囚徒困境、产量博弈、制式问题等
1.1.2 一个非技术性定义
定义:博弈就是一些个人、队组或其他组织,面对一定 的环境条件,在一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。

《复旦大学--经济博弈论》-公开课件

《复旦大学--经济博弈论》-公开课件

n 克劳鳆和索贝尔采用的一种随机选择的混合策 略可以克服这种问题。
1/26/2020
复旦大学经济博弈论课件
部分合并完美贝叶斯均衡的区间划分和数量
n两区间部分合并均衡区间长度不等长, =0.5-2b,前一 个区间的长度是 -0 = 0.5-2b,后一个区间的长度为1- = 0.5+2b,后一个区间长4b。 n结论对更多区间的部分合并均衡也成立。n区间,[ , ) 是之一,长度为c,行为方对该区间类型最优行为( + )/2 ,对后一区间[ , )类型的最佳行为( + )/2。两个区间 交界处类型声明方偏好的行为,须在( + )/2和( + )/2 间无差异:
1/26/2020
复旦大学经济博弈论课件
8.1.1 不完全信息动态博弈问题
n 古玩市场等各种议价博弈 n 不完全信息先后选择产量的寡头市场产量博弈 n 彩礼问题 n 广告对消费者的影响 n 学历、成绩在招聘人才、员工中的作用 n 投保人寿保险前的体检 n 学生考试前和毕业论文中的诚信承诺
1/26/2020
声明方 类型
2,0 1,1 1,1 2,0
不能传递信息(声明方 与行为方偏好相反)
1/26/2020
1. 不同类型的声明方必须偏好行为方不同行为 2. 对应声明方不同类型行为方必须偏好不同行为 3. 行为方的偏好必须与声明方具有一致性
复旦大学经济博弈论课件
离散型声明博弈模型
1/26/2020
复旦大学经济博弈论课件
第八章 不完全信息动态博弈
本章讨论不完全信息动态博弈,也就是动 态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯 博弈在许多方面是相似的,差别只是动态贝叶 斯博弈转化成的不是两阶段有同时选择的特殊 不完美信息动态博弈,而是更一般的不完美信 息动态博弈,因此可以直接利用不完美信息动 态博弈的均衡概念进行分析。本章主要介绍信 息传递条件、机制和效率方面的模型。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

G = {S1 ,..., S n ; u1 ,..., un }
if the strategies
* ( s1* , ..., s n )
are a NE, then they survive
iterated elimination of strictly dominated strategies.
Having more information may be a bad thing
Exercise: Extend the analysis to
n firm case.
2.2 Two stage games of complete but imperfect information 2.2.A Theory: Sub-Game Perfection
gi
).
Cont’d
His payoff is
giv(g1 +... + gi1 + gi + gi+1 +... + gn ) cgi
In NE
* * ( g1 ,..., g n ) , for each i , gi* must maximize
(1)
(1), given
that other farmers choose * * 1 i 1
Proposition A
In the
n -player normal form game
G = { S1 ,..., S n ; u1 , ..., u n }
if iterated elimination of strictly dominated strategies eliminates all but the strategies
( g ,..., g , g , g )
* i +1
* n
Cont’d
First order condition (FOC):
* * v( gi + g i ) + gi v '( gi + g i ) c = 0
* * * g i ≡ g1 + ... + gi*1 + gi*+1 + ... + g n
≥0;
q1 and then chooses a quantity q2 > 0 ;
(3) The payoff to firm
i is given by the profit function
π i (qi , q j ) = qi [ P (Q ) c]
P(Q) = a Q is the inverse demand function, Q = q1 + q2 , and
1.Static Game of Complete Information
1.3 Further Discussion on Nash Equilibrium (NE) 1.3.1 NE versus Iterated Elimination of Strict Dominance Strategies
c is the constant marginal cost of production (fixed cost being zero).
Cont’d
We solve this game with backward induction
q2 ∈ arg max π 2 (q1 , q2 ) = q2 (a q1 q2 c) a q1 c q = R2 (q1 ) = 2
1.3.2 Existence of NE
Theorem (Nash, 1950): In the
n -player normal form game
G = {S1 ,..., S n ; u1 ,..., un }
if
n is finite and S i is finite for every i , then there exist at
Then
a1 ∈ arg max u1 (a1 , R2 (a1 ))
“People think backwards”
2.1.B An example: Stackelberg Model of Duopoly
Two firms quantity compete sequentially. Timing: (1) Firm 1 chooses a quantity q1 (2) Firm 2 observes
competing firms? (Convergence to Competitive Equilibrium)
1.4.2 The problem of Commons
David Hume (1739): if people respond only to private incentives, public goods will be underprovided and public resources overutilized.
Here the information set is not a singleton. Consider following games (1)Players 1 and 2 simultaneously choose actions
a1
and
a2
from feasible sets A1 and A2, respectively. (2) Players 3 and 4 observe the outcome of the first stage ( a1, a2) and then simultaneously choose actions and from feasible sets A3 and A4, respectively. (3) Payoffs are ui ( a1 , a2 , a3 , a4 ) , i = 1, 2,3, 4
( s ,..., s ) , then these
* 1
* n
strategies are the unique NE of the game.
A Formal Definition of NE
In the n-player normal form G = {S1 ,..., Sn ; u1 ,..., un } the strategies
max Gv ( G ) Gc
FOC:
v(G**) + G**v '(G**) c = 0
(4)
Comparing (3) and (4), we can see that
G* > G **
Implications for social and economic systems (Coase Theorem)

n farmers’ FOC and then dividing by n yields
(3)
1 v (G * ) + G * v '( G * ) c = 0 n
Cont’d
In contrast, the social optimum G ** should resolve
Hardin(1968) : The Tragedy of Commons
Cont’d
There are
n
farmers in a village. They all graze their goat on the
village green. Denote the number of goats the i th farmer owns by
Cont’d
A maximum number of goats : for Also
Gmax : v(G) > 0
for
,
G < G max
but
v (G ) = 0
G ≥ Gmax
v '(G ) < 0, v ''(G ) < 0
The villagers’ problem is simultaneously choosing how many goats to own (to choose
* 2
(provided that
q1 < a c
).
Cont’d Now, firm 1’s problem
q1 ∈ arg max π 1 (q1 , R2 (q1 )) = q1[a q1 R2 (q1 ) c] ac q = 2
* 1
so,
ac q = 4
* 2
.
Cont’d
Compare with the Cournot model.
gi
, and the total number of goats in the village by
G = g1 +... + gn
Buying and caring each goat cost grazing each goat is
c and value to a farmer of
v (G ) .
2. Dynamic Games of Complete Information
2.1 Dynamic Games of Complete and Perfect Information 2.1.A Theory: Backward Induction Example: The Trust Game General features: (1) Player 1 chooses an action (2) Player 2 observes the feasible set (3) Payoffs are
a1
from the feasible set
相关文档
最新文档