经济博弈论 教程
经济博弈论讲解

L
2
x2
L´
R´
1
x1
R
2
x3
L´
R´
第6章
x4
L´´
R´´
x5
L´´
R´´
x6
L´´
R´´
L´´ x7 R´´
由于参与人3选择时,参与人1和参与人2都已经做出了选择, 因此当参与人3选择时可能面临的决策情形就有四种: (1)既知道参与人1的选择,也知道参与人2的选择; (2)知道参与人1的选择,但不知道参与人2的选择; (3)知道参与人2的选择,但不知道参与人1的选择; (4)既不知道参与人1的选择,也不知道参与人2的选择。
A的得益
制止 (-2,5)
制止 (2,2)
仿冒
A 不仿冒
B
不制止 (0,10)
仿冒
A
B 不制止
不仿冒 (5,5)
(10,4)
四个节均称为决策节:表示参与人在此选择行动
终点结:博弈行动路径
B的得益
的终点
信息集(每次行动时参与人知道些什么)
信息集由同一局中人在相同的时点上具有相同信息的决策节 点信组息成集。。用它满Iik(足i=1:,1,2, …,n,k=0,1,2, …ri)表示局中人i的第k个
连在一起。
参它与满人足两i的个信条息件集:(用Ii表示)是参与人i决策节的一个集合, (1) Ii中的每个决策节都是参与人i的决策节。 (的2决)策当节博上弈,达但到不信知息道集自Ii时己,究参竟与在人Ii中i知哪道个自决己策是节在上信。息集中
在博弈中,如何将“企业2行动时是否观察 到企业1的选择”这一信息表达出来? 开发
完全且完美信息动态博弈
游戏
两人参与游戏。首先参与人1可以向盒子里放1元钱或3元钱或 不放钱,然后盒子传到参与人2那里。参与人2看到盒子里的钱 后,他可以选择做相同的投资,即参与人1放1元钱他放1元钱, 参与人1放3元钱他放3元钱,他也可以把参与人1放的钱拿走。
复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
经济博弈论第二讲

▪ 请画出策略组合及得益矩阵,并分析博弈结果。
课后作业2(分析智猪博弈)
▪ 在博弈论经济学中,“智猪博弈”是一个著名例子 ▪ 假设猪圈里有一头大猪,一头小猪。猪圈的一头有猪
食槽,另一头安装着控制猪食供应的按钮,按一下按 钮会有10个单位的猪食进槽,但是谁按按钮就会首先 付出2个单位成本,若大猪先到槽边,大小猪吃到食 物的收益比是9:1;同时到槽边,收益比是7:3;小 猪先到槽边,收益比是6:4。 ▪ 在两头猪都有是有智慧的前提下,请分析猪的选择策 略。
▪ 上策均衡是反映了所有博弈方的绝对偏好,因此 非常稳定。根据上策均衡,就可以对博弈结果作 出最肯定的预测。
▪ 因此,进行博弈分析时,应首先判断各个博弈方是 否都有上策,博弈中是否存在上策均衡。
▪ 上策均衡分析采用的决策思路是一种选择法的思路, 是在所有可选择策略中选出最好的一种的思路。
▪ 因为博弈方的最优策略随其他博弈方的策略而变化 是博弈的根本特征,是博弈关系相互依存性的主要 表现形式,所以上策均衡不是普遍存在的。
1, 0 0, 4
1, 3 0, 2
囚
0, 1
徒
困
2, 0
境
-5, -5 -8, 0
0, -8 -1, -1
▪许多博弈不存在确定性的结果
猜
-1, 1
硬
币
1, -1
1, -1 -1, 1
夫 妻
2, 1
之
0, 0
争
0, 0 1, 3
2.1.4 箭头法
▪ 对博弈中每个策略组合进行分析,考察每个策略组合处各个博弈方 能否通过单独改变自己的策略而增加得益。
经济博弈论课件4

本章介绍基本博弈重复进行构成的重复博弈。 虽然形式上是基本博弈的重复进行,但重复博弈中 博弈方的行为和博弈结果却不一定是基本博弈的简 单重复,因为博弈方对于博弈会重复进行的意识, 会使他们对利益的判断发生变化,从而使他们在重 复博弈过程中的行为选择受到影响。这意味着不能 把重复博弈当作基本博弈的简单叠加,必须把整个 重复博弈过程作为整体进行研究。
t =1
∞
4.2 有限次重复博弈
4.2.1 两人零和博弈的有限次重复博弈 4.2.2唯一纯策略纳什均衡博弈 的有限次重复博弈 4.2.3多个纯策略纳什均衡博弈 的有限次重复博弈 4.2.4 有限次重复博弈的民间定理
4.2.1 两人零和博弈的有限次重复博弈
零和博弈是严格竞争的,重复博弈并不改变这 一点。 以零和博弈为原博弈的有限次重复博弈与猜硬 币博弈的有限次重复博弈一样,博弈方的正确 策略是重复一次性博弈中的纳什均衡策略。
本章分三节
4.1 重复博弈引论 4.2 有限次重复博弈 4.3 无限次重复博弈
4.1 重复博弈引论
4.1.1 为何研究重复博弈 4.1.2 基本概念
4.1.1 为何研究重复博弈
经济中的长期关系 人们的预见性 未来利益对当前行为的制约 长期合同、回头客、长客和一次性买卖的区别 有无确定的结束时间
V = 4 + δV
因此当 δ > 1 / 4 时,此触发策略纳什均衡策略
-1,-1
ห้องสมุดไป่ตู้
(-5,-5) 囚徒2 囚徒 坦 白 不坦白 囚 坦白 -10,-10 -5,-13 徒 -13,-5 -6,-6 1 不坦白 (-10,-10)
有限次重复削价竞争博弈
寡头2 寡头 高 价 寡 高价 头 1 低价 100,100 150,20 低 价 20,150 70,70
复旦大学经济博弈论课件--经济博弈论536页

d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
经济博弈论第2章(23) ppt课件

4 1
如果一个混合策略是流浪汉的最优选择,那一定意味 着政府在救济与不救济之间是无差异的,即:
uG 1, 4 1 uG 0,
0.2
PPT课件
18
• 解二: 支付等值法
如果一个混合策略是政府的最优选择,那一定意
味着流浪汉在寻找工作与游闲之间是无差异的,
即:
流浪汉
找工作
游荡
政府 救济 不救济
3,2 -1 , 1
-1 , 3 0,0
uL 1, 1 3 uL 0,
0.5
PPT课件
19
五、混合战略纳什均衡
• 对 * 0.2 的解释: • 如果流浪汉找工作的概率小于0.2, 则政府选择不
救济,如果大于0.2,政府选择救济 ,只有当概率等 于0.2时,政府才会选择混合战略或任何纯战略. • 对 * 0.5 的解释 • 如果政府救济的概率大于0.5,流浪汉的最优选择 是流浪,如果政府救济的概率小于0.5,流浪汉的最 优选择是寻找工作.
1 , -1 -1 , 1
假设A出红牌的概率为 p;B出红牌的概率为 q ;则
U A( p, q) 2 p(1 2q) (2q 1)
因此A的最佳反应函数为
p 1
0, 当q 1/ 2
p [0,1],当q 1/ 2
1, 当q 1/ 2
PPT课件
0
1/2
1 q 27
第二章 完全信息静态信息博弈-纳什均衡
一 博弈的基本概念及战略表述 二 占优战略均衡 三 重复剔除的占优均衡 四 纳什均衡 五 混合战略纳什均衡 六 纳什均衡存在性及相关讨论
PPT课件
经济博弈论ppt课件
1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
经济博弈论课程教学大纲
经济博弈论课程教学大纲经济博弈论课程教学大纲随着经济全球化和市场竞争的加剧,经济博弈论作为一门重要的经济学分支学科,逐渐受到人们的重视。
经济博弈论研究的是个体或群体在决策过程中面临的各种策略选择和博弈行为,以及这些行为对个体或群体利益的影响。
本文将探讨经济博弈论课程教学的大纲设计。
一、引言经济博弈论的基本概念和研究对象。
介绍经济博弈论的起源、发展和应用领域,以及为什么学习经济博弈论对于理解和解决现实经济问题的重要性。
二、博弈基本概念2.1 策略与策略组合解释策略和策略组合的概念,以及它们在博弈过程中的作用。
介绍纳什均衡和博弈树等基本工具,以及它们在博弈分析中的应用。
2.2 支配策略与支配策略组合讲解支配策略和支配策略组合的概念,以及如何通过排除支配策略来简化博弈分析。
举例说明支配策略的应用和意义。
2.3 均衡概念介绍纳什均衡、帕累托最优和互利最优等均衡概念。
解释各种均衡概念的定义和特点,以及它们在不同博弈模型中的应用。
三、静态博弈3.1 纳什均衡详细讲解纳什均衡的概念和计算方法。
通过案例分析,演示如何找到博弈中的纳什均衡,并讨论纳什均衡的稳定性和存在性。
3.2 博弈分类与解介绍博弈的分类方法,如合作博弈和非合作博弈。
解释不完全信息博弈和完全信息博弈的区别,并探讨如何解决不完全信息博弈中的不确定性问题。
四、动态博弈4.1 重复博弈讲解重复博弈的概念和特点。
介绍如何通过反复博弈来解决非合作博弈中的合作问题,以及如何应对策略的变化和学习。
4.2 演化博弈介绍演化博弈的基本原理和方法。
讨论演化博弈在生物学和社会科学中的应用,并探讨演化稳定策略的形成和演化路径。
五、应用案例分析通过实际案例,分析和讨论经济博弈论在市场竞争、企业决策、政府政策制定等领域的应用。
重点关注博弈分析在解决现实经济问题中的局限性和挑战。
六、总结与展望总结经济博弈论课程的主要内容和学习收获。
展望经济博弈论在未来的发展方向和应用前景,并鼓励学生在实际问题中运用所学知识进行创新和研究。
高鸿业西方经济学-第10章博弈论初步dmqn.pptx
30
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
二、存在纯策略均衡时的混合策略均衡
求解混合策略纳什均衡的方法不仅适用于纯策略 纳什均衡不存在的情况,而且也适用于纯策略纳什均 衡存在的情况。在后面这种情况下,纯策略纳什均衡 将作为特例被包含在相应的混合策略纳什均衡之中。
2024年9月29日星期日
12
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
五、寻找纳什均衡的方法——条件策略下划线法
2.条件策略下划线方法的五步法 第二,在甲厂商的支付矩阵中,找出每一列的最大者 (每列的最大者可能不只一个),并在其下划线
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
13
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
个厂商都不再有单独改变策略的倾向时,整个博弈就 达到了均衡,即博弈均衡。
博弈均衡是博弈各方最终选取的策略组合,是博 弈的最终结果,是博弈的解。
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
8
第十章 博弈论初步 第二节 同时博弈:纯策略均衡
四、纳什均衡
2.纳什均衡的概念 第一,纳什均衡的概念
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
24
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
一、不存在纯策略均衡时的混合策略均衡
1.混合策略 第三,“混合”策略的概念
把甲厂商和乙厂商原来的策略叫做“纯”策略, 把赋予这些纯策略的概率向量叫做“混合”策略。
2024年9月29日星期日
2024年9月29日星期日
制作者:张昌廷(河北经贸大学)
23
第十章 博弈论初步 第三节 同时博弈:混合策略均衡
第六章、合作博弈 《经济博弈论基础》PPT课件
• 定义4:对于n人合作博弈(N,V),分配集 W E(V )为稳定集, 则W满足:
(1)(内部稳定性)不存在 x, y W ,满足 x y; (2)(外部稳定性)对 y W ,x W,使得 x y 。
(N,V),有 i[U V ] i[U] i[V ]
4、夏普利值(Shapley value)
• 公理 (S1)反映了帕累托最优性的要求,表示分配收益时,不
七、策略型博弈向特征函数型博弈的转化
对于特征函数的上述求法,主要的批评是:它忽略 了联盟外局中人使联盟面临最坏处境时,自己也将付 出代价(有时代价很高)。
Harsayni认为,特征函数的取值应该由联盟与其对 立联盟(联盟外所有局中人形成的联盟)之间的一次 谈判而决定。
第二节 合作博弈解
一、合作博弈求解思路 合作博弈理论求解的目的: 得到博弈的“理性”最终分配,主要方法有 两种:优超与赋值。
(2) 分配:合作博弈的一个分配是指对n个局中人来说,存
在一个向量 x (x1,, xn ) ,满足:
(1) xi V (N) ;(2) xi V (i)。
其中V(N)表示n个局中人总的最大收益,V(i)表示局中人i不 与任何人结盟时的收益。
三、分配定义中两个条件的含义
条件(1)是群体理性,说明个人分配的收益和正好 是各种联盟形式总的最大收益;
七、策略型博弈向特征函数型博弈的转化
V(Φ)=0,没有人的联盟是不会有任何收益的;
V(1)=0,局中人2能使局中人1面临的最坏情形是局中人2取
策略
s
1 2
,局中人1将不得不在0与-1之间选择。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
②因为零和博弈即使重复进行多次也无法改变博弈方之间相互对立的 关系。 2、常和博弈 与上述零和博弈不同,在有些博弈中,每种结果之下各博弈方的得益 之和不等于0,但总是等于一个非零常数,这也是一类有特殊意义的 博弈,我们称之为“常和博弈”。当然零和博弈本身可被看作是常和 博弈的特例。 与零和博弈一样,常和博弈中各博弈方之间的利益关系也是对立的, 因此这些博弈方之间的基本变和博弈 零和博弈和常和博弈以外的所有博弈都可被称为“变和博弈”。变和 博弈即意味着不同策略组合(结果)下各博弈方的得益之和一般是不 相同的。变和博弈是最一般的博弈类型,而常和博弈和零和博弈则都 是它的特例。
严格下策反复消去法应用举例(1)
严格下策反复消去法应用举例(2)
严格下策反复消去法有时失效的原因在于有些博弈中的不 同策略往往不存在绝对的优劣关系,而是相对的优劣关系。 2.1.3 划线法 其思路是:先找出自己针对其他博弈方每种策略的最佳对 策,然后在此基础上,通过对其他博弈方策略选择的判断, 预测博弈可能的结果和确定自己的最优策略。
经济博弈论教程
1博弈导论
1.1博弈和博弈论 1.1.1概念 “博弈论”译自英文Game Theory。其实Game的基本意义是游戏, 因此Game Theory直译应该是“游戏理论”。 进一步观察还可以归纳出游戏的下列四个共同特征:第一,都有一定 的规则。 第二,有一个结果。而且结果常能用正或负的数值表示,至少能按照 一定的规则折算成数值。 第三,策略至关重要。 第四,策略有相互依存性。 因此博弈论在我国有时也常被称为“对策论”,具体的博弈问题则被 称为“对策”问题。
2.关于博弈进程的信息 动态博弈中如果轮到行为的博弈方对博弈的进程,即此前 行为的各博弈方的行为完全了解,我们称这样的博弈方 “具有完美信息的”博弈方,如果动态博弈中的所有博弈 方都是具有完美信息的,则该动态博弈称为“完美信息的 动态博弈”。 动态博弈中轮到行为的博弈方不完全了解此前全部博弈进 程时,我们称这样的博弈方“具有不完美信息的”博弈方, 有这样的博弈方的动态博弈则称为“不完美信息的动态博 弈”。
博弈的基础 1、“个体行为理性”-----是指个体的行为始终都是以实现自身的最大 利益为唯一目标,除非为了实现自身最大利益的需要,否则不会考虑 其他个体或社会的利益这样一种决策原则。 2、“非合作博弈”-----是指在各博弈方之间不能存在任何有约束力的 协议,也就是说各博弈方不能公然“串通”、“共谋”的博弈问题。 事实上,在我们证明非合作博弈无效率或低效率的同时,就自然说明 了存在着合作的可能性和必要性。
1.1.2定义 现在,我们来给博弈下一个定义:博弈即一些个人、队组 或其他组织,面对一定的环境条件,在一定的规则下,同 时或先后,一次或多次,从各自允许选择的行为或策略中 进行选择并加以实施,并从中各自取得相应结果的过程。 规定或定义一个博弈需要设定下列几个方面:(1)博弈 的参加者。 (2)各博弈方各自可选择的全部策略或行为的集合。 (3)进行博弈的次序。不同的次序必然是不同的博弈。 (4)博弈方的得益。结果无法量化为数量的决策问题不 能放在博弈论中研究。
1.3.5
博弈的信息结构
1.关于得益的信息 博弈中最重要的信息之一就是关于得益的信息, 即每个博弈方在每种结果(策略组合)下的得益 情况。 一般地,我们将博弈中各博弈方都完全了解所有 博弈方各种情况下得益听博弈称为“具有完全信 息的博弈”, 而将在博弈中至少存在部分博弈方不完全了解其 他博弈方得益情况的博弈称为“具有不完全信息 的博弈”。
1.3
博弈结构和博弈分类
1.3.1 博弈中的博弈方 博弈中独立决策、独立承担博弈结果的个人或组织称为博弈方。
1、单人博弈 所谓单人博弈就是指只有一个博弈方的博弈。 严格地讲,单人博弈已经退化为一般的最优化问题。
单人迷宫
单人迷宫博弈的扩展形
商人的运输路线博弈
走 水 路 的 期 望 得 益 为 : (-7000)*75%+(-16000)*25%=9250 因为9250<10000 ,应选水路。 若多次碰到同样的决策选择并每次都这样决策,则平均每 次费用应接近9250。 注释:“风险中性”类型的,即1单位期望得益和1单位确 定的得益对他来说是等价的。一种称为“风险偏好”,持 这种态度的人认为1单位的期望得益于1单位确定的得益; 另一种则正好相反,认为1单位期望得益不如1单位确定的 得益,称为“风险规避”。 事实上,当博弈方数量达到两个以上后,信息越多得益越 大的结论就不一定成立了。
两人博弈 第一,需要我们注意的是两人博弈中的两个博弈方之间并 不总是相互对抗的,有时候也会出现两博弈方的利益是一 致的情形。 第二,在两人博弈中,掌握信息较多并不能保证得益也一 定较多。 第三,我们在囚徒的困境博弈中已经证实了结论:个人追 求自身最大利益的行为常常并不能导致实现社会的最大利 益,也常常不能真正实现自身的最大利益。
1.2.3 关于产量决策的COURNOT(古诺)模型
设市场上有 n个厂商,厂商I的产量为qi,整个市场总产量Q=∑qi, 能够将商品全部销出的“市场出清价格”是投放到该市场上的该种商 品总量的函数,商品总量越大,市场出清价格就越低,而商品的总量 当然就是这n个厂商各自产量的总和。 市场出清价格P=P(Q),因此,P=P(Q)=P(∑qi ), 得益就是生产的利润,也就是销售收益减去成本后剩下的余额。 厂商i的收益为qi*P= qi* P(∑qi ),设每个厂商的平均单位成本为C, 因此厂商I生产qi产量的得益为: qi* P(∑qi )-C*qi=qi*[ P(∑qi )-C] 可见,厂商I的得益不仅取决其自身的产量和成本,还通过价格取决于 其他厂商的产量决策,即显示出策略的相互依存性。 如果我们假设产量是连续可分的(这时数学处理和讨论较容易),则 即使将超过厂商生产能力的不可能的产量去掉以后,每个厂商还都有 无限多种可供选择的产量。 所以此类问题要用函数表示。
第二章 完全信息静态博弈
所谓完全信息静态博弈即各博弈方同时决策,且 所有博弈方对博弈中的各种情况下的得益都完全 了解的博弈问题。 2.1. 基本分析思路和方法 2.1.1 上策均衡 某博弈中,如果不管其他博弈方选择什么策略, 一博弈方的某个策略给他带来的得益始终好于其 他策略,至少比低于其他策略,则该策略即为 “上策”。 如果一个博弈的某个策略组合中的所有策略都是 各方各自的上策,那么它必然是比较稳定的结果---上策均衡
1.2几个典型的博弈问题
1.2.1 囚徒的困境
由于这种结果在一次/有限次博弈中具有必然性,无法摆脱,因此叫做 “囚徒困境”。
启示:当一个社会中的每个个体都只为自身的利益打算时,即使大家 都遵守社会规则,个体的行为是不一定符合集体的或社会的利益的, 甚至也不一定真能实现个体的最佳利益,即使追求个体利益的动机变 为实现社会最大利益的手段的“看不见的手”并不总是存在的。
双寡头削价竞争
这个博弈的最终结果一定是两寡头都采用“低价”策略,即(70, 70)。 由于双方无法信任对方,即使彼此都完全清楚利害关系和相应的得益, 也无法改变这种结局,因此也是一种“囚徒困境”。
1.2.2 赌胜博弈
1、齐威王与田忌赛马
首先,各方不能让对方猜中自己的策略。 其次,6种策略本身相互之间并无优劣之分,有依存性。 因此,各方应以相同的概率选用。
这也就意味着在博弈方之间存在互相配合(不是串通,是指在利益驱 动下各自自觉、独立采取的合作态度及行为),争取较大的社会总得 益和个人得益的可能性。 1.3.4 博弈的过程 静态博弈 所有博弈方同时或可看作同时选择策略的博弈我们称为“静态博弈”。 动态博弈 我们把这种各博弈方不是同时,而是先后、依次进行选择、行动,而 且后选择、行动的博弈方在自己选择行动之前一般能看到此前其他博 弈方的选择、行动的博弈称为“动态博弈”。 因此在博弈方之间肯定是有某种不对称性的。 因而动态博弈中各博弈方的“策略”就是指这种计划,因此策略与选 择、行为之间不能简单等同。
多人博弈 有三个或三个以上博弈方参加的博弈我们称为“多人博 弈”。
在三人以上博弈中还有一个与两人博弈有本质区别的特别, 即可能存在“破坏者”。所谓破坏者即一个博弈中具有下 列特征的博弈方:其策略选择对自身的得益没有任何影响, 但却会影响其他博弈方的得益,有时这种影响甚至有决定 性的作用。
划线法举例---1
划线法举例---2(有解/无解)
划线法举例---3(夫妻之争/题目)
划线法举例---3(夫妻之争/结论)
该博弈有稳定的解,而无确定的解。
二、个体理性和集体理性
集体理性指至少有部分决策者追求集体利益最大 化的情况。 一般而言,集体利益最大化不是博弈方的根本目 标,人们的行为准则是个体理性。 允许存在有约束力协议的博弈称为合作博弈;不 允许存在有约束力协议的博弈称为非合作博弈。 非合作博弈受重视的原因:1、主导人们行为的基 石是个体理性。 2、如果证明了非合作博弈的无/低效率,自然就 说明了合作的必要性。
扩展形适合表示许多多人博弈,特别是动态多人博弈。
用矩阵表示三方博弈
1.3.2 博弈中的策略
博弈中的策略就是博弈中的各博弈方的决策内容,也就是对行为、经 济活动水平等等的可能的选择。 分为:有限策略博弈和无限策略博弈。 无限策略博弈一般只能用函数方式加以表示。
1.3.3 博弈中的得益
动态博弈举例
重复博弈 所谓重复博弈实际上就是同一个博弈反复进行所构成的博弈过程。构 成重复博弈的一次性博弈我们称为“原博弈”或“阶段博弈”。 因此重复博弈的最少重复次数是两次。这种到一定重复次数后肯定要 结束的重复博弈称为“有限次重复博弈”;否则为“无限次重复博 弈”。 在重复博弈中,我们关心的不是某一次重复的结果或得益,而是原博 弈重复进行以后的总体效果或平均效果,也就是说,重复博弈给博弈 提供了新的实现更有效率的结果的可能性,重复博弈的重复次数越多, 这种可能性就越大。 主要因为各方都担心对方在未来的报复,从而目前只能试图合作。