博弈论第6讲
博弈论讲义完整版

第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了“星期五”
石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
你 接受 求爱博弈: 品德优良者求爱 求爱者 求爱
100,100
不接受
-50,0 0,0
不求爱 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱 求爱者 接受 求爱 不求爱 0,0 你 不接受
问题:什么叫“完全而不完美信息博弈”?
第二章 完全信息静态博弈
一 博弈的基本概念及战略表述 二 占优战略(上策)均衡
三 重复剔除的占优均衡(严格下策反复消去法)
四 划线法
五 箭头法
六 纳什均衡
完全信息静态博弈
完全信息:每个参与人对所有其他参与人的特 征(包括战略空间、支付函数等)完全了解
同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境
囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的“最优策略”使整个“系统”处于不利 的状态。
思考:为什么会造成囚徒困境 是否由于“通讯”问题造成了囚徒困境? “要害”是否在于“利己主义”即“个人理 性”?
博弈论第六讲

Generated by Foxit PDF Creator © Foxit Software For evaluation only.
海萨尼转换后的市场进入博弈
N 高成本 [P] 不进入 进入 在位者
(0,300) (0,400)
低成本 进入者 不进入 [1-P] 进入 在位者 默许 斗争
1
Generated by Foxit PDF Creator © Foxit Software For evaluation only.
不完全信息的古诺模型
n在不完全信息的古诺模型中,参与人的类 型是成本函数。 p我们假定参与人1只有一种类型,即其 成本为 c 1; p参与人2有两种类型:
c H (概 率 为 θ ), c L (概 率 为 1 θ ), 其 中 θ 是 共 同 知 识
不完全信息表现在:
n
厂商2的成本有两种可能,是厂商2的私人信息,厂 商1只知道其成本的可能性(概率分布),因此厂商 1对厂商2的得益不完全清楚。
海萨尼转换(1967-1968)
海萨尼转换把不完全信息博弈转换成不完美信息动态博弈
1.引进虚拟自然博弈方,可称为博弈方0,其作用是在博弈方选择 之前,为每个实际博弈方按随机方式抽取他们的类型,构 成向量θ = (θ1,L,θ n ),其中θi ∈Θi , i =1,L, n 2.博弈方0让每个实际博弈方知道自己的类型θi,但不让(全部或 部分)博弈方知道其他博弈方的类型θ−i 3.在前述基础上,再进行原来的静态博弈,即各个实际博弈方 同时从各自的行为空间中选择行动方案a1,L, an 4.各博弈方得益ui = ui (a1,L, an ;θi ), i =1,L, n
Generated by Foxit PDF Creator © Foxit Software For evaluation only.
博弈论66个经典例子之六

博弈论经典例子一、囚徒困境故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。
警察知道两人有罪,但缺乏足够的证据。
警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。
于是,每个囚徒都面临两种选择:坦白或抵赖。
然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。
结果,两个嫌疑犯都选择坦白,各判刑八年。
如果两人都抵赖,各判一年,显然这个结果好。
但这个帕累托改进办不到,因为它不能满足人类的理性要求。
囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
二、旅行者困境两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。
提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。
航空公司知道花瓶的价格大概在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。
于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。
如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元,对讲假话的旅客罚款2元。
为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。
可是不,甲很聪明,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到101元。
何乐而不为?所以他准备写99元。
可是乙更聪明,他算计到甲要算计他写99元,于是他准备写98元。
想不到甲还要更聪明一个层次,估计到乙要写98元来坑他,于是他准备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗,“看”得越远,胜算越大。
第6讲:演化博弈论简介

dx/dt
可知,当F '(0) <0, F'(1)<0, 而F'(11/61)>0,则
x*=0和x*=1为ESS
0 11/61 1
x
这意味着: 当初始x<11/61时,ESS为x*=0;
图2 协调博弈的复制动态相位图
当初始x>11/61时,ESS 为x*=1.
第6讲:演化博弈论简介
复制动态与最优反应动态的比较:
稳定性定理
F(x)=dx/dt,t↑,则x↑
若x<x*,为使x→x*,应满足F(x)>0;
若x>x*,为使x→x*,应满足F(x)<0.
F(x)=dx/dt,t↑,则x↓
F(x)
这意味着:
x* 0 x
当F'(x*)<0,x*为ESS
第6讲:演化博弈论简介
(三)协调博弈的复制动态和ESS
复制动态方程F(x):
非对称博弈:不同群体间的演化博弈行为
(一) 市场阻入博弈
竞争者
有两个群体:竞争者和在位者
不进入
打击 竞 进入 争 者 不进 0 ,0 1 ,5 在位者 不打击 2 , 2 1, 5
进入 在位者 打击 (0,0) 不打击 (2,2)
(1,5)
第6讲:演化博弈论简介
采用A表示竞争者,B表示在位者
打击 A 进入 不进 0 ,0 1 ,5 B 不打击 2 , 2 1, 5
则复制动态方程F(x):
d x x 1 x x a c 1 x b d Fx xU U 1 d t
当F(x) =0时,
复制动态稳定状态为:x*=0,x*=1,x*=(d-b)/(a-b-c+d)
浙大《博弈论基础》蒋文华 第六讲 混合策略和监督博弈

第六讲 混合策略与监督博弈 第十三章 混合策略 第十四章 监督博弈
第十三章 混合策略
第一节 概念及说明
纯策略和混合策略 纯策略:如果一个策略要求参与者在每一个给定 信息情况下只选择一种特定的行动。 混合策略:如果一个策略要求参与者在给定信息 情况下以某种概率分布随机地选择不同的行动。
运用均衡的理念(P154)
当达到纳什均衡的时候,任何一方都不愿意改 变自己的策略。
即对于雇主来说: T检查 (C F) (V W C)(1 ) T不检查 (W) (V W)(1 )
当T检查=T不检查的时候达到均衡。
同理,对于雇员来说:T偷懒 (F ) (W )(1 ) T不偷懒 (W H ) (W H )(1 )
T总=V-H- CV
二、抵押金
V代表雇员创造的 价值,t代表雇员 为公司服务的时间, W代表薪水。
课堂讨论:
A企业起薪高,涨薪慢;B企业起 薪低,涨薪快。你会选哪一个?
特别提示: 选一些难学的专业,成功的路并 没有你想象的那么拥挤!
谢谢
THANK YOU
浙江大学、浙江工商大学和中科院理论物理研究 所的研究人员通过实验发现了石头剪刀布的一个 制胜策略。研究人员招募了360名学生,将他们 分成六组,随机配对玩300轮石头剪刀布游戏, 在每一轮中获胜的学生将会获得少量人民币奖励 。通过观察学生使用的策略,他们发现了获胜者 或失利者习惯使用的游戏策略。
简单说,如果你的剪刀输给了对手的石头,那么下一 轮你更有可能出能战胜石头的布;而如果你是获胜者 ,那么下一轮你更有可能沿用相同的出手。赢家保持 现状输家做出改变的策略(胜留败走)。 石头剪刀布的制胜策略:如果你是输家,下一轮换用 能打败对手的出手;如果你是赢家,下一轮不要再使 用原来的出手。也就是说,你用石头打败了对手的剪 刀,那么下一轮你不能再出石头,而应该出剪刀,因 为对方很有可能会出布。
博弈论理论经典讲解

博弈论经典案例冰晶淩(杂物区)2010-04-09 22:31:28 阅读258 评论0 字号:大中小订阅引用光光的博弈论经典案例1994年诺贝尔经济学奖授给了三位博弈论专家:纳什,泽尔腾和海萨尼.而博弈论可以划分为合作博弈和非合作博弈.那三位博弈论专家的贡献主要是在非合作博弈方面,而且现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈.合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有,就是合作博弈;反之,就是非合作博弈.非合作博弈强调的是个人理性,个人最优决策,其结果可能是有效率的,也可能是无效率的.而合作博弈强调的是团体理性.下面是我收集的张维迎教授的几个有关博弈论的经典案例.<案例一:囚徒困境>囚徒困境讲的是两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里审讯.警察告诉他们:如果两人都坦白,各判刑8年;如果两个都抵赖,各判1年(或许因证据不足);如果其中一人坦白一人抵赖,坦白的放出去,不坦白的判刑10年(这有点'坦白从宽,抗拒从严'的味道).这里,每个囚徒都有两种战略:坦白或抵赖.表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用),其中第一个数字是第一个囚徒的支付,第二个数字为第二个囚徒的支付.战略形式又称标准形式,是博弈的两种表述形式之一,它特别方便于静态博弈分析.在这个例子里,纳什均衡就是(坦白,坦白):给定B坦白的情况下,A的最优战略是坦白;同样,给定A坦白的情况下,B的最优战略也是坦白.事实上,这里,(坦白,坦白)不仅是纳什均衡,而且是一个占优战略均衡.就是说,不论对方如何选择,个人的最优选择是坦白.比如说,如果B不坦白,A坦白的话被放出来,不坦白的话判1年,所以坦白比不坦白好;如果B坦白,A坦白的话判8年,不坦白的话判10年,所以,坦白还是比不坦白好。
这样,坦白就是A占优战略;同样,坦白也是B的占优战略.结果是,每个人都选择坦白,各判刑8年.<案例二:智猪博弈>这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。
第六章最后通牒和独裁者博弈实验解析PPT课件精选全文完整版
最后通牒博弈实验是由德国经济学家Güth, Schmittberger, and
Schwarz (1982)来进行的,他们的实验结果显示传统博弈理论对最后通
牒博弈并没有得出一个有说服力的解释,而且也不能对现实世界中的
人们的行为提出满意的预测。从Güth等人的实验中观察到:在大多数
情况下提议者给响应者的分配比例的平均数不到70%,大约20%的提
12
. 2024/10/15
四、实验报告
教师应该在学生完成实验的第八步骤且上交实验记 录单之后,再将本报告发放给学生。
13
. 2024/10/15
四、相关理论详述
1.动态博弈
所谓动态博弈,是指博弈参与人的行动存在着先后次序, 并且后行动的参与人能够观察到先行动者所选择的行动。 值得注意的是,后者必须至少能获得先发者的部分行为信 息,否则行为时间的先后就不会有任何效果。通俗的理解 是:“囚徒困境”就是同时决策的博弈,属于静态博弈; 而棋牌类游戏等是决策或行动有先后次序的博弈,属于动 态博弈。
以上的钱给对方。某些部落中,送礼是很重要的文化传统,而且接受
了别人的馈赠之后,相对的也必须感恩图报。阿乌人就是如此,他们
对太过慷慨或太过吝啬的馈赠,通常都会拒绝。尽管有文化差异,实
验结果仍然和理性分析所预测的自私行为相去甚远。
19
. 2024/10/15
4、1 ~4轮中,你将与4个对手进行四次博弈,并填写对 手姓名和各轮收益。
7
. 2024/10/15
5、第5 ~8轮实验中,老师宣布你所在的一组同学具有分 配权时,你和你所在的这一组其他同学应该将分配方案写 在标有自己姓名的白纸上,并交给老师,由老师在你们制 定的分配方案中,找出本方目标利益最低的一个方案,选 出另一组同学中任意一位,尤其决定是否接受。如果他不 接受,则每个人得0元,如果他接受的方案正好是你提出的 方案,你和他就按照该方案填写对手姓名和本轮游戏收益。 如果他接受的方案是别人提出来的,那么你只能得0分。
博弈论蒋文华浙江大学
第一讲、博弈论概述献给诸位知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。
第一章何为“博弈”博:博览全局弈:对弈棋局→谋定而动是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。
第一节从一个简单的故事说起博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。
特别提示:博弈既可以是竞争,也可以是合作!特别提示:博弈,必须学会换位思考!特别提示:博弈,只需领先一步,高人一筹!博弈就是你中有我,我中有你。
由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。
博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。
特别提示:站在别人的立场上想一想,就是为自己未来的遭遇着想。
——米兰·昆德拉特别提示:如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示:请不要在一个充分竞争的市场去追求成功!特别提示:选对市场(对手)比选对策略更重要!特别提示:在博弈之前,博弈就已经开始了!第二节博弈的渊源一、中国的理解博+弈=下围棋略观围棋,法于用兵,怯者无功,贪者先亡。
----汉代刘向,《围棋赋》二、西方的理解game(规则)费厄泼赖(fair play)第三节学习博弈论的收益一、当局者清更有利的选择更快速的反应二、旁观者更清理解历史与现实预测未来的发展三、提出完善游戏规则(制度)的建议第二章发展简史第一节最初的探索和应用一、古诺模型参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。
二、伯川德模型该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。
《博弈论》精品讲义
Si,i1 ,2, ,n
和这些局中人各自的支付(盈利)函数
u i( S 1 ,S 2 , ,S n )i, 1 ,2 , ,n
我们将该博弈表示为:
G { S 1 ,S 2 , ,S n ;u 1 ,u 2 , ,u n }
博弈论20092009
正大光明 公正無私
7
➢长街上的超市 (海滩占位模型)
*********************
0
1/4 A’ 1/2 O’
3/4
1
✓资源浪费还是理性的必然?
✓其它相似情形:旅行社的热门路线;黄金时间 的电视节目;总统竞选。
博弈论20092009
正大光明 公正無私
8
➢狩猎与投资 狩猎:
两个猎人围住一头鹿,各卡住两个关口中的 一个,齐心协力即可成功获得并平分猎物。此时 有一群兔子跑过,任何一人去抓兔子必可成功, 但鹿会跑掉。
博弈论20092009
正大光明 公正無私
20
策略型表述: (两人有限博弈;Fra bibliotek阵形式)高需求情况
B
A
低需求情况?
博弈论20092009
正大光明 公正無私
21
➢房地产博弈分析
假设:同时决策;市场需求双方已知
若市场需求大,双方开发,各得0.4万元。 若市场需求小,依赖于对方行动。 若市场不确定,依赖对市场的判断及对方行动。
博弈论20092009
正大光明 公正無私
23
4.博弈练习
➢游戏一:心灵感应 两个人一组,独立写出1至10之间的任
意5个数。如果不重复则得奖;否则受罚。 获胜的秘诀是什么?
博弈论20092009
博弈论最全完整 讲解
也就是说,需要的是对这样的情况下该选什
么的预期的收敛。这一使得参与者能够成功
合作的共同预期的策略被称为焦点。心有灵
犀一点通。
精品课件
例2:焦点博弈 “We Can’t Take the Exam,
Because We Had a Flat Tire”
我们无法从所有这样的博弈的结构中找 到一般和本质的东西,来保证这样的收 敛。
博弈论与信息经济学
Game Theory and Economics of Information
精品课件
博弈论基本思想
人们在日常生活中进行着博弈,与配偶, 朋友,陌生人,老板/员工,教授等。
类似的博弈也在商业活动、政治和外交事 务、战争中进行着——在任何一种情况下, 人们相互影响以达成彼此有利的协议或者 解决争端。
某些博弈中,由于偶然的外因可以对策 略贴标签,或者参与者之间拥有某些共 同的知识体验,导致了焦点的存在。
没有某个这样的暗示,默契的合作就完 全不可能。
精品课件
例3:为什么教授如此苛刻?
许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。
教授们为何如此苛刻? 如果允许某种迟交,而且教授又不能辨
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
精品课件
威廉·维克 瑞,19141996,生于 美国
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
正因为这样的博弈对所有参与者存在着或大 或小的潜在成本,如何达成和维护互利的合 作就成为一个值得探究的重要问题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
28
图2-8 房地产开发博弈
动态博弈的策略式表述
B的纯策略为
{开发,开发} {开发,不开发} A 开发 B 不开发 B
{不开发,开发}
{不开发,不开发}
A的纯策略为
SA=(开发,不开发)
开发
不开发 开发
不开发
于是可以写成策略式 (-3,-3) (1,0) (0,1) (0,0) 表述形式,为 29 图2-8 房地产开发博弈
B B
(4,4)
(8,0)
(-3,-3)
(1,0) (0,8) (0,0) (0,1)
(0,0)
8
图2-2 房地产开发博弈
博弈树
若动态博弈是有限博弈,则可用博弈树 表示该博弈。这里有限的含义是
各阶段各参与人的行动数目有限 博弈的阶段数有限
9
博弈树
博弈树的基本结构为
结点(nodes)。包括决策结及终点结。决策 结是参与人采取行动的时点;终点结是博 弈行动路径的终点。 枝(branches)。从一个决策结到它的直 接后续结的连线,每一个枝代表参与人的 一个行动选择。
对完美信息动态博弈的博弈树来说,一个信 息集只包含一个决策结,对不完美信息动态 博弈,则一个信息集包含多个决策结。
12
博弈树
信息集:是决策结集合的一个子集。将博 弈树中某一决策者在某一行动阶段具有相 同信息的所有决策结称为一个信息集。
每个决策结都是同一个参与人的决策结。
该参与人知道博弈进入该集合的某个决策结, 但不知道自己究竟出于哪一个决策结(若该信 息集有两个或两个以上元素)。
但B有两个信息集,每个 信息集上有两个可选择的 行动,因而B有四个纯战 略,分别为
不论A开发还是不开发, 我开发; A开发我开发,A不开发 我不开发; A 开发 B 不开发 B
A开发我不开发,A不开 发我开发;
不论A开发与否,我不开 发。
开发
不开发 开发 (1,0) (0,1)
不开发
R
A 不 能 区 分 ( D,L )和 (D,R) 是正常的,因 为参与人1可能 没有观察到B是 选择了L还是选 择了R。
21
一些说明
现实中不具完美回忆的一个例子是扑克 比赛。在扑克比赛中,参与人常常忘记 别人曾出过些什么牌。
22
一些说明
需要注意的是,若有些动态博弈的阶段 很多乃至无限,或者参与人在一个阶段 有许多可以选择的行为,这时采用博弈 树表述将变得很困难,或者不可行。如 下棋等。 此时应用文字描述或用数学抽象形式表 述。
开发
不开发
B
开发
不开发 (1,0)
B
开发 不开发 (0,0)
(-3,-3)
(0,1)
图2-8 房地产开发博弈
比如(开发,{不开发, 表2-1 房地产开发博弈:策略式表述 开发,不 不开发, 不开发, 开发})决定了博弈的 开发,开发 开发 开发 不开发 路径为A开发B 开发 -3,-3 1,0 1,0 1,0 不开发(1,0)
这是一个完美信息博 弈(每个参与人的信 息集是单结的)。 A只有一个信息集, 两个可选择行动,因 而A的行动空间也就 是A的战略空间: SA=(开发,不开发)。
开发 B
A 不开发 B
开发
不开发 开发 (1,0) (0,1)
不开发
(0,0)
(-3,-3)
26
图2-8 房地产开发博弈
动态博弈的策略式表述
11
Definition An information set for a player is a collection of decision nodes satisfying: (ⅰ)the player has the move at every node in the information set,and (ⅱ)when the play of the game reaches a node in the information set, the player with the move does not know which node in the information set has (or has not) been reached.
10
节点nodes
决策节点(decision nodes)
终点节点(terminal nodes)
枝branches:每一条树枝代表一个行动 信息集information sets:参与人在决策节 点选择行动时,需要有关信息;对此前 博弈过程的一个全部而明确的认识就构 成一个信息集。信息集的定义:
(-3,-3)
(0,1)
图2-8 房地产开发博弈 表2-1 房地产开发博弈:战略式表述
开发,开发 开发,不 开发 不开发, 开发 不开发, 不开发
开发 不开发
-3,-3 0,1
-3,-3 0,0
1,0 0,1
1,0 0,0
33
动态博弈的策略式表述
给出了扩展式表述的战略式表述转换,就可 以像静态博弈那样,定义纯战略纳什均衡或 混合战略纳什均衡。 按照Von Neumann观点,将动态博弈模型转化 成策略式表述形式后,按照静态博弈分析方 法,即可处理动态博弈问题。 近来研究表明,存在策略式表述相同,但却 有本质差别的,不同扩展式表述的动态博弈。 说明上述观点具有一定的局限性。因此,策 略式表述并不能取代扩展式表述。
17
18
博弈树实例
注意,扩展式表述也可以用于分析静态博弈, 如图2-5的囚徒问题。
A 坦白 B 坦白 抵赖 坦白 抵赖 B 抵赖
(-5,-5) (0,-8)
(-8,0)
(-1,-1)
19
图2-5 囚徒问题的扩展式表述
一些说明
一般假定博弈满足“完美回忆”(perfect recall)要求。
(0,0)
(-3,-3)
27
图2-8 房地产开发博弈
动态博弈的策略式表述
若把B的信息集从左 到右排列,上述四个 纯战略可以简单记为
{开发,开发}
{开发,不开发} {不开发,开发} 开发 B
A 不开发 B
{不开发,不开发}
开发
不开发 开发 (1,0) (0,1)
不开发
(0,0)
(-3,-3)
5
博弈的扩展式表示
参与人的信息集(information set):每次 行动时参与人知道什么;
参与人的收益函数:在行动结束之后, 每个参与人得到些什么。 自然选择的概率分布(假定自然状态是 共同知识)。 对于有限博弈,博弈树是常用的表述方 式。
6
扩展式表述简例
图2-1就是一个商品仿冒和反仿冒动态博弈的 扩展型描述。
30
动态博弈的策略式表述
A
该博弈有四个纯战略 纳什均衡,分别为
(开发,{开发,不开 发 }) (开发,{不开发,开 发 }) (开发,{不开发,不 开发})
开发
不开发
B
开发
不开发 (1,0)
B
开发 不开发 (0,0)
(-3,-3)
(0,1)
图2-8 房地产开发博弈 表2-1 房地产开发博弈:策略式表述
“完美回忆” 的概念
完美回忆是指没有任何参与人会忘记自己 以前知道的事情,所有参与人都知道自己 以前的选择。 可以利用信息集概念描述完美回忆。
20
一些说明
图2-6描述了不完美回忆现象。
A
U L
D
B
R
B
但A不能区分 L A ( U,R )和 (D,L) A A 则说明A忘记了 在开始博弈时 选择了U行动 还是D行动, 因而不具有完 图2-6 不具有完美回忆的例子 美回忆。
knows the full history of the play of the game thus far.
14
15
16
博弈树
对于有限动态博弈,若参与人对彼此在各 决策结点的行动集合,彼此的效用函数, 历史的行动有着完全的了解,则称这样的 博弈为完全信息动态博弈。
如果博弈树的所有信息集都是单元素集, 称该博弈为完美信息博弈(game of perfect information)。 上述两个定义的差别在于对自然行动信息 的描述。
A 仿冒 制止 (-2,5) 制止 B 不制止 仿冒 B 不制止 (10,4) A 不仿冒 (0,10) 不仿冒
(5,5)
(2,2)
7
图2-1 仿冒和反仿冒博弈扩展型表述
扩展式表述简例
图2-2是包括自然选择的博弈扩展式表述
A
开发 不开发
N
大(1/2) 小(1/2)
N
大(1/2)
小(1/2)
B
B
24
动态博弈的策略式表述
从扩展式表述构造战 略式表述
假定开发商A先决策, 开发商B观测到A的 选择后决策。 那么博弈的扩展式表 述如图2-8表述。
开发
A 开发 B 不开发 开发 (1,0) (0,1) 不开发 B
不开发
(0,0)
(-3,-3)
25
图2-8 房地产开发博弈
动态博弈的策略式表述
上次内容回顾
帕累托占优 风险占优 聚点均衡 防共谋均衡 两个拆迁博弈
1
动态博弈的概念
一类博弈行为通常需要参与人多步决策 才能完成,具有明显的阶段性。
博弈的结局、各参与人的收益由多阶段 决策结果确定。 各参与人的决策有一定的顺序。
2
The key features of a dynamic game of complete and perfect information are that (ⅰ)the moves occur in sequence, (ⅱ)all previous moves are observed before the next move is chosen, and (ⅲ)the players’ payoffs from each feasible combination of moves are common knowledge.