尼科尔森《微观经济理论——基本原理与扩展》(第9版)笔记和课后习题详解-博弈定价模型(圣才出品)
尼科尔森微观经济理论_基本原理与扩展(第9版)课后习题详解(第3章 偏好与效用)

尼科尔森《微观经济理论-基本原理与扩展》(第9版)第2篇 选择与需求 第3章 偏好与效用课后习题详解跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。
以下容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。
1.画出下列效用函数的无差异曲线,并判断它们是否是凸状的(即边际替代率MRS 是否随着x 的增加而递减)。
(1)(),3U x y x y =+ (2)(),U x y x y =⋅ (3)(),U x y x y =+ (4)()22,U x y x y =- (5)(),xyU x y x y=+ 答:(1)无差异曲线如图3-7所示,为一组直线。
边际替代率为:/3/13x y MRS f f ===,为一常数,因而无差异曲线不是凸状的。
图3-7 完全替代型的无差异曲线(2)无差异曲线如图3-8所示,为性状良好的无差异曲线。
边际替代率为:()()0.50.50.5///0.5/x y y x MRS f f y x y x -===,随着x 的递增,MRS 将递减,因而有凸的无差异曲线。
图3-8 凸状的无差异曲线(3)无差异曲线如图3-9所示。
边际替代率为:0.5/0.5x y MRS f f x -==,因而边际替代率递减,无差异曲线是凸状的,此为拟线性偏好的效用函数。
图3-9 拟线性型的无差异曲线(4)无差异曲线如图3-10所示。
边际替代率为:()0.522220.5/0.52/0.5()2/x y MRS f f x y x x y y x y --==-⋅-⋅=,因而边际替代率递增,无差异曲线不是凸状的。
图3-10 凹状的无差异曲线(5)无差异曲线如图3-11所示。
尼科尔森《微观经济理论-基本原理与扩展》(第9版)课后习题详解(第4章 效用最大化与选择)

尼科尔森《微观经济理论-基本原理与扩展》(第9版)第4章 效用最大化与选择课后习题详解跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。
以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。
1.三年级学生保罗每天在校用餐,它只喜欢Twinkie (t )和苏打水(s ),他从中得到的效用为:(),U t s ts =。
(1)如果每份Twinkie 为0.1美元,苏打水每瓶为0.25美元,为了使效用最大化,保罗应该如何将妈妈给他的1美元伙食费分配在这两种食物上?(2)学校为了减少Twinkie 的消费,将其价格提高到每份0.4美元,那么为了让保罗得到与(1)中相同的效用,妈妈现在要给他多少伙食费?解:(1)对效用函数(),U t s ts =进行单调变换,令()()2,,V t s U t s ts ==⎡⎤⎣⎦,这并不改变偏好次序。
保罗效用最大化问题为:max .. 0.10.251tss t t s +=设拉格朗日函数为:()(),,10.10.25L s t ts t s λλ=+--一阶条件为:0.100.25010.10.250Ls t Lt s Lt s λλλ∂=-=∂∂=-=∂∂=--=∂ 解得:2s =,5t =。
因此,他所获得的效用:10U =(2)消费品Twinkie 价格提高了,但效用水平却保持不变,则保罗面临如下的支出最小化问题:min 0.40.25..10t s s tts +=设拉格朗日函数为:()(),,0.40.2510L s t t s ts λλ=++-一阶条件为:0.40Ls tλ∂=-=∂ (1) 0.25Lt sλ∂=-=0∂ (2) 100Lts λ∂=-=∂ (3) 由上述三式解得 2.5t =,4s =,则最小支出为:10.4 2.50.2542m =⨯+⨯=,所以妈妈现在要给他2美元伙食费使他的效用水平保持不变。
尼科尔森《微观经济理论-基本原理与扩展》(第9版)课后习题详解(第18章--不确定性和风险厌恶)

尼科尔森《微观经济理论-基本原理与扩展》(第9版)第7篇不确定性、信息和外部性第18章不确定性和风险厌恶课后习题详解跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。
以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。
1.乔治花了整整10万美元的赌注押在公牛队身上,打赌公牛队在与太阳队的NBA 总决赛中会获胜。
如果乔治的财富效用函数是对数形式的,并且他现在的财富是100万美元,那么他认为公牛队一定会赢的最小概率是多大?解:假设公牛队会赢的最小概率为p ,假设乔治的效用函数为:ln U w =,其中w 为财富水平。
在乔治参加赌博的情况下,他的期望效用为:()ln11000001ln 900000p p +-在乔治不参加赌博的情况下,他的效用为:ln1000000。
为了使他参加赌博,因而有:()ln11000001ln 900000ln1000000p p +-≥从而可以解得:0.525p ≥,也即他认为公牛队一定会赢的最小概率为0.525。
2.请说明如果一个人的财富效用函数是凸的,那么,他(她)就会选择公平赌博而不是确定的收入,甚至还可能愿意去接受某种不公平的赌博。
你认为这种接受风险的行为是普遍的吗?什么因素会趋向于限制这种行为?解:如图18-3所示,假设某人的初始财富为0W ,如果参加赌博,则他可以0.5的概率赢得h ,或以0.5的概率输掉h 。
在效用函数为凸的情况下,他不参加赌博所获得的确定性效用为()0U W ,而参加赌博后获得的期望效用为()0h U W 。
因为()()00h U W U W >,所以他会选择公平赌博,而不是仅获得确定的收入,甚至他还有可能参加不公平的赌博,因为此时的期望效用高于确定性收入下的期望效用。
尼科尔森《微观经济理论-基本原理与扩展》(第9版)课后习题详解(第14章--不完全竞争市场的传统模型

尼科尔森《微观经济理论-基本原理与扩展》(第9版)第14章 不完全竞争市场的传统模型课后习题详解跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。
以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。
1.为了简单起见,假设垄断者没有生产成本且它所面临的需求曲线由下式给定:150Q P =- (1)计算这一垄断者利润最大化时的价格—产量组合,并计算该厂商的垄断利润。
(2)假设第二个厂商进入了市场。
令1q 为第一个厂商的产出,2q 为第二个厂商的产出。
市场需求由下式给出12150q q P +=-假设第二个厂商也没有生产成本,运用双头垄断的古诺模型,确定一下利润最大化时每个厂商的产出水平及市场价格,并且计算每个厂商的利润。
(3)怎样把(1)与(2)中结果与完全竞争市场中的价格—产量组合相比较?画出需求曲线与边际收益曲线图形,并且指明需求曲线上的三个不同的价格—产量组合。
解:(1)因为150Q P =-,所以反需求曲线为150P Q =-,则该垄断者的利润函数为:()2150150PQ C Q Q Q Q π=-=-=-+利润最大化的一阶条件为:d 21500d Q Qπ=-+=,解得75Q =。
此时利润最大化时的价格为15075P Q =-=; 该厂商的垄断利润为21505625Q Q π=-+=。
(2)对于厂商1而言,其利润函数为:()11121150Pq C q q q π=-=--利润最大化的一阶条件为:112115020q q q π∂=--=∂,因而厂商1的反应函数为: 12750.5q q =- ①同理可得厂商2的反应函数为:21750.5q q =- ② 在古诺竞争均衡时,有①、②两式同时成立,因而可以解得古诺竞争均衡中两厂商的产量分别为:1250q q ==。
尼科尔森《微观经济理论——基本原理与扩展》(第9版)模拟试题及详解(二)【圣才出品】

3 / 14
圣才电子书
临的问题是选择一个
十万种考研考证电子书、题库视频学习平台
使得剩余
达到最大。
而对代理人来说,努力的成本记为 (比如时间、精力),它与 成正比。代理人的
问题是选择一个努力程度 以最大化自己的收入
,所以劳动的边际成
本等于工资;而当劳动市场为买方垄断时,劳动的供给随着工资的提高而增加,
,
所以劳动的边际成本高于工资。
根据劳动雇佣的最优条件,劳动的边际产值应该等于边际成本。所以,当劳动市场为买
方垄断时,劳动需求由下式决定:
当劳动市场为完全竞争时,劳动需求由下式决定:
因为劳动的边际产值曲线向下倾斜,所以买方垄断劳动市场上的厂商的劳动需求小于完 全竞争劳动市场的劳动需求。
仍可能下降,即 比 先达到最低点),而 在下降说明使用的可变要素的平均产量
还在上升阶段,即生产三阶段中的第一阶段。而生产要素的投入量应当在生产的第二阶段内
选择。所以,当 下降时,该厂商肯定未达到利润极大。
然而,厂商是否应该扩大生产,则需视情况而定。如果这一短期均衡是在价格低于
曲线的最低点水平上达到的,由于
图 1-1
(2)该观点前半部分正确,后半部分错误。在完全竞争市场中,因为长期均衡时,
,每个厂商的长期利润为零,即厂商只能获得正常利润而得不到超额利润。当产品
价格下降时,会引起部分厂商退出该行业,从而使得该行业的供给曲线向左上方移动,所以
价格会恢复到使留存厂商获得正常利润的水平。
,厂商应停止生产,而不应增加可变要素投入,
如图 7-1 中价格为 和产量为 时,
。但如果这一均衡是在价格高于平均可变成本最低点水平上达到的,厂商应
尼科尔森《微观经济理论—基本原理与扩展》(第9版)课后习题详解

尼科尔森《微观经济理论—基本原理与扩展》(第9版)课后习题详解第1篇引言第1章经济模型本章没有课后习题。
本章是全书的一个导言,主要要求读者对微观经济模型有一个整体了解,然后在以后各章的学习中逐渐深化认识。
第2章最优化的数学表达1.假设。
(1)计算偏导数,。
(2)求出上述偏导数在,处的值。
(3)写出的全微分。
(4)计算时的值——这意味着当保持不变时,与的替代关系是什么?(5)验证:当,时,。
(6)当保持时,且偏离,时,和的变化率是多少?(7)更一般的,当时,该函数的等高线是什么形状的?该等高线的斜率是多少?解:(1)对于函数,其关于和的偏导数分别为:,(2)当,时,(1)中的偏微分值分别为:,(3)的全微分为:(4)当时,由(3)可知:,从而可以解得:。
(5)将,代入的表达式,可得:。
(6)由(4)可得,在,处,当保持不变,即时,有:(7)当时,该函数变为:,因而该等高线是一个中心在原点的椭圆。
由(4)可知,该等高线在(,)处的斜率为:。
2.假定公司的总收益取决于产量(),即总收益函数为:;总成本也取决于产量():。
(1)为了使利润()最大化,公司的产量水平应该是多少?利润是多少?(2)验证:在(1)中的产量水平下,利润最大化的二阶条件是满足的。
(3)此处求得的解满足“边际收益等于边际成本”的准则吗?请加以解释。
解:(1)由已知可得该公司的利润函数为:利润最大化的一阶条件为:从而可以解得利润最大化的产量为:;相应的最大化的利润为:。
(2)在处,利润最大化的二阶条件为:,因而满足利润最大化的二阶条件。
(3)在处,边际收益为:;边际成本为:;因而有,即“边际收益等于边际成本”准则满足。
3.假设。
如果与的和是1,求此约束下的最大值。
利用代入消元法和拉格朗日乘数法两种方法来求解此问题。
解:(1)代入消元法由可得:,将其代入可得:。
从而有:,可以解得:。
从而,。
(2)拉格朗日乘数法的最大值问题为:构造拉格朗日函数为:一阶条件为:从而可以解得:,因而有:。
尼科尔森《微观经济理论-基本原理与扩展》(第9版)笔记(第15章 博弈定价模型)

尼科尔森《微观经济理论-基本原理与扩展》(第9版)第15章 博弈定价模型复习笔记跨考网独家整理最全经济学考研真题,经济学考研课后习题解析资料库,您可以在这里查阅历年经济学考研真题,经济学考研课后习题,经济学考研参考书等内容,更有跨考考研历年辅导的经济学学哥学姐的经济学考研经验,从前辈中获得的经验对初学者来说是宝贵的财富,这或许能帮你少走弯路,躲开一些陷阱。
以下内容为跨考网独家整理,如您还需更多考研资料,可选择经济学一对一在线咨询进行咨询。
1.基本概念博弈指一种互动决策,即每一行为主体的利益不仅依赖它自己的行为选择,而且依赖于别人的行为选择,以致它所采取的最好行动有赖于其竞争对手将选择什么行为。
博弈论,又称对策论或游戏论,它所研究的是行为者之间策略相互依存和相互作用的一种决策理论。
博弈可以是合作的,在这种情况下,局中人能够达成协议;博弈也可以是非合作的,在这种情况下,不可能达成任何协议。
所有博弈都具有以下三个基本要素:局中人、策略、报酬。
(1)局中人局中人是指博弈中每个策略的决策者。
这些局中人可以是个人、厂商,或者是整个国家。
所有局中人具有有能力在一组可能的行为集合中作出选择的特征。
(2)策略策略指博弈中局中人每个回合的行动。
根据考察的博弈的不同,一个策略可能是非常简单的行动,也可能是非常复杂的行动。
但是每个策略都被认为是有明确定义的、特定的一个回合的行动。
(3)报酬报酬指的是博弈中局中人的最终收益。
报酬通常是用局中人获得的效用水平来测度的,通常会被货币报酬所替代(如厂商的利润)。
一般情况下,假设局中人能够对博弈的报酬根据偏好程度由高到低进行排序,以寻求可达到的最高序列的报酬。
(4)符号一般情况下没有正式的符号来标记一个博弈,但是符号能澄清事实。
通常,将一个两个局中人之间的博弈标记为:()(),,,,,A B A B G S S U a b U a b ⎡⎤⎣⎦其中,A S 和B S 分别代表对于局中人A 和B 可以采用的策略组合。
尼科尔森《微观经济理论——基本原理与扩展》(第9版)笔记和课后习题详解-商品间的需求关系(圣才出品)

此时,组合商品 y 的价格变为 t 。
6.2 课后习题详解
1.Heidi 从羊奶( m )和果馅卷( s )两种商品中获得效用,其效用函数为:
U (m, s) = m s
(1)证明:羊奶的价格上升不会改变 Heidi 对果馅卷的购买量,即证明:s / pm = 0 。 (2)证明: m / ps = 0 。 (3)利用斯勒茨基方程和净替代的对称性证明:(1)、(2)两问中涉及的收入效应影响
(3)因为:
s pm=0=s pm Nhomakorabea|U
−m s I
m ps
=0=
m ps
|U
−s m I
又因为
s pm
|U
=
m ps
|U
,所以有:m s I
=
s
m I
,即与(1)、(2)中的偏导数有关的收入效
应是相等的。
(4)由(1)中 m 和 s 的马歇尔需求函数可知:
m
s I
=
m
0.5
ps
=
m
0.5 pmm /
U =常数
0 ,则
xi
与 xj
称为净替代品;如果
xi x j
U =常数
0
,则
xi
与
xj
称为净互补
品。净替代品与净互补品有对称性。
1 / 11
圣才电子书 十万种考研考证电子书、题库视频学习平台
3.多种商品情形下的替代关系 大多数商品是具有替代关系的,这一结论被称为“希克斯第二需求定律”。该结论证明 如下:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第15章博弈定价模型15.1 复习笔记1.基本概念博弈指一种互动决策,即每一行为主体的利益不仅依赖它自己的行为选择,而且依赖于别人的行为选择,以致它所采取的最好行动有赖于其竞争对手将选择什么行为。
博弈论,又称对策论或游戏论,它所研究的是行为者之间策略相互依存和相互作用的一种决策理论。
博弈可以是合作的,在这种情况下,局中人能够达成协议;博弈也可以是非合作的,在这种情况下,不可能达成任何协议。
所有博弈都具有以下三个基本要素:局中人、策略、报酬。
(1)局中人局中人是指博弈中每个策略的决策者。
这些局中人可以是个人、厂商,或者是整个国家。
所有局中人具有有能力在一组可能的行为集合中作出选择的特征。
(2)策略策略指博弈中局中人每个回合的行动。
根据考察的博弈的不同,一个策略可能是非常简单的行动,也可能是非常复杂的行动。
但是每个策略都被认为是有明确定义的、特定的一个回合的行动。
(3)报酬报酬指的是博弈中局中人的最终收益。
报酬通常是用局中人获得的效用水平来测度的,通常会被货币报酬所替代(如厂商的利润)。
一般情况下,假设局中人能够对博弈的报酬根据偏好程度由高到低进行排序,以寻求可达到的最高序列的报酬。
(4)符号一般情况下没有正式的符号来标记一个博弈,但是符号能澄清事实。
通常,将一个两个局中人之间的博弈标记为:其中,和分别代表对于局中人和可以采用的策略组合。
和表示和选择特定策略时局中人可以得到的效用。
2.博弈的描述(1)规范形式的博弈规范形式的博弈,又称标准式博弈,在规范形式的博弈中,所有参与者同时选择各自的策略,所有参与人选择的策略一起决定每个参与人的支付。
规范形式的博弈一般用支付矩阵的形式来描述。
规范形式的博弈非常容易刻画静态博弈,因为此时非常容易确定博弈各方的策略。
规范形式的博弈也可以刻画一些动态博弈。
在静态博弈中,由于参与人是一次性行动,可以不考察该计划在各种情况下对行动的规定,只要指出参与人选择什么样的策略就可以了;而对于动态博弈来说,由于各个参与人的行动有先后顺序,这样某参与人的策略就需要规定该参与人在各种情况下的行动。
通过找出参与人在动态博弈中的所有策略,就可以通过规范形式的博弈来刻画一个动态博弈。
(2)外延式博弈外延式博弈用来描述谁在何时行动,在该时点上它能做什么,它行动时知道哪些信息,以及与参与人行动相联系的最终支付。
对于外延式博弈,一般采用博弈树的方式进行描述,博弈树的构成要素主要有结、枝、路径、信息集。
一般而言,假设每个参与人都具有完全信息:每个人都知道其他人是谁,都知道其他人的可能行动,都知道所有参与人的支付情况。
也就是说,每个参与人都知道博弈树的完整结构,并且知道其他人也了解这些信息。
在一些博弈中,参与人并不总是确切地知道轮到自己行动时,博弈进行到博弈树中的什么位置。
当其他参与人的行动不是清晰可见时就会产生这()(),,,,,A B A BG S S U a b U a b⎡⎤⎣⎦ASBS A BAUBU A B种不确定性。
一般将刻画参与人所掌握的信息的多寡的集合称为信息集。
显然,信息集中的节点越多,意味着参与人越不能确定博弈进行到哪一个节点上,说明参与人的信息越少。
如果一个信息集中只有一个节点,这说明该参与人知道另一参与人在这之前的确切选择,这时称参与人在该点有完美信息。
同一个信息集中,参与人可能采取的行动在每个节点处必须相同;否则,节点就可以被分辨,从而不能达到参与人无法分辨信息集的每一个节点这一要求。
较为适合描述动态博弈的外延式博弈也能描述静态博弈。
3.占优策略均衡与纳什均衡(1)占优策略均衡:囚徒困境模型一般来说,由于每个博弈方的效用(支付)是博弈中所有参与者的策略的函数,因而每个博弈方的最优策略选择依赖于所有其他博弈方的策略选择。
但在一些特殊的博弈中,一个博弈方的最优策略可能并不依赖于其他博弈方的策略选择。
也就是说,不论其他博弈方选择什么样的策略,他的最优策略是唯一的,这样的最优策略被称为“占优策略”。
在博弈中,如果所有的博弈方都有占优策略存在,从而博弈将在所有博弈方的占优策略的基础上达到均衡,则这种均衡称为“占优策略均衡”。
囚徒困境模型是占优策略均衡的一个典型例子。
囚徒困境模型指两个被捕获的囚犯之间的一种特殊“博弈”,说明为什么甚至在合作对双方有利时,保持合作也是困难的。
囚徒两难处境的故事包含着一个一般性的结论,这个结论适用于任何一个力图维持其成员合作的集团。
这是博弈论中的一个经典例证,同一市场上的寡头在力图达到垄断结果时的博弈类似于两个处于两难处境的囚徒的博弈。
具体情况如下:两囚徒被指控为一桩罪案的同案犯。
他们被分关在不同的牢房且无法互通信息。
各囚徒都被要求坦白罪行。
如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,则很难对他们提起刑事诉讼,因而两囚徒可以期望被从轻发落为入狱2年;另一方面,如果一个囚徒坦白而另一个囚徒不坦白,坦白的囚徒就只需入狱1年,而另一个将被判入狱10年。
那么囚徒将会怎么选择呢?下面的支付矩阵归纳了各种可能的结果。
(其中“得益”是负的,表格右下角单元格意思是两个囚徒各2年徒刑)。
该表说明,这两个囚徒面临着一种困境。
如果他们都不坦白(以一种会遵守的方法),那么两人只需入狱仅仅2年。
但他们不能相互讲话,如果囚徒A不坦白,他就冒着被B利用的危险。
因为不管囚徒A怎么选择,囚徒B坦白总是最优方案。
同样,囚徒A坦白也总是最优方案,所以囚徒B必须担心要是自己不坦白,就会被利用。
因此,两囚徒大概都会坦白并入狱5年。
总之,在上述囚徒两难处境的模型中,对囚徒个人而言,选择坦白总比选择抵赖有较高的收益,但从2人支付的总和来看,双方都抵赖(合作或串谋)的结果是最优的。
因而,囚徒困境模型就深刻地揭示了社会和经济生活中的一种普遍情形,即“个人理性”与“集体理性”的矛盾,这就是“困境”。
现实生活中有很多囚徒困境的例子,如国家间的军备竞赛、厂商间的价格战、公共物品的搭便车问题等。
(2)纳什均衡及其存在性纳什均衡是以美国数学家约翰·纳什(John Nash)命名的一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的情况下,他选择了最好的策略,也就是说,给定其他人的策略,任何个人都没有积极性去选择其他策略,从而这个均衡就没有人有积极性去打破。
1950年,纳什曾证明,对任何有限博弈(指参与人和策略集都有限的博弈)来说,至少存在一个纳什均衡(这个均衡可能是混合策略纳什均衡)。
关于纳什均衡存在性的定理称为纳什定理。
纳什定理指,如果一个博弈的参与人是有限的,并且每一个参与人只有有限个策略,那么该博弈至少存在一个纳什均衡。
纳什定理只给出了纳什均衡的存在性,但没有说明其是否唯一。
实际上,一个博弈可能存在多个纳什均衡。
需要指出的是,占优策略均衡一定是纳什均衡,但纳什均衡不一定是占优策略均衡。
4.子博弈与子博弈精炼纳什均衡(1)子博弈子博弈是原博弈的一部分,指一个决策结点及属于该决策结点的所有后续结点构成的一个博弈。
要注意的是:必须从单结的决策结点开始;必须包括后面所有的决策结点和终点;在信息不完美时不能切割信息集。
(2)子博弈精炼纳什均衡对于所有的子博弈都是最优的纳什均衡,称为子博弈精炼纳什均衡。
子博弈精炼纳什均衡要求参与人应该是序贯理性的。
序贯理性指不论过去发生了什么,参与人应该在博弈的每一时点上最优化自己的决策。
一个精练均衡首先是一个纳什均衡,但纳什均衡不见得是精炼均衡,只有那些不包括不可置信威胁的纳什均衡才是精练纳什均衡。
确定进入博弈的子博弈精炼纳什均衡的过程可以一般化:即首先确定一个博弈的纳什均衡,然后检验该纳什均衡在各个子博弈上面能否诱致纳什均衡,通过这一检验,就说该纳什均衡是一个子博弈精炼纳什均衡,否则,就不是。
但这一方法无疑是繁琐的。
对于完美信息的动态博弈,可以用逆向归纳的方法比较简便地确定子博弈精炼纳什均衡。
简单地说,所谓逆向归纳就指首先在最接近终点的子博弈上面确定一个纳什均衡,然后把这一纳什均衡带来的结果作为新的终点,继续寻最接近这一终点的子博弈纳什均衡,反复下去,直到原博弈的终点。
5.重复博弈(1)重复博弈的含义与“以牙还牙”策略动态博弈是一种反复进行的博弈。
重复博弈是动态博弈的一种特殊情况,在重复博弈中,同一个博弈被重复多次。
与一次性博弈不同,重复博弈中的所有博弈方过去的行为都是观测得到的,因而某一博弈方可以通过自己在本阶段博弈中的策略选择,来报复其他博弈方在以前的阶段博弈中的行为,即“以牙还牙”的策略。
也就是指所有成员从一开始就合作,对于每一个成员来说,只要其他成员是合作的,则他就把合作继续下去。
但只要有一个成员背弃合作协议一次,其他成员就从此再也不与其合作了。
(2)有限次重复博弈模型博弈重复次数有限,意味着存在所有博弈方都可以预测到的“最后一次”。
在最后一局博弈中,所有的对局者都明白,如果某一博弈方选择了自己的占优策略,给其他参与人造成损失,则其他博弈方不可能报复,因而在最后一次博弈中都会选择占优策略,从而构成与单次博弈相同的占优策略均衡。
有限次的博弈与一次性的博弈在本质上没有什么不同,每次博弈出现的都是一次性博弈的均衡结果。
(3)无限次重复博弈模型在无限次重复博弈中,如果参与人有足够的耐心,那么任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精练均衡得到。
或者说,只要时间足够长(或博弈次数足够多),时间贴现率足够低,那么参与人总是有动力为了将来利益而惩罚另一个参与人,即使该惩罚损害了当前利益。
6.动态博弈与策略行动在动态博弈中,参与人为了使得其他参与人的选择对自己有利,往往采取一些行动来影响其他参与人对于自己行为的预期。
这些行为称为策略行动。