计量经济学重点笔记第四讲
古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解

三、计量经济学方法论
大致说来,传统的计量经济学方法论按如下路线进行:
1.理论或假说的陈述;
2.理论的数学模型设定;
3.统计或计量经济模型设定;
4.获取数据;
5.计量经济模型的参数估计;
理论计量经济学是要找出适当的方法,去测度由计量经济模型设定的经济关系。为此,计量经济学家非常依赖于数理统计。
在应用计量经济学中,利用理论计量经济学工具去研究经济学或管理学中的某些特殊领域。
0.2
本章没有课后习题。本章是全书的一个引言,对计量经济学这门学科作一个简要介绍。对于本章内容,学员简单了解即可。
(3)在问卷调查中,无应答的问题也可能相当严重。
(4)获取数据的抽样方法可能变化很大,要比较不同样本得来的结果常常非常困难。
(5)通常获得的经济数据都是高度加总的。
(6)由于保密性质,某些数据只能以高度加总的形式公布。
研究结果不可能比数据的质量更好。所以,如果在一定情况下,研究者发现研究的结果“不能令人满意”的话,原因不一定是误用模型,而是数据的质量不好。
4.名义尺度
此类变量不具备比率尺度变量的任何一个特征。因此适合于比率尺度变量的计量经济方法可能不适合于名义尺度变量。
1.2
1.表1-1给出了7个工业化国家的消费者价格指数(CPI)数据,以1982~1984年为该指数的基期并令1982—1984=100。
1.经济理论所作的陈述或假说大多数是定性的。计量经济学家的工作就是要提供这一数值估计。换言之,计量经济学对大多数的经济理论赋予经验内容。
2.数理经济学的主要问题,是要用数学形式(方程式)来表述经济理论,而不管该理论是否可以量化或是否能够得到实证支持。计量经济学家常常使用数理经济学家所提供的数学方程式,但要把这些方程式改造成适合于经验检验的形式。这种从数学方程到计量经济方程的转换需要有许多的创造性和实际技巧。
计量经济学复习重点

计量经济学复习重点第一章1. 计量经济学的性质计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究的主体(出发点、归宿、核心):经济现象及数量变化规律研究的工具(手段):模型数学和统计方法方法手段要服从研究对象的本质特征(与数学不同),方法是为经济问题服务计量经济研究的三个方面理论:即说明所研究对象经济行为的经济理论(计量经济研究的基础)数据:对所研究对象经济行为观测所得到的信息(计量经济研究的原料或依据)方法:模型的方法与估计、检验、分析的方法(计量经济研究的工具与手段2. 计量经济学与相关学科的联系与区别联系:●计量经济学研究的主体—经济现象和经济系的数量规律●计量经济学必须以经济学提供的理论原则和经济运行规律为依据●经济计量分析的结果:对经济理论确定的原则加以验证、充实、完善区别:●经济理论重在定性分析,并不对经济关系提供数量上的具体度量●计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容3. 学习计量经济学的必要性4. 计量经济学研究的基本思路和步骤模型设定(选择变量和数学关系式)、估计参数(确定变量间的数量关系)、模型检验(检验所得结论的可靠性)、模型应用(作经济分析和经济预测)5. 模型的设定、参数估计、模型检验的要求模型设定要求●要有科学的理论依据●选择适当的数学形式(单一方程、联立方程线性形式、非线性形式)●模型要兼顾真实性和实用性●包含随机误差项●方程中的变量要具有可观测性参数估计要求参数的估计值:所估计参数的具体数值参数的估计式:估计参数数值的公式6. 模型中的变量及其类型从变量的因果关系区分:被解释变量(应变量)——要分析研究的变量解释变量(自变量)—说明应变量变动主要原因的变量(非主要原因归入随机误差项)从变量的性质区分内生变量—其数值由模型所决定的变量,是模型求解的结果外生变量—其数值由模型以外决定的变量(相关概念:前定内生变量、前定变量)注意:外生变量数值的变化能够影响内生变量的变化,内生变量却不能反过来影响外生变量7. 计量经济研究中数据的类型时间数列数据(同一空间、不同时间)、截面数据(同一时间、不同空间)、混合数据(面板数据 Panel Data)、虚拟变量数据8. 参数估计的方法类型单一方程模型最常用的是普通最小二乘法、极大似然估计法等联立方程模型常用二段最小二乘法和三段最小二乘法等9. 建立计量经济模型的依据第二章1、变量间的关系:函数关系——相关关系相关系数——对变量间线性相关程度的度量◆相关关系的类型●?从涉及的变量数量看简单相关、多重相关(复相关)●?从变量相关关系的表现形式看线性相关——散布图接近一条直线、非线性相关——散布图接近一条曲线●??从变量相关关系变化的方向看正相关——变量同方向变化,同增同减、负相关——变量反方向变化,一增一减不相关2、现代意义的回归:一个被解释变量对若干个解释变量依存关系的研究实质:由固定的解释变量去估计被解释变量的平均值3、总体回归函数(PRF):将总体被解释变量Y的条件均值表现为解释变量X 的某种函数样本回归函数(SRF):将被解释变量Y 的样本条件均值表示为解释变量X 的某种函数。
计量经济学复习知识点重点难点

计量经济学复习知识点重点难点计量经济学知识点第一章导论1、计量经济学的研究步骤:模型设定、估计参数、模型检验、模型应用。
2、计量经济学是统计学、经济学和数学的结合。
3、计量经济学作为经济学的一门独立学科被正式确立的标志:1930年12月国际计量经济学会的成立。
4、计量经济学是经济学的一个分支学科。
第二章简单线性回归模型1、在总体回归函数中引进随机扰动项的原因:①作为未知影响因素的代表;②作为无法取得数据的已知因素的代表;③作为众多细小影响因素的综合代表;④模型的设定误差;⑤变量的观测误差;⑥经济现象的内在随机性。
2、简单线性回归模型的基本假定:①零均值假定;②同方差假定;③随机扰动项和解释变量不相关假定;④无自相关假定;⑤正态性假定。
3、OLS回归线的性质:①样本回归线通过样本均值;②估计值的均值等于实际值的均值;③剩余项ei的均值为零;④被解释变量的估计值与剩余项不相关;⑤解释变量与剩余项不相关。
4、参数估计量的评价标准:无偏性、有效性、一致性。
5、OLS估计量的统计特征:线性特性、无偏性、有效性。
6、可决系数R2的特点:①可决系数是非负的统计量;②可决系数的取值范围为[0,1];③可决系数是样本观测值的函数,可决系数是随抽样而变动的随机变量。
第三章多元线性回归模型1、多元线性回归模型的古典假定:①零均值假定;②同方差和无自相关假定;③随机扰动项和解释变量不相关假定;④无多重共线性假定;⑤正态性假定。
2、估计多元线性回归模型参数的方法:最小二乘估计、极大似然估计、矩估计、广义矩估计。
3、参数最小二乘估计的性质:线性性质、无偏性、有效性。
4、可决系数必定非负,但是根据公式计算的修正的可决系数可能为负值,这时规定为0。
5、可决系数只是对模型拟合优度的度量,可决系数越大,只是说明列入模型中的解释变量对被解释变量的联合影响程度越大,并非说明模型中各个解释变量对被解释变量的影响程度也大。
6、当R2=0时,F=0;当R2越大时,F值也越大;当R2=1时,F→∞。
伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解-第1~4章【圣才出品】

Байду номын сангаас
2.假设让你进行一项研究,以确定较小的班级规模是否会提高四年级学生的成绩。
4 / 119
圣才电子书 十万种考研考证电子书、题库视频学习平台
(i)如果你能设定你想做的任何实验,你想做些什么?请具体说明。 (ii)更现实地,假设你能搜集到某个州几千名四年级学生的观测数据。你能得到他们 四年级班级规模和四年级末的标准化考试分数。你为什么预计班级规模与考试成绩存在负相 关关系? (iii)负相关关系一定意味着较小的班级规模会导致更好的成绩吗?请解释。 答:(i)假定能够随机的分配学生们去不同规模的班级,也就是说,在不考虑学生诸如 能力和家庭背景等特征的前提下,每个学生被随机的分配到不同的班级。因此可以看到班级 规模(在伦理考量和资源约束条件下的主体)的显著差异。 (ii)负相关关系意味着更大的班级规模与更差的考试成绩是有直接联系的,因此可以 发现班级规模越大,导致考试成绩越差。 通过数据可知,两者之间的负相关关系还有其他的原因。例如,富裕家庭的孩子在学校 可能更多的加入小班,而且他们的成绩优于平均水平。 另外一个可能性是:学校的原则是将成绩较好的学生分配到小班。或者部分父母可能坚 持让自己的孩子进入更小的班级,而同样这些父母也更多的参与子女的教育。 (iii)鉴于潜在的其他混杂因素(如 ii 所列举),负相关关系并不一定意味着较小的班 级规模会导致更好的成绩。控制混杂因素的方法是必要的,而这正是多重回归分析的主题。
计量经济学 第四章

100%
统计检验
利用统计量对模型参数进行假设 检验,判断参数是否显著。
80%
计量经济学检验
包括模型的异方差性、自相关性 、多重共线性等问题的检验。
模型的修正方法
增加解释变量
如果模型存在遗漏变量,可以通过增加解释变量来 修正模型。
删除解释变量
如果模型中某些解释变量不显著或存在多重共线性 ,可以考虑删除这些变量。
模型表达式
Y = β0 + β1X + ε
最小二乘法
通过最小化残差平方和来估计参数β0和β1
参数解释
β0为截距项,β1为斜率项,ε为随机误差项
模型的检验
包括拟合优度检验、显著性检验等
多元线性回归模型
01
02
03
04
模型表达式
参数解释
最小二乘法
Y = β0 + β1X1 + β2X2 + ... + βkXk + ε
最小二乘法估计量的性质
线性性
最小二乘法估计量是随机样本的线性组合。
无偏性
最小二乘法估计量的期望值等于总体参数的 真实值。
有效性
在所有无偏估计量中,最小二乘法估计量的 方差最小。
一致性
随着样本量的增加,最小二乘法估计量收敛 于总体参数的真实值。
最小二乘法的计算步骤
构造设计矩阵X和响应向量Y。 计算设计矩阵X的转置矩阵X'。 计算X'X和X'Y。
求解线性方程组X'Xβ=X'Y,得到回归系 数的最小二乘估计β^=(X'X)^(-1)X'Y。
根据β^计算因变量的拟合值Y^=Xβ^。
计算残差e=Y-Y^,以及残差平方和 RSS=e'e。
古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解

资料来源:EconomicReport ofthe President,2007,Table13-110,P.356.
答:a.把汇率的对数作为纵轴并把时间作为横轴进行描点,如图1-4所示,汇率的波动性很大。比如,在1985年,1美元只能兑换0.257比索,但到了2004年,它能兑换约11.29比索。
2.回归分析与相关分析的区别
回归分析中,对因变量和解释变量的处理方法存在着不对称性。因变量被当作是统计的、随机的,也就是它有一个概率分布。而解释变量则被看作是(在重复抽样中)取固定值的。
相关分析中,任何(两个)变量的处理方法都是对称的;因变量和解释变量之间不加区别;两个变量都被看作是随机的。
五、术语与符号
计量经济学可定义为实际经济现象的数量分析。这种分析基于理论与观测的并行发展,而理论与观测又通过适当的推断方法得以联系。
计量经济学可定义为这样的社会科学:它把经济理论、数学和统计推断作为工具,应用于经济现象的分析。
2.研究对象和研究方法
计量经济学研究经济定律的经验判定。计量经济学家的艺术,就在于找出一组足够具体且足够现实的假定,使他尽可能最好地利用他所获得的数据。
图1-3
b.如图1-3所示,这六个国家的通货膨胀率与美国的通货膨胀率正相关。
c.相关并不意味着因果关系。从逻辑上说,回归得到的统计关系式本身不可能意味着任何因果关系。肯德尔和斯图亚特认为,一个统计关系式永远不能确立因果方面的联系,对因果关系的理念,必须来自统计学以外的某种理论。
3.表1-3给出了9个工业化国家1985~2006年间的外汇汇率数据。除英国外,汇率都定义为一美元兑换外币的数量;而英国的汇率定义为一英镑兑换美元的数量。
资料来源:Economic Report of the President,2007,Table l08,P.354.
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

第15章定性响应回归模型15.1 复习笔记考点一:定性响应模型的性质★★定性响应模型是指模型中的回归子是一个二值或二分变量的模型,通常被称为概率模型。
回归子也可以是多分响应变量或多类型响应变量。
将二值响应变量建立成概率模型的方法包括线性概率模型(LPM)、logit模型、probit模型和tobit模型。
考点二:线性概率模型(LPM)★★★★1.LPM的定义以下述回归模型为例说明:Y i=β1+β2X i+u i。
其中X表示家庭收入;Y=1,则表示该家庭拥有住房;Y=0,则该家庭不拥有住房。
该模型被称为线性概率模型,因为Y i在给定X i下的条件期望E(Y i|X i)可解释为在给定X i下事件(家庭拥有住房)发生的条件概率,即Pr(Y i=1|X i)。
2.LPM的特征令P i表示“Y i=1”(即事件发生)的概率,而1-P i表示“Y i=0”(即事件不发生)的概率,则变量Y i服从贝努利概率分布。
根据期望的定义,有:E(Y i)=0(1-P i)+1P i=P i。
此外有:E(Y i|X i)=β1+β2X i =P i,即模型的条件期望事实上可以解释为Y i的条件概率。
该模型的约束条件为:0≤E(Y i|X i)≤1。
3.LPM的问题(1)干扰项u i的非正态性若把方程写成:u i=Y i-β1-β2X i,u i的概率分布见表15-1。
表15-1 u i的概率分布可见u i服从贝努利分布而不是正态分布。
虽然干扰项不满足正态性假定,但OLS的点估计值仍具有无偏性。
此外在大样本下,OLS估计量一般都趋于正态分布,因此LPM的统计推断仍可用正态性假定下的OLS程序。
(2)干扰项的异方差性即使LPM中的干扰项满足零均值和无序列相关性假定,但也不能说它具有同方差性。
对于贝努利分布,理论上的均值和方差分别为P和P(1-P),可见方差是均值的函数,而均值的取值依赖于X的值,因此LPM中的干扰项具有异方差性。
计量经济学复习笔记

计量经济学复习笔记CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究主体是经济现象及其发展变化的规律。
2、运用计量分析研究步骤:模型设定——确定变量和数学关系式估计参数——分析变量间具体的数量关系模型检验——检验所得结论的可靠性模型应用——做经济分析和经济预测3、模型变量:解释变量:表示被解释变量变动原因的变量,也称自变量,回归元。
被解释变量:表示分析研究的对象,变动结果的变量,也成应变量。
内生变量:其数值由模型所决定的变量,是模型求解的结果。
外生变量:其数值由模型意外决定的变量。
外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。
前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响,但能够影响我们所研究的本期的内生变量。
前定变量:前定内生变量和外生变量的总称。
数据:时间序列数据:按照时间先后排列的统计数据。
截面数据:发生在同一时间截面上的调查数据。
面板数据:虚拟变量数据:表征政策,条件等,一般取0或1.4、估计评价统计性质的标准无偏:E(^β)=β随机变量,变量的函数?有效:最小方差性一致:N趋近无穷时,β估计越来越接近真实值5、检验经济意义检验:所估计的模型与经济理论是否相等统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著计量经济检验:是否符合计量经济方法的基本假定预测检验:将模型预测的结果与经济运行的实际对比CH2 CH3 线性回归模型模型(假设)——估计参数——检验——拟合优度——预测1、模型(线性)(1)关于参数的线性模型就变量而言是线性的;模型就参数而言是线性的。
Y i=β1+β2lnX i+u i线性影响随机影响Y i=E(Y i|X i)+u i E(Y i|X i)=f(X i)=β1+β2lnX i引入随机扰动项,(3)古典假设A零均值假定 E(u i|X i)=0B同方差假定 Var(u i|X i)=E(u i2)=σ2D 随机扰动项与解释变量不相关假定 Cov(u i ,X i )=0E 正态性假定u i ~N(0,σ2)F 无多重共线性假定Rank(X)=k 2、估计在古典假设下,经典框架,可以使用OLS 方法:OLS 寻找min ∑e i 2^β1ols= (Y 均值)-^β2(X 均值)^β2ols = ∑x i y i /∑x i23、性质OLS 回归线性质(数值性质)(1)回归线通过样本均值 (X 均值,Y 均值) (2)估计值^Y i 的均值等于实际值Y i 的均值 (3)剩余项e i 的均值为0(4)被解释变量估计值^Y i 与剩余项e i 不相关 Cov(^Y i ,e i )=0 (5)解释变量X i 与剩余项e i 不相关 Cov(e i ,X i )=0在古典假设下,OLS 的统计性质是BLUE 统计 最佳线性无偏估计 4、检验 (1)Z 检验Ho:β2=0 原假设 验证β2是否显著不为0标准化: Z=(^β2-β2)/SE (^β2)~N (0,1) 在方差已知,样本充分大用Z 检验 拒绝域在两侧,跟临界值判断,是否β2显著不为0 (2)t 检验——回归系数的假设性检验方差未知,用方差估计量代替 ^σ2=∑e i 2/(n-k) 重点记忆 t =(^β2-β2)/^SE (^β2)~t (n-2)拒绝域:|t|>=t 2/a (n-2)拒绝,认为对应解释变量对被解释变量有显著影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四讲 异方差一、 同方差与异方差:图形展示对于模型12i i i y x ββε=++,在高斯-马尔科夫假定下有:12222()iii iy E y x εββδδδ=+==其中22iεδδ=意味着同方差假定成立。
为了理解同方差假定,我们先考察图一。
在图一中,空心圆点代表(,())i ix E y ,实心圆点代表观测值(,)i i x y 观测,i y 观测是随机变量i y 的一个实现(注意,按照假定,i x 是非随机的,即在重复抽样的情况下,给定i 的取值,ix 不随样本的变化而变化),倾斜的直线代表总体回归函数:12()i iE y x ββ=+。
图一显示了一个重要特征,即,尽管12,,...y y的期望值随着12,,...x x 的不同而随之变化,但由于假定222iiyεδδδ==,它们的离散程度(方差)是不变的。
然而,假定误差项同方差从而被解释变量同方差可能并不符合经济现实。
例如,如果被解释变量y 代表居民储蓄,x 代表收入,那么经常出现的情况是,低收入居民间的储蓄不会有太大的差异,这是因为在满足基本消费后剩余收入已不多。
但在高收入居民间,储蓄可能受消费习惯、家庭成员构成等因素的影响而千差万别。
图二能够展示这种现象。
图一同方差情况图二异方差情况在图二中,依据x1所对应的分布曲线形状,x5所对应的实心圆点看起来是一个异常点(但依据x5所对应的分布曲线形状,它或许称不上是异常点)。
异常点的出现是同方差假定被违背情况下的一个典型症状,事实上通过散点图来发现异常点从而初步识别异方差现象在实践中经常被采用,见图三。
浙江工商大学金融学院姚耀军讲义系列图三异方差情况下的散点图笔记:应该注意的是,如果第一个高斯-马尔科夫假定被违背,即模型设定有误,那么也可能出现异方差症状。
例如,正确模型是非线性的,但我们错误地设定为线性,以这个线性模型为参照,散点图也许显示出明显的异方差症状。
事实上,在很多情况下,异方差症状被认为是模型错误设定的一个表现。
如果产生异方差症状的原因是模型设定有误,那么我们首先应该要做的事情是正确设定模型,而不是基于错误设定的模型寻找有效的估计方法。
在本讲中,我们假定其他所有的高斯-马尔科夫假定成立。
二、异方差的后果在证明高斯-马尔科夫定理时,我们仅仅在证明OLS估计量具有有效性时涉及到了同方差假定,而在证明线性、无偏性并没有用到该假定,因此违背同方差假定并不影响OLS估计量所具有的线性与无偏性这两个性质(实际上也不影响OLS估计量的一致性,一致性只涉及到高斯-马尔科夫假定一、二、三)。
既然存在异方差,在估计各系数时我们为何不利用这个信息呢?要知道,利用的信息越多,我们获得的估计量其方差将越小,即估计精度越高。
利用OLS 估计法来估计系数时并没有利用异方差这个信息,因此,在存在异方差的情况下,在所有线性无偏估计量中,OLS 估计量并不是最有效的。
另外值得注意的是,当同方差假定被违背时,计量软件包在默认状态下计算出的参数估计量的标准误是无意义的,因为默认状态是同方差假定成立。
作为一个复习,下面我们把默认状态下参数估计量的标准差与标准误公式再推导一遍。
真实模型是:01i i i y x ββε=++,那么有:12ˆ12222()()()()(())()()[()]i i i i i i i i i x x Var x x x x Var x x Var x x x x βεδβεε-=+---==--∑∑∑∑∑∑ 在重要假定五:(,)0,i j Cov i j εε=≠下,有:122ˆ22()()[()]i i i x x Var x x βεδ-=-∑∑ 在重要假定四:22()iiVar εεδδ==下, 12ˆ222222()[()]()i iix x x x x x βδδδ-==--∑∑∑计量软件包默认状态下通过公式:1ˆ)(se β=浙江工商大学金融学院姚耀军讲义系列来计算1ˆβ的标准误,其中用22ˆˆ2iN δε=-∑来估计误差项的方差。
显然,如果同方差假定不成立,则12ˆ22()ix x βδδ≠-∑,故试图1ˆβδ的想法是错误的。
我们也注意到,只有在高斯-马尔科夫假定成立的前提下,22ˆˆ2iN δε=-∑才是对误差项方差的一个无偏估计。
当误差项具有异方差性时,即误差项的方差随着i 的变化而变化时,用一个与i 无关的估计量(2ˆ2iN ε-∑的最终结果与i 无关)去估计误差项的方差显然是不合理的。
换句话说,当误差项具有异方差性时,22ˆˆ2iN δε=-∑不可能是对误差方差的一个恰当估计。
笔记:如果误差项方差已被恰当估计出,如22212,,...,ˆˆˆN δδδ,直观来看,我们应该1ˆβ的标准差估计。
不幸的是,我们无法很好地估计出各个误差项的方差。
误差项是观察不到的,因为我们并不知道参数的真实值。
但我们可以获得残差。
如果残差是对误差的良好近似,则对误差项性质的任何推断都可以建立在对残差的观察基础上。
然而,在异方差情况下,对于每一种不同的误差分布曲线,我们只有一个残差观测值。
仅仅依靠一个观察值,我们无法获得对误差方差的一致估计。
应该注意到,22)2([]()ii i i E E E εεεεδ-==,既然残差是对误差的近似,难道我们不可以用2ˆi ε来作为对2iεδ的估计吗?问题还是在于,我们只能使用一个观测值来估计2iεδ,它不可能是一个一致估计。
然而,尽管2ˆi ε是对2iεδ的糟糕估计,但以2222ˆ()[()]i i i x x x x ε--∑∑来估计12ˆβδ其情况应该更为乐观,因为借助于求和,单个估计误差有被抵消的可能。
事实上White(1980)已经证明,2222ˆ()[()]i i i x x x x ε--∑∑是对估计量1ˆβ方差的一致估计,其正的平方根被称为异方差稳健性标准误,或者White-Huber-Eicher 标准误。
总而言之,在异方差情况下采用公式1ˆ)(se β=算1ˆβ的标准误是不恰当的,当然,依靠这个错误的标准误来进行的t 检验也是无效的。
思考题:通常的F 检验有效吗?F 检验在何处体现了同方差假定?三、 发现异方差我们是通过对残差的分析来检验同方差假定是否被违背。
因此,下面所有的异方差检验方法都隐含一个前提,即残差是对误差的良好近似。
记住这一点十分重要,因为高斯-马尔科夫假定中的假定一、二、三被违背将使得下面的一系列检验都无效。
(一)Goldfeld-Quandt 检验Goldfeld-Quandt 检验法假设,在经典线性模型假定中,只有同方差假定或许并不成立,而其他假定是成立的。
浙江工商大学金融学院姚耀军讲义系列笔记:如果误差项序列相关,即使其他经典线性模型假定成立,但2RSS/ δ并不服从卡方分布,而2RSS/ δ对于构造F 检验十分重要。
为什么2RSS/ δ不服从卡方分布呢?这是因为按照定义,221()ni i n z χ==∑,其中..(0,1)i i di z N ~。
如果服从正态分布的误差项序列相关,则各误差项并不独立,此时,作为对误差项的近似,各残差将不是独立的,进而通过残差标准化所构建的卡方统计量就再也不服从卡方分布了。
这意味着,在利用Goldfeld-Quandt 检验法之前,误差项序列无关的假定是否被违背应该先于检验,在序列相关情况下,异方差检验将无效。
只有在序列相关被校正之后,异方差检验才能被进行。
该检验的原假设是误差项同方差,备择假设是方差随着某一个变量z 的增加而增加。
其检验步骤是:1、对N 个观测值按z 升序排列,并抛弃中间的N-2N*个观测值,形成两个容量都为N*的子样本;2、就两个子样本分别进行回归,记RSS 1、RSS 2分别为两次回归的残差平方和。
3、计算RSS 2/RSS 1。
在同方差的原假设下有:22***2122*RSS /1=RSS / RSS (1,1)RSS /1N k F N k N k N k δδ--~------若计算出的F 值大于F a ,则在显著水平a 下我们拒绝原假设。
笔记:1、在原假设为真时,*2RSS / (1)N k --与*1RSS / (1)N k --都是对2δ的无偏、一致估计,故RSS 2与RSS 1应该相差不大,而RSS 2/RSS 1与1接近。
2、为了提高检验的势(不会错误地不拒绝原假设的概率),中间被抛弃的观测值数目约为总样本容量的3/8,以使RSS 2与RSS 1的差异显得更明显(“放大镜”作用)。
通俗地讲,所谓检验的势,是指该检验对原假设的“苛刻度”,如果该检验不会轻易地“不拒绝原假设”,那么检验的势就高。
实际上,如果轻易地“不拒绝原假设”,那么我们犯“第二类错误”(不拒绝错误的原假设)的概率就高。
显然,当检验对原假设的“苛刻度”较高时我们仍然不拒绝原假设,那么原假设的真实性是更加可信的。
3、有时我们或许具有确切的理由认为不同的样本期间被解释变量具有不同的方差。
例如,在解释我国1952-2002年间工业产值增长率时,我们有理由认为,在1952-1978年间工业产值增长率的方差应该小于1979-2002年期间的方差,因为前段样本期间属于计划经济,缺乏市场冲击,而后一段时期属于市场或者半市场经济,存在市场冲击。
此时,我们可以把完整样本期间只划分为两个子期间,按照Goldfeld-Quandt 检验法第2、3步进行异方差检验。
(二) White 检验Goldfeld-Quandt 检验对误差方差的形式作了一定的假定。
然而,很多时候我们除了知道方差与解释变量具有一定关系之外,并无其他的关于方差的确切先验信息。
此时,我们可以利用White 检验。
假设模型是01122i i i i yx x βββε=+++,则White 检验的步骤是:1、估计模型并计算残差的平方2ˆi ε;2、估计辅助回归(auxiliary regression )模型:222501122314212ˆi i i i i ii i a a x a x a x a x a x x v ε=++++++ 原模型同方差的原假设对应于辅助模型的原假设:512340a a a a a =====3、对于辅助回归模型,利用拉格朗日乘数(LM )统计量22()aurNR q χ~进行检验原假设512340a a a a a =====。
其中2ur R 是辅助模型的判定系数(利用第三讲的术语,对于辅助模型,它就是不受约束情况下的判定系数),q 是辅助模型中不包含截距项的浙江工商大学金融学院姚耀军讲义系列解释变量的个数,在上例中q=5。
笔记:1、应该注意到,辅助模型的被解释变量是2ˆi ε而不是误差方差2δ,毕竟误差方差是无法获得的。
采取这样的做法有什么理由呢?注意到0011ˆˆˆ()()i i ix εββββε=-+-+。