计量经济学-设定误差与测量误差

合集下载

计量经济学 考试要点整理

计量经济学 考试要点整理
6.1如何使用DW统计量来进行自相关检验?该检验方法的前提条件和局限性有哪些? 答:DW 检验是杜宾和 沃特森于1951年提出的一种适用于小样本的检验方法,一般的计算 机软件都可以计算出DW 值。 给定显著水平α, 依据样本容量n和解释变量个数k’, 查D.W.表得d统计量的上界du和下界dL, 当0<d<dL时, 表明存在一阶正自相关, 而且正自相关的程度随d向0的靠近而增强。 当dL<d<du 时,表明为不能确定存在自相关。当du<d<4-du时,表明不存在一阶自相关。当4-du<d<4-dL 时,表明不能确定存在自相关。当4-dL<d<4时,表明存在一阶负自相关,而且负自相关的 程度随d向4的靠近而增强。 DW检验的前提条件:(1)回归模型中含有截距项;(2)解释变量是非随机的(因此与随 机扰动项不相关)(3)随机扰动项是一阶线性自相关。;(4)回归模型中不把滞后内生变 量(前定内生变量)做为解释变量(5)没有缺失数据,样本比较大。 DW检验的局限性:(1)DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就 无法判断。 这时, 只有增大样本容量或选取其他方法 (2) DW统计量的上、 下界表要求n 15, 这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断(3) DW检 验不适应随机误差项具有高阶序列相关的检验.(4) 只适用于有常数项的回归模型并且解释 变量中不能含滞后的被解释变量
ˆ i y) 2 ei2 ( yi y) 2 ( y
在通过分析可知,回归平方差越大,残差平方和越小,回归直线与样本点拟 合程度越高,而我们要检验总体的线性是否显著,先看一下
ˆi y ) 2 ( y ei2
的比
值,如果其比值越大,则解释变量 X 对被解释变量 Y 的解释程度越高,可推测

计量经济学的概念

计量经济学的概念

2 计量经济学的研究方法:(1)模型设定。

选择变量和数学关系式.(2)估计参数。

确定变量间的数量关系。

(3)模型检验。

检验所得结论的可靠性。

(4)模型应用。

作经济分析和经济预测3 为什么要对参数作估计一般说参数是未知的,又是不可直接观测的。

由于随机项的存在,参数也不可能通过变量值去精确计算。

只能通过变量样本观测值选择适当方法去估计4 内生变量:其数值由模型所决定的变量,是模型求解的结果。

一些变量是由模型体现的经济体系本身所决定的,在模型中是随机变量。

5 经济变量:不同时间、不同空间的表现不同,取值不同,是可以观测的因素。

是模型的研究对象或影响因素6 经济参数:表现经济变量相互依存程度的、决定经济结构和特征的、相对稳定的因素,通常不能直接观测7 应用的数据类型:时间序列数据、截面数据、面板数据、虚拟变量数据8 经济模型:是对实际经济现象或过程的一种数学模拟,是对复杂经济现象的简化与抽象9 参数估计方法:(1)单一方程模型。

最常用的是普通最小二乘法、极大使然估计法。

(2)联立方程模型。

二段、三段最小二乘法10 回归函数:应变量Y的条件期望 E(Y|X)随解释变量X的的变化而有规律的变化,如果把Y的条件期望E(Y|X)表现为X的某种函数12 随机扰动项:各个Y值与条件均值E(Y|X)的偏差u代表排除在模型以外的所有因素对Y 的影响13 样本回归函数:如果把应变量Y的样本条件均值表示为解释变量X的某种函数14 参数估计值的统计性质:无偏性、最小方差性、渐近性质15 拟合优度:样本回归线是对样本数据的一种拟合,不同估计方法可拟合出不同的回归线,拟合的回归线与样本观测值总有偏离。

样本回归线对样本观测数据拟合的优劣程度16 可决系数:在总变差分解基础上确定的,模型解释了的变差在总变差中的比重。

作用.:可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。

反之可决系数小,说明模型对样本观测值的拟合程度越差。

第九章 模型设定误差 《计量经济学》PPT课件

第九章    模型设定误差  《计量经济学》PPT课件
备择假设H1:无约束模型为真,即遗漏了变量。 排并列将,残对差排序序列后e残i按差照序遗列漏计解算释d变统量计X量3的:递增次序
n
(ei ei1)2
d i2 n
ei2
i 1
(9.3.2)
3. 给定显著性水平,查DW表,若统计量显示为正
自相关,则拒绝原假设,首先考虑存在模型设定
误差。
• 例9.1 我们来看一个教学例子。表9.1给出了一个 总成本(Y)和产出(X)的数据,现在来建立总成 本函数模型
• 对于模型一,DW=2.7002,n=10,k′=3,给定显著
性水平5%,查表得临界值为dL=0.525和dU=2.016。 DW落在[4-dU,4-dL]=[1.984,3.475]区域,表明残 差中不存在显著的正相关。从而可以判断模型没
有遗漏的变量。
(三)拉姆齐的RESET检验
拉姆齐(Ramsey)于1969年提出了回归设定误 差检验(regression specification error test, RESET),它是一般性设定误差检验(test for general mis-specification)。
(一)残差图示法
进行OLS回归,得到残差序列ei,并做其与时间t 或某解释变量X的散点图,从图形上来考察残差序 列ei是否有规律地变动,以此来判断模型是否有遗 漏变量或函数形式设定的错误。
(二)DW检验
确定模型存在遗漏有关变量(非纯自相关)还是 模型真的存在自相关(纯自相关)。
假如真实模型为:
Yi 1 2 X 2i 3 X3i ui(9.2.1)
RESET检验的具体步骤:
1. 对所选模型
u)
(9.2.14)
从而,在满足经典假定条件下

计量经济学复习

计量经济学复习

解释变量:解释变量也称自变量,是用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。

被解释变量:被解释变量也称因变量或应变量,是作为研究对象的变量。

它的变动是由解释变量作出解释的,表现为议程所描述的因果关系的果。

时间序列:是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。

随机扰动项:各个被解释变量实际值YI与条件期望E的偏差,代表排除在模型以外的所有因素对Y的影响,称为随机扰动项。

拟合优度:样本回归线对样本观测数据拟合的优劣程度称为样本回归线的拟合优度。

残差:所谓残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。

内生变量:一些变量是由模型体现的经济体系本身所决定的,在模型中是随机变量,称为内生变量。

外生变量:一些变量是在模型体现的经济体系之外给定的,在模型中是非随机的,称为外生变量。

前定变量:在模型中滞后内生变量或更大范围的内生变量的作用视为外生变量,并与外生变量一起称为前定变量。

多重共线性:指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

异方差性:是指模型中随机误差项的方差不是常量,而且它的变化与解释变量的变动有关。

自相关:是指总体回归模型的随机误差项之间存在相关关系。

即不同观测点上的误差项彼此相关。

滞后变量:是指过去时期的、对当前被解释变量产生影响的变量。

可分为滞后解释变量和滞后被解释变量两类。

虚拟变量:计量经济学中,将取值为0和1的人工变量称为虚拟变量。

单位根:设n 是正整数,当一个数的n 次乘方等于1 时,称此数为n 次“单位根”。

单位根检验:检验序列的非平稳性就变为检验特征方程是否有单位根,这就是单位根检验法。

单整:经过一次差分后变为平稳的序列称为一阶单整序列。

协整:所谓协整,是指多个非平稳变量的某种线性组合是平稳的。

滞后期:滞后期就是说,事件发生后对后面要发生事件持续影响的时间。

计量经济学-第13章 模型设定和诊断检验

计量经济学-第13章 模型设定和诊断检验

(13.2.7)所表明的是,研究者没有使用真正的Yi和Xi,却用
了含有测量误差的替代变量Yi*和Xi*。
11
5、对随机误差项ui不正确的设定 (Specification errors to the stochastic error )
如果真实的、正确的模型是:
Yi Xiui
并且lnui满足CLRM的假定
就很困难。
表现出数据的协调性;即从模型中估计的残差必须完全随机
(从技术上而言必须是白噪音)。
模型有一定的包容性;即模型应该包容或包括所有与之竞争
的模型。
6
§13.2 设定误差的类型
1、漏掉一个有关变量(1.Omitting A Relevant Variable)
为了简明起见,令这个模型为:
因此,(13.2.2)中的误差项u2i事实上是:
u2i
u1i


4
X
3 i
8
2、包含了一个无需或无关的变量 (Including an unnecessary or irrelevant variable)
假定另一个研究者使用了以下模型:
Yi

1
2 X i

3
X
2 i

4
X
3 i

或近似地为 例如,若 c = 15,k = 5,α = 5%, 由(13.4.3),真实的显著性水平为 (15/5)(5%) = 15%
(13.4.2) (13.4.3)
28
在实践中,多数研究者都仅报告其“最终”回归结 果,而不透露此前是如何通过大量数据开采或预检验而 得到这些结果的详情。
——这与个人升迁有关!
( E(ˆ3) 2

计量经济学重点

计量经济学重点

计量经济学重点第一章经济计量学的特征及研究范围1、经济计量学的定义P11经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学;2经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果;2、学习计量经济学的目的计量经济学与其它学科的区别P1-P21计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对大多数经济理论给出经验解释,进行数值估计2计量经济学与数理经济学数理经济学:主要是用数学形式或方程或模型描述经济理论计量经济学:采用数理经济学家提出的数学模型,把这些数学模型转换成可以用于经验验证的形式3计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运用数据验证结论3、进行经济计量的分析步骤P2-P31建立一个理论假说2收集数据3设定数学模型4设立统计或经济计量模型5估计经济计量模型参数6核查模型的适用性:模型设定检验7检验源自模型的假设8利用模型进行预测4、用于实证分析的三类数据P3-P41时间序列数据:按时间跨度收集到的定性数据、定量数据;2截面数据:一个或多个变量在某一时点上的数据集合;3合并数据:包括时间序列数据和截面数据;一类特殊的合并数据—面板数据纵向数据、微观面板数据:同一个横截面单位的跨期调查数据第二章线性回归的基本思想:双变量模型1、回归分析P18用于研究一个变量称为被解释变量或应变量与另一个或多个变量称为解释变量或自变量之间的关系2、回归分析的目的P18-P191根据自变量的取值,估计应变量的均值;2检验建立在经济理论基础上的假设;3根据样本外自变量的取值,预测应变量的均值;4可同时进行上述各项分析;3、总体回归函数PRFP19-P221概念:反映了被解释变量的均值同一个或多个解释变量之间的关系2表达式:①确定/非随机总体回归函数:EY|Xi =B1+B2XiB1:截距;B2:斜率从总体上表明了单个Y同解释变量和随机干扰项之间的关系②随机/统计总体回归函数:Yi =B1+B2Xi+μiμi:随机扰动项随机误差项、噪声B1+B2Xi:系统/确定性部分μi:非系统/随机部分4、随机误差项P221定义:代表了与被解释变量Y有关但未被纳入模型变量的影响;每一个随机误差项对于Y的影响是非常小的,且是随机的;随机误差项的均值为02性质①误差项代表了未纳入模型变量的影响;②反映人类行为的内在随机性;③代表了度量误差;④反映了模型的次要因素,使得模型描述尽可能简单;5、样本回归函数P22-P251概念:是总体回归函数的近似2表达式①确定/非随机样本回归函数:i =b1+b2Xib 1:截距;b2:斜率②随机/统计样本回归函数:Yi =b1+b2Xi+eiei :残差项残差,ei= Yi-iB1+B2Xi:系统/确定性部分μ:非系统/随机部分6、条件期望与非条件期望1EY|Xi条件期望:在解释变量X给定条件下Y的条件期望,可以通过X给定条件下的条件概率分布得到;2非条件期望:在不考虑其他随机变量取值情况时,某个随机变量的期望值;它可以通过该随机变量的非条件分布或边缘分布得到;6、线性回归模型回归参数为线性B的模型7、回归系数/回归参数线性回归模型中的B参数8、回归系数的估计量bs说明了如何通过样本数据来估计回归系数Bs,计算出的回归系数的值称为样本回归估计值9、随机总体回归函数与随机样本回归函数的关系1随机样本回归函数:从所抽取样本的角度说明了被解释变量Yi 同解释变量Xi及残差ei之间的关系;2随机总体回归函数:从总体的角度说明了被解释变量Yi 同解释变量Xi及随机误差项μ之间的关系;10、关于线性回归的两种解释P25-P261变量线性:应变量的条件均值是自变量的线性函数此解释下的非线性回归:EY= B1+B2Xi2;EY= B1+B2×1/Xi2参数线性:应变量的条件均值是参数B的线性函数此解释下的非线性回归:EY= B1+B22Xi线性回归在教材中指的是参数线性的回归11、多元线性回归的表达式P261确定/非随机总体回归函数:EX=B1+B2X2i+B3X3i+B4X4i2随机/统计总体回归函数:Yi = B1+B2X2i+B3X3i+B4X4i+μi12、最小二乘法OLS法P26-P281最小二乘以残差被解释变量的实际值同拟合值之间的差平方和最小的原则对回归模型中的系数进行估计的方法;1表达式2重要性质①用OLS法得出的样本回归线经过样本均值点:;②残差的均值总为0;③对残值与解释变量的积求和,其值为0,即这两个变量不相关:④对残差与i 估计的Yi的积求和,其值为0,即第三章双变量模型:假设检验1、古典线性回归模型的假设P41-P441回归模型是参数线性的,但不一定是变量线性的:Yi =B1+B2Xi+μi2解释变量X与扰动误差项μ不相关3给定Xi ,扰动项的期望或均值为0:Eμ| Xi=04μi 的方差为常数,或同方差:varμi=σ2每个Y值以相同的方差分布在其均值周围,非这种情况为异方差5无自相关假定:两个误差项之间不相关,covμi ,μj=06回归模型是正确假定的:实证分析的模型不存在设定偏差或设定误差2、OLS估计量运用最小二乘法计算出的总体回归参数的估计量3、普通最小二乘估计量的方差与标准误P44-P461的方差与标准误①方差:②标准误:2的方差与标准误①方差:②标准差:3的计算公式n-2为自由度:独立观察值的个数4:回归标准误,常用于度量估计回归线的拟合优度,值越小,Y的回归值越接近根据回归模型得到的估计值4、OLS估计量的性质P461b1和b2是线性估计量:它们是随机变量Y的线性函数2b1和b2是无偏估计量:Eb1=B1,Eb2=B23Eσ^2=σ^2:误差方差的OLS估计量是无偏的4b 1和b 2是有效估计量:varb 1小于B 1的任意一个线性无偏估计量的方差,varb 2小于B 2的任意一个线性无偏估计量的方差 5、OLS 估计量的抽样分布或概率分布P47-P481新加的假设:在总体回归函数Yi=B 1+B 2X i +μi 中,误差项μi 服从均值为0,方差为σ^2的正态分布:μi ~N0,σ^2 2OLS 估计量服从的分布情况:b 1~NB 1,σ2b1 b 2~NB 2,σ2b26、假设检验P48-P53 1使用公式近似2方法①置信区间法②显着性检验法:对统计假设的检验过程 3几个相关检验①t 检验法:基于t 分布的统计假设检验过程 ②双边检验:备择假设是双边假设的检验 ③单边检验:备择假设是单边假设的检验 7、判定系数r 2P53-P56 1重要公式:TSS=ESS+RSS①总平方和TSS=:真实Y 值围绕其均值的总变异;②解释平方和ESS=:估计的Y值围绕其均值=的变异,也称为回归平方和由解释变量解释的部分③残差平方和RSS=:Y变异未被解释的部分2r2判定系数的定义:度量回归线的拟合程度回归模型对Y变异的解释比例/百分比3r2的性质①非负性②0≤r2≤14r2的计算公式5r的计算公式8、同方差性方差相同9、异方差性方差不同10、BLUE最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中方差最小11、统计显着拒绝零假设的简称第四章多元回归:估计与假设检验1、三变量线性回归模型EYi =B1+B2Xt+ B3X3tY i =B1+B2X2t+ B3X3t+μi2、偏回归系数B2,B3:1B2:在X3保持不变的情况下,X2单位变动引起Y均值EY的变动量2B3:在X2保持不变的情况下,X3单位变动引起Y均值EY的变动量3、多元线性回归模型的若干假定P73-P74 1回归模型是参数线性的,并且是正确设定的2X2,X3与扰动误差项μ不相关①X2,X3非随机:自动满足②X2,X3随机:必须独立同分布于误差项μ3误差项的期望或均值为0:Eμi=04同方差假定:varμi=σ25误差项μi ,μi无自相关:两个误差项之间不相关,covμi,μji≠j6解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系X2不能表示为另一变量X3的线性函数7随机误差μ服从均值为0,同方差为σ^2的正态分布:μi~N0,σ2 4、多重共线性问题1完全共线性:解释变量之间存在的精确的线性关系2完全多重共线性:解释变量之间存在着多个精确的线性关系5、多元回归函数的估计P74-P756、OLS估计量的方差与标准误P75-P761b1的方差与标准误2b1的方差与标准误3b3的方差与标准误7、多元判定系数P76-P778、多元回归的假设检验P78 方法类似于第三章9、检验联合假设P80-P811联合假设:H0:B2=B3=0H:R2=0多元回归的总体显着性检验2三变量回归模型的方差分析表2F分布公式10、F与R2之间的重要关系P82-P83 1关系式2R2形式的方差分析表11、设定误差P84会导致模型中遗漏相关变量12、校正判定系数P84-P851作用衡量了解释变量能解释的离差占被解释变量总离差的比例2公式3性质①如果k>1,则≤R2,即随着模型中解释变量个数的增加,校正判定系数越来越小于非校正判定系数②虽然未校正判定系数R2总为正,但校正判定系数可能为负13、受限最小二乘法P86-P871受限模型:B2=B3=02非受限模型:包含了所有相关变量3受限最小二乘法:对受限模型用OLS估计参数4非受限最小二乘法:对非受限模型用OLS估计参数5判定对模型施加限制是否有效的F分布公式14、显着性检验1单个多元回归系数的显着性检验①提出零假设和备择假设;②选择适当的显着性水平;③在零假设为真的情况下,计算t统计量;④将t统计量的绝对值|t|同相应自由度和显着性水平下的临界值相比较;⑤如果t统计量大于临界值,则拒绝零假设;该步骤中务必要使用合适的单边或双边检验;2所有偏斜率系数的显着性检验①零假设:H0:B2=B3=...=Bk=0,即所有的偏回归系数均为0;②备择假设:至少一个偏回归系数不为0;③运用方差分析和F检验;④如果F统计量的值大于相应显着性水平下的临界值,拒绝零假设,否则接受;⑤3在1和2中可以不事先选择好显着性水平,只需得到相应统计量的p值,如果p 值足够小,我们就可以拒绝零假设;第五章回归模型的函数形式1、不同的函数形式P121模型形式斜率强性线性双对数对数—线性线性—对数倒数逆对数2、多元对数线性回归模型P104-P1073、线性趋势模型P1104、多项式回归模型P116-P1175、过原点的回归P1186、标准化变量的回归P120第六章虚拟变量回归模型1、虚拟变量P133-P134因变量受到一些定性变量的影响,这类定性变量称为虚拟变量,用D表示虚拟变量,虚拟变量的取值通常为0和12、虚拟变量陷阱P136引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱3、虚拟变量回归模型的类型包含一个定量变量、一个定性变量的回归模型1只影响截距加法模型2只影响斜率乘法模型3同时影响截距与斜率混合模型4、交互效应P142:交互作用虚拟变量5、分类变量和定性变量这类变量的取值不是一般的数据数值变量或定量变量,它们通常代表所研究的对象是否具有的某种特征;6、方差分析模型ANOVA解释变量仅包含定型变量或虚拟变量的回归模型;7、协方差分析模型ANOCVA回归模型中的解释变量有些是线性的,有些是定量的;8、差别截距虚拟变量包含此变量的模型能够分辨被解释变量的均值在不同类别之间是否相同; 9、差别斜率虚拟变量包含此变量的模型能够分辨不同类别之间被解释变量均值变化率的变化范围第七章模型选择:标准与检验1、好的模型具有的性质P164-P1651简约性:模型应尽可能简单;2可识别性:每个参数只有一个估计值;3拟合优度:用模型中所包含的解释变量尽可能地解释应变量的变化;4理论一致性:构建模型时,必须有一定的理论基础;5预测能力:选择理论预测与实践吻合的模型;2、产生设定误差的原因1研究者对所研究问题的相关理论了解不深2研究者没有关注本领域前期的研究成果3研究者在研究中缺乏相关数据4数据测量时的误差3、设定误差的类型P1651遗漏相关变量:“过低拟合”模型P165-P168实际模型:估计模型:后果:①如果遗漏变量X3与模型中的变量X2相关,则a1和a2是有偏的;也就是说,其均值或期望值与真实值不一致;②a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失;③如果X2和X3不相关,则b32为零,即a2是无偏的,同时也是一致的;④根据两变量模型得到的误差方差是真实误差方差σ2的有偏估计量;⑤此外,通常估计的a2的方差是真实估计量方差的有偏估计量;即使等于零,这一方差仍然是有偏的;⑥通常的置信区间和假设检验过程不再可靠;置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零;2包括不相关变量:“过度拟合”模型P168-169正确模型:错误模型:后果:①过度拟合模型的估计量是无偏的也是一致的;②从过度拟合方程得到的σ2的估计量是正确的;③建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的;④从过度拟合模型中估计的a是无效的——其方差比真实模型中估计的b的方差大;因此,建立在a的标准误上的置信区间比建立在b的标准误上的置信区间宽,尽管前者的假设检验是有效的;总之,从过度拟合模型中得到的OLS估计量是线性无偏估计量,但不是最优先性无偏估计量;3不正确的函数形式P170-171如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量;4度量误差①应变量中度量误差对回归结果的影响i. OLS估计量是无偏的;ii. OLS估计量的方差也是无偏的;iii. 估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中;②解释变量的度量误差对回归结果的影响i. OLS估计量是有偏的;ii. OLS估计量也是不一致的;③解决方法:如果解释变量中存在度量误差,建议使用工具变量或替代变量;4、设定误差的诊断1诊断非相关变量P172-P1742对遗漏变量和不正确函数形式的检验P174-P175①判定系数R2和校正后的R2;②估计的t值;③与先验预期相比,估计系数的符号;3在线性和对数线性模型之间选择:MWD检验P175-P176:线性模型:Y是X的线性函数①设定如下假设;HH:对数线性模型:lnY是X或lnX的线性函数1②估计线性模型,得到Y的估计值③估计线性对数模型,得到lnY的估计值④求⑤做Y对X和的回归,如果根据t检验的系数是统计显着的,则拒绝H0⑥求⑦做lnY对X或lnX和的回归,如果的系数是统计显着的,则拒绝H14回归误差设定检验:RESETP177-P178①根据模型估计出Y值;②把的高次幂,,等纳入模型以获取残差和之间的系统关系;由于上图表明残差和估计的Y值之间可能存在曲线关系,因而考虑如下模型③令从以上模型中得到的为,从前一个方程得到的为,然后利用如下F检验判别从以上方程中增加的是否是统计显着的;④如果在所选的显着水平下计算的F值是统计显着的,则认为原始模型是错误设定的;第八章多重共线性:解释变量相关会有什么后果1、完全多重共线性P183-P185回归模型的某个解释变量可以写成其他解释变量的线性组合;设X2可以写成其他某些解释变量的线性组合,即:X 2=a3X3+a4X4…+akXk至少有一个ai≠0,i= 2,3,…k称存在完全多重共线性2、高度多重共线性P185-P187X2与其他解释变量高度共线性,即可以近似写成其他解释变量的线性组合X 2=a3X3+a4X4…+akXk+i至少有一个ai ≠0,i= 2, 3,…k, vi是随机误差项;3、产生多重共线的原因1时间序列解释变量受同一因素影响经济发展、政治事件、偶然事件、时间趋势经济变量的共同趋势2模型设立:解释变量中含有当期和滞后变量4、多重共线性的理论后果P187-P188OLS估计量仍然是最优无偏估计量1在近似共线性的情形下,OLS估计量仍然是无偏的;2近似共线性并未破坏OLS估计量的最小方差性;3即使在总体回归方程中变量X之间不是线性相关的,但在某个样本中,X变量之间可能线性相关;5、多重共线性的实际后果P188-P1891OLS估计量的方差和标准误较大;2置信区间变宽;3t值不显着;4R2值较高;5OLS估计量及其标准误对数据的微小变化非常敏感6回归系数符号有误;7难以评估各个解释变量对回归平方和ESS或者R2的贡献6、多重共线性的诊断P189-P1921观察回归结果R2较高,F很大,但t值显着的不多;多重共线性的经典特征R2较高,F检验拒绝零假设,但各变量的t检验表明,没有或少有变量系数是统计显着的;2简单相关系数法解释变量两两高度相关;变量相关系数比如超过,则可能存在较为严重的共线性;这一标准并不总是可靠,相关系数较低时,也有可能存在共线性3检查偏相关系数不一定可行4判定系数法辅助回归某个解释变量对其余的解释变量进行回归如果判定系数很大,F检验显着,即X与其他解释变量存在多重共线i5方差膨胀因子7、多重共线性的补救P195-P1981从模型中删除引起共线性的变量①找出引起多重共线性的解释变量,将它排除出去最为简单的克服多重共线性问题的方法;②逐步回归法i. 逐步引入如果拟合优度变化显着—新引入的变量是一个独立解释变量;选择解释变量的原则:a. 调整的R2增加,每个∣t∣增加,则保留引入变量;b. 调整的R2下降,每个∣t∣变化不大,则删除引入变量;ii. 逐步剔除①排除变量时应该注意:i. 由实际经济分析确定变量的相对重要性,删除不太重要的变量;ii. 如果删除变量不当,会导致模型设定误差;2获取额外的数据或新的样本3重新考虑模型4先验信息5变量变换将原模型变换为差分模型可有效消除存在于原模型中的多重共线性一般,增量之间的线性关系远比总量之间的线性关系弱得多; 第九章异方差:如果误差方差不是常数会有什么后果1、异方差的定义随机误差项ui 的方差随着解释变量Xi的变化而变化,即:2、异方差的性质P205-P208OLS估计仍是线性无偏,但不具最小方差1线性性2无偏性3方差式1不具有最小方差,式2具有最小方差3、异方差性的后果P209-P210经典模型假定下,OLS估计量是最优线性无偏估计量BLUE;去掉同方差假定:1OLS估计量仍是线性的;2OLS估计量仍是无偏的;3OLS估计量不再具有最小方差性,即不再是最优有效估计量;4OLS估计量的方差通常是有偏的;5偏差的产生是由于,即不再是真实σ2的无偏估计量;6建立在t分布和F分布之上的置信区间和假设检验是不可靠的,如果沿用传统的检验方法,可能得出错误的结论;4、异方差的检验1图形检验P211-P212e2对一个或多个解释变量或Y的拟合值作图; 2帕克检验Park TestP212-P214假定误差方差与解释变量相关形式:步骤:①做OLS估计求平方,取对数②对ei③做辅助回归④检验零假设:B=023格莱泽检验Glejser TestP214假定误差方差与解释变量相关形式:步骤:①做OLS估计②对e求绝对值i③做辅助回归方程=0④检验零假设:B24怀特检验White TestP215-P216和交叉乘积呈线性关系假定误差方差与X、X2步骤:①OLS估计得残差②做辅助回归③检验统计量5、异方差的修正1加权最小二乘法WLSWeighted Least SquaresP217-P222①方差已知原模型:加权后的模型:误差项的方差为:1加权的权数:②方差未知成比例:i. 误差方差与Xi模型变换:ii. 误差方差与Xi2成比例:模型变换:2怀特异方差校正的标准误P222-P223①如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验;②怀特估计方法③大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验;第十章自相关:如果误差项相关会有什么结果1、自相关的定义P233按时间或空间顺序排列的观察值之间存在的相关关系;2、自相关的性质P233-P2341若古典线性回归模型中误差项ui不存在自相关Covui,uj=Eui,uj=0,i≠j2若误差项之间存在着依赖关系—ui存在自相关Covui,uj=Eui,uj≠0,i≠j3、产生自相关的原因P235-P2361惯性2设定偏误①模型中遗漏了重要变量;②模型选择了错误的函数形式;i. 从不正确的模型中得到的残差会呈现自相关;ii. 检验是否由于模型设定错误而导致残差自相关的方法:3蛛网现象4数据的加工①在用到季度数据的时间序列回归中,这些数据通常来自于每月数据;这种数据加工方式减弱了每月数据的波动而引进数据的匀滑性;②用季度数据描绘的图形要比用月度数据看来匀滑得多;这种匀滑性本身可能使扰动项中出现自相关;③内插法或外推法:用这些方法加工得到的数据都会给数据带来原始数据没有的系统性,这种系统性可能会造成误差自相关;4、自相关的后果P236-P2371OLS估计得到的仍为线性、无偏估计;2OLS估计不再具有有效性;3OLS估计量的方差有偏:低估了估计量的标准差;4通常所用的t检验和F检验是不可靠的;5计算得到的误差方差是真实σ2的无偏估计量,并且很有可能低估了真实的σ2;6通常计算的R2不能测度真实的R27通常计算的预测方差和标准误也是无效的5、自相关的诊断1图形法—时序图P237-P239①误差u并不频繁地改变符号,而是几个正之后跟着几个负,几个负之后跟着t几个正,则呈正自相关;②扰动项的估计值呈循环型,而是相继若干个正的以后跟着几个负的,表明存在正自相关;③扰动项的估计值呈锯齿型一个正接一个负,随时间逐次改变符号,表明存在负自相关;2检验P239-P242①定义值d值近似1 =-1完全负相关d=42 =0无自相关d=23 =1完全正相关d=0②DW检验的判断准则6、自相关的修正ρ的估计主要方法1ρ=1:一阶差分方法P244假定误差项之间完全正相关 Y t = α+βX t +u tu t = u t-1+tY t - Y t-1= βX t -X t-1+t2从DW 统计量中估计ρP244-P245 3从OLS 残差e t 中估计Cochrane-OrcuttP245-P246①e t = e t-1+t②利用OLS 残差,得的估计量 ③迭代,得的收敛值。

计量经济学-名词解释及简答

计量经济学-名词解释及简答

一、名词解释第一章1、计量经济学:计量经济学是以经济理论和经济数据的事实为依据,运用数学、统计学的方法,借助计算机为辅助工具,通过建立数学模型来研究经济数量关系和规律的一门经济学科。

2、虚拟变量数据:虚拟变量数据是人为构造的,通常取值为1或0的,用来表征政策等定性事实的数据。

3、计量经济学检验:计量经济学检验主要是检验模型是否符合计量经济方法的基本假定。

4、政策评价:政策评价是利用计量经济模型对各种可供选择的政策方案的实施后果进行模拟测算,从而对各种政策方案做出评价第二章1、回归平方和:回归平方和用ESS 表示,是被解释变量的样本估计值与其平均值的离差平方和。

2、拟和优度检验:拟和优度检验指检验模型对样本观测值的拟合程度,用2R 表示,该值越接近1,模型对样本观测值拟合得越好。

3、相关关系:当一个或若干个变量X 取一定数值时,与之相对应的另一个变量Y 的值虽然不确定,但却按某种规律在一定范围内变化,变量之间的这种关系,称为不确定性的统计关系或相关关系,可表示为Y=f(X ,u),其中u 为随机变量。

4、高斯-马尔科夫定理:在古典假定条件下,O LS 估计式是其总体参数的最佳线性无偏估计式。

第三章1、偏回归系数:在多元线性回归模型中,回归系数j (j=1,2,……,k )表示的是当控制其他解释变量不变的条件下,第j 个解释变量的单位变动对被解释变量平均值的影响,这样的回归系数称为偏回归系数。

2、多重可决系数:“回归平方和”与“总离差平方和”的比值,用2R 表示。

3、修正的可决系数:用自由度修正多重可决系数2R 中的残差平方和与回归平方和。

4、回归方程的显著性检验(F 检验):对模型中被解释变量与所有解释变量之间的线性关系在总体上是否显著做出推断。

5、回归参数的显著性检验(t 检验):当其他解释变量不变时,某个回归系数对应的解释变量是否对被解释变量有显著影响做出推断。

6、无多重共线性假定:假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关,在此条件下,解释变量观测值矩阵X 列满秩Rank(X)=k ,此时,方阵X`X 满秩, Rank(X`X)=k从而X`X 可逆,(X`X) 存在。

庞皓《计量经济学》(第4版)章节题库-第9章 设定误差与测量误差【圣才出品】

庞皓《计量经济学》(第4版)章节题库-第9章 设定误差与测量误差【圣才出品】
答:不同意这种观点。模型中遗漏变量或者增加非相关的变量都会对模型的估计产生
2 / 13
圣才电子书

严重的影响。
十万种考研考证电子书、题库视频学习平 台
(1)如果模型中遗漏变量,需要分成两种情况讨论:①遗漏变量与模型中的解释变
量相关。这种情况是最常见的,此时参数的估计是有偏且不一致的,并且参数估计也不满
圣才电子书

十万种考研考证电子书、题库视频学习平 台
第 9 章 设定误差与测量误差
一、选择题 1.若真实模型是解释变量为 X1 的一元线性回归模型,但在建模时将与 X1 无关的变量 X2 包含在模型中,则斜率参数的最小二乘估计量( )。 A.仍具有无偏性、一致性和最小方差性 B.不具有无偏性、一致性和最小方差性 C.仍具有无偏性、一致性,但不具有最小方差性 D.不具有无偏性、一致性,但仍具有最小方差性 【答案】C 【解析】在包含无关变量的模型中,最小二乘估计量是无偏且一致的,随机干扰项的 方差也能被正确估计,但 OLS 估计量不具有最小方差性。该类错误的后果通常体现为,包 含无关变量的偏误主要表现为“错误”模型的普通最小二乘估计量的方差一般会大于“正 确”模型相应参数估计量的方差。
程的自由度降低,从而扰动项的方差估计变小,模型中参数的标准误增大,从而影响参数
的假设检验,置信区间的计算。
都很严重。
3.“好的”经济计量模型有哪些性质? 答:一个好的模型应具备以下条件: (1)模型应尽可能简洁; (2)模型中系数的估计值应唯一; (3)对样本数据的拟合程度较好; (4)模型中估计系数的符号同相关经济理论相符; (5)具有良好的预测力。
料限制等问题,忽略某些重要变量而造成的模型设定偏误。
b.误选无关变量:在回归模型引入了一些无关紧要的自变量,从而造成模型设定偏
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

ˆu2 RSSu n - 3
x22i
x22i
的有偏估计,即使 X3与X2 不相关,也有 Vaˆr(ˆ2) Vaˆr(ˆ),
致使假设检验程序很有可能是可疑的。
必须清楚,一旦根据相关理论把模型建立起来,
再从中删除变量需要有充分的理由并十分谨慎。
23
2. 包含无关变量偏误
定义:模型中包括了不重要的解释变量,即采用误 选了无关解释变量的模型进行估计而带来的偏误, 称为包含无关变量偏误
2 v
x22i (1- r223 )
25
无关变量的设定误差的后果
1. 可以证明,(2)式参数的OLS估计量是无偏, 且为一致性的。即:
E(ˆ1) 1, E(ˆ3 ) 3 0
同理,可证明:
E(ˆ2 ) 2
p limˆ1 1
n
p limˆ2 2
n
p limˆ3 3 0
n
26
2. ˆ2 不是有效估计量:
10
1. 相关变量的遗漏
(Omitting Relevant Variables)
例如,如果“正确”的模型为
Yi 1 2 X 2i 3 X3i i
而我们将模型设定为
Yi 1 2 X 2i i
即设定模型时漏掉了一个相关的解释变量。 这类错误称为遗漏相关变量(“欠拟合”)。
11
2. 无关变量的误选
4. 遗漏变量 X 3 ,式中的随机扰动项 vi的方差估计
量将是有偏的,即:
ˆ
2 v
RSSv
(n - 2)
E ˆv2
2 u
5. 与方差相关的检验,包括假设检验、区间估计,
在关于参数的统计显著性方面,都容易导出错误的
结论。
20
特别注意
(1) 若 X3与X2相关,r223 0,显然,Var ˆ2 Var ˆ2
关,则拒绝原假设,受约束回归模型不成立,存 在模型设定误差,否则接受原假设,受约束回归 模型成立,模型无设定误差。
33

举例
对下表的数据设定总生产成本函数,准备 使用如 下三个备选模型:
1
Yi
1 2 Xi
3 Xi2
4
X
3 i
ui
2
Yi
1
2 Xi
3
X
2 i
3 Yi 1 2 Xi
有(1)为真实模型,试用DW法检验模型设定误 差。
28
第二节 设定误差的检验
本节基本内容:
●DW检验 ●拉各朗日乘数检验 ●一般性检验
29
对变量设定误差进行检验必须在经济理论指导下进行, 不可抛弃经济理论而进行假设检验。
对于是否误选无关变量的检验,只要针对无关变量系 数的期望值为零的假设,用t检验或F检验,对无关变 量系数作显著性检验即可。
对于遗漏变量设定误差的检验有多种方法,例如DW 检验、拉格朗日乘数检验、豪斯曼检验、RESET 一 般性检验等。
x2i x3i x22i
x2i (ui - u ) x22i
16
遗漏变量设定误差的后果
由此可以看出,X 3的遗漏将产生如下后果。
两边取概率极限,有:
p limˆ2
n
2
3
Cov X2i , X3i Var X2i
Cov
Var
X2i ,ui
X2i
17
1.
如果漏掉的X

3
X
相关,则参数估计值是有偏且不一致
3
对模型的设定是计量经济研究的重要环节。
前面各章除了对随机扰动项 ui分布的基本假定以 外,还强调:
假定设定的模型对变量和函数形式的设定是正 确地描述被解释变量与解释变量之间的真实关系, 假定模型中的变量没有测量误差。
但是在实际的建模实践中,对模型的设定不一定
能够完全满足这样的要求,从而会使模型出现设
定误差。
4
第九章 设定误差与测量误差
本章主要讨论:
●设定误差 ●设定误差的检验 ●测量误差
5
第一节 设定误差
本节基本内容:
●设定误差及类型 ●变量设定误差的后果
6
• 不能机械的做应用计量经济学,他需要理 解、直觉和技巧:
• …通常我们在驾车通过一座桥梁时,并不 担心其结构的可靠性,因为我们合理的相 信已经有人严格的检查过其工程的原理和 实践。经济学家做模型时也必须这样,否 则的话,就必须奉送一句警告“使用导致 坍塌概不负责。”
34
总成本(Y )
1
193
2
226
3
240
4
244
5
257
6
260
7
274
8
297
9
350
10
420
产出(X )
1 2 3 4
5 6 7 8 9 10
35
三个模型分别代入数据回归
)
(1)
Yi
141.767
63.487
X
i
-12.962
X
2 i
0.939
X
3 i
se (6.375) (4.778) (0.9856) (0.0592)
7
• 经济学家多年来对真理的寻求曾给人一种 感觉:经济学家们就好像在一间黑房子里 搜寻一只原本并不存在的黑猫,而计量经 济学家还声称找到了一只。
8
一、设定误差及类型
计量经济模型是对变量间经济关系因果性的设想, 若所设定的回归模型是“正确”的,主要任务是所 选模型参数的估计和假设检验。但是如果对计量模 型的各种诊断或检验总不能令人满意,这时应把注 意力集中到模型的设定方面:
当模型设定出现误差时,模型估计结果也会与 “实际”有偏误;
偏误的性质与程度与模型设定误差的类型密切相 关。
从实质上看,变量设定误差的主要后果,是一个 或多个解释变量与随机扰动项之间存在着相关性, 进而影响参数估计的统计特性。
14
1. 遗漏相关变量(欠拟合)偏误
采用遗漏了重要解释变量的模型进行估计而带来 的偏误,称为遗漏相关变量偏误。 设正确的模型为:
x22i 0;
似乎分别有:
Eˆ2 2 Var(ˆ2) Var(ˆ2);
若这两个等式成立,意味着尽管变量 X 3,在理 论上分析是有关的变量,但从所选模型中略去
似乎也不会导致什么危害。这种认识实际也不
正确。
22
因为
Vaˆr(ˆ2)
ˆv2 RSSv n - 2
x22i
x22i
是Vaˆr(ˆ2)
2
的。分别在小样本下求期望、在大样本下求概率极限,
有:
E(ˆ1) 1
且 p lim(ˆ1) 1
n
E(ˆ2 ) 2
p lim(ˆ2 ) 2
n
2. 如果X 3 与 X不2 相关,则 2的估计满足无偏性与一致
性;但这时 的估计却是有偏的。 1 18
3. ˆ2 的方差是 ˆ2方差的有偏估计:
由 Y = 1 + 2 X2 + v得 Var(ˆ2)
(Including Irrevelant Variables)
例如,如果“真实模型”为:
Yi 1 2 X 2i 3 X3i i
但我们却将模型设定为
Yi 1 2 X 2i 3 X3i 4 X 4i i
即设定模型时,多选了一个无关解释变量。这类 错误称为无关变量的误选(“过拟合”)。
12
似乎有:Varˆ2 Var ˆ2 ;
但实际情形并不完全如此。 可以注意到残差平方和RSS的计算
ˆ2 RSSv (n 2) RSSu (n 3) ˆu2; 因此,有可能:
RSSv (n 2) RSSu (n 3);
21
(2)若X 3与X 2 不相关,有
r223 0和 x2i x3i
IM = -172.42 + 0.271GDP - 949.12T + 160.73T 2 - 10.18T 3
t (-0.177) (5.67) (-2.22) (2.20) (-2.74) R2 0.991 F 272.95 DW 1.97
2
有人根据“简单优于复杂”原则,得到以下方程:
设正确模型 Y = β1 + β2X2 + μ
(1)
但却估计了 Y α1 α2X2 α3X3 v
(2)
如果 3 0,则(2)与(1)相同,因此,可将(1)式 视为以 3 0 为约束的(2)式的特殊形式。
采用OLS 法对(2)进行估计,有:
24
ˆ2
x2i yi x32i - x3i yi x2i x3i x22i x32i - ( x2i x3i )2
IM -217.186 0.173GDP
t (-0.5) (16.94)
(2)
R2 0.960 F 286.95 DW 0.735 进行比较:
两个方程的检验结果都较理想;
方程(2)GDP的t检验值似乎优于方程(1);
方程(2)函数形式也更为简单;
然而,能否根据“Occam’s razor”原则,判断方程(2)比 方程(1)好?


v2
x22i
Y = β1 + β2 X2 + β3 X3 + u
Var(ˆ2)
2
x22i (1-
x2i x22i
x3i x32i
)
u2
x22i (1- r223)
19
如果 X 3与 X 2相关,显然有 Var(ˆ2) Var(ˆ2)
如果
X

3
X
不相关,也有
2
Var(ˆ2) Var(ˆ2)
Yi 1 2 X 2i 3i X 3i ui
正确模型离差形式为:
相关文档
最新文档