第四章多重共线性答案(1)
第四章 多重共线性

二、产生多重共线性的背景
多重共线性产生的经济背景主要有几种情形: 1.经济变量之间具有相同的变化趋势。 2.模型中包含滞后变量。 3.利用截面数据建立模型也可能出现多重共线性。 4.样本数据的原因。
6
第二节 多重共线性的后果
一、完全多重共线性产生的后果
1.参数的估计值不确定 2.参数估计值的方差无限大
Cov( ˆ2 ,
ˆ3 )
(1
r223 )
r23 2
x22i
x32i
随着共线性增加,r23趋于1,方差将增大。同样 协方差的绝对值也增大,它们增大的速度决定于
方差扩大(膨胀)因子(variance inflation factor, VIF)
VIF
1
1 r223
这时
Var(ˆ2 )
4.多重共线性严重时,甚至可能使估计的回归系数 符号相反,得出完全错误的结论。(如引例)
18
第三节 多重共线性的检验
本节基本内容: 简单相关系数检验法 方差扩大因子法 直观判断法 病态指数检验法 逐步回归法
19
一、简单相关系数检验法 简单相关系数检验法是利用解释变量之间的线性 相关程度去判断是否存在严重多重共线性的一种 简便方法。适用于只有两个变量的情形。
2
x32i 0
同理
ˆ3
这说明完全多重共线性时,参数估计量的方差将 变成无穷大。
9
关于方差的推导
Var(ˆ2 )
x32i (x22i ) (x32i )
(x2i x3i )2
2
1 X21 X 1 X22
1 X2n
4.1 多重共线性(计量经济学)

放宽基本假定的模型
说明
• 经典多元线性模型在满足若干基本假定的条件下, 应用普通最小二乘法得到了无偏、有效且一致的 参数估计量。
• 在实际的计量经济学问题中,完全满足这些基本 假定的情况并不多见。不满足基本假定的情况, 称为基本假定违背。
• 对截面数据模型来说,违背基本假定的情形主要 包括:
•逐步回归法(Stepwise forward Regression)
– 以Y为被解释变量,逐个引入解释变量,构成回归 模型,进行模型估计。
– 根据拟合优度的变化决定新引入的变量是否独立。 • 如果拟合优度变化显著,则说明新引入的变量是 一个独立解释变量;
• 如果拟合优度变化很不显著,则说明新引入的变 量与其它变量之间存在共线性关系。
§4.1 多重共线性 Multicollinearity
一、多重共线性 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的方法 六、案例
一、多重共线性的概念
1、多重共线性
Yi 0 1Xi1 2 Xi2 k Xik i i 1, 2, , n
实际上:正态性假设的违背
• 李子奈(2011):计量经济学模型方法论 – 当存在模型关系误差时,如果解释变量是随机的,随 机误差项的正态性将得不到保证。 – 当模型遗漏了显著的变量,如果遗漏的变量是非正态 的随机变量,随机误差项将不具有正态性。 – 如果待估计的模型是原模型经过函数变换得到的,随 机误差项将不再服从正态分布。 – 当模型存在被解释变量的观测误差,如果观测误差相 对于随机误差项的标准差特别大、样本长度又特别小, 随机误差项的正态性假设会导致显著性水平产生一定 程度的扭曲。 – 当模型存在解释变量观测误差时,一般情况下,随机 误差项的正态性假设都是不能成立的;只有在回归函 数是线性的,且观测误差分布是正态的特殊情形下, 随机误差项的正态性才成立。
多重共线性习题及答案

多重共线性一、单项选择题1、当模型存在严重的多重共线性时,OLS估计量将不具备()A、线性B、无偏性C、有效性D、一致性2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF()A、大于B、小于C、大于5D、小于53、模型中引入实际上与解释变量有关的变量,会导致参数的OLS估计量方差()A、增大B、减小C、有偏D、非有效4、对于模型y t=b0+b1x1t+b2x2t+u t,与r12=0相比,r12=0.5时,估计量的方差将是原来的()A、1倍B、1.33倍C、1.8倍D、2倍5、如果方差膨胀因子VIF=10,则什么问题是严重的()A、异方差问题B、序列相关问题C、多重共线性问题D、解释变量与随机项的相关性6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( )A 异方差B 序列相关C 多重共线性D 高拟合优度7、存在严重的多重共线性时,参数估计的标准差()A、变大B、变小C、无法估计D、无穷大8、完全多重共线性时,下列判断不正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的拟合程度不能判断D、可以计算模型的拟合程度二、多项选择题1、下列哪些回归分析中很可能出现多重共线性问题()A、资本投入与劳动投入两个变量同时作为生产函数的解释变量B、消费作被解释变量,收入作解释变量的消费函数C、本期收入和前期收入同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型2、当模型中解释变量间存在高度的多重共线性时()A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关3、下述统计量可以用来检验多重共线性的严重性()A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数4、多重共线性产生的原因主要有()A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确5、多重共线性的解决方法主要有()A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量6、关于多重共线性,判断错误的有()A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应用的意义D、存在严重的多重共线性的模型不能用于结构分析7、模型存在完全多重共线性时,下列判断正确的是()A、参数无法估计B、只能估计参数的线性组合C、模型的判定系数为0D、模型的判定系数为1三、简述1、什么是多重共线性?产生多重共线性的原因是什么?2、什么是完全多重共线性?什么是不完全多重共线性?3、完全多重共线性对OLS估计量的影响有哪些?4、不完全多重共线性对OLS估计量的影响有哪些?5、从哪些症状中可以判断可能存在多重共线性?6、什么是方差膨胀因子检验法?四、判断(1)如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。
计量经济学(第四章多重共线性)

06
总结与展望
研究结论总结
多重共线性现象普遍存在于经济数据中,对计量 经济学模型的估计和解释产生了重要影响。
通过使用多种诊断方法,如相关系数矩阵、方差膨 胀因子(VIF)和条件指数(CI),可以有效地识别 多重共线性问题。
在存在多重共线性的情况下,普通最小二乘法 (OLS)估计量虽然仍然是无偏的,但其方差可能 变得很大,导致估计结果不稳定。
主成分分析法的优点
可以消除多重共线性的影响,同 时降低自变量的维度,简化模型。
岭回归法
岭回归法的基本思想
通过在损失函数中加入L2正则化项(即所有自变量的平方和),使得回归系数的估计更加稳定, 从而消除多重共线性的影响。
岭回归法的步骤
首先确定正则化参数λ的值,然后求解包含L2正则化项的损失函数最小化问题,得到岭回归系数的估 计值。
逐步回归法的优点
可以自动选择重要的自变量,同时消除多重共线性的影响。
主成分分析法
主成分分析法的基本思想
通过正交变换将原始自变量转换 为互不相关的主成分,然后选择 少数几个主成分进行回归分析。
主成分分析法的步骤
首先对原始自变量进行标准化处理, 然后计算相关系数矩阵并进行特征值 分解,得到主成分及其对应的特征向 量。最后,选择少数几个主成分作为 新的自变量进行回归分析。
岭回归法的优点
可以有效地处理多重共线性问题,同时避免过拟合现象的发生。此外,岭回归法还可以提供对所 有自变量的系数进行压缩估计的功能,使得模型更加简洁易懂。
05
实证研究与结果分
析
数据来源及预处理
数据来源
本研究采用的数据集来自于公开的统 计数据库,涵盖了多个经济指标和影 响因素的观测值。
数据预处理
第四章 多重共线性 答案(1)

第四章 多重共线性一、判断题1、多重共线性是一种随机误差现象。
(F )2、多重共线性是总体的特征。
(F )3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。
(F )4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。
(T )5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。
(T )6、变量的两两高度相关并不表示高度多重共线性。
(F )7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。
(T )8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。
(F )9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。
( F )10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。
(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。
(T )12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。
(F )13、多重共线性的存在会降低OLS 估计的方差。
(F )14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。
(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。
(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。
(T )17、多重共线性问题是随机扰动项违背古典假定引起的。
(F ) 18、存在多重共线性时,模型参数无法估计。
(F )二、单项选择题1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在 ( B ) A 、异方差 B 、多重共线性 C 、序列相关 D 、随机解释变量2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型中存在 ( C ) A 、异方差性 B 、序列相关C 、多重共线性D 、拟合优度低3、对于模型i i 22i 110i u X X Y +++=βββ,与0r 12=相比,当50r 12.=时,估计量1βˆ的方差()1βˆvar 将是原来的 ( B ) A 、 1 倍 B 、 1.33 倍 C 、1.96 倍 D 、 2 倍 4、如果方差膨胀因子VIF =10,则认为什么问题是严重的( C )A 、异方差问题B 、序列相关问题C 、多重共线性问题D 、 解释变量与随机项的相关性 5、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF ( C )。
计量经济学庞皓课后思考题答案

答:定义关系是指根据定义而表达的恒等式,是由经济理论或客观存在的经济关系决定的恒等关系。国民经济中许多平衡关系都可以建立恒等关系,这样的模型称为定义方程式。在联立方程组模型中经常利用定义方程式。但是,定义方程式的恒等关系中没有随机误差项和需要估计的参数,所以一般不宜用于建立单一方程模型。
1.12为什么计量经济模型可以用于政策评价?其前提条件是什么?
答:所谓政策评价,是利用计量经济模型对各种可供选择的政策方案的实施后果进行模拟运算,从而对各种政策方案作出评价。前提是,我们是把计量经济模型当作经济运行的实验室,去模拟所研究的经济体计量经济模型体系,分析整个经济体系对各种假设的政策条件的反映。在实际的政策评价时,经常把模型中的某些变量或参数视为可用政策调整的政策变量,然后分析政策变量的变动对被解释变量的影响。
1.4在计量经济模型中被解释变量和解释变量的作用有什么不同?
答:在计量经济模型中,解释变量是变动的原因,被解释变量是变动的结果。被解释变量是模型要分析研究的对象。解释变量是说明被解释变量变动主要原因的变量。
1.5一个完整的计量经济模型应包括哪些基本要素?你能举一个例子吗?
答:一个完整的计量经济模型应包括三个基本要素:经济变量、参数和随机误差项。
2.9为什么对被解释变量个别值的预测区间会比对被解释变量平均值的预测区间更宽?
答:预测被解释变量平均值仅存在抽样误差,而对被解释变量个别值的预测,不仅存在抽样误差,而且要受随机扰动项的影响。所以对个别值的预测区间比对平均值的预测区间更宽。
2.10如果有人利用中国1978~2000年的样本估计的计量经济模型直接预测“中国综合经济水平将在2050年达到美国2002年的水平”,你如何评论这种预测?
第四章 多重共线性 思考题

第四章 多重共线性 思考题4.1 多重共线性的实质是什么 ? 为什么会出现多重共线性 ? 4.2 多重共线性对回归参数的估计有何影响 ?4.3 多重共线性的典型表现是什么 ? 判断是否存在多重共线性的方法有哪些 ? 4.4 针对出现多重共线性的不同情形 , 能采取的补救措施有哪些 ?4.5 在涉及相关的宏观经济总量指标如 GDP 、货币供应量、物价总水平、国民总收入、就业人数等时间序列的数据中一般都会怀疑有多重共线性 , 为什么 ?4.6 多重共线性的产生与样本容量的个数n 、解释变量的个数k 是有无关系 ? 4.7 具有严重多重共线性的回归方程能否用来进行预测 ? 4.8 岭回归法的基本思想是什么 , 它对降低共线性有何作用 ? 4.9 以下陈述是否正确 ? 请判断并说明理由。
1) 在高度多重共线性的情形中 , 要评价一个或多个偏回归系数的单个显著性是不可能的。
2) 尽管有完全的多重共线性 ,OLS 估计量仍然是BLUE 。
3) 如果有某一辅助回归显示出高的2j R 值,则高度共线性的存在是肯定无疑的。
4) 变量的两两高度相关并不表示高度多重共线性。
5) 如果其他条件不变 ,VIF 越高 ,OLS 估计量的方差越大。
6) 如果在多元回归中,根据通常的t 检验,全部偏回归系数分别都是统计上不显著的 ,你就不会得到一个高的2R 值。
7) 在 Y 对2X 和3X 的回归中 , 假如3X 的值很少变化 ,这就会使Var(3ˆβ)增大 , 在极端的情形下 , 如果全部3X 值都相同 ,Var(3ˆβ)将是无穷大。
8) 如果分析的目的仅仅是预测 , 则多重共线性是无害的。
练习题 4.1 假设在模型12233ii i i Y X X u βββ=+++中 ,2X 与3X 之间的相关系数为零 , 于是有人建议你进行以下回归。
1221i i i Y X u αα=++ 1332i i i Y X u γγ=++是否存在2ˆα=2ˆβ且3ˆγ=3ˆβ?为什么 ? 2) 1ˆβ会等于1ˆα或1ˆγ或两者的某个线性组合吗 ? 3) 是否有Var(2ˆβ)且Var(2ˆα)且Var (3ˆβ)=Var(3ˆγ)? 4.2 在决定一个回归模型的 " 最优 " 解释变量集时人们常用逐步回归的方法,在逐步回归中既可采取每次引进一个解释变量的程序 ( 逐步向前回归 ), 也可以先把所有可能的解释变 量都放在一个多元回归中 , 然后逐一地将它们剔除 ( 逐步向后回归 ) 。
计量经济学 第四章 多重共线性-

多重共线性产生的经济背景主要有几种情形:
1. 经济变量之间具有共同变化趋势。 2. 模型中包含滞后变量。 3. 利用截面数据建立模型也可能出现多重共线性。 4. 样本数据自身的原因。
11
Econom
etrics 第二节 多重共线性产生的后果
本节基本内容: ● 完全多重共线性产生的后果 ● 不完全多重共线性产生的后果
说明存在完全的多重共线性。
8
不完全的多重共线性 Econom
etrics
实际中,常见的情形是解释变量之间存在不完
全的多重共线性。
对于解释变量 ,使得
,存在不全为0的数
其中, 为随机变量。这表明解释变量 只是一种近似的线性关系。
9
Econom etrics
回归模型中解释变量的关系
可能表现为三种情形:
(1)
,解释变量间毫无线性关系,变量间相
互正交。这时已不需要作多元回归,每个参数 j都可 以通过Y 对 Xj 的一元回归来估计。
(2)
,解释变量间完全共线性。此时模型参
数将无法确定。
(3)
,解释变量间存在一定程度的线性关
系。实际中常遇到的情形。
10
Econom etrics
二、产生多重共线性的背景
18
Econom etrics
二、方差扩大(膨胀)因子法
统计上可以证明,解释变量 的方差可表示为
的参数估计式
其中的
是变量 的方差扩大因子
(Variance Inflation Factor),即
其中
是多个解释变量辅助回归的可决系数
19
Econom etrics
经验规则
● 方差膨胀因子越大,表明解释变量之间的多重共 性越严重。反过来,方差膨胀因子越接近于1, 多重共线性越弱。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 多重共线性一、判断题1、多重共线性是一种随机误差现象。
(F )2、多重共线性是总体的特征。
(F )3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。
(F )4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。
(T )5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。
(T )6、变量的两两高度相关并不表示高度多重共线性。
(F )7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。
(T )8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。
(F )9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。
( F )10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。
(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。
(T )12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。
(F )13、多重共线性的存在会降低OLS 估计的方差。
(F )14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。
(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。
(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。
(T )17、多重共线性问题是随机扰动项违背古典假定引起的。
(F ) 18、存在多重共线性时,模型参数无法估计。
(F )二、单项选择题1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在( B )A 、异方差B 、多重共线性C 、序列相关D 、随机解释变量2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型中存在( C )A 、异方差性B 、序列相关C 、多重共线性D 、拟合优度低3、对于模型i i 22i 110i u X X Y +++=βββ,与0r 12=相比,当50r 12.=时,估计量1βˆ的方差()1βˆvar 将是原来的( B )A 、 1 倍B 、 倍C 、 倍D 、 2 倍 4、如果方差膨胀因子VIF =10,则认为什么问题是严重的( C )A 、异方差问题B 、序列相关问题C 、多重共线性问题D 、 解释变量与随机项的相关性 5、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF ( C )。
A 、大于1B 、小于1C 、大于10D 、小于10 6、模型中引入实际上与解释变量有关的变量,会导致参数的OLS 估计量方差( A ) A 、增大 B 、减小 C 、有偏 D 、非有效 7、存在严重的多重共线性时,参数估计的标准差( A )。
A 、变大B 、变小C 、无穷大D 、无法估计 8、完全多重共线性时,下列判断不正确的是( D )。
A 、参数无法估计B 、只能估计参数的线性组合C 、模型的拟合程度不能判断D 、可以计算模型的拟合程度9、模型中引入一个无关的解释变量( C )A 、对模型参数估计量的性质不产生任何影响B 、导致普通最小二乘估计量有偏C 、导致普通最小二乘估计量精度下降D 、导致普通最小二乘估计量有偏,同时精度下降三、多项选择题1、关于多重共线性的影响,下面哪些正确:( ABCD )A 、增大回归系数的标准差B 、难以区分单个自变量的影响C 、t 检验倾向于不显著D 、回归参数估计值不稳定 2、下列哪些回归分析中很可能出现多重共线性问题( ACE )。
A 、资本投入与劳动投入两个变量同时作为生产函数的解释变量B、消费作被解释变量,收入作解释变量的消费函数C、本期收入和前期收入同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型3、当模型中解释变量间存在高度的多重共线性时(ACD )。
A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将高度相关C、估计量的精度将大幅度下降D、估计对于样本容量的变动将十分敏感E、模型的随机误差项也将序列相关4、下述统计量可以用来检验多重共线性的严重性(ACD )。
A、相关系数B、DW值C、方差膨胀因子D、特征值E、自相关系数5、多重共线性产生的原因主要有(ABCDE )。
A、经济变量之间往往存在同方向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采用滞后变量也容易产生多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确6、多重共线性的解决方法主要有(ABCDE )。
A、保留重要的解释变量,去掉次要的或替代的解释变量B、利用先验信息改变参数的约束形式C、变换模型的形式D、综合使用时序数据与截面数据E、逐步回归法以及增加样本容量7、关于多重共线性,判断错误的有(ABC )。
A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应用的意义D、存在严重的多重共线性的模型不能用于结构分析8、模型存在完全多重共线性时,下列判断正确的是(AB )。
A、参数无法估计B、只能估计参数的线性组合C、模型的可决系数为0D、模型的可决系数为19、下列判断正确的有(ABC )。
A、在严重多重共线性下,OLS估计量仍是最佳线性无偏估计量。
B、多重共线性问题的实质是样本现象,因此可以通过增加样本信息得到改善。
C 、虽然多重共线性下很难精确区分各个解释变量的单独影响,但可据此模型进行预测。
D 、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。
10、检测多重共线性的方法有( AC )。
A 、 简单相关系数检测法B 、 样本分段比较法C 、 方差膨胀因子检测法D 、 可决系数增量贡献法E 、 工具变量法四、简答题1、什么是多重共线性产生多重共线性的原因是什么答:多重共线性是指解释变量之间存在完全或近似的线性关系。
产生多重共线性主要有下述原因:(1)经济变量之间具有共同变化趋势(2)模型中包含滞后变量(3)利用截面数据建立模型(4)样本数据的自身原因,例如抽样仅限于总体中解释变量取值的一个有限范围。
2、什么是完全多重共线性什么是不完全多重共线性答:完全多重共线:对于解释变量k 32X X X 1,,,, ,如果存在不全为0的数k 21λλλ,,, ,使得()n 21i 0X X X ki k i 33i 221,,, ==++++λλλλ则称解释变量k 32X X X 1,,,, 之间存在着完全的多重共线性。
不完全多重共线性:对于解释变量k 32X X X 1,,,, ,如果存在不全为0的数k 21λλλ,,, ,使得()n 21i 0v X X X i ki k i 33i 221,,, ==+++++λλλλ式中,i v 为随机变量,则称解释变量k 32X X X 1,,,, 之间存在着不完全的多重共线性。
3、完全多重共线性对OLS 估计量的影响有哪些 答:(1)参数的估计值不确定,不能独立分辨各个解释变量对被解释变量的影响。
(2)参数估计值的方差无穷大。
4、不完全多重共线性对OLS 估计量的影响有哪些答:(1)回归的参数估计值很不稳定,普通最小二乘估计不精确。
(2)参数估计值的方差与协方差增大。
(3)对参数区间估计时,置信区间趋于变大。
(4)严重多重共线性时,假设检验容易作出错误的判断,t 检验可能倾向于不显著,甚至可能回归系数的正负号得不到合理的经济解释。
5、从哪些症状中可以判断可能存在多重共线性答:(1)模型总体性检验F 值和R 2值都很高,但各回归系数估计量的方差很大,t 值很低,系数不能通过显著性检验。
(2)回归系数值难以置信或符号错误。
(3)参数估计值对删除或增加少量观测值,以及删除一个不显著的解释变量非常敏感。
6、什么是方差膨胀因子检验法答:所谓方差膨胀因子是存在多重共线性时回归系数估计量的方差与无多重共线性时回归系数估计量的方差对比而得出的比值系数。
若1VIF j =时,认为原模型不存在“多重共线性问题”;若1VIF j >时,则认为原模型存在“多重共线性问题”;若10VIF j ≥时,则模型的“多重共线性问题”的程度是很严重的,而且是非常有害的。
五、计算题1、考虑下表中的数据 Y -10 -8 -6 -4 -2 0 2 4 6 8 10 X 1 1 2 3 4 5 6 7 8 9 10 11 X 2 1 3 5 7 9 11 13 15 17 19 21假设你做Y 对X 1和X 2的多元回归,你能估计模型的参数吗为什么 答:不能。
因为X 1和X 2存在完全的多重共线性,即X 2=2 X 1-1,或X 1=(X 2+1)。
2、下表给出了以美元计算的每周消费支出(Y ),每周收入(X 1)和财富(X 2)的假想数据。
(1)作Y 对X 1和X 2的OLS (2)直观地判断这一回归方程中是否存在多重共线性为什么 (3)分别作Y 对X 1和X 2的回归,这些回归结果表明了什么 (4)作X 2对X 1的回归。
这一回归结果表明了什么 答:(1)21X 0350X 872033724Y ...ˆ-+=T R 2=(2)可能存在多重共线性。
因为财富的系数解释是随着财富的增加,消费支出的金额在减少,这与经济理论不相符。
而且,财富的系数不显著。
因此可能是由于多重共线性引起的。
(3)1X 509045524Y ..ˆ+=T R 2=2X 048045226Y ..ˆ+=T R 2=回归结果表明两个解释变量对消费支出的影响都是显著的,并且解释能力较强。
(4)12X 373103643X ..ˆ+-=T R 2=回归结果表明每周的收入与财富是高度线性相关的,二者同时作为解释变量会产生严重的多重共线性。
3、某地区供水部门利用最近15年的用水年度数据得出如下估计模型:rain 1231price 8717pcy 0050pop 3630house 30509326water ......---++-=t=938F 930R 2.,.==其中,water-用水总量(百万立方米),house-住户总数(千户),pop-总人口(千人),pcy-人均收入(元),price-价格(元/100 立方米),rain-降水量(毫米)。