计量经济学讲义第六讲(共十讲)

合集下载

计量经济学第六章

计量经济学第六章


根据时间序列自身发展变化的基本规律和特点

即趋势,选取适当趋势模型进行分析和预测

趋势模型
一般形式
yˆt ft
常用的趋势模型
7
模型的选择
计 定性分析

在选模型之前,弄清楚模型的条件和预测对象性

质、特点

例如:指数曲线和Logistic曲线模型

夏 定量分析

根据资料把握现象的特点
L=3646.067128 a=2.026802528 b=0.531299085
14

模型的参数估计(续5)

经 济
[例6-3]续例6-2,我国自行车销售量预测

参数考虑用NLS,得到参数的精确估计
夏 凡
用param 命令为参数赋初值,初值取前面算出的
L、a和b
c(1)=3646.067128
Y
由图可知,序列的增长在近期变缓,考虑建立 Logistic模型
由于增长上限事先无法确定,参数用三和值法估计 12

模型的参数估计(续3)
量 经
将数据等分成三段
济 学
本例全部数据为14个,则需舍弃部分数据
从预测角度看,舍弃最早的数据(1978和1979)

将剩余的12个数据等分成三段

预测值序列为ysaf2 模型的MAPE为4.78
26
季节模型预测应用(续3)
计 量
趋势模型的选择

由序列ysa、ysaf1和ysaf2的时序图,结合两
济 学
个模型的MAPE来看
二次曲线趋势模型的误差小于对数曲线趋势模型

则最终选择二次曲线趋势模型作为趋势方程

计量经济学讲义

计量经济学讲义

计量经济学讲义第一部分:引言计量经济学是研究经济现象的量化方法,它结合了统计学和经济学原理,旨在提供对经济现象进行定量分析的工具和技术。

本讲义将介绍计量经济学的基本概念和方法,帮助读者理解和应用计量经济学的基本原理。

第二部分:经济数据和计量经济学模型1. 经济数据的类型- 我们将介绍经济数据的两种主要类型:时间序列数据和截面数据。

时间序列数据是在一段时间内收集的数据,而截面数据是在同一时间点上收集的数据。

2. 计量经济学模型- 我们将讨论计量经济学模型的基本原理和应用,例如最小二乘法和线性回归模型。

这些模型可以帮助我们分析经济数据之间的关系,并进行预测和政策评估。

第三部分:经济数据的描述性统计分析1. 描述性统计分析的概念- 我们将介绍描述性统计分析的基本概念和方法,包括中心趋势测量、离散度测量和分布形态测量。

这些方法可以帮助我们理解和总结经济数据的基本特征。

2. 经济数据的描述性统计分析实例- 我们将通过实例演示如何使用描述性统计分析方法来分析和解释经济数据。

例如,我们可以使用均值和方差来描述一个国家的经济增长和收入分配。

第四部分:计量经济学的统计推断1. 统计推断的概念- 我们将讨论统计推断的基本概念和方法,包括假设检验和置信区间。

这些方法可以帮助我们从样本数据中推断总体参数,并评估推断的精度和可靠性。

2. 统计推断的实例- 我们将通过实例演示如何使用统计推断方法来研究和解释经济现象。

例如,我们可以使用假设检验来判断一个政策措施对经济增长的影响。

第五部分:计量经济学的回归分析1. 单变量线性回归模型- 我们将介绍单变量线性回归模型的基本原理和应用。

这个模型可以帮助我们分析一个因变量和一个自变量之间的关系,并进行预测和政策评估。

2. 多变量线性回归模型- 我们将讨论多变量线性回归模型的基本原理和应用。

这个模型可以帮助我们分析多个自变量对一个因变量的影响,并进行政策评估和变量选择。

第六部分:计量经济学的时间序列分析1. 时间序列模型的基本概念- 我们将介绍时间序列模型的基本概念和方法,包括自回归模型和移动平均模型。

计量经济学第六章-PPT课件

计量经济学第六章-PPT课件


若模型有三个未知数,将数据三等分,分别求出 每部分的和,代入方程,得到三个方程,解方程 组可获得三个参数的估计值 10
模型的参数估计(续1)

参数的非线性最小二乘估计(第五章)

非线性模型可利用NLS进行参数的精确估计
首先,用param命令对参数赋初值 其次,输入方程,对模型进行估计

11


考虑选择指数曲线模型
2000000
1500000
1000000
500000
0 72 74 76 78 80 Y 82 84 YF 86 88 90 92
9
模型的参数估计

参数的最小二乘估计
常用的各类趋势模型参数估计仍常用OLS 其中,自变量为时间t


参数的三和值法(第五章)
若选用有增长上限的曲线趋势模型,当增长 上限事先不能确定时,可采用三和值法 基本思想
1961-1981年我国搪瓷面盆销售量数据如下 根据其变化,试以Gompertz曲线作为预测模型

由于增长上限L事先无法得知,参数估计可用NLS 在精确估计前,选择三和值法获得参数的初值 模型取对数转换成修正指数曲线 t ˆ y log L b log a log t

计算各段和值 根据参数计算公式计算参数值

产品市场生命周期
进入期 成长期 成熟期 衰退期

20
产品生命周期分析(续1)
f(t)
饱和点
进 成长期 入 期
成熟期 后 期 前 期
衰退期
t
21
产品生命周期分析(续2)

产品市场生命周期的各个阶段与某些趋势 模型存在大致的对应关系

计量经济学全部课件

计量经济学全部课件
3
通过本课程的教学,要求学生掌握计量经 济学的基本理论和主要模型设定方法,熟悉计 量经济分析工作的基本内容和工作程序,能用 计量经济学软件包进行实际操作。本课程教学 采用课堂讲授与计算机实验相结合,适当运用 计算机多媒体课件和投影仪。教学目的不是要 求学生成为计量经济方法研究的专家,而是使 学生掌握计量经济学技术,并在经济分析、经 济管理和决策中正确使用这些技术,成为适应 现代化经济管理要求的人才。
35
库兹涅茨假设
但是,库兹涅茨对凯恩斯这种边际消费 倾向下降的观点持否定态度。他研究的 结论,消费与国民收入之间存在稳定的 上升比例。因此,上式只是根据凯恩斯 消费理论设定的消费模型。
16
二、计量经济学与经济统计 学、数理统计学
经济统计学主要涉及收集、加工、整理和计算 经济数据,并以列表或图示的形式提供经济数 据,而计量经济学则是研究经济关系本身。计 量经济研究中要使用经济统计学提供的经济数 据。数理统计学论述度量的方法,它是在实验 室控制试验的基础上发展起来的,不适用经济 关系,经过修正,使统计方法适用于经济生活 问题后,计量经济学就应用这些方法,称为计 量经济方法。
Y = b0 + b1 X
这里Y是消费支出,X是收入,b0和b1是常数或 参数,斜率系数b1表示MPC。 方程说明消费对收入的线性相关,这是数学模 型的一个例子。简单说,模型是一组数学方 程。假使模型只有一个方程,就称为单方程模 型;如果不止一个方程,就称为多方程模型或 联立方程模型。
29
可是消费函数的数学模型如上式所给出的,对 计量经济学家来说并无多大兴趣,因为它假设 消费与收入之间存在着严格的或确定的关系。 但是一船经济变量间的关系是不确定的。因 此,如果我们取得比如5000个中国家庭的消费 支出与可支配的收入(扣除税收后)的样本资 料,并把这些资料描绘在图纸上,以垂直轴作 为消费支出,水平轴作为可支配的收入,我们 决不会期望所有5000个观察值都恰好落在方程 的直线上。这是因为除收入外,还有其它变量 也影响消费支出。例如,家庭大小、家庭成员 年龄、家庭宗教信仰等等有可能对消费施加某 些影响。

计量经济学课件很详细共99页

计量经济学课件很详细共99页
计量经济学课件很详细
1、战鼓一响,法律无声。——英国 2、任何法律的根本;不,不成文法本 身就是 讲道理 ……法 律,也 ----即 明示道 理。— —爱·科 克
3、法律是最保险的头盔。——爱·科 克 4、一个国家如果纲纪不正,其国风一 定颓败 。—— 塞内加 5、法律不能使人人平等,但是在法律 面前人 人是平 等的。 ——波 洛克
43、重复别人所说的话,只需要教育; 而Байду номын сангаас挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国

计量经济学课件(全)

计量经济学课件(全)

计量经济学第一章绪论目前,在经济学、管理学以及一些相关学科的研究中,定量分析用得越来越多。

所谓定量分析,即揭示经济活动中客观存在的数量关系。

定量分析方法统计分析方法:一元多元经济计量分析方法:以模型为基础时间序列分析方法:动态时间序列§1.1 计量经济学及其模型概述一、计量经济学计量经济学的诞生计量经济学“Econometrics”一词最早是由挪威经济学家弗里希(R.Frish)于1926年仿照“Biometrics”(生物计量学)提出来的,这标志着计量经济学的诞生。

弗里希将计量经济学定义为经济学、统计学和数学三者的结合。

计量经济学的定义计量经济学是以经济理论为指导,以经济事实为依据,以数学、统计学为方法,以计算机为手段;主要从事经济活动的数量规律研究,并以建立、检验和运用计量经济学模型为核心的一门经济学学科。

二、计量经济学模型模型,是对现实的描述和模拟。

模型分类语义模型:语言文字。

物理模型:简化的实物。

几何模型:几何图形。

数学模型:数学公式。

计算机模拟模型:计算机模拟技术。

计量经济学模型属于经济数学模型,即用数学公式来描述经济活动。

例:生产函数经济数学模型是建立在经济理论的基础之上的。

生产理论:“在供给不足的条件下,产出由资本、劳动、技术等投入要素决定,随着各投入要素的增加,产出也随之增加,但要素的边际产出递减。

” 建立初始模型初始模型的特点模型描述了经济变量之间的理论关系;通过模型可以分析经济活动中各因素之间的相互影响,从而为控制经济活动提供理论指导;认为这种关系是准确实现的;模型并没有揭示各因素之间的定量关系,因为参数未知。

模型的改进以1964-1984年我国工业生产活动的数据作为样本,估计得到:改进模型的特点1.用随机性的数学方程描述现实的经济活动与经济关系。

2.揭示了经济活动中各因素之间的定量关系。

3.可用于对研究对象进行深入的研究,如结构分析、生产预测等。

初始模型——数理经济学模型数理经济学模型:由确定性的数学方程所构 成,用以揭示经济活动中各因素间的理论关系。

计量经济学讲义

计量经济学讲义

第一章绪论第一节什么是计量经济学计量经济学含义.计量经济学是一个迅速发展的经济学分支,其目标是给出经济关系的经济内容。

.计量经济学可以定义为实际经济现象的定量分析,这种分析根据的是适当推断方法联系在一起的理论和观测的即时发展。

计量经济学运用数理统计知识分析经济数据,对构建于数理经济学基础上的数学模型提供经验支持,并得出数量结果。

.计量经济学是将经济理论、数学方法和统计推断等工具应用于经济现象分析的社会科学。

第二节计量经济学方法计量经济学方法的内容计量经济学研究包括两个基本要素:经济理论和事实。

将经济理论与现实情况结合起来,用统计技术估计经济关系。

最可用的形式就是模型。

计量经济分析步骤.陈述理论。

例如有关价格变动与需求量之间的关系的经济理论:在其他条件不变的情况下,一商品的价格上升(下降),则对该商品的需求量减少(增加)。

建立计量经济模型⑴需求函数的数学模型例如线性函数模型。

如果需求量与价格之间的关系式线性的,则数学上需求函数可以表示为Q P αβ=+()αβ和称为该函数的参数。

等号左边的变量称为因变量或被解释变量,等号右边的变量称为自变量或解释变量。

⑵计量经济模型式()假定需求量与价格之间的关系是一种确定关系,而现实的经济变量之间,极少有这种关系,更常见的是一种不确定性关系(见散点图),线性模型应该为Q P αβε=++()ε是随机扰动项。

收集数据估计计量经济模型中的参数之前,必须得到适当的数据。

在经验分析中常用的数据有两种:时间序列数据(纵向数据)和横截面数据(横向数据)。

有时会同时出现前面的纵向数据和横向数据,称之为混合数据。

面板数据是混合数据的一种特殊类型。

估计参数如利用收集的数据估计出式()中的参数,得回归模型76.05 3.88Q P =-()假设检验对回归模型以及模型中的系数进行检验。

预测和政策分析例如在回归模型()中,想预测价格时的需求量值时,则有76.05 3.8876.05 3.88 4.558.59Q P =-=-⨯=第二章线性回归分析第一节线性回归概述2.1.1回归模型简介如果(随机)变量y 与12,,,p x x x L存在相关关系12(,,,)p y f x x x ε=+L (2.1.1)其中y 是可观测的随机变量,12,,,p x x x L 为一般变量,ε是不可观测的随机变量;y 称为因变量(被解释变量),12,,,p x x x L 称为自变量(解释变量),ε称为随机误差。

计量经济学课件全

计量经济学课件全
• 计量经济的方法和统计方法一样,本质上 是归纳法,是将实事归纳成理论的一个有 效的辅助工具。计量经济学可以结合实际 观测数据对经济理论进行验证,检验理论 的正确性,提供进一步改进理论的方向。
11
数据
• 观测数据:主要是指统计数据和各种调查 数据。是所考察的经济对象的客观反映和 信息载体,是计量经济工作处理的主要现 实素材。
7
计量经济学构成要素
经济理论 模型
计量经济模型
数据 精炼的数据
数理统计理论 计量经济理论
采用计量经济技术并使用精练数据估计计量经济模型 应用
结构分析
经济预测
政策评价
计算机 8
三大要素
• 经济理论 • 数据 • 统计推断 • 经济理论、数据和统计理论这三者对于真
正了解现代经济生活中的数量关系都是必 要的,但本身并非是充分条件。三者结合 起来就是力量,这种结合便构成了计量经 济学。
• 按照时间的顺序,每隔一定的时间观测经 济变量的取值,所得到的统计数据。
• 观测对象是一个单位:一国,一地区,某 企业
• 时间间隔:可以是一年,一个季度,一个 月,一天,甚至更短,要视问题的性质和 重要性而定。
14
时间序列数据(time series data)
• 这类变量反应了变量的动态特征,即在时 间上的变动趋势。
GNP 10201.4 11954.5 14922.3 16917.8 18598.4 21662.5 26651.9 34560.5 46670 57494.9 66850.5 73142.7 76967.2
• 萨缪尔森:“经济计量学的定义为:在 理论与观测协调发展的基础上,运用相 应的推理方法,对实际经济现象进行数 量分析。”
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六讲 多重共线一、 FWL 定理及其应用考虑模型:112233i i i i i y a b x b x b x ε=++++ (1)假如我们只关注1ˆb,则通过如下步骤可以获得之。

第1步:把1x 对其他解释变量进行回归(请注意,截距所对应的解释变量为1),即有: 101223ˆˆˆˆi i i ix x x v βββ=+++ (2)第2步:把y 也对(2)中的解释变量进行回归,即有:01223ˆˆˆˆi i i i y x x w ϕϕϕ=+++ (3)第3步:把ˆw 对ˆv 进行回归(不含截距,当然你可以包含截距,但你会发现,截距的估计结果是零,这是因为ˆw 与ˆv 其均值都为零),即有模型:ˆˆi i i ve w η=+ (4) 则有:2ˆˆˆˆi i iw v v η=∑∑,可以验证,1ˆˆb η=,且残差ˆi e 等于初始的残差ˆi ε。

此即著名的FWL 定理(Frisch-Waugh-Lovell theorem )。

关于FWL 定理的一个简单证明见附录1。

思考题:利用关于“偏导数”的直觉,你能够理解1ˆˆb η=吗? 考察2ˆˆˆˆi i iw v v η=∑∑,把01223ˆˆˆˆi i i i y x x w ϕϕϕ=---代入,现在分子是:2012230123ˆˆˆˆ()ˆˆˆˆˆˆˆˆˆi i i i i i i ii i i v x i i y x x y v x v v v wv ϕϕϕϕϕϕ------∑∑∑==∑∑∑应该注意到,在进行第一步回归时,OLS 法保证了203ˆˆˆi i i i i v x x vv ===∑∑∑ 因此,22ˆˆˆˆˆˆi i i i i iw v y v v v η==∑∑∑∑ 显然,如果把y 对ˆv 直接进行无截距回归:*ˆiiiy v ης=+ (5)我们也可以得到:*122ˆˆˆˆˆˆˆi i i i i i y v w v b v vηη====∑∑∑∑。

因此,如果只关注如何获得1ˆb ,我们可以把FWL 定理中第二步与第三步合并为把y 对ˆv 直接进行无截距回归。

思考题:ˆiς与ˆi e 相等吗?提示:ˆˆˆˆˆˆˆi i i e v i i iw y v ηςη--== 注意到,2ˆiv ∑是(2)中的残差平方和,对(2),有: 2221111()()ˆˆiiix x x x v TSS ESS RSS-=-+↓↓↓∑∑∑22211112211112112211(2)()()ˆˆ()ˆ[()](1)()[()](1)i iiiiiiv x x x x x x x x x x x x R =----=---=--∑∑∑∑∑∑∑其中2(2)R 是根据(2)计算的决定系数。

因此,12211(2)ˆˆˆ[()](1)i i i y vb x x R η==--∑∑。

练习: 对1122i i i i y a b x b x ε=+++进行OLS 估计,利用前述知识证明:12211ˆx x b =在这里,12x x r、2yx r 分别是x2与x1、y 的样本相关系数。

笔记:在上述练习题中,当120x x r =时,则111(,)ˆ()Cov y x b Var x =。

现在考虑另外一个回归模型:011i i iy x e ββ=++,在OLS 法下,有:111ˆ(,)()Cov y x Var x β=。

总结:尽管1122i i i iy a b x b x ε=+++与101i i i y x e ββ=++是不同的模型,但当x 2与x 1样本不相关时,在OLS 法下,11ˆˆbβ=。

1ˆb 的方差是多少呢? 12ˆ112233*********ˆˆ()()()ˆˆˆˆˆˆˆ()ˆbi i i i i i i i i i i i i i i i i i i y v a b x b x b x v Var Var v vav b x v b x v b x v v Var vδεε=++++=++++=∑∑∑∑∑∑∑∑∑∑OLS 法保证了320ˆˆˆi i i x i i x v vv ===∑∑∑,因此 12ˆ112ˆˆ()ˆbi i i i i b x v v Var vδε=+∑∑∑由于我们假定1i x 是非随机的,进而ˆi v 也是非随机的,因此在i ε是同方差且序列无关的假定下,有:22211(2)212ˆ[()](1)2ˆi bx x R iv δδδ=--=∑∑其中22iεδδ=。

在上式中,2(2)11R -通常被称为方差膨胀因子(VIF ),而2(2)1R -被称为容忍度(Tolerence )。

另外,由于2111()i Nx x -∑为1x 的样本方差1()V ar x ,因此,122(2)1/2ˆ)((1)N b V a r x R δδ-=(6) 就上述例子,根据(6)式,初步的总结是,1ˆb 的方差(或者标准差1ˆ()sd b ): (1)随着样本容量的增加而减少; (2)随着1x样本方差的增加而减少;(3)随着2(2)R 增加而增加; (4)随着误差项方差的增加而增加;样本容量越大则信息越多,1x 样本方差越大意味着样本覆盖面广,故信息越多。

信息越多将提高估计精度。

2(2)R 越大表示解释变量所蕴含信息的重叠度高,因此有效信息较少,故降低估计精度。

误差项方差大意味着估计时所面临的不确定性程度高,因此估计精度下降。

2δ一般是未知的,需要估计。

1ˆb 的标准误为:1ˆ)(bse =其中222ˆˆˆ44ii e N N δε==--∑∑。

因此,1ˆ)(b se =考虑初始模型(1),显然有:2222[)](1)()(1)ˆ(i iy R NVar y R y ε=--=-∑∑因此,有:1ˆ)(bse = (7)特别要注意,1ˆ)(bse 是随机的(在(7)式中,2R 是随机的,其随机性来源于y 的随机性)。

既然1ˆ)(bse 是随机的,那么我们再也不能像对(6)式那样总结了!然而在大样本下,由于标准误在概率上收敛于标准差,故此时有关标准差的一些结论可以应用于标准误。

根据特定的样本,我们可以计算出一个具体的标准误的值,公式仍然是(7)式,但此时它是非随机的。

考虑此种情况。

如果在模型(1)上再增添一个解释变量4x ,显然2(2)R 一般是增加的,因此将增加1ˆb 的标准差,但一定会增加1ˆb 的标准误吗? 二、完全共线与多重共线针对上述例子,如果2(2)1R =,即1x 被231,,x x 完全拟合,换句话说,存在:112324310x x x λλλλ+∙++=其中1λ不为零。

那么根据公式:12211(2)ˆˆ[()](1)i i i y vb x x R =--∑∑22211(2)12ˆ[()](1)i b x x R δδ=--∑ 有:121ˆ0ˆ;0b bδ==∞。

思考题:为什么0ˆi i y v=∑?现在我们把情况推广:112324310x x x λλλλ∙+++=其中,1,2,3,4jj λ=不全为零,此时,我们称四变量完全共线。

根据前面的分析,我们知道,至少有一个系数的估计量是无法确定的,其方差无穷大。

把初始模型写成矩阵模式:Y XB ε=+,其中1121311231231(1)1NNN x x x X x x x x x x ⎛⎫ ⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪⎝⎭≡≡ 。

在OLS 法下,1ˆ()BX X X Y -=''。

为了保证估计量的存在,我们必须假定1()X X -'存在。

然而,当X不是列满秩的,即112324310x x x λλλλ+∙++=,其中,1,2,3,4j j λ=不全为零,那么1()X X -'是不存在的。

把情况进一步推广:112324310i x x x λλλλμ+∙+++=,其中,1,2,3,j j λ=不全为零,i μ为随机误差,那么我们称四变量多重共线。

多重共线并没有违背高斯-马尔科夫假定,因此,高斯-马尔科夫定理仍然成立!三、 多重共线的后果基于特定的样本,我们根据公式:1ˆ)(bse =计算出一个具体的标准误的值。

显然,如果2(2)R较大,即多重共线性越强,那么我们得到的标准误的值可能很大。

如果情况确实如此,那么这又有什么后果呢?(1)回忆111ˆ()ˆ()b b t se b-=,b 1是假设的真实系数。

如果1ˆ()se b很大,那么上式的分母很大,从而t 趋于零,因此,也许你无论假设b 1为多少,你都会不拒绝原假设!因此,t 检验的可靠性降低,犯第二类错误(取误)的概率较大。

(2)构建一个1a -置信水平的置信区间:11/2ˆ()ˆa se b b t ±,显然,1ˆ()se b很大将导致置信区间更宽,因此,我们不能很好地猜测b 1的取值。

四、 如何判断多重共线的严重程度? (一)基于严重多重共线性情况下模型的一些典型症状来判断多重共线性的严重程度。

这些典型症状是:1、模型整体拟合较好但很多解释变量不显著。

考虑在初始模型增添一个解释变量,显然其判定系数一般是增加的(相应的是,新模型F 值可能较大),然而,增加解释变量很可能导致严重的多重共线性,从而很多解释变量不显著。

2、系数估计的符号不符合理论预期,但往往不显著。

思考题:为什么?3、增加样本容量导致估计结果发生了很大的变化。

删除一些变量也导致估计结果发生了很大的变化。

思考题:为什么?(二)考察解释变量两两相关系数。

如果存在取值较大的相关系数,那么这意味着多重共线性程度严重,然而也应该注意到,即使两两相关系数都很小,多重共性性仍可能是严重的。

思考题:为什么即使两两相关系数都很小,多重共线性仍可能是严重的? (三)考察VIF 或者2i R 。

如果VIF 大于10,一般认为存在较严重的多重共线性(当然也可考察容忍度)。

按照VIF 的定义,显然,当VIF 大于10时,必有一个解释变量对其他解释变量回归所得到的2i R 超过90%,而这是一个很高的判定系数。

事实上,按照Klien ’s rule of thumb ,当2i R 大于初始模型的2R 时,多重共线问题就值得关注了。

(四)特征根检验。

当完全共线时,1()X X -'不存在,0X X=',当存在严重的多重共线时,0X X≈'。

假设X X'的特征根是121,,...,k λλλ+,根据矩阵代数知识:11k i i X Xλ+=='∏,因此,如果X X'的特征根中至少有一个近似为0,则0X X≈'。

因此可以根据X X'的特征根来判断多重共线的严重程度。

笔记:在实践中,通常基于标准化变量回归模型(每一个解释变量的每一次观察值都减去样本均值,然后再除以样本标准差,此即变量的标准化处理。

相关文档
最新文档