计量经济学讲义共十讲

合集下载

2024版计量经济学全册课件(完整)pptx

2024版计量经济学全册课件(完整)pptx

REPORTING
2024/1/28
23
EViews软件介绍及操作指南
EViews软件概述
EViews是一款功能强大的计量经济学 软件,提供数据处理、统计分析、模型
估计和预测等功能。
统计分析与检验
2024/1/28
详细讲解EViews中的统计分析工具, 包括描述性统计、假设检验、方差分
析等。
数据导入与预处理 介绍如何在EViews中导入数据,进行 数据清洗、转换和预处理等操作。
随着大数据时代的到来,机器学 习算法在数据挖掘、预测和分类 等方面展现出强大的能力,为计 量经济学提供了新的研究工具和 方法。
机器学习在计量经济 学中的应用领域
机器学习在计量经济学中的应用 领域广泛,如变量选择、模型选 择、非线性模型估计、高维数据 处理等。
机器学习在计量经济 学中的常用算法
机器学习在计量经济学中常用的 算法包括决策树、随机森林、支 持向量机(SVM)、神经网络等。 这些算法可以用于分类、回归、 聚类等任务,提高模型的预测精 度和解释力。
面板数据特点
同时具有时间序列和截面数据的特征,能够提供更多的信息、更多的变化、更少共 线性、更多的自由度和更高的估计效率。
2024/1/28
20
固定效应模型与随机效应模型
固定效应模型(Fixed Effects Model)
对于特定的个体而言,其截距项是固定的,不随时间变化而变化。
随机效应模型(Random Effects Mode…
经典线性回归模型
REPORTING
2024/1/28
7
一元线性回归模型
模型设定与参数估计
介绍一元线性回归模型的基本形式, 解释因变量、自变量和误差项的含义, 阐述最小二乘法(OLS)进行参数估 计的原理。

计量经济学讲义第六讲(共十讲)

计量经济学讲义第六讲(共十讲)

计量经济学讲义第六讲(共⼗讲)第六讲多重共线⼀、 FWL 定理及其应⽤考虑模型:112233i i i i i y a b x b x b x ε=++++ (1)假如我们只关注1b,则通过如下步骤可以获得之。

第1步:把1x 对其他解释变量进⾏回归(请注意,截距所对应的解释变量为1),即有: 101223i i i ix x x v βββ=+++ (2)第2步:把y 也对(2)中的解释变量进⾏回归,即有:01223i i i i y x x w ???=+++ (3)第3步:把w 对?v 进⾏回归(不含截距,当然你可以包含截距,但你会发现,截距的估计结果是零,这是因为?w 与?v 其均值都为零),即有模型:i i i ve w η=+ (4)则有:2i i iw v v η=∑∑,可以验证,1??b η=,且残差?i e 等于初始的残差?i ε。

此即著名的FWL 定理(Frisch-Waugh-Lovell theorem )。

关于FWL 定理的⼀个简单证明见附录1。

思考题:利⽤关于“偏导数”的直觉,你能够理解1b η=吗?考察2i i iw v v η=∑∑,把01223i i i i y x x w ?=---代⼊,现在分⼦是:2012230123()?i i i i i i i ii i i v x i i y x x y v x v v v wv ------∑∑∑==∑∑∑应该注意到,在进⾏第⼀步回归时,OLS 法保证了203i i i i i v x x vv ===∑∑∑ 因此,22i i i i i iw v y v v v η==∑∑∑∑ 显然,如果把y 对?v 直接进⾏⽆截距回归:*?iiiy v η?=+ (5)我们也可以得到:*122i i i i i i y v w v b v vηη====∑∑∑∑。

因此,如果只关注如何获得1b ,我们可以把FWL 定理中第⼆步与第三步合并为把y 对v 直接进⾏⽆截距回归。

计量经济学全部课件

计量经济学全部课件
31
0. 模型设定的定义
依据一定的经济理论,先验地用一个或 一组数学方程式表示被研究系统内经济 变量之间的关系。这阶段的工作称为模 型设定。 这是计量经济学研究中最重要也是最困 难的阶段,为此,需要作以下工作: 1.研究有关经济理论 2.确定变量和函数形式
32
1.研究有关经济理论
建立模型需要理论抽象。模型是对客观 事物的基本特征和发展规律的概括,是 对现实抓住本质的简化。 这种概括和简化就是理论分析的成果。 因此,在模型设定阶段,首先要注意基 于经济理论的定性分析。
3
通过本课程的教学,要求学生掌握计量经 济学的基本理论和主要模型设定方法,熟悉计 量经济分析工作的基本内容和工作程序,能用 计量经济学软件包进行实际操作。本课程教学 采用课堂讲授与计算机实验相结合,适当运用 计算机多媒体课件和投影仪。教学目的不是要 求学生成为计量经济方法研究的专家,而是使 学生掌握计量经济学技术,并在经济分析、经 济管理和决策中正确使用这些技术,成为适应 现代化经济管理要求的人才。
三、方法论
应用计量经济方法解决实际经济问题,是在一 定的经济理论指导下,建立相应的数学模型, 利用各种计量方法和资料估计参数,运用模型 解决问题。一般来说,这个研究过程要采取四 个步骤。为了说明计量经济学的方法论,让我 们考察凯恩斯的消费理论。凯恩斯说:……基 本的心理法则是……作为平均数规律,男人 (妇女)当他们的收入增加时,倾向于增加消 费,但消费并不如他们的收入增加那样多。总 之,凯恩斯假设边际消费倾向(MPC),即消费 变化对单位(如一元)收入变化的比率,大于 0而小于1。为了检验这个理论,计量经济学家 可以按如下步骤进行。
33
菲利普斯曲线
例如,根据劳动力市场均衡学说,工资 增长率y、失业率x1和物价上涨率x2,有 关系y=f(x1,x2)。 失业率越高,表明劳动力的供给大于需 求,从而工资上升率越低,这就是著名 的菲利普斯曲线。 这一曲线在西方国家建模中被广泛使 用。

计量经济学讲义

计量经济学讲义

计量经济学讲义第一部分:引言计量经济学是研究经济现象的量化方法,它结合了统计学和经济学原理,旨在提供对经济现象进行定量分析的工具和技术。

本讲义将介绍计量经济学的基本概念和方法,帮助读者理解和应用计量经济学的基本原理。

第二部分:经济数据和计量经济学模型1. 经济数据的类型- 我们将介绍经济数据的两种主要类型:时间序列数据和截面数据。

时间序列数据是在一段时间内收集的数据,而截面数据是在同一时间点上收集的数据。

2. 计量经济学模型- 我们将讨论计量经济学模型的基本原理和应用,例如最小二乘法和线性回归模型。

这些模型可以帮助我们分析经济数据之间的关系,并进行预测和政策评估。

第三部分:经济数据的描述性统计分析1. 描述性统计分析的概念- 我们将介绍描述性统计分析的基本概念和方法,包括中心趋势测量、离散度测量和分布形态测量。

这些方法可以帮助我们理解和总结经济数据的基本特征。

2. 经济数据的描述性统计分析实例- 我们将通过实例演示如何使用描述性统计分析方法来分析和解释经济数据。

例如,我们可以使用均值和方差来描述一个国家的经济增长和收入分配。

第四部分:计量经济学的统计推断1. 统计推断的概念- 我们将讨论统计推断的基本概念和方法,包括假设检验和置信区间。

这些方法可以帮助我们从样本数据中推断总体参数,并评估推断的精度和可靠性。

2. 统计推断的实例- 我们将通过实例演示如何使用统计推断方法来研究和解释经济现象。

例如,我们可以使用假设检验来判断一个政策措施对经济增长的影响。

第五部分:计量经济学的回归分析1. 单变量线性回归模型- 我们将介绍单变量线性回归模型的基本原理和应用。

这个模型可以帮助我们分析一个因变量和一个自变量之间的关系,并进行预测和政策评估。

2. 多变量线性回归模型- 我们将讨论多变量线性回归模型的基本原理和应用。

这个模型可以帮助我们分析多个自变量对一个因变量的影响,并进行政策评估和变量选择。

第六部分:计量经济学的时间序列分析1. 时间序列模型的基本概念- 我们将介绍时间序列模型的基本概念和方法,包括自回归模型和移动平均模型。

计量经济学讲义第二讲(共十讲)

计量经济学讲义第二讲(共十讲)

第二讲 普通最小二乘估计量 一、基本概念:估计量与估计值对总体参数的一种估计法则就是估计量。

例如,为了估计总体均值为u ,我们可以抽取一个容量为N 的样本,令Y i 为第i 次观测值,则u 的一个很自然的估计量就是ˆiY uY N==∑。

A 、B 两同学都利用了这种估计方法,但手中所掌握的样本分别是12(,,...,)A A AN y y y 与12(,,...,)B B B N y y y 。

A 、B 两同学分别计算出估计值ˆAiA y uN=∑与ˆBiB y uN=∑。

因此,在上例中,估计量ˆu是随机的,而ˆˆ,A B u u 是该随机变量可能的取值。

估计量所服从的分布称为抽样分布。

如果真实模型是:01y x ββε=++,其中01,ββ是待估计的参数,而相应的OLS 估计量就是:1012()ˆˆˆ;()iiix x yy x x x βββ-==--∑∑ 我们现在的任务就是,基于一些重要的假定,来考察上述OLS 估计量所具有的一些性质。

二、高斯-马尔科夫假定●假定一:真实模型是:01y x ββε=++。

有三种情况属于对该假定的违背:(1)遗漏了相关的解释变量或者增加了无关的解释变量;(2)y 与x 间的关系是非线性的;(3)01,ββ并不是常数。

●假定二:在重复抽样中,12(,,...,)N x x x 被预先固定下来,即12(,,...,)N x x x 是非随机的(进一步的阐释见附录),显然,如果解释变量含有随机的测量误差,那么该假定被违背。

还存其他的违背该假定的情况。

笔记:12(,,...,)N x x x 是随机的情况更一般化,此时,高斯-马尔科夫假定二被更改为:对任意,i j ,i x 与j ε不相关,此即所谓的解释变量具有严格外生性。

显然,当12(,,...,)N x x x 非随机时,i x 与j ε必定不相关,这是因为j ε是随机的。

●假定三:误差项期望值为0,即()0,1,2i E i N ε==。

计量经济学讲义

计量经济学讲义

第一章绪论第一节什么是计量经济学计量经济学含义.计量经济学是一个迅速发展的经济学分支,其目标是给出经济关系的经济内容。

.计量经济学可以定义为实际经济现象的定量分析,这种分析根据的是适当推断方法联系在一起的理论和观测的即时发展。

计量经济学运用数理统计知识分析经济数据,对构建于数理经济学基础上的数学模型提供经验支持,并得出数量结果。

.计量经济学是将经济理论、数学方法和统计推断等工具应用于经济现象分析的社会科学。

第二节计量经济学方法计量经济学方法的内容计量经济学研究包括两个基本要素:经济理论和事实。

将经济理论与现实情况结合起来,用统计技术估计经济关系。

最可用的形式就是模型。

计量经济分析步骤.陈述理论。

例如有关价格变动与需求量之间的关系的经济理论:在其他条件不变的情况下,一商品的价格上升(下降),则对该商品的需求量减少(增加)。

建立计量经济模型⑴需求函数的数学模型例如线性函数模型。

如果需求量与价格之间的关系式线性的,则数学上需求函数可以表示为Q P αβ=+()αβ和称为该函数的参数。

等号左边的变量称为因变量或被解释变量,等号右边的变量称为自变量或解释变量。

⑵计量经济模型式()假定需求量与价格之间的关系是一种确定关系,而现实的经济变量之间,极少有这种关系,更常见的是一种不确定性关系(见散点图),线性模型应该为Q P αβε=++()ε是随机扰动项。

收集数据估计计量经济模型中的参数之前,必须得到适当的数据。

在经验分析中常用的数据有两种:时间序列数据(纵向数据)和横截面数据(横向数据)。

有时会同时出现前面的纵向数据和横向数据,称之为混合数据。

面板数据是混合数据的一种特殊类型。

估计参数如利用收集的数据估计出式()中的参数,得回归模型76.05 3.88Q P =-()假设检验对回归模型以及模型中的系数进行检验。

预测和政策分析例如在回归模型()中,想预测价格时的需求量值时,则有76.05 3.8876.05 3.88 4.558.59Q P =-=-⨯=第二章线性回归分析第一节线性回归概述2.1.1回归模型简介如果(随机)变量y 与12,,,p x x x L存在相关关系12(,,,)p y f x x x ε=+L (2.1.1)其中y 是可观测的随机变量,12,,,p x x x L 为一般变量,ε是不可观测的随机变量;y 称为因变量(被解释变量),12,,,p x x x L 称为自变量(解释变量),ε称为随机误差。

计量经济学讲义第五讲(共十讲)

计量经济学讲义第五讲(共十讲)

第五讲 自相关高斯-马尔科夫假定五是:(,)0,i j i j C ovariance i j εεεεδ==≠如果该假定不成立,那么称模型的误差项是序列相关的。

由于序列相关主要针对于时间序列数据,因此,下面把i 改写为t ,样本容量N 改写为T 。

笔记:1、如果基于横截面数据的回归模型其误差项是相关的,则称为空间自相关。

但是要记住,除非观察顺序具有某种逻辑或者经济上的意义,否则,在横截面数据回归中,观察顺序是可以随意的,因此,也许在某种观测顺序下误差项呈现出一种模式的自相关但在另一种观测顺序下又呈现出另外一种模式的自相关。

然而,当我们处理时间序列时,观测服从时间上的一种自然顺序。

2、在经济变量时间序列回归模型中,误差项经常被称之为冲击(Shock )。

对经济系统的冲击经常具有持续性,从而这为误差项序列相关提供了现实依据。

一、 自相关的后果在证明高斯-马尔科夫定理时,我们仅仅在证明OLS 估计量的方差最小(在所有线性无偏估计量中)时用到了序列无关假定,而在证明线性、无偏性并没有用到该假定,因此违背无自相关性假定并不影响线性、无偏性,只影响方差最小性质。

在证明方差最小时,我们分了两步,其中第一步是计算OLS 估计量的方差。

对模型:t 01t t y x ββε=++有:12ˆ12222()()()()(())()()[()]t t t t t t t t tx x Variance x x x x Variance x x Variance x x x x βεδβεε-=+---==--∑∑∑∑∑∑在假定五:0,0t t j j εεδ+=≠下,有:122ˆ222()[()]ttt x x x x βεδδ-=-∑∑如果假定五不成立,那么正确的方差表达式应该是:12ˆ1221122()2()()[()]t t t jT T tt t t j t j t x x x x x x x x βεεεδδδ+--+==-+--=-∑∑∑∑所以, OLS 法下通常的系数估计量方差的表示是错误的。

计量经济学讲义第十讲(共十讲)

计量经济学讲义第十讲(共十讲)

第十讲 ARCH 模型及其扩展一、数学准备:迭代期望定律我们在第二讲中的笔记部分涉及到迭代期望定律。

作为复习,此处把该定律再展示一次。

如果信息集Θ⊆Ω,则有][()()E E X E X ΩΘ=Θ,此即迭代期望定律。

为了理解上述等式,考虑一个极端情况:Ω包含了全部的信息,则基于信息集Ω对x 的预测将没有任何预测误差,即有:()E X X Ω=,因此必有][()()E E X E X ΩΘ=Θ。

另外,无条件期望所对应的信息集是空集,因此按照迭代期望定律必有:[()]()E E XE X Ω=。

二、ARCH 模型考虑如下一个模型:01t t t y x φφε=++ (1)其中t tv ε=t v 是白噪声,方差为21vδ=;t v 和(1)t i i ε-≥相互独立;0110,,...,0,1ppi i a a a a =>≥<∑。

对上述模型,可以验证: (1))0(t E ε=练习:证明上式。

(2))0,0(t t i i E εε-=≠,即误差项序列无关。

证明:首先,,...,,...,1212,,...,,,...,)))0(((t t t t i t i t i t p t i t t t p t i t t E E E εεεεεεεεεεεεεε-----------=== 其次,按照迭代期望定律有:,...,12,,...,)])[((t t t i t i t p t i t t E E E εεεεεεεε------=因此有:)0,0(t t i i E εε-=≠(3)201)1(tpii a a E ε==-∑证明:22220011[()]())(tppt i t i i t i i i v a a a a E EE εεε--==+=+=∑∑令2)(t t x E ε=,则有差分方程:01t t i pi i x a a x -==+∑由于11,...,0,1ppi i a a a =≥<∑,故上述差分方程满足平稳性的充分条件:11pii a =<∑(参见第八讲附 录),因此,当t 趋于无穷大时t x 收敛于均衡值x*,其中01pi i xa a x**==+∑,即11pii a a x*==-∑。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量经济学讲义共十讲文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]第一讲 普通最小二乘法的代数一、 问题假定y 与x 具有近似的线性关系:01y x ββε=++,其中ε是随机误差项。

我们对01ββ、这两个参数的值一无所知。

我们的任务是利用样本数据去猜测01ββ、的取值。

现在,我们手中就有一个样本容量为N 的样本,其观测值是:1122(,),(,),...,(,)N N y x y x y x 。

问题是,如何利用该样本来猜测01ββ、的取值为了回答上述问题,我们可以首先画出这些观察值的散点图(横轴x ,纵轴y )。

既然y 与x 具有近似的线性关系,那么我们就在图中拟合一条直线:01ˆˆˆy x ββ=+。

该直线是对y 与x 的真实关系的近似,而01ˆˆ,ββ分别是对01,ββ的猜测(估计)。

问题是,如何确定0ˆβ与1ˆβ,以使我们的猜测看起来是合理的呢笔记:1、为什么要假定y 与x 的关系是01y x ββε=++呢一种合理的解释是,某一经济学理论认为x 与y 具有线性的因果关系。

该理论在讨论x 与y 的关系时认为影响y 的其他因素是不重要的,这些因素对y 的影响即为模型中的误差项。

2、01y x ββε=++被称为总体回归模型。

由该模型有:01E()E()y x x x ββε=++。

既然ε代表其他不重要因素对y 的影响,因此标准假定是:E()0x ε=。

故进而有:01E()y x x ββ=+,这被称为总体回归方程(函数),而01ˆˆˆy x ββ=+相应地被称为样本回归方程。

由样本回归方程确定的ˆy 与y 是有差异的,ˆy y-被称为残差ˆε。

进而有:01ˆˆˆy x ββε=++,这被称为样本回归模型。

二、 两种思考方法法一:12(,,...,)N y y y '与12ˆˆˆ(,,...,)N y y y '是N 维空间的两点,0ˆβ与1ˆβ的选择应该是这两点的距离最短。

这可以归结为求解一个数学问题:由于ˆi i y y -是残差ˆi ε的定义,因此上述获得0ˆβ与1ˆβ的方法即是0ˆβ与1ˆβ的值应该使残差平方和最小。

法二:给定i x ,看起来i y 与ˆi y越近越好(最近距离是0)。

然而,当你选择拟合直线使得i y 与ˆi y是相当近的时候,j y 与ˆj y的距离也许变远了,因此存在一个权衡。

一种简单的权衡方式是,给定12,,..,N x x x ,拟合直线的选择应该使1y 与2ˆy、2y 与2ˆy 、...、N y 与ˆN y 的距离的平均值是最小的。

距离是一个绝对值,数学处理较为麻烦,因此,我们把第二种思考方法转化求解数学问题:由于N 为常数,因此法一与法二对于求解0ˆβ与1ˆβ的值是无差异的。

三、 求解定义2011ˆˆ()Ni ii Q y x ββ==--∑,利用一阶条件,有: 由(1)也有:在这里11N i i y y N ==∑、11Ni i x x N ==∑笔记:这表明:1、样本回归函数01ˆˆˆy x ββ=+过点(,)x y ,即穿过数据集的中心位置;2、ˆy y =(你能证明吗),这意味着,尽管01ˆˆββ、的取值不能保证ˆi i y y =,但01ˆˆββ、的取值能够保证ˆy 的平均值与y 的平均值相等;3、虽然不能保证每一个残差都为0,但我们可以保证残差的平均值为0。

从直觉上看,01ˆˆββ、作为对01ββ、的一个良好的猜测,它们应该满足这样的性质。

笔记:对于简单线性回归模型:01y x ββε=++,在OLS 法下,由正规方程(1)可知,残差之和为零【注意:只有拟合直线带有截距时才存在正规方程(1)】。

由正规方程(2),并结合正规方程(1)有:1ˆˆˆˆˆ0()()()0ˆ(,)0i ii i iixx x x Cov x εεεεεε=⇒-=--=⇒=∑∑∑见练习()提示无论用何种估计方法,我们都希望残差所包含的信息价值很小,如果残差还含有大量的信息价值,那么该估计方法是需要改进的!对模型01y x ββε=++利用OLS ,我们能保证(1):残差均值为零;(2)残差与解释变量x 不相关【一个变量与另一个变量相关是一个重要的信息】。

方程(1)与(2)被称为正规方程,把01ˆˆy x ββ=-带入(2),有:上述获得01ˆˆββ、的方法就是普通最小二乘法(OLS )。

练习: (1)验证:提示:定义i Z 的离差为i i z Z Z =-,则离差之和10Nii z==∑必为零。

利用这个简单的代数性质,不难得到: 笔记:定义y 与x 的样本协方差、x 的样本方差分别为:2(,)()()/()()/i i i Cov x y x x y y N Var x x x N=--=-∑∑,则1(,)ˆ()Cov x y Var x β=。

上述定义的样本协方差及其样本方差分别是对总体协方差xy δ及其总体方差2x δ的有偏估计。

相应的无偏估计是:基于前述对()Var x 与(,)Cov x y 的定义,可以验证:其中a ,b 是常数。

值得指出的是,在本讲义中,在没有引起混淆的情况下,我们有时也用()Var x 、(,)Cov x y 来表示总体方差与协方差,不过上述公式同样成立。

(2)假定y x βε=+,用OLS 法拟合一个过原点的直线:ˆˆyx β=,求证在OLS 法下有: 并验证:∑∑∑+=222ˆˆi i i y y ε笔记:1、现在只有一个正规方程,该正规方程同样表明ˆ0i i x ε=∑。

然而,由于模型无截距,因此在OLS 法下我们不能保证ˆ0iε=∑恒成立。

所以,尽管ˆ0i ix ε=∑成立,但现在该式并不意味着ˆ(,)0Cov x ε=成立。

2、无截距回归公式的一个应用:01101()()()i i i i i i y x y y x x y x ββεβεεββε=++⎫⎪⇓⇒-=-+-⎬⎪=++⎭定义ii F y y =-、i i D x x =-、i i e εε=-,则1i i i F D e β=+。

按照OLS 无截距回归公式,有:(3)假定y βε=+,用OLS 法拟合一水平直线,即:ˆˆyβ=,求证ˆy β=。

笔记:证明上式有两种思路,一种思路是求解一个最优化问题,我们所获得的一个正规方程同样是ˆ0iε=∑;另外一种思路是,模型y βε=+是模型y x βε=+的特例,利用ˆ0i i x ε=∑的结论,注意到此时1ix =,因此同样有ˆ0i ε=∑。

(4)对模型01y x ββε=++进OLS 估计,证明残差与ˆy 样本不相关,即ˆˆ(,)0Cov y ε=。

四、 拟合程度的判断(一)方差分解及其R 2的定义可以证明,ˆˆ()()()Var y Var y Var ε=+。

证明:方差表示一个变量波动的信息。

方差分解亦是信息分解。

建立样本回归函数01ˆˆˆy x ββ=+时,从直觉上看,我们当然希望关于ˆy的波动信息能够最大程度地体现关于y 的波动信息。

因此,我们定义判定系数2ˆ()()Var yR Var y =,显然,201R ≤≤。

如果R 2大,则y 的波动信息就越能够被ˆy 的波动信息所体现。

R 2也被称为拟合优度。

当21R =时,ˆ()0Var ε=,而残差均值又为零,因此着各残差必都为零,故样本回归直线与样本数据完全拟合。

(二)总平方和、解释平方和与残差平方和定义:其中TSS 、ESS 、RSS 分别被称为总平方和、解释平方和与残差平方和。

根据方差分解,必有:TSS=ESS+RSS 。

因此,2/1/R ESS TSS RSS TSS ==-(三)关于R 2的基本结论1、R 2也是y 与ˆy的样本相关系数r 的平方。

证明:2、对于简单线性回归模型:01y x ββε=++, R 2是y 与x 的样本相关系数的平方。

证明:22222011201122ˆˆˆˆ(,+)(,)(,)R ˆˆˆˆ()()()(+)()()(,)xyCov y x Cov y y Cov y x Var y Var y Var y Var x Var y Var x Cov y x r ββββββ=====练习:(1)对于模型:y βε=+,证明在OLS 法下R 2=0。

(2)对于模型:01y x ββε=++,证明在OLS 法 警告!软件包通常是利用公式21/R RSS TSS =-,其中2ˆi RSS ε=∑来计算R 2。

应该注意到,我们在得到结论 222ˆˆ()()i i i y y y y ε-=-+∑∑∑时利用了ˆ0ε=的性质,而该性质只有在拟合直线带有截距时才成立,因此,如果拟合直线无截距,则上述结论并不一定成立,因此,此时我们不能保证R 2为一非负值。

总而言之,在利用R 2时,我们的模型一定要带有截距。

当然,还有一个大前提,即我们所采用的估计方法是OLS 。

五、 自由度与调整的R 2如果在模型中增加解释变量,那么总的平方和不变,但残差平方和至少不会增加,一般是减少的。

为什么呢举一个例子。

假如我们用OLS 法得到的模型估计结果是:01122ˆˆˆˆi i iy x x βββ=++, 此时,OLS 法估计等价于求解最小化问题:令最后所获得的目标函数值(也就是残差平方和)为RSS1。

现在考虑对该优化问题施加约束:2ˆ0β=并求解,则得到目标函数值RSS2。

比较上述两种情况,相对于RSS1, RSS2是局部最小。

因此,RSS1小于或等于RSS2。

应该注意到,原优化问题施加约束后对应于模型估计结果:011ˆˆˆi iy x ββ'''=+ 因此,如果单纯依据R 2标准,我们应该增加解释变量以使模型拟合得更好。

增加解释变量将增加待估计的参数,在样本容量有限的情况下,这并不一定是明智之举。

这涉及到自由度问题。

什么叫自由度假设变量x 可以自由地取N 个值12(,,...,)N x x x ,那么x 的自由度就是N 。

然而,如果施加一个约束,i x a =∑,a 为常数,那么x 的自由度就减少了,新的自由度就是N-1。

考虑在样本回归直线01122ˆˆˆˆi i iy x x βββ=++下残差ˆε的自由度问题。

对残差有多少约束根据正规方程(1)(2),有:ˆˆ0;0i i i x εε==∑∑,因此存在两个约束。

故残差的自由度是N-2。

如果当样本回归函数是:012ˆˆˆˆy x z βββ=++,则残差的自由度为N-3。

显然,待估计的参数越多,则残差的自由度越小。

自由度过少会带来什么问题简单来说,自由度过少会使估计精度很低。

例如,我们从总体中随机抽取12,,...,N x x x 来计算x 以作总体均值的估计,现在x 的自由度是N ,显然N 越大则以x 作为总体均值的估计越精确。

相关文档
最新文档