使用eviews做线性回归方程
EViews计量经济学实验报告-简单线性回归模型分析

时间地点实验题目简单线性回归模型分析一、实验目的与要求:目的:影响财政收入的因素可能有很多,比如国内生产总值,经济增长,零售物价指数,居民收入,消费等。
为研究国内生产总值对财政收入是否有影响,二者有何关系。
要求:为研究国内生产总值变动与财政收入关系,需要做具体分析。
二、实验内容根据1978-1997年中国国内生产总值X和财政收入Y数据,运用EV软件,做简单线性回归分析,包括模型设定,估计参数,模型检验,模型应用,得出回归结果。
三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等)简单线性回归分析,包括模型设定,估计参数,模型检验,模型应用。
(一)模型设定为研究中国国内生产总值对财政收入是否有影响,根据1978-1997年中国国内生产总值X 和财政收入Y,如图1:1978-1997年中国国内生产总值和财政收入(单位:亿元)根据以上数据,作财政收入Y 和国内生产总值X 的散点图,如图2:从散点图可以看出,财政收入Y 和国内生产总值X 大体呈现为线性关系,所以建立的计量经济模型为以下线性模型:01i i i Y X u ββ=++(二)估计参数1、双击“Eviews ”,进入主页。
输入数据:点击主菜单中的File/Open /EV Workfile —Excel —GDP.xls;2、在EV 主页界面点击“Quick ”菜单,点击“Estimate Equation ”,出现“Equation Specification ”对话框,选择OLS 估计,输入“y c x ”,点击“OK ”。
即出现回归结果图3:图3. 回归结果Dependent Variable: Y Method: Least Squares Date: 10/10/10 Time: 02:02 Sample: 1978 1997 Included observations: 20Variable Coefficient Std. Error t-Statistic Prob. C 857.8375 67.12578 12.77955 0.0000 X0.1000360.00217246.049100.0000R-squared 0.991583 Mean dependent var 3081.158 Adjusted R-squared 0.991115 S.D. dependent var 2212.591 S.E. of regression 208.5553 Akaike info criterion 13.61293 Sum squared resid 782915.7 Schwarz criterion 13.71250 Log likelihood -134.1293 F-statistic 2120.520 Durbin-Watson stat0.864032 Prob(F-statistic)0.000000参数估计结果为:i Y = 857.8375 + 0.100036i X(67.12578) (0.002172)t =(12.77955) (46.04910)2r =0.991583 F=2120.520 S.E.=208.5553 DW=0.8640323、在“Equation ”框中,点击“Resids ”,出现回归结果的图形(图4):剩余值(Residual )、实际值(Actual )、拟合值(Fitted ).(三)模型检验1、 经济意义检验回归模型为:Y = 857.8375 + 0.100036*X (其中Y 为财政收入,i X 为国内生产总值;)所估计的参数2ˆ =0.100036,说明国内生产总值每增加1亿元,财政收入平均增加0.100036亿元。
EVIEWS回归结果的理解

EVIEWS回归结果的理解在经济学和统计学中,回归分析是一种常用的方法,用于研究变量之间的关系。
EVIEWS是一款常用的计量经济学软件,通过进行回归分析,可以得到一系列统计结果。
本文将介绍EVIEWS回归结果的理解,并解释这些结果对研究的意义和解释。
一、回归方程在进行回归分析后,EVIEWS将给出一个回归方程。
回归方程表示了自变量与因变量之间的关系。
通常,回归方程的形式为:Y = β0 + β1X1 + β2X2 + ... + βkXk + ε其中,Y代表因变量,X1、X2、...、Xk代表自变量,β0、β1、β2、...、βk代表回归系数,ε代表误差项。
回归系数可以理解为自变量对因变量的影响程度,而误差项表示了模型无法解释的部分。
二、回归系数的解释EVIEWS给出的回归结果中,包含了回归方程中自变量的回归系数。
这些回归系数可以帮助我们理解自变量对因变量的影响。
回归系数的正负值表示变量间的正相关或负相关关系,绝对值大小表示相关关系的强弱程度。
需要注意的是,回归系数的统计显著性非常重要。
EVIEWS会给出回归系数的t值和p值,用于判断回归系数是否显著。
如果p值小于设定的显著性水平(通常为0.05),则认为回归系数是显著的,即表明自变量对因变量的影响是存在的。
三、决定系数(R-squared)在EVIEWS回归结果中,还会给出一个被称为决定系数的统计量,用于衡量回归模型对因变量的解释程度。
决定系数的取值范围在0到1之间,越接近1表示回归模型对因变量的解释能力越强。
需要注意的是,决定系数并不代表回归模型的好坏。
一个决定系数较高的回归模型并不一定是更好的模型,因为决定系数受到样本大小、变量选择等多个因素的影响。
因此,在解读决定系数时,需要结合实际问题和模型的适用性进行综合评估。
四、残差分析在EVIEWS回归结果中,还会给出一系列统计指标,用于评估回归模型的拟合优度和模型的合理性。
其中,残差是一项重要指标。
Eviews线性回归教程

工资差别
为了解工作妇女是否受到了歧视,可以用美国统计局的“当前人口调查” 中的截面数据研究男女工资有没有差别。这项多元回归分析研究所用到的变 量有:
W — 雇员的工资(美元/小时)
1;若雇员为妇女 SEX =
0;其他
ED — 受教育的年数 AGE — 雇员的年龄
1;若雇员不是西班牙裔也不是白人
NONWH = 0;其他
l T (1 log( 2 π) log( uˆuˆ / T )) 2
第22页/共41页
(6) Durbin-Watson 统计量
D-W 统计量衡量残差的序列相关性,计算方法如下:
T
T
DW (uˆt uˆt1)2
uˆt2
t2
t 1
作为一个规则,如果DW值小于2,证明存在正序列相关。 在例1的结果中,DW值很小,表明残差中存在序列相关。关 于 Durbin-Watson 统 计 量 和 残 差 序 列 相 关 更 详 细 的 内 容 参 见 “序列相关理论”。
第18页/共41页
2 方程统计量
(1) R2 统计量
R2 统计量衡量在样本内预测因变量值的回归是否成功。R2
是自变量所解释的因变量的方差。如果回归完全符合,统计值
会等于1。如果结果不比因变量的均值好,统计值会等于0。R2
可能会由于一些原因成为负值。例如,回归没有截距或常数,
或回归包含系数约束,或估计方法采用二阶段最小二乘法或
第1页/共41页
打开工作文件,双击一个序列名,即进入序列的对话 框。单击“view”可看到菜单分为四个区,第一部分为序列 显示形式,第二和第三部分提供数据统计方法,第四部分是 转换选项和标签。
第2页/共41页
描述统计量
经典线性回归模型的Eviews操作

经典线性回归模型经典回归模型在涉及到时间序列时,通常存在以下三个问题:1)非平稳性→ ADF单位根检验→ n阶单整→取原数据序列的n阶差分(化为平稳序列)2)序列相关性→D.W.检验/相关图/Q检验/LM检验→n阶自相关→自回归ar(p)模型修正3)多重共线性→相关系数矩阵→逐步回归修正注:以上三个问题中,前两个比较重要。
整体回归模型的思路:1)确定解释变量和被解释变量,找到相关数据。
数据选择的时候样本量最好多一点,做出来的模型结果也精确一些。
2)把EXCEL里的数据组导入到Eviews里。
3)对每个数据序列做ADF单位根检验。
4)对回归的数据组做序列相关性检验。
5)对所有解释变量做多重共线性检验。
6)根据上述结果,修正原先的回归模型。
7)进行模型回归,得到结论。
Eviews具体步骤和操作如下。
一、数据导入1)在EXCEL中输入数据,如下:除去第一行,一共2394个样本。
2)Eviews中创建数据库:File\new\workfile, 接下来就是这个界面(2394就是根据EXCEL里的样本数据来),OK3)建立子数据序列程序:Data x1再enter键就出来一个序列,空的,把EXCEL里对应的序列复制过来,一个子集就建立好了。
X1是回归方程中的一个解释变量,也可以取原来的名字,比如lnFDI,把方程中所有的解释变量、被解释变量都建立起子序列。
二、ADF单位根检验1)趋势。
打开一个子数据序列,先判断趋势:view\graph,出现一个界面,OK。
得到类似的图,下图就是有趋势的时间序列。
X1.4.2.0-.2-.4-.6-.8100020003000400050002)ADF检验。
直接在图形的界面上进行操作,view\unit root test,出现如下界面。
在第二个方框内根据时序的趋势选择,Intercept指截距,Trend为趋势,有趋势的时序选择第二个,OK,得到结果。
上述结果中,ADF值为-3.657113,t统计值小于5%,即拒绝原假设,故不存在单位根。
计量经济学-一元线性回归预测模型-Eviews6完整

数学与统计学院实验报告院(系):数学与统计学学院学号:姓名:实验课程:计量经济学指导教师:实验类型(验证性、演示性、综合性、设计性):综合性实验时间:2017年 3 月 1 日一、实验课题一元线性回归预测模型二、实验目的和意义用回归模型预测木材剩余物(1)用Eviews软件建立y关于x的回归方程,并对模型和参数做假设检验;(2)求y t的点预测和平均木材剩余物产出量E(y t)的置信区间预测。
(3)假设乌伊岭林业局2000年计划采伐木材20万m3,求木材剩余物的点预测值。
三、解题思路1、录非结构型的数据;2、进行描述性统计,列出回归模型;通过看t、f等统计量,检验回归模型是否正确3、运用forecast进行内预测(1-16样本),可以得到yf的点预测;再运用[yf+se]、[yf-se]进行区间估计(运用excel操作)4、将样本范围改到17个,令x=20,运用forecast进行外预测(17-17)四、实验过程记录与结果1、原始数据:乌伊岭26.1361.4东风23.4948.3新青21.9751.8红星11.5335.9五营7.1817.8上甘岭 6.817友好18.4355翠峦11.6932.7乌马河 6.817美溪9.6927.3大丰7.9921.5南岔12.1535.5带岭 6.817朗乡17.250桃山9.530双丰 5.5213.82、用Eviews软件建立y关于x的回归方程,并对模型和参数做假设检验;模型为:y=0.404280x-0.762928通过上表t、f统计量的p值<0.05,以及残差图基本在两倍标准差的范围内波动,可以得出该模型通过原假设。
3、求yt的点预测和平均木材剩余物产出量E(yt)的置信区间预测。
Yt的点估计:E(yt)的置信区间:4、假设乌伊岭林业局2000年计划采伐木材20万m3,求木材剩余物的点预测值。
空心点为预测值,上下两个红点是预测值的范围。
所以当x=20时,y的点预测值为7.322668五、结果的讨论和分析通过以上的实验,可知:模型为:y=0.404280x-0.762928,根据相关的统计量,可以得出该模型通过参数假设检验;yt的点预测运用内预测完成,而当2000年计划采伐木材20万立方米,运用外预测,可得木材剩余物的量为7.322668万立方米的六、实验小结通过这次实验,对eviews操作界面更加熟悉;掌握了如何建立数据的回归方程,以及参数的假设检验是否正确;运用eviews进行yt的点预测以及E(yt)的区间预测;当解释变量确定时,被解释变量应该为多少。
实验 Eviews的基本使用线性回归模型的估计和检验

实验一 Eviews 的基本使用、线性回归模型的估计和检验实验目的与要求:熟悉Eviews 软件基本使用功能、掌握线性回归模型的参数估计及其检验。
实验内容:建立一个工作文件、数据的输入、数据的保存、生成新序列、 作序列图和相关图。
线性回归模型的参数估计及其检验。
实验步骤:(具体步骤同学们可按照课堂讲解的程序进行也可按下面的指导操作,无论怎么操作,只要得到正确的结果即可) 一、模型的构建表 2002年中国各地区城市居民人均年消费支出和可支配收入 作城市居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)的散点图,如图从散点图可以看出居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)大体呈现为线性关系,4000600080001000012000Y所以建立的计量经济模型为如下线性模型: 12i i i Y X u ββ=++ 二、估计参数利用EViews 作简单线性回归分析的步骤如下: 1、建立工作文件首先,双击EViews 图标,进入EViews 主页。
在菜单一次点击File\New\Workfile ,出现对话框“Workfile Range ”。
在“Workfile frequency ”中选择数据频率: Annual (年度) Weekly ( 周数据 )Quartrly (季度) Daily (5 day week ) ( 每周5天日数据 ) Semi Annual (半年) Daily (7 day week ) ( 每周7天日数据 ) Monthly (月度) Undated or irreqular (未注明日期或不规则的)在本例中是截面数据,选择“Undated or irreqular ”。
并在“Start date ”中输入开始时间或顺序号,如“1”在“end date ”中输入最后时间或顺序号,如“31”点击“ok ”出现“Workfile UNTITLED ”工作框。
EVIEWS回归结果的理解
EVIEWS回归结果的理解在数据分析和经济研究中,EViews 是一款被广泛使用的统计软件,而回归分析则是其中非常重要的一个功能。
当我们运行回归分析后,得到的结果往往包含了丰富的信息,然而,要正确理解和解读这些结果却并非易事。
接下来,让我们一起深入探讨 EViews 回归结果的各个方面。
首先,我们来看回归系数。
回归系数是回归方程中自变量的系数,它表示当自变量变化一个单位时,因变量的平均变化量。
例如,如果我们研究收入(因变量)与教育年限(自变量)的关系,回归系数为500 ,这意味着教育年限每增加一年,平均来说收入会增加 500 元。
但需要注意的是,回归系数的大小和符号都有重要意义。
正的系数表示自变量与因变量正相关,负的系数则表示负相关。
同时,我们还要关注回归系数的显著性。
在 EViews 结果中,通常会给出 t 统计量和 p 值来检验回归系数的显著性。
如果 p 值小于我们设定的显著性水平(通常为 005 ),我们就可以认为该回归系数在统计上是显著的,也就是说,我们有足够的证据相信这个自变量对因变量的影响不是偶然的。
但如果 p 值大于显著性水平,那么我们就不能确定这个自变量对因变量有真正的影响。
除了单个回归系数,我们还要考虑整个回归方程的拟合优度。
常见的衡量指标是 Rsquared (决定系数),它的值介于 0 到 1 之间。
Rsquared 越接近 1 ,说明回归方程对数据的拟合程度越好,也就是说自变量能够较好地解释因变量的变化。
但需要注意的是,Rsquared 高并不一定意味着模型就是完美的,有可能存在过拟合的问题。
此外,还有调整后的 Rsquared 。
它考虑了模型中自变量的个数,对于比较包含不同数量自变量的模型具有重要意义。
一般来说,如果我们增加一个自变量,Rsquared 会增加,但调整后的 Rsquared 不一定增加。
只有当新增加的自变量能够显著提高模型的解释能力时,调整后的 Rsquared 才会增加。
实验课eviews基本操作与一元线性回归.ppt
1. 变量的转换
做一个对数模型
ln(chukou) ln(gdp)
需要对chukou和gdp的数据进行对数化处理 Quick/Generate Series… 在弹出的对话框中输入命令: chukoul = log(chukou) gdpl = log(gdp)
Upper-left data cell指明数据的范围
手动输入数据
Quick/Empty Group
将数据绘图
View/Graph/Line Quick/Graph 利用数组绘图
在数据组窗口中,
View/Multiple Graphs
描述性统计
打开数据组 View/Descriptive Stats
当工作文件中包含大量对象时,很难查找到指定的对 象。可以使用工作文件中的显示限制来解决这一问题。在 工作文件窗口中选择View/Display Filter,或者双击工作文 件窗口中的Filter。将显示一个对话框,这个对话框有两部 分组成。在编辑区域内,可以放置一个或几个名字的描述, 可以包括通配符“*”(与任何字符相匹配)和“?”(与 任何单个字符相匹配)。在编辑区域的下面是一系列复选 框,对应于不同类型的EViews对象。EViews将仅仅显示与 编辑区域中名字相匹配的指定类型的对象。
在标题栏的正下方是菜单和工具条,利用菜单和工具条 可以方便地实现很多操作。工具条中的按扭仅仅是一种快捷 方式,可以方便地处理EViews的主菜单中的一些操作。如 菜单“View/Name Display”可以实现大小写转换。默认是小 写。
工作文件的范围、样本和显示限制
在工具条的下面是两行信息栏,在这里EViews显示工作文 件的范围(结构)、工作文件的当前样本(被用于计算和统计 操作的观测值的范围)和显示限制(在工作文件窗口中显示对 象子集的规则)。双击这些标签并在对话框中输入相关的信息, 可以改变工作文件的范围、样本和显示限制。
Eviews-一元线性回归分析
1.一元线性回归分析(Eviews)研究一个解释变量对一个被解释变量的函数关系Eviews操作主要是Quick。
例子:分析31个省城镇居民平均每人全年家庭总收入X(元)与2011年底城镇居民家庭平1.打开Eviews,依次点击File\New\Workfile。
2.点击”Q uick-Empty Group”,输入数据,点击”obs”,按“”第一列和第二列分别命名为Y和X,将数据粘贴。
二、作Y与X的相关图(散点图)在“Workfile”窗口中,选择X和Y的数据表,双击选择“Open Group”。
选择“View\Graph”,在Graph type中选择“Scatter”,在Fit lines选择“Regression Line”。
从散点图中可以看出,X与Y近似于线性关系,可考虑建立简单线性回归模型。
Y i=β1+β2X i+u i三、估计参数(求出β1和β2的值)假定所建立的模型及其中的随机扰动项u i满足各项古典假定,可以用OLS法估计其参数。
1.方法一:点击“Quick\Estimate Equation”,在Specification中输入“Y C X”。
方法二:在Eviews主命令框中输入“LS Y C X”,按回车。
结果第一行依次表示:变量,参数,标准误差,t统计量,概率值样本回归函数为:Ŷi=11.95802+0.002873X iR2=0.831966,即判定系数表示回归解释平方和与总平方和之比,拟合优度度量值。
2.显示回归结果的图形,在“Equation”框中,点击“Resids”。
四、模型检验1.经济意义检验所估计的参数β̂1=11.95802,β̂2=0.002873,分别表示城镇居民平均每人全年家庭总收入每增加1元,2011年底城镇居民家庭平均每百户计算机拥有量增加0.002873台,与预期的经济意义相符。
2.拟合优度和统计检验R2=0.831966,即判定系数表示回归解释平方和与总平方和之比,拟合优度度量值,说明所建立的模型拟合效果较好。
EViews上机练习1一元线性回归
对于b1,t统计量为132.4233,给定α=0.05,查t分布表,在自由度为n-2=22下,得临界值t0.025(22)=2.074,因为t=132.4233>t0.025(22)=2.074,所以拒绝H0:b1=0,表明国内生产总值对我国最终消费支出有显著性影响。
7)预测。
在估计出的“Equation”框里选“Forecast”项,Eviews自动计算出样本估计期内的被解释变量的拟合值,预测结果见图14
0.333718
F统计量的概率
0.00000
赤池信息准则(Akaike info criterion):赤池信息准则即AIC,它对方程中的滞后项数选择提供指导。它是在残差平方和的基础上进行的。在特定条件下,可以通过选择使AIC达到最小值的方式来选择最优滞后分布的长度。AIC值越小越好。
施瓦茨准则(Schwarz Criterion):施瓦茨准则与AIC类似,他们具有基本相同的解释。
49722.70
82067.50
2000
54616.70
89442.20
2001
58952.60
95933.20
资料来源:国家统计局.中国统计年鉴2001.北京:中国统计出版社,2002
运行Eviews,在出现的对话框中按以下步骤进行一员线性回归。
1)给出工作范围。打开Eviews窗口,File→New→Workfile→Workfile Range→Workfile Frequency→Annual→Start date(1978)→End data(2001)→OK (图1,图2,图3)
估计标准误差是根据样本资料计算的,用来反映被解释变量的实际值yt与估计值 t的平均误差程度的指标。当SE越大,则回归直线精度越低;SE越小,则回归直线精度越高,代表性越好。当SE=0时,表示所有的样本点都落在回归直线上,解释变量与被解释变量之间表现为函数关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Glossary: ls(least squares)最小二乘法 R-sequared样本决定系数(R2):值为0-1,越接近1表示拟合越好,>0.8认为可以接受,但是R2随因变量的增多而增大,解决这个问题使用来调整 Adjust R-seqaured() S.E of regression回归标准误差 Log likelihood对数似然比:残差越小,L值越大,越大说明模型越正确 Durbin-Watson stat:DW统计量,0-4之间 Mean dependent var因变量的均值 S.D. dependent var因变量的标准差 Akaike info criterion赤池信息量(AIC)(越小说明模型越精确) Schwarz ctiterion:施瓦兹信息量(SC)(越小说明模型越精确) Prob(F-statistic)相伴概率 fitted(拟合值)
线性回归的基本假设: 1.自变量之间不相关 2.随机误差相互独立,且服从期望为0,标准差为σ的正态分布 3.样本个数多于参数个数 建模方法: ls y c x1 x2 x3 ... x1 x2 x3的选择先做各序列之间的简单相关系数计算,选择同因变量相关系数大而自变量相关系数小的一些变量。模型的实际业务含义也有指导意义,比如m1同gdp肯定是相关的。 模型的建立是简单的,复杂的是模型的检验、评价和之后的调整、择优。
模型检验: 1)方程显著性检验(F检验):模型拟合样本的效果,即选择的所有自变量对因变量的解释力度
F大于临界值则说明拒绝0假设。 Eviews给出了拒绝0假设(所有系统为0的假设)犯错误(第一类错误或α错误)的概率(收尾概率或相伴概率)p值,若p小于置信度(如0.05)则可以拒绝0假设,即认为方程显著性明显。
2)回归系数显著性检验(t检验):检验每一个自变量的合理性 |t|大于临界值表示可拒绝系数为0的假设,即系数合理。t分布的自由度为n-p-1,n为样本数,p为系数位置 3)DW检验:检验残差序列的自相关性,检验基本假设2(随机误差相互独立) 残差:模型计算值与资料实测值之差为残差 0<=dw<=dl 残差序列正相关,du<dw<4-du 无自相关, 4-dl<dw<=4负相关 ,若不在以上3个区间则检验失败,无法判断 demo中的dw=0.141430 ,dl=1.73369,du=1.7786,所以存在正相关
模型评价 目的:不同模型中择优 1)样本决定系数R-squared及修正的R-squared R-squared=SSR/SST 表示总离差平方和中由回归方程可以解释部分的比例,比例越大说明回归方程可以解释的部分越多。 Adjust R-seqaured=1-(n-1)/(n-k)(1-R2) 2)对数似然值(Log Likelihood,简记为L) 残差越小,L越大 3)AIC准则 AIC= -2L/n+2k/n, 其中L为 log likelihood,n为样本总量,k为参数个数。 AIC可认为是反向修正的L,AIC越小说明模型越精确。 4)SC准则 SC= -2L/n + k*ln(n)/n 用法同AIC非常接近 预测forecast root mean sequared error(RMSE)均方根误差 Mean Absolute Error(MAE)平均绝对误差 这两个变量取决于因变量的绝对值, MAPE(Mean Abs. Percent Error)平均绝对百分误差,一般的认为MAPE<10则认为预测精度较高 Theil Inequality Coefficient(希尔不等系数)值为0-1,越小表示拟合值和真实值差异越小。 偏差率(bias Proportion),bp,反映预测值和真实值均值间的差异 方差率(variance Proportion),vp,反映预测值和真实值标准差的差异 协变率(covariance Proportion),cp,反映了剩余的误差 以上三项相加等于1。 预测比较理想是bp,vp比较小,值集中在cp上。
eviews不能直接计算出预测值的置信区间,需要通过置信区间的上下限公式来计算。如何操作?
其他 1)Chow检验 chow's breakpoint检验 零假设是:两个子样本拟合的方程无显著差异。有差异则说明关系中结构发生改变 demo中 Chow Breakpoint Test: 1977Q1
F-statistic 2.95511837136742 Prob. F(3,174) 0.0339915698953355 Log likelihood ratio 8.94507926849178 Prob. Chi-Square(3) 0.0300300700620291
p值<0.05,可拒绝0假设,即认为各个因素的影响强弱发生了改变。 问题是如何才能准确的找到这个或这几个断点?目前的方法是找残差扩大超出边线的那个点,但这是不准确的,在demo中1975Q2的残差超出,但是chow's breakpoint检验的两个p值都接近0.2,1976Q3开始两个p值才小于0.05,并且有逐渐减小之势。 chow's forecast检验 用断点隔断样本,用之前的样本建立回归模型,然后用这个模型对后一段进行预测,检验这个模型对后续样本的拟合程度。 0假设是:模型与后段样本无显著差异 demo中的1976Q4作为break point,得到两个p值为0,即认为两段样本的系数应该是不同的。 2)自变量的选择 testadd检验: 操作方法是: eqation name.testadd ser1 ser2 ... 0假设:应该将该变量引入方程 检验统计量:wald,LR 结果:通过两个p值(Prob. F,Prob Chi-sequare)看是否拒绝原假设 testdrop检验: 操作方法是: eqation name.testdrop ser1 ser2 ... 0假设:应该将该变量剔除 检验统计量:wald,LR 结果:通过两个p值(Prob. F,Prob Chi-sequare)看是否拒绝原假设
含定性变量的回归模型 分为:自变量含定性变量,因变量含定性变量。后一种情况较为复杂 建立dummy 变量(名义变量):用D表示 当变量有m种情况时,需要引入m-1个dummy变量 处理办法:把定性变量定义成0.1.2等数值后和一般变量同样处理
常见问题及对策 1)多重共线性(multicollinearity): p个回归变量之间存在严格或近似的线性关系 诊断方法: 1.如果模型的R-sequared很大,F检验通过,但是某些系统的t检验没通过 2.某些自变量系数之间的简单相关系数很大 3.回归系数符号与简单相关系统符号相反 以上3条发生都有理由怀疑存在多重共线性 方差扩大因子(variance inflation factor VIFj)是诊断多重共线性的常用手段。 VIFj为矩阵(X’ X)-1第j个对角元素cjj=1/(1-R2j)(j=1,2…,p) 其中R2j为以作为cj因变量,其余p-1个自变量作为自变量建立多元回归模型所得的样本决定系数,所以R2j越大则说明自变量之间自相关性越大,此时也越大,可以认为VIFj>10(R2j>0.9)则存在多重共线性。 还可以使用VIFj的平均数作为判断标准,如果avg(VIFj)远大于10则认为存在多重共线性。 eviews里如何使用VIF法?--建立方程,然后手工建立scalar vif。demo中GDP和PR的vif为66,存在多重共线性? 只有一个自变量的方程是否会失效?此时dw值只有0.01远小于dl,说明GDP远远不是PR能决定的。结合testdrop将PR去除,两个p值为0,说明不能把PR去除。 在eviews中当自变量存在严重的多重共线性时将不能给出参数估计值,而会报错:nearly singular matrix 多重共线性的处理: 1.剔除自变量,选择通过testdrop实验,并且vif值最大的那个 2.差分法,在建立方程时填入 ls m1-m1(-1) c gdp-gdp(-1) pr-pr(-1)。m1(-1)表示上一个m1 差分法常常会丢失一些信息,使用时应谨慎。 demo中得到的模型,c 的p值0.11, pr-pr(-1)的p值为0.60,说明参数无效。
2)异方差性(Herteroskedasticity) 即随机误差项不满足基本假设的同方差性,异方差性说明随机误差中有些项对因变量的影响是不同于其他项的。 一般地,截面数据做样本时出现异方差性的可能较大,或者说都存在异方差性 若存在异方差性,用OLS估计出来的参数,可能导致估计值虽然是无偏的,但不是有效的。 (截面数据就是同一时间点上各个主体的数据,比如2007年各省的GDP数据放在一起就是一组截面数据 与之相对的是时间序列数据 如河北省从00年到07年的数据就是一组时间序列数据 两者综合叫面板数据 ) 00年到07年各省的数据综合在一起就叫面板数据