经验分享,使用eviews做回归分析

经验分享,使用eviews做回归分析
经验分享,使用eviews做回归分析

[经验分享] 使用eviews做线性回归分析

Glossary:

ls(least squares)最小二乘法

R-sequared样本决定系数(R2):值为0-1,越接近1表示拟合越好,>0.8认为可以接受,但是R2随因变量的增多而增大,解决这个问题使用来调整

Adjust R-seqaured()

S.E of regression回归标准误差

Log likelihood对数似然比:残差越小,L值越大,越大说明模型越正确

Durbin-Watson stat:DW统计量,0-4之间

Mean dependent var因变量的均值

S.D. dependent var因变量的标准差

Akaike info criterion赤池信息量(AIC)(越小说明模型越精确)

Schwarz ctiterion:施瓦兹信息量(SC)(越小说明模型越精确)

Prob(F-statistic)相伴概率

fitted(拟合值)

线性回归的基本假设:

1.自变量之间不相关

2.随机误差相互独立,且服从期望为0,标准差为σ的正态分布

3.样本个数多于参数个数

建模方法:

ls y c x1 x2 x3 ...

x1 x2 x3的选择先做各序列之间的简单相关系数计算,选择同因变量相关系数大而自变量相关系数小的一些变量。模型的实际业务含义也有指导意义,比如m1同gdp肯定是相关的。

模型的建立是简单的,复杂的是模型的检验、评价和之后的调整、择优。

模型检验:

1)方程显著性检验(F检验):模型拟合样本的效果,即选择的所有自变量对因变量的解释力度

F大于临界值则说明拒绝0假设。

Eviews给出了拒绝0假设(所有系统为0的假设)犯错误(第一类错误或α错误)的概率(收尾概率或相伴概率)p 值,若p小于置信度(如0.05)则可以拒绝0假设,即认为方程显著性明显。

2)回归系数显著性检验(t检验):检验每一个自变量的合理性

|t|大于临界值表示可拒绝系数为0的假设,即系数合理。t分布的自由度为n-p-1,n为样本数,p为系数位置

3)DW检验:检验残差序列的自相关性,检验基本假设2(随机误差相互独立)

残差:模型计算值与资料实测值之差为残差

0<=dw<=dl 残差序列正相关,du

demo中的dw=0.141430 ,dl=1.73369,du=1.7786,所以存在正相关

模型评价

目的:不同模型中择优

1)样本决定系数R-squared及修正的R-squared

R-squared=SSR/SST 表示总离差平方和中由回归方程可以解释部分的比例,比例越大说明回归方程可以解释的部分越多。

Adjust R-seqaured=1-(n-1)/(n-k)(1-R2)

2)对数似然值(Log Likelihood,简记为L)

残差越小,L越大

3)AIC准则

AIC= -2L/n+2k/n, 其中L为log likelihood,n为样本总量,k为参数个数。

AIC可认为是反向修正的L,AIC越小说明模型越精确。

4)SC准则

SC= -2L/n + k*ln(n)/n

用法同AIC非常接近

预测forecast

root mean sequared error(RMSE)均方根误差

Mean Absolute Error(MAE)平均绝对误差

这两个变量取决于因变量的绝对值,

MAPE(Mean Abs. Percent Error)平均绝对百分误差,一般的认为MAPE<10则认为预测精度较高

Theil Inequality Coefficient(希尔不等系数)值为0-1,越小表示拟合值和真实值差异越小。

偏差率(bias Proportion),bp,反映预测值和真实值均值间的差异

方差率(variance Proportion),vp,反映预测值和真实值标准差的差异

协变率(covariance Proportion),cp,反映了剩余的误差

以上三项相加等于1。

预测比较理想是bp,vp比较小,值集中在cp上。

eviews不能直接计算出预测值的置信区间,需要通过置信区间的上下限公式来计算。如何操作?

其他

1)Chow检验

chow's breakpoint检验

零假设是:两个子样本拟合的方程无显著差异。有差异则说明关系中结构发生改变

demo中

Chow Breakpoint T est: 1977Q1

F-statistic 2.95511837136742 Prob. F(3,174) 0.0339915698953355 Log likelihood ratio 8.94507926849178 Prob. Chi-Square(3) 0.0300300700620291

p值<0.05,可拒绝0假设,即认为各个因素的影响强弱发生了改变。

问题是如何才能准确的找到这个或这几个断点?目前的方法是找残差扩大超出边线的那个点,但这是不准确的,在demo中1975Q2的残差超出,但是chow's breakpoint检验的两个p值都接近0.2,1976Q3开始两

个p值才小于0.05,并且有逐渐减小之势。

chow's forecast检验

用断点隔断样本,用之前的样本建立回归模型,然后用这个模型对后一段进行预测,检验这个模型对后续样本的拟合程度。

0假设是:模型与后段样本无显著差异

demo中的1976Q4作为break point,得到两个p值为0,即认为两段样本的系数应该是不同的。

2)自变量的选择

testadd检验:

操作方法是: eqation name.testadd ser1 ser2 ...

0假设:应该将该变量引入方程

检验统计量:wald,LR

结果:通过两个p值(Prob. F,Prob Chi-sequare)看是否拒绝原假设

testdrop检验:

操作方法是: eqation name.testdrop ser1 ser2 ...

0假设:应该将该变量剔除

检验统计量:wald,LR

结果:通过两个p值(Prob. F,Prob Chi-sequare)看是否拒绝原假设

含定性变量的回归模型

分为:自变量含定性变量,因变量含定性变量。后一种情况较为复杂

建立dummy 变量(名义变量):用D表示

当变量有m种情况时,需要引入m-1个dummy变量

处理办法:把定性变量定义成0.1.2等数值后和一般变量同样处理

常见问题及对策

1)多重共线性(multicollinearity):

p个回归变量之间存在严格或近似的线性关系

诊断方法:

1.如果模型的R-sequared很大,F检验通过,但是某些系统的t检验没通过

2.某些自变量系数之间的简单相关系数很大

3.回归系数符号与简单相关系统符号相反

以上3条发生都有理由怀疑存在多重共线性

方差扩大因子(variance inflation factor VIFj)是诊断多重共线性的常用手段。

VIFj为矩阵(X’X)-1第j个对角元素cjj=1/(1-R2j)(j=1,2…,p)

其中R2j为以作为cj因变量,其余p-1个自变量作为自变量建立多元回归模型所得的样本决定系数,所以R2j越大则说明自变量之间自相关性越大,此时也越大,可以认为VIFj>10(R2j>0.9)则存在多重共线性。

还可以使用VIFj的平均数作为判断标准,如果avg(VIFj)远大于10则认为存在多重共线性。

eviews里如何使用VIF法?--建立方程,然后手工建立scalar vif。demo中GDP和PR的vif为66,存在多重共线性? 只有一个自变量的方程是否会失效?此时dw值只有0.01远小于dl,说明GDP远远不是PR能决定的。结合testdrop将PR去除,两个p值为0,说明不能把PR去除。

在eviews中当自变量存在严重的多重共线性时将不能给出参数估计值,而会报错:nearly singular matrix

多重共线性的处理:

1.剔除自变量,选择通过testdrop实验,并且vif值最大的那个

2.差分法,在建立方程时填入ls m1-m1(-1) c gdp-gdp(-1) pr-pr(-1)。m1(-1)表示上一个m1

差分法常常会丢失一些信息,使用时应谨慎。demo中得到的模型,c 的p值0.11, pr-pr(-1)的p值为0.60,说明参数无效。

2)异方差性(Herteroskedasticity)

即随机误差项不满足基本假设的同方差性,异方差性说明随机误差中有些项对因变量的影响是不同于其他项的。

一般地,截面数据做样本时出现异方差性的可能较大,或者说都存在异方差性

若存在异方差性,用OLS估计出来的参数,可能导致估计值虽然是无偏的,但不是有效的。

(截面数据就是同一时间点上各个主体的数据,比如2007年各省的GDP数据放在一起就是一组截面数据与之相对的是时间序列数据如河北省从00年到07年的数据就是一组时间序列数据

两者综合叫面板数据)

00年到07年各省的数据综合在一起就叫面板数据

诊断方法:

1.图示法,以因变量作为横坐标,以残差项为纵坐标,根据散点图判断是否存在相关性。

(选择两个序列作为group打开,先选中的序列将作为group的纵坐标)

2.戈里瑟(Glejser)检验:

??

3.怀特(White)检验:

用e2作为因变量,原先的自变量及自变量的平方(还可以加上各自变量之间的相互乘积)作为自变量建立模型。

怀特检验的统计量为:m=n*R2(n是样本容量,R2是新模型的拟合优度), m~ χ2(k) k为新模型除常数项之外的自变量个数

零假设:模型不存在异方差性

操作:在估计出来的方程中,view-residual tests-White Herteroskedasticity(no cross/cross) 分别为是否含自变量交叉项

demo中的两个p值为0,所以拒绝零假设,认为存在严重的异方差性。

异方差性的处理:

1.加权最小二乘法(WLS weighted least sequare)。

最常用的方法,一般用于异方差形式可知的情况。基本思路是赋予残差的每个观测值不同的权数,从而使模型的随机误差项具有相同的方差。

2.自相关相容协方差(Heteroskedasticity and antocorrelation consistent convariances HAC)

用于异方差性形式未知时。在建模时在options中选择Heteroskedasticity consistent convariances 再从white,newey-west中选择一种。

HAC不改变参数的点估计,改变的知识估计标准差。如何改变标准差?

3)自相关性

残差项不满足相互独立的假设。一般的,经济时间序列中自相关现象较为常见,这主要是经济变量的滞后性带来的。

自相关性将导致参数估计值虽然是无偏的,但不是有效的。

诊断方法:

1.绘制残差序列图。如果序列图成锯齿形或循环状的变化,可以判定存在自相关

2.回归检验法:

以残差e(t)为被解释变量,以各种可能的相关变量,如e(t-1) e(t-2)作为自变量,选择显著的最优拟合模型作为自相关的形式。

demo中以ls residm1 c residm1(-1) residm1(-2)后发现c的p值为0.54,做testdrop实验,两个p值都>0.5 可以将c剔除。剔除c后:

Dependent V ariable: RESIDM1

Method: Least Squares

Date: 12/29/07 Time: 11:26

Sample (adjusted): 1952Q3 1996Q4

Included observations: 178 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.

RESIDM1(-1) 1.215361 0.077011 15.78173 0.0000

RESIDM1(-2) -0.271664 0.078272 -3.470763 0.0007

R-squared 0.868569 Mean dependent var 0.011855

Adjusted R-squared 0.867823 S.D. dependent var 26.91138

S.E. of regression 9.783961 Akaike info criterion 7.410538

Sum squared resid 16847.76 Schwarz criterion 7.446289

Log likelihood -657.5379 Durbin-Watson stat 2.057531

模型的r-sequared稍小,参数很显著,dw显示为无自相关。

但是常数c能剔除吗?剔除后模型没有f-statistic和对应p值,原理何在?

3.DW检验法

用于小样本的一阶自相关情况,缺点:当回归方程右边存在因变量的滞后项如m1(t-i) (i=1,2,...)时,检验失败。

解决办法:

1.差分法

用增量数据代替原来的样本数据,较好的克服了自相关,但是改变了原方程的形式,意义不大。

2.Cochrane-Orcutt迭代法

不能有常数项!验证了回归检验的中的做法。

建立新方程时,e同e(-1) e(-2) 相关,有两个系数如何处理?

--《数据分析与EVIEWS应用》读书笔记

本文来自: 人大经济论坛EViews专版版,详细出处参考:https://www.360docs.net/doc/7215770387.html,/forum.php?mod=viewthread&tid=835621&page=1&fromuid=3321751

eviews多元线性回归案例分析

中国税收增长的分析 一、研究的目的要求 改革开放以来,随着经济体制的改革深化和经济的快速增长,中国的财政收支状况发生了很大的变化,中央和地方的税收收入1978年为519.28亿元到2002年已增长到17636.45亿元25年间增长了33倍。为了研究中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济学模型。 影响中国税收收入增长的因素很多,但据分析主要的因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本源泉。(2)公共财政的需求,税收收入是财政的主体,社会经济的发展和社会保障的完善等都对公共财政提出要求,因此对预算指出所表现的公共财政的需求对当年的税收收入可能有一定的影响。(3)物价水平。我国的税制结构以流转税为主,以现行价格计算的DGP等指标和和经营者收入水平都与物价水平有关。(4)税收政策因素。我国自1978年以来经历了两次大的税制改革,一次是1984—1985年的国有企业利改税,另一次是1994年的全国范围内的新税制改革。税制改革对税收会产生影响,特别是1985年税收陡增215.42%。但是第二次税制改革对税收的增长速度的影响不是非常大。因此可以从以上几个方面,分析各种因素对中国税收增长的具体影响。 二、模型设定 为了反映中国税收增长的全貌,选择包括中央和地方税收的‘国家财政收入’中的“各项税收”(简称“税收收入”)作为被解释变量,以放映国家税收的增长;选择“国内生产总值(GDP)”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表;选择“商品零售物价指数”作为物价水平的代表。由于税制改革难以量化,而且1985年以后财税体制改革对税收增长影响不是很大,可暂不考虑。所以解释变量设定为可观测“国内生产总值(GDP)”、“财政支出”、“商品零售物价指数” 从《中国统计年鉴》收集到以下数据 财政收入(亿元) Y 国内生产总值(亿 元) X2 财政支出(亿 元) X3 商品零售价格指 数(%) X4 1978519.283624.11122.09100.7 1979537.824038.21281.79102 1980571.74517.81228.83106

利用Eviews软件进行最小二乘法回归实例

例题中国居民人均消费支出与人均GDP(1978-2000),数据(例题1-2),预测,2001年人均GDP为4033.1元,求点预测、区间预测。(李子奈,p50)解答: 一、打开Eviews软件,点击主界面File按钮,从下拉菜单中选择Workfile。 在弹出的对话框中,先在工作文件结构类型栏(Workfile structure type)选择固定频率标注日期(Dated – regular frequency),然后在日期标注说明栏中(Date specification)将频率(Frequency)选为年度(Annual),再依次填入起止日期,如果希望给文件命名(可选项),可以在命名栏(Names - optional)的WF项填入自己选择的名称,然后点击确定。 此时建立好的工作文件如下图所示:

在主界面点击快捷方式(Quick)按钮,从下拉菜单中选空白数据组(Empty Group)选项。 此时空白数据组出现,可以在其中通过键盘输入数据或者将数据粘贴过来。 在Excel文件(例题1-2)中选定要粘贴的数据,然后在主界面中点击编辑(Edit)按钮,从下拉菜单中选择粘贴(Paste),数据将被导入Eviews软件。

将右侧的滚动条拖至最上方,可以在最上方的单元格中给变量命名。 二、估计参数 在主界面中点击快捷方式(Quick)按钮,从下拉菜单中选择估计方程(Estimate Equation) 在弹出的对话框中设定回归方程的形式。

在方程表示式栏中(Equation specification ),按照被解释变量(Consp )、常数项(c )、解释变量(Gdpp )的顺序填入变量名,在估计设置(Estimation settings )栏中选择估计方法(Method )为最小二乘法(LS – Least Squares ),样本(Sample )栏中选择全部样本(本例中即为1978-2000),然后点击确定,即可得到回归结果。 以上得到的回归结果可以表示为: 201.1190.3862(13.51)(53.47)Consp GDPP =+? 如果你试图关闭回归方程页面(或Eviews 主程序),这时将会弹出一个对话框,询问是否删除未命名的回归方程,如下图所示

Eviews处理多元回归分析操作步骤

Eviews处理多元回归分析操作步骤操作步骤 1. 建立工作文件 (1) 建立数据的exel电子表格 (2)将电子表格数据导入eviews File-open-foreign data as workfile,得到数据的Eviews工作文件和数据序列表。

2. 计算变量间的相关系数 在窗口中输入命令:cor coilfuture dow shindex nagas opec ueurope urmb,点击回车键,得到各序列之间的相关系数。结果表明Coilfuture数列与其他数列存在较好的相关关系。

3.时间序列的平稳性检验 (1)观察coilfuture序列趋势图 在eviews中得到时间序列趋势图,在quick菜单中单击graph,在series list对话框中输入序列名称coilfuture,其他选择默认操作。图形表明序列随时间变化存在上升趋势。 (2)对原序列进行ADF平稳性检验 quick-series statistics-unit root test,在弹出的series name对话框中输入需要检验的序列的名称,在test for unit root in 选择框中选择level,得到原数据序列的ADF检验结果,其他保持默认设置。

得到序列的ADF平稳性检验结果,检测值0.97大于所有临界值,则表明序列不平稳。以此方法,对各时间序列依次进行ADF检验,将检验值与临界值比较,发现所有序列的检验值均大于临界值,表明各原序列都是非平稳的。 (3)时间序列数据的一阶差分的ADF检验

quick-series statistics-unit root test,在series name对话框中输入需要检验的序列的名称,在test for unit root in 选择框中选择1nd difference,对其一阶差分进行平稳性检验,其他保持默认设置。 得到序列的ADF平稳性检验结果,检测值-7.8远小于所有临界值,则表明序列一阶差分平稳。以此方法,对各时间序列的一阶差分依次进行ADF检验,将检验值

用eviews进行一元线性回归分析实施报告

天津外国语大学国际商学院本科生课程论文(设计) 题目:一元回归分析居民收入和支出的关系姓名: 学号: 专业: 年级: 班级: 任课教师: 2014 年 4 月

内容摘要 随着本文中的收集数据参考了中国统计年鉴以及书本《计量经济学》中的相关统计结果,对我国各地区城镇居民家庭人均全年可支配收入与人均全年消费性支出进行分析。利用EVIEWS软件对计量模型进行参数评估和检验,最终得出相关结论。 关键词:居民消费;居民收入;EVIEWS;一元回归分析

目录 一、引言 (1) (一)研究背景 (1) (二)研究意义 (1) 二、研究综述 (2) (一)模型设定 (2) 1.定义变量 (2) 2.数据来源 (2) (二)作散点图 (3) 三、估计参数 (4) (一)操作步骤 (4) (二)回归结果 (4) 四、模型检验 (5) (一)经济意义检验 (5) (二)拟合优度和统计检验 (5) (三)回归预测 (5) 五、结论 (5) 参考文献: (6)

一元回归分析居民收入与支出的关系 一、引言 (一)研究背景 随着近年来我国成为世界第二大经济体,居民的高生活水平也日益显著。我国人口正在高速城镇化,2011年中国大陆城镇人口为69079万人,城镇人口占总人口比重达到51.27%。因此城镇居民作为消费主体,研究城镇居民人均可支配收入以及人均可支配消费性支出之间的关系,可以有效的了解到我国各地区的人民生活水平以及经济状况,因此能更好的的带动我国GDP的飙升,改善居民的生活水平。 (二)研究意义 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这要是人民生活水平的具体体现。改革开饭以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2007年的城市居民家庭平均每人每年消费支出,最高的是上海市达人均20667.91元,最低的则是新疆,人均只有8871.27元,上海是新疆的2.33倍。为了研究全国居民消费水平及其变动的原因,需要做具体的

使用eviews做线性回归分析

使用eviews做线性回归分析 关键字: linear regression Glossary: ls(least squares)最小二乘法 R-sequared样本决定系数(R2):值为0-1,越接近1表示拟合越好,>0.8认为可以接受,但是R2随因变量的增多而增大,解决这个问题使用来调整 Adjust R-seqaured() S.E of regression回归标准误差 Log likelihood对数似然比:残差越小,L值越大,越大说明模型越正确Durbin-Watson stat:DW统计量,0-4之间 Mean dependent var因变量的均值 S.D. dependent var因变量的标准差 Akaike info criterion赤池信息量(AIC)(越小说明模型越精确) Schwarz ctiterion:施瓦兹信息量(SC)(越小说明模型越精确) Prob(F-statistic)相伴概率 fitted(拟合值) 线性回归的基本假设: 1.自变量之间不相关 2.随机误差相互独立,且服从期望为0,标准差为σ的正态分布 3.样本个数多于参数个数 建模方法: ls y c x1 x2 x3 ... x1 x2 x3的选择先做各序列之间的简单相关系数计算,选择同因变量相关系数大而自变量相关系数小的一些变量。模型的实际业务含义也有指导意义,比如 m1同gdp肯定是相关的。 模型的建立是简单的,复杂的是模型的检验、评价和之后的调整、择优。 模型检验: 1)方程显著性检验(F检验):模型拟合样本的效果,即选择的所有自变量对因变量的解释力度 F大于临界值则说明拒绝0假设。 Eviews给出了拒绝0假设(所有系统为0的假设)犯错误(第一类错误或α错误)的概率(收尾概率或相伴概率)p值,若p小于置信度(如0.05)则可以拒绝0假设,即认为方程显著性明显。 2)回归系数显著性检验(t检验):检验每一个自变量的合理性 |t|大于临界值表示可拒绝系数为0的假设,即系数合理。t分布的自由度为 n-p-1,n为样本数,p为系数位置

Eviews处理多元回归分析操作步骤

操作步骤 1.建立工作文件 (1)建立数据的exel电子表格 (2)将电子表格数据导入eviews File-open-foreign data as workfile,得到数据的Eviews工作文件和数据序列表。

2.计算变量间的相关系数 在窗口中输入命令:cor coilfuture dow shindex nagas opec ueurope urmb,点击回车键,得到各序列之间的相关系数。结果表明Coilfuture数列与其他数列存在较好的相关关系。 3.时间序列的平稳性检验 (1)观察coilfuture序列趋势图 在eviews中得到时间序列趋势图,在quick菜单中单击graph,在series list对话框中输入序列名称coilfuture,其他选择默认操作。图形表明序列随时间变化存在上升趋势。

(2)对原序列进行ADF平稳性检验 quick-series statistics-unit root test,在弹出的series name对话框中输入需要检验的序列的名称,在test for unit root in 选择框中选择level,得到原数据序列的ADF检验结果,其他保持默认设置。

得到序列的ADF平稳性检验结果,检测值0.97大于所有临界值,则表明序列不平稳。以此方法,对各时间序列依次进行ADF检验,将检验值与临界值比较,发现所有序列的检验值均大于临界值,表明各原序列都是非平稳的。 (3)时间序列数据的一阶差分的ADF检验 quick-series statistics-unit root test,在series name对话框中输入需要检验的序列的名称,在test for unit root in 选择框中选择1nd difference,对其一阶差分进行平稳性检验,其他保持默认设置。

用Eviews软件建立一元线性回归模型并进行有关检验的实验报告

用Eviews软件建立一元线性回归模型并进行相关检验的实验报告1.数据 表1列出了某年中国部分省市城镇居民每个家庭平均全年可支配收入X与消费性支出Y 的统计数据。

2.建立模型 应用EViews软件,以表1的数据可绘出可支配收入X与消费性支出Y的散点图(图2-1)。从该三点图可以看出,随着可支配收入的增加,消费性支出也在增加,大致程线性关系。据此,我们可以建立一元线性回归模型: Y=β0+β1·X+μ 图2-1 对模型作普通最小二乘法估计,在Eviews软件下,OLS的估计结果如图(2-2)所示。 Dependent Variable: Y Method: Least Squares Date: 12/07/11 Time: 21:00 Sample: 1 20 Included observations: 20

Variable Coefficient Std. Error t-Statistic Prob. X 0.755368 0.023274 32.45486 0.0000 C 271.1197 159.3800 1.701090 0.1061 R-squared 0.983198 Mean dependent var 5199.515 Adjusted R-squared 0.982265 S.D. dependent var 1625.275 S.E. of regression 216.4435 Akaike info criterion 13.68718 Sum squared resid 843260.4 Schwarz criterion 13.78675 Log likelihood -134.8718 Hannan-Quinn criter. 13.70661 F-statistic 1053.318 Durbin-Watson stat 1.302512 Prob(F-statistic) 0.000000 图2-2 OLS估计结果为 ^ Y=271.12+0.76X (1.70) (32.45) R2=0.9832 D.W. =1.3025 F=1053.318 3.模型检验 从回归估计的结果看,模型拟合较好。可绝系数R2=0.983198,表明城镇居民每个家庭平均全年消费性支出变化的98.3198%可由可支配收的变化来解释。从斜率项β1的t检验看,大于5%显著性水平下自由度为n-2=18的临界值t0.025(18)=2.101,且该斜率值满足0<0.755368<1,符合经济理论中边际消费倾向在0与之间的绝对收入假说,表明中国城镇居民平均全年可支配收入每增加1元,消费性支出增加0.755368元。 4.预测 假设我们需要关注2012年平均年可支配收入在20000元这一水平下的中国城镇居民平均年消费支出问题。由上述回归方程可得该类家庭人均消费支出的预测值: ^ Y0=271.1197+0.755368×20000=15378.4797 下面给出该类居民平均年消费支出95%置信度的预测区间。

使用eviews做线性回归分析

Glossary: ls(least squares)最小二乘法 R-sequared样本决定系数(R2):值为0-1,越接近1表示拟合越好,>0.8认为可以接受,但是R2随因变量的增多而增大,解决这个问题使用来调整 Adjust R-seqaured() S.E of regression回归标准误差 Log likelihood对数似然比:残差越小,L值越大,越大说明模型越正确 Durbin-Watson stat:DW统计量,0-4之间 Mean dependent var因变量的均值 S.D. dependent var因变量的标准差 Akaike info criterion赤池信息量(AIC)(越小说明模型越精确) Schwarz ctiterion:施瓦兹信息量(SC)(越小说明模型越精确) Prob(F-statistic)相伴概率 fitted(拟合值) 线性回归的基本假设: 1.自变量之间不相关 2.随机误差相互独立,且服从期望为0,标准差为σ的正态分布 3.样本个数多于参数个数 建模方法: ls y c x1 x2 x3 ... x1 x2 x3的选择先做各序列之间的简单相关系数计算,选择同因变量相关系数大而自变量相关系数小的一些变量。模型的实际业务含义也有指导意义,比如m1同gdp肯定是相关的。模型的建立是简单的,复杂的是模型的检验、评价和之后的调整、择优。 模型检验: 1)方程显著性检验(F检验):模型拟合样本的效果,即选择的所有自变量对因变量的解释力度 F大于临界值则说明拒绝0假设。 Eviews给出了拒绝0假设(所有系统为0的假设)犯错误(第一类错误或α错误)的概率(收尾概率或相伴概率)p值,若p小于置信度(如0.05)则可以拒绝0假设,即认为方程显著性明显。 2)回归系数显著性检验(t检验):检验每一个自变量的合理性 |t|大于临界值表示可拒绝系数为0的假设,即系数合理。t分布的自由度为n-p-1,n为样本数,p为系数位置 3)DW检验:检验残差序列的自相关性,检验基本假设2(随机误差相互独立) 残差:模型计算值与资料实测值之差为残差 0<=dw<=dl 残差序列正相关,du

eviews处理多元回归分析操作步骤

操作步骤 1. 作 ?件 (1)?e xel?子表格 (2 子表格?导入e?v iews? File-open-forei?g n data as workf?i le?E view?s 作 件??表。

2.?? ?入命令:cor coilf?u ture? dow shind?e x nagas? opec ueuro?pe urmb ???。结果表明C?oilfu?t ure????。 3.?? (1 观察coi?l futu?r e?势图 evie?w s??势图 quic?k?g rap?h seri?e s list ? 入?名称c?o ilfu?ture?操作。图 表明 ???势。

(2?行A D F? quick?-serie?s stati?s tics?-unit root test 弹出 s?e ries? name? 入?? 名称?test? for unit root in ?leve?l?AD?F 结果??设置。

?A D F? 结果? 测值0.97? 值 表明 ?不 。 ? 行?A DF? 值 ? 值 ?? 值??值 表明 ?? 。 (3??分ADF? quick?-serie?s stati?s tics?-unit root test seri?e s name? 入?? 名称?test? for unit root in ??分 行 ??设置。

?A D F? 结果?测值-7.8? 值 表明 ? 分 ?。??分 行?A D F? 值 ? 值 ?? 值??值 表明 ? 分 ? 。由 ???。 4.Grang?e r 果 ? (1quick?-group?stati?s t i cs?-grang?e r causa?l ity test 出 ? 入 ?名称 OK。 ?入?? 果 ?。 (2?用E vie?w s?

相关文档
最新文档