多元回归分析案例解析

合集下载

多元线性回归实例分析

多元线性回归实例分析

SPSS--回归-多元线性回归模型案例解析!(一)多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为:毫无疑问,多元线性回归方程应该为:上图中的 x1, x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示:那么,多元线性回归方程矩阵形式为:其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样)1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。

2:无偏性假设,即指:期望值为03:同共方差性假设,即指,所有的随机误差变量方差都相等4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。

今天跟大家一起讨论一下,SPSS---多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。

通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。

数据如下图所示:点击“分析”——回归——线性——进入如下图所示的界面:将“销售量”作为“因变量”拖入因变量框内,将“车长,车宽,耗油率,车净重等10个自变量拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可以选择其它的方式,如果你选择“进入”默认的方式,在分析结果中,将会得到如下图所示的结果:(所有的自变量,都会强行进入)如果你选择“逐步”这个方法,将会得到如下图所示的结果:(将会根据预先设定的“F统计量的概率值进行筛选,最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切,贡献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条件的概率值必须小于0.05,当概率值大于等于0.1时将会被剔除)“选择变量(E)" 框内,我并没有输入数据,如果你需要对某个“自变量”进行条件筛选,可以将那个自变量,移入“选择变量框”内,有一个前提就是:该变量从未在另一个目标列表中出现!,再点击“规则”设定相应的“筛选条件”即可,如下图所示:点击“统计量”弹出如下所示的框,如下所示:在“回归系数”下面勾选“估计,在右侧勾选”模型拟合度“ 和”共线性诊断“ 两个选项,再勾选“个案诊断”再点击“离群值”一般默认值为“3”,(设定异常值的依据,只有当残差超过3倍标准差的观测才会被当做异常值)点击继续。

多元线性回归模型的案例讲解

多元线性回归模型的案例讲解

多元线性回归模型的案例讲解以下是一个关于房价的案例,用多元线性回归模型来分析房价与其他变量的关系。

假设我们想研究一些城市的房价与以下变量之间的关系:房屋面积、卧室数量、厨房数量和所在区域。

我们从不同的房屋中收集了这些变量的数据,以及对应的房价。

我们希望通过构建多元线性回归模型来预测房价。

首先,我们需要收集数据。

我们找到100个不同房屋的信息,包括房屋的面积、卧室数量、厨房数量和所在区域,以及对应的房价。

接下来,我们需要进行数据处理和探索性分析。

我们可以使用统计软件,如Python的pandas库,对数据进行清洗和处理。

我们可以检查数据的缺失值、异常值和离群点,并对其进行处理。

完成数据处理后,我们可以继续进行变量的选择和模型构建。

在多元线性回归中,我们需要选择合适的自变量,并建立模型。

可以使用统计软件,如Python的statsmodels库,来进行模型的构建。

在本例中,我们使用房屋面积、卧室数量、厨房数量和所在区域作为自变量,房价作为因变量。

我们可以构建如下的多元线性回归模型:房价=β0+β1*面积+β2*卧室数量+β3*厨房数量+β4*所在区域其中,β0、β1、β2、β3和β4是回归模型的系数,表示因变量与自变量之间的关系。

我们需要对模型进行拟合和检验。

使用统计软件,在模型拟合之后,我们可以得到回归模型的系数和统计指标。

常见的指标包括回归系数的显著性、解释方差、调整R方和残差分析等。

根据回归模型的系数,我们可以解释不同自变量对因变量的影响。

例如,如果回归系数β1大于0且显著,说明房屋面积对房价有正向影响。

同理,其他自变量的系数也可以解释其对因变量的影响。

最后,我们可以使用建立的多元线性回归模型进行房价的预测。

通过输入房屋的面积、卧室数量、厨房数量和所在区域等自变量的数值,我们可以预测其对应的房价。

需要注意的是,多元线性回归模型的效果不仅取决于数据的质量,还取决于模型的选择和拟合程度。

因此,在模型选择和拟合过程中,我们需要进行多次实验和优化,以得到较好的模型。

多元回归模型分析案例

多元回归模型分析案例

多元回归模型分析案例回归模型是统计学中最常用的分析方法之一,是一种用来预测两个或多个变量之间的关系的方法。

这种模型可以用来估算单独变量以及组合变量对信息或结果的影响。

多元回归模型是具有两个或多个自变量的回归模型,它在预测和分析多变量之间的关系时特别有用。

本文旨在提供一个用多元回归模型分析的案例。

首先,本文将介绍多元回归模型的基本原理,并详细阐述案例中使用的各项数据。

接下来,将对案例中遇到的问题进行详细讨论,并介绍多元回归模型的具体应用。

最后,将对分析的结果进行讨论,以便判断回归模型的准确性。

一、多元回归模型的基本原理多元回归模型是一种建立在一组多元数据上的回归模型,它用一个线性函数根据观察数据预测一个特定变量。

基本形式为:Y=+βX1+βX2+...+βXn其中,Y是被预测变量,X1,X2,…,Xn是影响Y的因素。

β1,β2,…,βn是模型中所有自变量的系数,通过这些系数可以计算出每个因素对Y的影响程度。

多元回归模型需要解决的重要任务是:从观察的多变量数据中提取有用的信息,并确定Y的影响因素,并用这些因素来构建一个反映实际情况的模型,以评估变量对Y的影响程度。

因此,多元回归模型在分析多变量数据时非常有用。

二、案例介绍本文使用多元回归模型分析一年级学生的成绩,以探究学生成绩的影响因素及其对成绩的影响程度。

案例中共有20名一年级学生,每个学生的数据包括学生的学习和社交能力以及准备考试的时长等三个自变量。

其中学习能力和准备时长的取值范围分别为1-10,社交能力的取值范围为1-5。

案例数据如下:学生习能力交能力备时长绩1 8 3 7 772 4 2 8 553 7 5 5 654 6 1 6 675 9 4 7 84.....20 7 1 5 63三、案例问题分析本案例旨在探究一年级学生成绩的影响因素及其对成绩的影响程度,而这种因果关系很难仅用一句话来表达,只有使用多元回归模型才能获得更准确的结果。

在分析案例时,学习能力、社交能力和准备时长这三个自变量的影响是需要考虑的重要因素。

Eviews多元回归模型案例分析

Eviews多元回归模型案例分析

Eviews多元回归模型案例分析1. 引言本文将通过一个多元回归模型的案例分析来展示Eviews软件的应用。

多元回归模型是一种统计学方法,用于研究多个自变量对因变量的影响关系。

2. 数据集和变量2.1 数据集我们使用的数据集是一份包含多个变量的经济数据集,包括自变量和因变量。

2.2 变量在本案例中,我们选择了以下变量:- 因变量:Y- 自变量1:X1- 自变量2:X2- 自变量3:X33. 回归模型建立和参数估计3.1 建立模型我们根据选定的变量,建立了以下多元回归模型:Y = β0 + β1X1 + β2X2 + β3X3 + ε3.2 参数估计使用Eviews软件,我们对模型中的参数进行了估计。

具体估计结果如下:- β0的估计值为a- β1的估计值为b1- β2的估计值为b2- β3的估计值为b34. 模型拟合和统计检验4.1 拟合优度为了评估模型的拟合优度,我们计算了决定系数R^2。

结果显示,模型拟合效果良好,并能解释自变量对因变量的变异程度。

4.2 统计检验我们进行了一系列统计检验,包括回归系数的显著性检验、F 检验和残差分析等。

结果显示,模型的回归系数显著,并且F检验的p值足够小,支持多元回归模型的有效性。

5. 模型解释和预测5.1 模型解释我们分析了模型中每个自变量的系数和显著性水平,解释了它们对因变量的影响。

根据模型结果,可以得出每个自变量对因变量的贡献程度。

5.2 模型预测基于建立的多元回归模型,我们可以进行因变量的预测。

根据给定的自变量取值,我们可以通过模型预测出相应的因变量值。

6. 结论通过Eviews软件进行多元回归模型的案例分析,我们得出了一些结论。

多元回归模型在解释因变量和自变量之间关系方面具有一定的效果,并且可以用于因变量的预测。

然而,我们需要注意模型的限制和假设,并且在实际应用中进行进一步的验证和调整。

以上是对Eviews多元回归模型案例分析的简要介绍。

如有更详细的需求或其他问题,请随时联系。

多元线性回归实例分析报告

多元线性回归实例分析报告

SP SS--回归-多元线性回归模型案例解析!( 一)多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为:Y = 00 十 十 E毫无疑问,多元线性回归方程应该为:上图中的x1, x2, xp 分别代表“自变量” Xp 截止,代表有P 个自变量,如果有“ N 组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示:记n 俎样本分别是(兀那么,多元线性回归方程矩阵形式为:'"" + £1的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样)2:无偏性假设,即指:期望值为 3:同共方差性假设,即指,所有的4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。

今天跟大家一起讨论一下, SPSS---多元线性回归的具体操作过程, 下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。

通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。

数据如下图所示:V = B Q +02] +角工2 + -…+y =>'2*a A1X"1儿丿,0 二卩\■■■ ■丿 /鞋丿其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释1服成正太分布,即指:随机误差必须是服成正太分别的随机变量。

随机误差变量方差都相等“分析”一一回归一一线性一一进入如下图所示的界面:1 salesnesaletyp&priceengiriE 」horse pow , wheelbaswidth ] length1S.919' 16 360 0 21.500!1.8140 101.2 67.3 172.4 39 364 19S75 0 2B4003 2225 108 1 70 3 192 3 14.114 18225 0 - 3.2 225 106.9 70.5 192.0 8 588 29 725 0 42 000 3-S' 210 114 6 71 4 1966 20 397 2225S 0 33.990 1.8 150 1O2?6 63 2 178.0 1378023i'S5'5 033 9&0 28 200 108 7 76 1 192 O' 138039 00062 000 第 310 113 0 74 Q 1982 19 747 -0 26.9902.5 170 107.3 63.4 1176.01 9_231 2Se75 0 33 400 I2.8133 107 3 63 5 17'6 O' 17.537 3& 13S 0| 3S.900 ; 2-8 1931114 70.9 188.0 91 561 12-475 0 21 9751 ! 31 175 1i0'9 0 72 7194.6 39.3£0 13.740 0 25.300 , 3.3 240 109 0 72 7 196^2 27 861 20 190' 0 31.965j : 3.3 205 1138 747 206.8 S326Z 13 360'0 27 635 1 30 205 1122 73 5 200 0 63.72&22525 0 39.E95 ; 壮 275 115.3 74.5 2072 15 94327 100' O '44-475 1 46 275 112 2 75 0 201 0 e.53G 25725 0 39.G&5 , 4.6 275 108.0 75 S 200.G 11 IBS IS 2250 31 CIO i30 2C0 107 4 70 3 194呂 14.785 - 1 46.225;! 5 7 355 117.5 77.0 201.2 US. 519' 9.250' 0 13 2S0 2.2, 115 104.1 67 9 ieo'9 135 12611 22516 6351 ; 3 1 170 107 0 69 4 1904 24.62& 10.3110'0| 1S.S90 1 3.1 175 110I7.& 72 S200.9 42 593 11 525O '19 390134180110 572 7197 9curt点击蛆厂逛[manuracl]Mod si [mo'del I 炉新车售价(单位=... 茨拜肯二手车售价… £| Vehicle 射pg [typ 鬪 捞'Price in thousand... 炉 Engine size [engi... 袴 Horsep'OW'erlhor... 夕'jVlieelba3€ |whe…, 拧车宽[WFdlhl 務军衽[lergtA] 少车净垂[curb.wgt] 少 Fuel capacity 拐耗油量辺硏Inpgj @ Cooks Dfstance [... 少 95铀 LCI forinsa... 撐95«i4UCliforInsa...LCI kr Insa...将“销售量”作为“因变量”拖入因变量框内,将“车长,车宽,耗油率,车净重等个自变量 拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可 以选择其它的方式,如果你选择“进入”默认的方式,在分析结果中,将会得到如下图所示 的结果:(所有的自变量,都会强行进入)輸入/窿去的吏量h移去的娈量左法 1油量迎册, 车稳 Price in tnoLJsands,Vehicle type, 车毘Engine size, Fuel capacity, Wheelbase, 军淨重, Horsepower输入a. 已输入斯肓诸號的吏量•b. 因变呈:Log-transformecJ sales如果你选择“逐步”这个方法,将会得到如下图所示的结果:(将会根据预先设定的“ 计量的概率值进行筛选,最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切,J [,牯贴£川重置迟)]〔取消j [ M Ja 篷择变>(E >:! J一个对签Q* I 护 Pneo 需thousands [price]VVLS 权重®:10块1的1 ijj Veliicleb'peltyipeJPrice inthodsandslprice] $ Engine siz&Iergine^s]贡献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条件的概率值必须小于,当概率值大于等于时将会被剔除)“选择变量(E)"框内,我并没有输入数据,如果你需要对某个“自变量”进行条件筛选, 可以将那个自变量,移入“选择变量框”内,有一个前提就是:该变量从未在另一个目标列表中出现!,再点击“规则”设定相应的“筛选条件”即可,如下图所示:定义琏弃规则sales 値W:....... k.i. J .產壬一二不等于小于小于等于丸于大于等于thousands h点击“统计量”弹出如下所示的框,如下所示:□ Ddrbin*Watson(U) n 个就诊断©在“回归系数”下面勾选“估计,在右侧勾选” 模型拟合度“和”共线性诊断“两个选项, 再勾选“个案诊断”再点击“离群值”一般默认值为“3”,(设定异常值的依据,只有当残差超过3倍标准差的观测才会被当做异常值) 点击继续。

多元线性回归分析案例

多元线性回归分析案例

多元线性回归分析案例多元线性回归分析是统计学中常用的一种分析方法,它可以用来研究多个自变量对因变量的影响,并建立相应的数学模型。

在实际应用中,多元线性回归分析可以帮助我们理解变量之间的关系,预测未来的趋势,以及制定相应的决策。

本文将通过一个实际案例来介绍多元线性回归分析的基本原理和应用方法。

案例背景。

假设我们是一家电子产品制造公司的市场营销团队,我们想要了解产品销量与广告投入、产品定价和市场规模之间的关系。

我们收集了过去一年的数据,包括每个月的产品销量(千台)、广告投入(万元)、产品定价(元/台)和市场规模(亿人)。

数据分析。

首先,我们需要对数据进行描述性统计分析,以了解各变量的分布情况和相关性。

我们计算了产品销量、广告投入、产品定价和市场规模的均值、标准差、最大最小值等统计量,并绘制了相关性矩阵图。

通过分析发现,产品销量与广告投入、产品定价和市场规模之间存在一定的相关性,但具体的关系还需要通过多元线性回归分析来验证。

多元线性回归模型。

我们建立了如下的多元线性回归模型:\[Sales = \beta_0 + \beta_1 \times Advertising + \beta_2 \times Price + \beta_3 \times MarketSize + \varepsilon\]其中,Sales表示产品销量,Advertising表示广告投入,Price表示产品定价,MarketSize表示市场规模,\(\beta_0, \beta_1, \beta_2, \beta_3\)分别为回归系数,\(\varepsilon\)为误差项。

模型验证。

我们利用最小二乘法对模型进行参数估计,并进行了显著性检验和回归诊断。

结果表明,广告投入、产品定价和市场规模对产品销量的影响是显著的,模型的拟合效果较好。

同时,我们还对模型进行了预测能力的验证,结果表明模型对未来产品销量的预测具有一定的准确性。

决策建议。

—多元线性回归分析案例

—多元线性回归分析案例

—多元线性回归分析案例多元线性回归分析是一种广泛使用的统计分析方法,用于研究多个自变量对一个因变量的影响程度。

在实际应用中,多元线性回归可以帮助我们理解变量之间的相互关系,并预测因变量的数值。

下面我们将以一个实际案例来介绍多元线性回归分析的应用。

假设我们是一家电子产品制造商,我们想研究影响手机销量的因素,并尝试通过多元线性回归模型来预测手机的销量。

我们选择了三个自变量作为影响因素:广告投入、价格和市场份额。

我们收集了一段时间内的数据,包括这三个因素以及对应的手机销量。

现在我们将利用这些数据来进行多元线性回归分析。

首先,我们需要将数据进行预处理和清洗。

我们检查数据的完整性和准确性,并去除可能存在的异常值和缺失值。

然后,我们对数据进行描述性统计分析,以了解数据的整体情况和变量之间的关系。

接下来,我们将建立多元线性回归模型。

我们将销量作为因变量,而广告投入、价格和市场份额作为自变量。

通过引入这些自变量,我们可以预测手机销量,并分析它们对销量的影响程度。

为了进行回归分析,我们需要估计模型的系数。

这可以通过最小二乘法来实现,该方法将使得模型的预测结果与实际观测值之间的残差平方和最小化。

接下来,我们将进行统计检验,以确定自变量对因变量的显著影响。

常见的统计指标包括回归系数的显著性水平、t值和p值。

在我们的案例中,假设多元线性回归模型的方程为:销量=β0+β1×广告投入+β2×价格+β3×市场份额+ε。

其中,β0、β1、β2和β3为回归系数,ε为误差项。

完成回归分析后,我们可以进行模型的诊断和评估。

我们可以检查模型的残差是否呈正态分布,以及模型的拟合程度如何。

此外,我们还可以通过交叉验证等方法评估模型的准确性和可靠性。

最后,我们可以利用训练好的多元线性回归模型来进行预测。

通过输入新的广告投入、价格和市场份额的数值,我们可以预测手机的销量,并根据预测结果制定相应的市场策略。

综上所述,多元线性回归分析是一种强大的统计工具,可用于分析多个自变量对一个因变量的影响。

多元回归模型分析案例

多元回归模型分析案例

多元回归模型分析案例多元回归模型分析是一种重要的数据分析技术,它可用于解决一系列实际问题,如预测商品消费量、预测股票市场行情等。

本文将以一个简单的案例来说明如何利用多元回归模型来分析数据,以便发现有用的信息,并更好地了解因果关系。

假设一家商店想要预测它的销售额,并且想了解它的销售额与其他变量之间的关系。

接下来,我们以该商店的历史销售数据建立一个多元回归模型,预测未来销售额,并分析它与其他变量之间的关系。

首先,需要收集有关商店历史销售数据的所有信息,包括产品的价格、促销活动的有效性等。

然后,使用统计软件将这些数据分析成矩阵,并将这些变量作为自变量,而销售额作为因变量。

然后,使用多元线性回归的算法,对收集的数据进行分析和处理,并建立一个具有最佳拟合度的多元回归模型。

回归模型中,各变量之间的关系可以通过相关系数来衡量,其中正相关系数表示两个变量增大时,另一变量也会增大;反之,负相关系数表示两个变量增大时,另一变量则下降。

根据统计分析,可以得出每一个变量与销售额之间的相关性。

通过观察变量与销售额之间的关系,我们可以清楚地了解到每一个变量对销售额影响的程度,以及它们之间的因果关系。

此外,建立的多元回归模型还可用于预测未来的销售情况。

将未来的变量值带入模型,即可得出推测的未来销售额,方便商店更好地制定销售计划和预算。

当然,预测的准确程度取决于多元回归模型的准确性。

本文以一个简单的案例介绍了如何使用多元回归模型来分析数据,以更好地了解因果关系,以及用于预测未来销售情况。

多元回归模型分析是一种重要的数据分析技术,被广泛用于现实生活中的实际问题的解决。

但要记住,多元回归分析的结果仅供参考,最后的决策仍应根据实际情况,由实际决策者综合评估。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量经济学案例分析多元回归分析案例学院:数理学院班级:数学092班学号: *********姓名:***摘要:为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,用Eviews 软件对相关数据进行了多元回归分析,得出了相关结论关键词:多元回归分析 ,Evicews 软件, 中国人口自然增长; 一、 建立模型为了全面反映中国“人口自然增长率”的全貌,选择人口自然增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP ”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。

国名总收入,居民消费价格指数增长率,人均GDP 作为解释变量暂不考虑文化程度及人口分布的影响。

通过对表1的数据进行分析,建立模型。

其模型表达式为:i i i i i u X X X Y ++++=332211ββββ (i=1,2,,3)其中Y 表示人口自然增长率,X 1 表示国名总收入,X 2表示居民消费价格指数增长率,X 3表示人均GDP ,根据以往经验和对调查资料的初步分析可知,Y 与X 1,X 2 ,X3呈线性关系,因此建立上述三元线性总体回归模型。

Xi 则表示各解释变量对税收增长的贡献。

µi 表示随机误差项。

通过上式,我们可以了解到,每个解释变量增长1亿元,粮食总产值会如何变化,从而进行财政收入预测。

相关数据: 表1年份人口自然增长率(%。

)Y 国民总收入(亿元)X1居民消费价格指数增长率(CPI )%X2 人均GDP(元)X31988 15.7315037 18.8 1366 1989 15.04 17001 18 1519 1990 14.39 18718 3.1 1644 1991 12.98 21826 3.4 1893 1992 11.6 26937 6.4 2311 1993 11.45 35260 14.7 2998 1994 11.21 48108 24.1 4044 1995 10.55 59811 17.1 5046 1996 10.42 70142 8.3 5846 1997 10.06 78061 2.8 6420 1998 9.14 83024 -0.8 6796 1999 8.18 88479 -1.4 7159 2000 7.58 98000 0.4 7858 2001 6.95 108068 0.7 8622 2002 6.45 119096 -0.8 9398 2003 6.01 135174 1.2 10542 2004 5.87 159587 3.9 12336 2005 5.89 184089 1.8 14040 2006 5.38 213132 1.5 16024 2007 5.24 235367 1.7 17535 20085.452776541.919264二、 参数估计利用上表中的数据,运用eview 软件,采用最小二乘法,对表中的数据进行线性回归,对所建模型进行估计,估计结果见下图。

从估计结果可得模型:321005881.0050364.0000392.077177.15ˆX X X Y -++= Y 关于X 1的散点图:可以看出Y 和X 1成线性相关关系Y 关于X 2的散点图:可以看出Y 和X 2成线性相关关系Y关于X的散点图:3成线性相关关系可以看出Y和X3回归结果三、模型检验:1、经济意义检验模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000392%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长 1%,人口增长率增长0.050364%;在假定其它变量不变的情况下,当年人均GDP 没增加一元,人口增长率就会降低0.005881%。

这与理论分析和经验判断相一致。

2、统计检验 (1)、拟合优度检验由于 2TSS Y Y nY '=-, 2ESS X Y nY β∧''=- 所以 2ESS R TSS ==0.941625, 2211(1)1n R R n k -=----=0.930680,可见模型在整体上拟合得非常好。

(2)、F 检验由于 RSS TSS ESS =- 所以 //(1)ESS kF RSS n k =--=86.02977 ,针对0:3210===βββH ,给定显著性水平0.05α=,在F 分布表中查出自由度为k-1=3和n-k-1=16的临界值24.3)16,3(=αF 。

由表 3.4中得到F=86.02977 ,由于F=86.02977 >24.3)16,3(=αF 应拒绝原假设0:3210===βββH ,说明回归方程显著,即“国民总收入”、“居民消费价格指数增长率”、“人均GDP ”等变量联合起来确实对“人口自然增长率”有显著影响。

(3)、t 检验由于=--=--=∑112;2k n e k n e e i σ 0.780038 且=0β S 0.830371,=1β S 8.89415E-05 ,=2β S 0.03196669,=3β S 0.00121009 , 当0010:0,:0H H ββ=≠, ==00βββS t 18.99364在0.05α=时, 2αt (16)=2.120因为t=18.99364>2.120,所以在95%的置信度下拒绝原假设,说明截距项对回归方程影响显著。

当0111:0,:0H H ββ=≠==1011βββS t 4.407392在0.05α=时,2αt (16)=2.120因为t=4.407392>2.120所以在95%的置信度下拒绝原假设,说明X1变量对Y 影响显著。

当0212:0,:0H H ββ=≠==222βββS t 1.575515在0.05α=时,2αt (16)=2.120因为t=1.575515<2.120,所以在95%的置信度下接受原假设,说明X2变量对Y 影响不显著。

当0313:0,:0H H ββ=≠ ==333βββS t - 4.859971在0.05α=时,2αt (16)=2.120因为t=- 4.859971<2.120,所以在95%的置信度下接受原假设,说明X3变量对Y 影响不显著。

(4)、012345,,,,,ββββββ的置信区间0β的置信区间为:0220000t St S ααβββββ∧∧∧∧-<<+,计算得:∈0β(14.01138,17.53216);1β的置信区间为:1221111t S t S ααβββββ∧∧∧∧-<<+,计算得:∈1β(0.000203,0.000581);2β的置信区间为:2222222t S t S ααβββββ∧∧∧∧-<<+,计算得: ∈2β(-0.01741,0.118133);3β的置信区间为:3223333t St S ααβββββ∧∧∧∧-<<+,计算得:; ∈3β(-0.00845,-0.00332)综上所述,模型通过各种检验,符合要求。

四、方差分析(新增解释变量对被解释变量边际贡献显著性的分析) 引入不同解释变量的ESS,RSS,2R首先做Y 对1X 的回归,得到样本回归方程为=Y13.65401-0.00004571X (24.45422) (-9.131990)1ESS =175.8443, =1RSS 37.95517,21R =0.822473;由t 检验可知,1X 对Y 有显著影响。

21R =0.822473表明,对于各种人口自然增长率Y 来说,国民总收入(亿元)1X 只解释了Y 的总离差的82%,还有18%没有解释。

引入第二个解释变量2X 后,样本回归方程为:ˆY =-12.55023-0.00003991X +0.0925042X 12ESS =182.8952, =12RSS 30.90454,212R =0.855451;新引入2X 的方差分析表变差来源 平方和自由度 F 统计量 对1X 回归 1ESS =175.8443 1 对1X 和2X 回归 12ESS =182.8952 2对1X 和2X 回归,2X 新增的部分对1X 和2X 回归的残差12ESS -1ESS =7.05095823RSS =974550.4120-3=17F=50.30362对于给定的显著性水平α=0.05,查F 分布表可得临界值0.05(1,17) 4.45F =,由于F=50.30362>4.45,所以新引入的解释变量2X 是显著的,2X 的引入可以显著的提高对Y 的解释程度,即2X 的边际贡献较大,因此2R 从0.822473提高到0.855451,RSS 从=37.95517降低到30.90454 再引入第三个解释变量3X :ˆY =15.77177+0.0003921X +0.0503642X -0.0058813X 123ESS =201.3198, =123RSS 12.48060,2123R =0.941625;新引入3X 的方差分析表查F 分布表可得临界值0.05(1,16)F =4.49,F=86.02977>4.49,所以新引入的解释变量3X 显著,即3X 的边际贡献较大,因此2R 从0.855451提高到0.941625,RSS 从30.90454下降到12.48060,因此应该引入3X 。

只引入一个解释变量1X ,2X 或3X ;引入两个解释变量1X 和2X ,1X 和3X 或2X 和3X ;以及引入三个变量1X 2X 3X 的ESS,RSS 和2R 的结果如表引入不同解释变量时的ESS ,RSS ,2R由Eviews 可得,只引入一个解释变量1X ,2X ,3X 时的F 统计量分别为1F =83.39325,2F =12.40147,3F =96.53269,由1F ,2F 和3F 都大于临界值0.05(1,18) 4.41F =,所以如果单独用2X ,3X 或4X 作解释变量都显著,如果引入两个解释变量,显然引入1X ,3X 的结果最好,如果引入三个解释变量1X 2X 3X 无论最后引入哪个解释变量结果都显著,因此最后确定引入三个解释变量,相应的回顾方程为 :ˆY =15.77177+0.0003921X +0.0503642X -0.0058813X 2R =0.941625 2R =0.930680模型预测设2009年国民总收入为295267亿元,居民消费价格指数增长率为2.1%,人均GDP 为21427元,将值代入样本回归方程,得到1998年的各项税收总量预测值的点估计值1998ˆY : =2009Y15.77177+0.000392*295267+0.050364*0.021-0.005881*21427(亿元),实际人口自然增长率为5.51%。

相关文档
最新文档