多元线性回归模型案例分析

合集下载

多元线性回归实例分析

多元线性回归实例分析

SPSS--回归-多元线性回归模型案例解析!(一)多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为:毫无疑问,多元线性回归方程应该为:上图中的 x1, x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示:那么,多元线性回归方程矩阵形式为:其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样)1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。

2:无偏性假设,即指:期望值为03:同共方差性假设,即指,所有的随机误差变量方差都相等4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。

今天跟大家一起讨论一下,SPSS---多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。

通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。

数据如下图所示:点击“分析”——回归——线性——进入如下图所示的界面:将“销售量”作为“因变量”拖入因变量框内,将“车长,车宽,耗油率,车净重等10个自变量拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可以选择其它的方式,如果你选择“进入”默认的方式,在分析结果中,将会得到如下图所示的结果:(所有的自变量,都会强行进入)如果你选择“逐步”这个方法,将会得到如下图所示的结果:(将会根据预先设定的“F统计量的概率值进行筛选,最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切,贡献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条件的概率值必须小于0.05,当概率值大于等于0.1时将会被剔除)“选择变量(E)" 框内,我并没有输入数据,如果你需要对某个“自变量”进行条件筛选,可以将那个自变量,移入“选择变量框”内,有一个前提就是:该变量从未在另一个目标列表中出现!,再点击“规则”设定相应的“筛选条件”即可,如下图所示:点击“统计量”弹出如下所示的框,如下所示:在“回归系数”下面勾选“估计,在右侧勾选”模型拟合度“ 和”共线性诊断“ 两个选项,再勾选“个案诊断”再点击“离群值”一般默认值为“3”,(设定异常值的依据,只有当残差超过3倍标准差的观测才会被当做异常值)点击继续。

多元线性回归分析的实例研究

多元线性回归分析的实例研究

多元线性回归分析的实例研究多元线性回归是一种经典的统计方法,用于研究多个自变量对一个因变量的影响关系。

在实际应用中,多元线性回归分析可以帮助我们理解多个因素对一些现象的综合影响,并通过构建模型来进行预测和决策。

本文将以一个假想的房价分析为例,详细介绍多元线性回归分析的步骤、数据解释以及结果分析。

假设我们想要研究一个城市的房价与面积、房龄和地理位置之间的关系。

我们收集了100个房源的数据,包括房价(因变量)、面积(自变量1)、房龄(自变量2)和地理位置(自变量3)。

下面是我们的数据:序号,房价(万元),面积(平方米),房龄(年),地理位置(距市中心距离,公里)----,------------,--------------,----------,--------------------------------1,150,120,5,22,200,150,8,63,100,80,2,104,180,130,10,55,220,160,12,3...,...,...,...,...100,250,180,15,1首先,我们需要对数据进行描述性统计分析。

通过计算平均值、标准差、最小值、最大值等统计量,可以初步了解数据的分布和变异程度。

然后,我们需要进行回归模型的拟合。

回归模型可以表示为:房价=β0+β1*面积+β2*房龄+β3*地理位置+ε其中,β0、β1、β2、β3是待估计的回归系数,ε是模型的误差项。

回归系数表示自变量对因变量的影响大小和方向。

为了估计回归系数,我们可以使用最小二乘法。

最小二乘法通过找到一组回归系数,使得实际观测值与模型预测值之间的平方误差最小化。

在本例中,我们可以使用统计软件进行回归模型的拟合和参数估计。

假设我们得到的回归模型如下:房价=100+1.5*面积-5*房龄+10*地理位置接着,我们需要对回归模型进行评价和解释。

首先,我们可以计算回归模型的决定系数(R^2),它表示因变量的变异中能够被模型解释的比例。

多元线性回归模型案例(DOC)

多元线性回归模型案例(DOC)

多元线性回归模型案例分析——中国人口自然增长分析一·研究目的要求中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。

此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。

影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。

(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。

二·模型设定为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。

暂不考虑文化程度及人口分布的影响。

从《中国统计年鉴》收集到以下数据(见表1):表1 中国人口增长率及相关数据设定的线性回归模型为:1222334t t t t t Y X X X u ββββ=++++三、估计参数利用EViews 估计模型的参数,方法是:1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对话框“Workfile Range ”。

在“Workfile frequency ”中选择“Annual ” (年度),并在“Start date ”中输入开始时间“1988”,在“end date ”中输入最后时间“2005”,点击“ok ”,出现“Workfile UNTITLED ”工作框。

其中已有变量:“c ”—截距项 “resid ”—剩余项。

《2024年多元线性回归分析的实例研究》范文

《2024年多元线性回归分析的实例研究》范文

《多元线性回归分析的实例研究》篇一一、引言多元线性回归分析是一种统计学方法,用于探究一个因变量与多个自变量之间的关系。

这种方法在各个领域的研究中广泛应用,如经济学、社会学、心理学等。

本文将通过一个具体的实例,展示多元线性回归分析的应用过程及其实证结果。

二、研究背景与目的本研究以某地区房价为研究对象,探讨房价与地理位置、房屋面积、房屋装修等因素之间的关系。

目的是通过多元线性回归分析,找出影响房价的主要因素,为房地产投资者和购房者提供参考依据。

三、数据收集与处理本研究采用某地区房地产交易数据,包括房价、地理位置、房屋面积、房屋装修等变量。

在数据收集过程中,我们确保数据的准确性和完整性,并对数据进行清洗和处理,以消除异常值和缺失值的影响。

四、多元线性回归分析(一)模型构建根据研究目的和收集的数据,构建多元线性回归模型。

假设房价为因变量Y,地理位置、房屋面积、房屋装修等因素为自变量X1、X2、X3。

则模型可以表示为:Y = β0 + β1X1 + β2X2 +β3X3 + ε。

其中,β0为常数项,β1、β2、β3为回归系数,ε为随机误差项。

(二)参数估计与假设检验利用统计软件对模型进行参数估计,得到各回归系数的估计值及其显著性水平。

通过假设检验,检验自变量与因变量之间的线性关系是否显著。

若显著性水平低于预设的阈值(如0.05),则认为自变量与因变量之间存在显著的线性关系。

(三)模型检验与优化对模型进行检验和优化,包括检查模型的拟合优度、自相关性和异方差性等。

若存在显著问题,则采取相应的方法进行修正和优化。

五、实证结果与分析(一)回归系数解释根据参数估计结果,得出各回归系数的估计值。

解释各系数在模型中的意义和作用,如地理位置对房价的影响程度、房屋面积对房价的影响程度等。

(二)实证结果分析根据实证结果,分析自变量与因变量之间的关系及影响程度。

通过对比各回归系数的估计值和显著性水平,找出影响房价的主要因素。

同时,结合实际情况,对实证结果进行深入分析和解释。

多元线性回归模型案例

多元线性回归模型案例

多元线性回归模型案例多元线性回归是统计学中常用的一种回归分析方法,它可以用来研究多个自变量与因变量之间的关系。

在实际应用中,多元线性回归模型可以帮助我们理解不同自变量对因变量的影响程度,从而进行预测和决策。

下面,我们将通过一个实际案例来介绍多元线性回归模型的应用。

案例背景:某电商公司希望了解其产品销售额与广告投入、季节因素和竞争对手销售额之间的关系,以便更好地制定营销策略和预测销售额。

数据收集:为了分析这一问题,我们收集了一段时间内的产品销售额、广告投入、季节因素和竞争对手销售额的数据。

这些数据将作为我们多元线性回归模型的输入变量。

模型建立:我们将建立一个多元线性回归模型,以产品销售额作为因变量,广告投入、季节因素和竞争对手销售额作为自变量。

通过对数据进行拟合和参数估计,我们可以得到一个多元线性回归方程,从而揭示不同自变量对产品销售额的影响。

模型分析:通过对模型的分析,我们可以得出以下结论:1. 广告投入对产品销售额有显著影响,广告投入越大,产品销售额越高。

2. 季节因素也对产品销售额有一定影响,不同季节的销售额存在差异。

3. 竞争对手销售额对产品销售额也有一定影响,竞争对手销售额越大,产品销售额越低。

模型预测:基于建立的多元线性回归模型,我们可以进行产品销售额的预测。

通过输入不同的广告投入、季节因素和竞争对手销售额,我们可以预测出相应的产品销售额,从而为公司的营销决策提供参考。

结论:通过以上分析,我们可以得出多元线性回归模型在分析产品销售额与广告投入、季节因素和竞争对手销售额之间关系时的应用。

这种模型不仅可以帮助我们理解不同因素对产品销售额的影响,还可以进行销售额的预测,为公司的决策提供支持。

总结:多元线性回归模型在实际应用中具有重要意义,它可以帮助我们理解复杂的变量关系,并进行有效的预测和决策。

在使用多元线性回归模型时,我们需要注意数据的选择和模型的建立,以确保模型的准确性和可靠性。

通过以上案例,我们对多元线性回归模型的应用有了更深入的理解,希望这对您有所帮助。

多元线性回归分析案例

多元线性回归分析案例

多元线性回归分析案例1. 引言多元线性回归分析是一种用于探究多个自变量与一个连续型因变量之间关系的统计分析方法。

本文将以一个虚构的案例来介绍多元线性回归分析的应用。

2. 背景假设我们是一家电子产品制造公司,我们想了解哪些因素会对产品销售额产生影响。

为了解决这个问题,我们收集了一些数据,包括产品的价格、广告费用、竞争对手的产品价格和销售额。

3. 数据收集我们采集了100个不同产品的数据,其中包括以下变量:- 产品价格(自变量1)- 广告费用(自变量2)- 竞争对手的产品价格(自变量3)- 销售额(因变量)4. 数据分析为了进行多元线性回归分析,我们首先需要对数据进行预处理。

我们检查了数据的缺失情况和异常值,并进行了相应的处理。

接下来,我们使用多元线性回归模型来分析数据。

模型的方程可以表示为:销售额= β0 + β1 × 产品价格+ β2 × 广告费用+ β3 × 竞争对手的产品价格+ ε其中,β0、β1、β2、β3是回归系数,ε是误差项。

5. 结果解释我们使用统计软件进行回归分析,并得到了以下结果:- 回归系数的估计值:β0 = 1000, β1 = 10, β2 = 20, β3 = -5- 拟合优度:R² = 0.8根据回归系数的估计值,我们可以解释模型的结果:- β0表示当产品价格、广告费用和竞争对手的产品价格都为0时,销售额的估计值为1000。

- β1表示产品价格每增加1单位,销售额平均增加10单位。

- β2表示广告费用每增加1单位,销售额平均增加20单位。

- β3表示竞争对手的产品价格每增加1单位,销售额平均减少5单位。

拟合优度R²的值为0.8,说明模型可以解释销售额的80%变异程度。

这意味着模型对数据的拟合程度较好。

6. 结论根据我们的多元线性回归分析结果,我们可以得出以下结论:- 产品价格、广告费用和竞争对手的产品价格对销售额有显著影响。

《2024年多元线性回归分析的实例研究》范文

《2024年多元线性回归分析的实例研究》范文

《多元线性回归分析的实例研究》篇一一、引言多元线性回归分析是一种统计方法,用于研究多个变量之间的线性关系。

在实际生活和科研工作中,这种分析方法广泛应用于经济、医学、生态学等领域。

本文以一个具体实例为例,深入探讨多元线性回归分析的步骤和应用。

该实例关注于房屋价格的影响因素分析。

二、研究背景及目的随着房地产市场的发展,房屋价格受到多种因素的影响。

为了探究这些因素如何共同影响房屋价格,本文选取了一组具有代表性的房屋数据,并运用多元线性回归分析方法进行实证研究。

研究目的在于揭示影响房屋价格的主要因素,为购房者和房地产投资者提供参考依据。

三、数据与方法(一)数据来源本研究的数据来源于某城市房屋交易数据库,涵盖了多个区域的房屋信息,包括房屋价格、房屋面积、房屋年龄、周边环境、学区等因素。

(二)研究方法本研究采用多元线性回归分析方法,通过建立模型来研究各因素与房屋价格之间的线性关系。

具体步骤包括:数据清洗、变量选择、模型建立、模型检验和结果解释等。

四、多元线性回归分析步骤及结果(一)变量选择与数据清洗根据研究目的和前人研究成果,本研究选择了以下变量:房屋价格(因变量)、房屋面积、房屋年龄、周边环境(包括交通、商业、绿化等)、学区等(自变量)。

在数据清洗阶段,剔除了异常值和缺失值,确保数据的准确性和可靠性。

(二)模型建立根据选定的变量,建立多元线性回归模型。

模型形式如下:P = β0 + β1 × Area + β2 × Age + β3 × Environment + β4 × Schoo l + ε其中,P表示房屋价格,Area表示房屋面积,Age表示房屋年龄,Environment表示周边环境因素,School表示学区因素,βi 为各变量的回归系数,ε为随机误差项。

(三)模型检验通过SPSS软件进行模型检验。

首先进行多重共线性检验,发现各变量之间不存在明显的共线性问题。

多元线性回归实例分析报告

多元线性回归实例分析报告

SP SS--回归-多元线性回归模型案例解析!( 一)多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为:Y = 00 十 十 E毫无疑问,多元线性回归方程应该为:上图中的x1, x2, xp 分别代表“自变量” Xp 截止,代表有P 个自变量,如果有“ N 组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示:记n 俎样本分别是(兀那么,多元线性回归方程矩阵形式为:'"" + £1的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样)2:无偏性假设,即指:期望值为 3:同共方差性假设,即指,所有的4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。

今天跟大家一起讨论一下, SPSS---多元线性回归的具体操作过程, 下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。

通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。

数据如下图所示:V = B Q +02] +角工2 + -…+y =>'2*a A1X"1儿丿,0 二卩\■■■ ■丿 /鞋丿其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释1服成正太分布,即指:随机误差必须是服成正太分别的随机变量。

随机误差变量方差都相等“分析”一一回归一一线性一一进入如下图所示的界面:1 salesnesaletyp&priceengiriE 」horse pow , wheelbaswidth ] length1S.919' 16 360 0 21.500!1.8140 101.2 67.3 172.4 39 364 19S75 0 2B4003 2225 108 1 70 3 192 3 14.114 18225 0 - 3.2 225 106.9 70.5 192.0 8 588 29 725 0 42 000 3-S' 210 114 6 71 4 1966 20 397 2225S 0 33.990 1.8 150 1O2?6 63 2 178.0 1378023i'S5'5 033 9&0 28 200 108 7 76 1 192 O' 138039 00062 000 第 310 113 0 74 Q 1982 19 747 -0 26.9902.5 170 107.3 63.4 1176.01 9_231 2Se75 0 33 400 I2.8133 107 3 63 5 17'6 O' 17.537 3& 13S 0| 3S.900 ; 2-8 1931114 70.9 188.0 91 561 12-475 0 21 9751 ! 31 175 1i0'9 0 72 7194.6 39.3£0 13.740 0 25.300 , 3.3 240 109 0 72 7 196^2 27 861 20 190' 0 31.965j : 3.3 205 1138 747 206.8 S326Z 13 360'0 27 635 1 30 205 1122 73 5 200 0 63.72&22525 0 39.E95 ; 壮 275 115.3 74.5 2072 15 94327 100' O '44-475 1 46 275 112 2 75 0 201 0 e.53G 25725 0 39.G&5 , 4.6 275 108.0 75 S 200.G 11 IBS IS 2250 31 CIO i30 2C0 107 4 70 3 194呂 14.785 - 1 46.225;! 5 7 355 117.5 77.0 201.2 US. 519' 9.250' 0 13 2S0 2.2, 115 104.1 67 9 ieo'9 135 12611 22516 6351 ; 3 1 170 107 0 69 4 1904 24.62& 10.3110'0| 1S.S90 1 3.1 175 110I7.& 72 S200.9 42 593 11 525O '19 390134180110 572 7197 9curt点击蛆厂逛[manuracl]Mod si [mo'del I 炉新车售价(单位=... 茨拜肯二手车售价… £| Vehicle 射pg [typ 鬪 捞'Price in thousand... 炉 Engine size [engi... 袴 Horsep'OW'erlhor... 夕'jVlieelba3€ |whe…, 拧车宽[WFdlhl 務军衽[lergtA] 少车净垂[curb.wgt] 少 Fuel capacity 拐耗油量辺硏Inpgj @ Cooks Dfstance [... 少 95铀 LCI forinsa... 撐95«i4UCliforInsa...LCI kr Insa...将“销售量”作为“因变量”拖入因变量框内,将“车长,车宽,耗油率,车净重等个自变量 拖入自变量框内,如上图所示,在“方法”旁边,选择“逐步”,当然,你也可 以选择其它的方式,如果你选择“进入”默认的方式,在分析结果中,将会得到如下图所示 的结果:(所有的自变量,都会强行进入)輸入/窿去的吏量h移去的娈量左法 1油量迎册, 车稳 Price in tnoLJsands,Vehicle type, 车毘Engine size, Fuel capacity, Wheelbase, 军淨重, Horsepower输入a. 已输入斯肓诸號的吏量•b. 因变呈:Log-transformecJ sales如果你选择“逐步”这个方法,将会得到如下图所示的结果:(将会根据预先设定的“ 计量的概率值进行筛选,最先进入回归方程的“自变量”应该是跟“因变量”关系最为密切,J [,牯贴£川重置迟)]〔取消j [ M Ja 篷择变>(E >:! J一个对签Q* I 护 Pneo 需thousands [price]VVLS 权重®:10块1的1 ijj Veliicleb'peltyipeJPrice inthodsandslprice] $ Engine siz&Iergine^s]贡献最大的,如下图可以看出,车的价格和车轴跟因变量关系最为密切,符合判断条件的概率值必须小于,当概率值大于等于时将会被剔除)“选择变量(E)"框内,我并没有输入数据,如果你需要对某个“自变量”进行条件筛选, 可以将那个自变量,移入“选择变量框”内,有一个前提就是:该变量从未在另一个目标列表中出现!,再点击“规则”设定相应的“筛选条件”即可,如下图所示:定义琏弃规则sales 値W:....... k.i. J .產壬一二不等于小于小于等于丸于大于等于thousands h点击“统计量”弹出如下所示的框,如下所示:□ Ddrbin*Watson(U) n 个就诊断©在“回归系数”下面勾选“估计,在右侧勾选” 模型拟合度“和”共线性诊断“两个选项, 再勾选“个案诊断”再点击“离群值”一般默认值为“3”,(设定异常值的依据,只有当残差超过3倍标准差的观测才会被当做异常值) 点击继续。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元线性回归模型案例分析
——中国人口自然增长分析一·研究目的要求
中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的降到1980年,接近世代更替水平。

此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。

影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。

(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。

二·模型设定
为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。

暂不考虑文化程度及人口分布的影响。

从《中国统计年鉴》收集到以下数据(见表1):
表1 中国人口增长率及相关数据

设定的线性回归模型为:
1222334t t t t t Y X X X u ββββ=++++
三、估计参数
利用EViews 估计模型的参数,方法是:
1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对
话框“Workfile Range ”。

在“Workfile frequency ”中选择“Annual ” (年
年份 @
人口自然增长率
(%。


国民总收入
(亿元) 居民消费价格指数增长
率(CPI )%
人均GDP (元) 1988
15037 1366 1989 …
17001 18 1519 1990
18718 1644 1991 【
21826 1893 1992
26937 2311 1993 .
35260 2998 1994
48108 4044 1995 —
59811 5046 1996
70142 5846 1997 ~
78061 6420 1998
83024 6796 1999 【
88479 7159 2000
98000 7858 2001 [
108068 8622 2002
119096 9398 2003 :
135174 10542 2004
159587 12336 2005 、
184089 14040 2006
213132
16024
度),并在“Start date”中输入开始时间“1988”,在“end date”中输入最后时间“2005”,点击“ok”,出现“Workfile UNTITLED”工作框。

其中已有变量:“c”—截距项“resid”—剩余项。

在“Objects”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK”出现数据编辑窗口。

2、输入数据:点击“Quik”下拉菜单中的“Empty Group”,出现“Group”窗口数据编辑框,点第一列与“obs”对应的格,在命令栏输入“Y”,点下行键“↓”,即将该序列命名为Y,并依此输入Y的数据。

用同样方法在对应的列命名X2、X
3、X4,并输入相应的数据。

或者在EViews命令框直接键入“data Y 2X X3 X4…”,回车出现“Group”窗口数据编辑框,在对应的Y、X2、X3、X4下输入响应的数据。

3、估计参数:点击“Procs“下拉菜单中的“Make Equation”,在出现的对话框的“Equation Specification”栏中键入“Y C X2X3 X4”,在“Estimation Settings”栏中选择“Least Sqares”(最小二乘法),点“ok”,即出现回归结果:


根据表中数据,模型估计的结果为:
432005109.0047918.0000332.060851.15X X X Y t -++=Λ
t=
930526.02=R 915638.02
=R
F=
四、模型检验
1、经济意义检验
模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长 1%,人口增长率增长%;在假定其它变量不变的情况下,当年人均GDP 没增加一元,人口增长率就会降低%。

这与理论分析和经验判断相一致。

2、统计检验
:
(1)拟合优度:由表中数据可以得到:930526.02
=R ,修正的
可决系数为915638
.02
=R
,这说明模型对样本的拟合很好。

(2)F 检验:针对0234:0H βββ===,给定显著性水平0.05α=,在F 分布表中查出自由度为k-1=3和n-k=14的临界值34.3)14,3(=αF 。

由表中得到F= ,由于F= >(3,21) 3.075F α=,应拒绝原假设
0234:0H βββ===,说明回归方程显著,即“国民总收入”、“居民消
费价格指数增长率”、“人均GDP ”等变量联合起来确实对“人口自然增长率”有显著影响。

(3)t 检验:分别针对0H :0(1,2,3,4)j j β==,给定显著性水平0.05α=,
查t 分布表得自由度为n-k=14临界值145.2)(2/=-k n t α。

由表中数据可得,与^
1β、^
2β、^
3β、^
4β对应的t 统计量分别为、 、、
除^
3β,其绝对值均大于145.2)(2/=-k n t α,这说明分别都应当拒
绝0H :)4,2,1(0==j j β,也就是说,当在其它解释变量不变的情况下,
解释变量“国民总收入”、“人均GDP ”分别对被解释变量“人口自然增长率”Y 都有显著的影响。

^
3β的绝对值小于145.2)(2/=-k n t α,:这说明接受0H :03=β,
X3系数对t 检验不显著,这表明很可能存在多重共线性。

所以计算各解释变量的相关系数,选择X2、X3、X4数据,点”view/correlations ”得相关系数矩阵(如表):

.
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

五、消除多重共线性
采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y 对X2、X3、X4的一元回归,结果如表所示:

<
按2R 的大小排序为:X4、X2、X3
以X2为基础,顺次加入其他变量逐步回归。

首先加入X2回归结果为:
40005397.02000350.035540.16ˆX X Y -+=
t= 920622.02
=R
当取05.0=α时,131
.2)318(025
.0)(2
/=-=-t
t k n α,X2参数的t 检验显
著,加入X3回归得
4
32005109.0047918.0000332.060851.15X X X Y t -++=Λ
t=
930526.02=R 915638.02
=R
F=
当取05.0=α时, 145.2)418(2/=-αt ,X3参数的t 检验不显著,予以剔

即40005397.02000350.035540.16ˆX X Y -+=,这是最后消除多重共线性的结果。

在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长%;在假定其它变量不变的情况下,在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低%。

金服131 王亚平。

相关文档
最新文档