多元回归分析SPSS1

合集下载

SPSS—回归—多元线性回归结果分析

SPSS—回归—多元线性回归结果分析

SPSS—回归—多元线性回归结果分析(二),最近一直很忙,公司的潮起潮落,就好比人生的跌岩起伏,眼看着一步步走向衰弱,却无能为力,也许要学习“步步惊心”里面“四阿哥”的座右铭:“行到水穷处”,”坐看云起时“。

接着上一期的“多元线性回归解析”里面的内容,上一次,没有写结果分析,这次补上,结果分析如下所示:结果分析1:由于开始选择的是“逐步”法,逐步法是“向前”和“向后”的结合体,从结果可以看出,最先进入“线性回归模型”的是“price in thousands"建立了模型1,紧随其后的是“Wheelbase"建立了模型2,所以,模型中有此方法有个概率值,当小于等于0.05时,进入“线性回归模型”(最先进入模型的,相关性最强,关系最为密切)当大于等0.1时,从“线性模型中”剔除结果分析:1:从“模型汇总”中可以看出,有两个模型,(模型1和模型2)从R2 拟合优度来看,模型2的拟合优度明显比模型1要好一些(0.422>0.300)2:从“Anova"表中,可以看出“模型2”中的“回归平方和”为115.311,“残差平方和”为153.072,由于总平方和=回归平方和+残差平方和,由于残差平方和(即指随即误差,不可解释的误差)由于“回归平方和”跟“残差平方和”几乎接近,所有,此线性回归模型只解释了总平方和的一半,3:根据后面的“F统计量”的概率值为0.00,由于0.00<0.01,随着“自变量”的引入,其显著性概率值均远小于0.01,所以可以显著地拒绝总体回归系数为0的原假设,通过ANOVA方差分析表可以看出“销售量”与“价格”和“轴距”之间存在着线性关系,至于线性关系的强弱,需要进一步进行分析。

结果分析:1:从“已排除的变量”表中,可以看出:“模型2”中各变量的T检的概率值都大于“0.05”所以,不能够引入“线性回归模型”必须剔除。

从“系数a” 表中可以看出:1:多元线性回归方程应该为:销售量=-1.822-0.055*价格+0.061*轴距但是,由于常数项的sig为(0.116>0.1) 所以常数项不具备显著性,所以,我们再看后面的“标准系数”,在标准系数一列中,可以看到“常数项”没有数值,已经被剔除所以:标准化的回归方程为:销售量=-0.59*价格+0.356*轴距2:再看最后一列“共线性统计量”,其中“价格”和“轴距”两个容差和“vif都一样,而且VIF 都为1.012,且都小于5,所以两个自变量之间没有出现共线性,容忍度和膨胀因子是互为倒数关系,容忍度越小,膨胀因子越大,发生共线性的可能性也越大从“共线性诊断”表中可以看出:1:共线性诊断采用的是“特征值”的方式,特征值主要用来刻画自变量的方差,诊断自变量间是否存在较强多重共线性的另一种方法是利用主成分分析法,基本思想是:如果自变量间确实存在较强的相关关系,那么它们之间必然存在信息重叠,于是就可以从这些自变量中提取出既能反应自变量信息(方差),而且有相互独立的因素(成分)来,该方法主要从自变量间的相关系数矩阵出发,计算相关系数矩阵的特征值,得到相应的若干成分。

spss多元线性回归分析

spss多元线性回归分析

spss多元线性回归分析SPSS多元线性回归分析试验在科学研究中,我们会发现某些指标通常受到多个因素的影响,如血压值除了受年龄影响之外,还受到性别、体重、饮食习惯、吸烟情况等因素的影响,用方程定量描述一个因变量y与多个自变量x1、x2、x3.......之间的线性依存关系,称为多元线性回归。

有学者认为血清中低密度脂蛋白增高是引起动脉硬化的一个重要原因。

现测量30名怀疑患有动脉硬化的就诊患者的载脂蛋白A、载脂蛋白B、载脂蛋白E、载脂蛋白C、低密度脂蛋白中的胆固醇含量。

资料如下表所示。

求低密度脂蛋白中的胆固醇含量对载脂蛋白A、载脂蛋白B、载脂蛋白E、载脂蛋白C的线性回归方程。

表1 30名就诊患者资料表序号载脂蛋白A 载脂蛋白B载脂蛋白E载脂蛋白C低密度蛋白1 173 106 7.0 14.7 1372 139 132 6.4 17.8 1623 198 112 6.9 16.7 1344 118 138 7.1 15.7 1885 139 94 8.6 13.6 1386 175 160 12.1 20.3 2157 131 154 11.2 21.5 1718 158 141 9.7 29.6 1489 158 137 7.4 18.2 19710 132 151 7.5 17.2 11311 162 110 6.0 15.9 14512 144 113 10.1 42.8 8113 162 137 7.2 20.7 18514 169 129 8.5 16.7 15715 129 138 6.3 10.1 19716 166 148 11.5 33.4 15617 185 118 6.0 17.5 15618 155 121 6.1 20.4 15419 175 111 4.1 27.2 14420 136 110 9.4 26.0 9021 153 133 8.5 16.9 21522 110 149 9.5 24.7 18423 160 86 5.3 10.8 11824 112 123 8.0 16.6 12725 147 110 8.5 18.4 13726 204 122 6.1 21.0 12627 131 102 6.6 13.4 13028 170 127 8.4 24.7 13529 173 123 8.7 19.0 18830 132 131 13.8 29.2 122 spss数据处理步骤:(1)打开spss输入数据后,点击“分析”-“回归”-“线性”。

SPSS多元线性回归分析实例操作步骤

SPSS多元线性回归分析实例操作步骤

SPSS多元线性回归分析实例操作步骤在数据分析领域,多元线性回归分析是一种强大且常用的工具,它能够帮助我们理解多个自变量与一个因变量之间的线性关系。

接下来,我将为您详细介绍使用 SPSS 进行多元线性回归分析的具体操作步骤。

首先,准备好您的数据。

数据应该以特定的格式整理,通常包括自变量和因变量的列。

确保数据的准确性和完整性,因为这将直接影响分析结果的可靠性。

打开 SPSS 软件,在菜单栏中选择“文件”,然后点击“打开”,找到您存放数据的文件并导入。

在导入数据后,点击“分析”菜单,选择“回归”,再点击“线性”。

这将打开多元线性回归的对话框。

在“线性回归”对话框中,将您的因变量拖放到“因变量”框中,将自变量拖放到“自变量”框中。

接下来,点击“统计”按钮。

在“统计”对话框中,您可以选择一些常用的统计量。

例如,勾选“估计”可以得到回归系数的估计值;勾选“置信区间”可以得到回归系数的置信区间;勾选“模型拟合度”可以评估模型的拟合效果等。

根据您的具体需求选择合适的统计量,然后点击“继续”。

再点击“图”按钮。

在这里,您可以选择生成一些有助于直观理解回归结果的图形。

比如,勾选“正态概率图”可以检查残差的正态性;勾选“残差图”可以观察残差的分布情况等。

选择完毕后点击“继续”。

然后点击“保存”按钮。

您可以选择保存预测值、残差等变量,以便后续进一步分析。

完成上述设置后,点击“确定”按钮,SPSS 将开始进行多元线性回归分析,并输出结果。

结果通常包括多个部分。

首先是模型摘要,它提供了一些关于模型拟合度的指标,如 R 方、调整 R 方等。

R 方表示自变量能够解释因变量变异的比例,越接近 1 说明模型拟合效果越好。

其次是方差分析表,用于检验整个回归模型是否显著。

如果对应的p 值小于给定的显著性水平(通常为 005),则说明模型是显著的。

最重要的是系数表,它给出了每个自变量的回归系数、标准误差、t 值和 p 值。

回归系数表示自变量对因变量的影响程度,p 值用于判断该系数是否显著不为 0。

多元回归分析的精辟分析spss

多元回归分析的精辟分析spss

1、利用OLS(ordinary least squares)来做多元回归可能是社会学研究中最常用的统计分析方法。

利用此法的基本条件是应变项为一个分数型的变项(等距尺度测量的变项),而自变项之测量尺度则无特别的限制。

当自变项为类别变项时,我们可依类别数(k)建构k-1个数值为0与1之虚拟变项(dummy variable)来代表不同之类别。

因此,如果能适当的使用的话,多元回归分析是一相当有力的工具。

2、多元回归分析主要有三个步骤:5 G7 M5 K" T5 d z. p" I8 N─ 第一、利用单变项和双变项分析来检视各个准备纳入复回归分析的变项是否符合OLS线性回归分析的基本假定。

─ 选定回归模式,并评估所得到的参数估计和适合度检定(goodness of fit)。

2 L! ]2 Z3 o, A$ J* g─ 在我们认真考虑所得到的回归分析结果前,应做残余值(residuals)之诊断分析(diagnosis)。

但通常我们是先确定回归模式之设定(specification)是否恰当后,才会做深入之残余值分析。

3、回归分析的第一步是一一检视每个即将纳入回归分析模式的变项。

首先,我们必须先确定应变项有足够的变异(variability),而且是接近常态分配(回归系数的估计并不要求应变项是常态分配,但对此估计做假设测定时,则是要求残余值应为常态分配。

而应变项离开常态分配的状态很远时,残余值不是常态分配的可能性增大)。

其次,各自变项也应该有适当的变异,并且要了解其分配之形状和异常的个案(outlying cases;outliers)。

7 t% `+ K3 y2 Y9 P% o7 n1 ^-Y我们可用直方图(histogram)和Normal P-P(probability plot)图等来测定应变项是否拒绝其为常态分配的假设,以及是否有异常之个案。

同样的,我们可用直方图和其它单变项之统计来检视各个自变项之分配形状、程度,以及异常个案等。

运用SPSS做多元回归分析

运用SPSS做多元回归分析

结果二:方差分析表
• 表中显著度(Sig)<0.001,表明整个方程是显著的,也 就是说自变量与因变量之间具有显著的线性关系。 • 但这并不意味着每个自变量与因变量都具有显著的线性关 系,具体的结论还需要看后面对每个自变量的回归系数的 检验结果。
结果三:回归系数表
• 表中B栏的非标准化回归系数表明:
FOR EXAMPLE
一个变量的变化直接与另一组变量的变化有关:
人的体重与身高、胸围 血压值与年龄、性别、劳动强度、饮食习惯、吸烟 状况、家族史 糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总 胆固醇、甘油三脂
多元回归分析数据格式
编号 1 2 ┇ i ┇ n
X1
X 11
X2
X 12
┅ ┅ ┅ ┇ ┅ ┇ ┅
多元回归模型必须满足的假定条件
1. 2.
因变量是连续随机变量; 自变量是固定数值型变量,且相互独立;
3.
4. 5. 6.
每一个自变量与因变量呈线性关系;
每一个自变量与随机误差相互独立; 观察个体的随机误差之间相互独立; 残差是随机变量,均值为零。
不良贷款(亿元)各项贷款余额(亿元)本年累计应收贷款(亿元)贷款项目个数(个) 本年固定资产投资额(亿元) 0.9 67.3 6.8 5 51.9 1.1 111.3 19.8 16 90.9 4.8 173 7.7 17 73.7 3.2 80.8 7.2 10 14.5 7.8 199.7 16.5 19 63.2 12.5 185.4 27.1 18 43.8 1 96.1 1.7 10 55.9 2.6 72.8 9.1 14 64.3 0.3 64.2 2.1 11 42.7 4 132.2 11.2 23 76.7 0.8 58.6 6 14 22.8 3.5 174.6 12.7 26 117.1 10.2 263.5 15.6 34 146.7 0.2 14.8 0.6 2 42.1 0.4 73.5 5.9 11 25.3 1 24.7 5 4 13.4 6.8 139.4 7.2 28 64.3 11.6 368.2 16.8 32 163.9 1.6 95.7 3.8 10 44.5 1.2 109.6 10.3 14 67.9 7.2 196.2 15.8 16 39.7

spss多元线性回归分析

spss多元线性回归分析
量(independent variable,IV)

因变量:度量变量

自变量:度量变量(e.g., 收入)或非度量变量
(e.g.,职位)

建立统计关系(statistical relationship)
Total cost
=fixed cost + variable cost
Байду номын сангаас
No. Credit Card
自变量解释的变异=因变量总变异-SSE= 22-5.5=16.5
R方=自变量解释的变异/因变量总变异=16.5/22=0.75

回归方程:Y = b0 +b1 V1 +b2 V2 + ε


预测值 ෠ = 0.482 +0.63 V1+0.216 V2
对于第1个家庭:
෠ = 0.482 + 0.63*2 +0.216*14 = 4.76



回归方程: ෠ = 2.87 + 0.97 V1
对于第1个家庭:
෠ = 2.87 + 0.97*2 = 4.81

实际观测值 Y = 4
残差:4-4.81 = -0.81
残差平方:(-0.81)* (-0.81)= 0.66
SSE
残差平方和


R方:自变量解释了多少因变量的总变异

1 线性回归基本理论

2 多元线性回归的步骤

3 使用SPSS进行多元线性回归

4 回归值预测和残差分析

5 多重共线性分析

6 逐步回归

7 层次线性回归

使用spss进行多元回归分析

使用spss进行多元回归分析

使用spss进行多元回归分析在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。

可以建立因变量y与各自变量xj(j=1,2,3,…,n)之间的多元线性回归模型:其中:b0是回归常数;bk(k=1,2,3,…,n)是回归参数;e是随机误差。

多元回归在病虫预报中的应用实例:某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。

分级别数值列成表2-1。

预报量y:每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。

预报因子:x1诱蛾量0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;x2卵量0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;x3降水量0~10.0毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;x4雨日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。

表2-1数据保存在“DATA6-5.SAV”文件中。

1)准备分析数据在SPSS数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量,并输入数据。

再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量“x1”、“x2”、“x3”、“x4”和“y”,它们对应的分级数值可以在SPSS数据编辑窗口中通过计算产生。

或者打开已存在的数据文件“DATA6-5.SAV”。

2)启动线性回归过程单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图2-2所示的线性回归过程窗口。

图2-2 线性回归对话窗口3) 设置分析变量设置因变量:用鼠标选中左边变量列表中的“幼虫密度[y]”变量,然后点击“Dependent”栏左边的向右拉按钮,该变量就移到“Dependent”因变量显示栏里。

SPSS多元线性回归分析实例操作步骤

SPSS多元线性回归分析实例操作步骤

SPSS 统计剖析多元线性回归剖析办法操纵与剖析试验目标:引入1998~2008年上海市城市生齿密度.城市居平易近人均可安排收入.五年以上平均年贷款利率和衡宇空置率作为变量,来研讨上海房价的变动身分.试验变量:以年份.商品房平均售价(元/平方米).上海市城市生齿密度(人/平方公里).城市居平易近人均可安排收入(元).五年以上平均年贷款利率(%)和衡宇空置率(%)作为变量.试验办法:多元线性回归剖析法软件操纵进程:第一步:导入Excel数据文件1.open data document——open data——open;2. Opening excel data source——OK.第二步:1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents (自变量)选择城市生齿密度.城市居平易近人均可安排收入.五年以上平均年贷款利率.衡宇空置率;Method选择Stepwise.进入如下界面:2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson.Casewise diagnostics默认;接着选择Modelfit.Collinearity diagnotics;点击Continue.3.点击右侧Plots,选择*ZPRED(尺度化猜测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(尺度化残差图)中的Histogram.Normalprobability plot;点击Continue.4.点击右侧Save,勾选Predicted Vaniues(猜测值)和Residuals (残差)选项组中的Unstandardized;点击Continue.5.点击右侧Options,默认,点击Continue.6.返回主对话框,单击OK.输出成果剖析:该表显示模子最先引入变量城市生齿密度 (人/平方公里),第二个Variables Entered/Removed aModel Variables Entered Variables RemovedMethod1城市生齿密度 (人/平方公里). Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).2城市居平易近人均可安排收入(元). Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).a. Dependent Variable: 商品房平均售价(元/平方米)该表显示各模子的方差剖析成果.从表中可以看出,模子的F统计量的不雅察值为,概率p值为0.000,在明显性程度为0.05的情况下,可以以为:商品房平均售价(元/平方米)与城市生齿密度 (人/平方公里),和城市居平易近人均可安排收入(元)之间有线性关系.4.回归系数该图为回归尺度化残差的直方图,正态曲线也被显示在直方图上,用以断定尺度化残差是否呈正态散布.但是因为样本数只有11个,所以只能精确断定其呈正态散布.该图回归尺度化的正态P-P图,该图给出了不雅测值的残差散布与假设的正态散布的比较,由图可知尺度化残差散点散布接近直线,因而可断定尺度化残差呈正态散布.该图显示的是因变量与回归尺度化猜测值的散点图,个中DEPENDENT为x轴变量,*ZPRED为y轴变量.由图可见,两变量呈直线趋向.附件:原始数据:自变量散点图:由散点图可以看出,可进入剖析的变量为城市生齿密度.城市居平易近人均可安排收入.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元线性回归分析预测法多元线性回归分析预测法(Multi factor line regression method,多元线性回归分析法)[编辑]多元线性回归分析预测法概述在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。

而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。

例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。

这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。

多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。

当自变量与因变量之间存在线性关系时,称为多元线性回归分析。

[编辑]多元线性回归的计算模型[1]一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。

当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。

设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:其中,b0为常数项,为回归系数,b1为固定时,x1每增加一个单位对y的效应,即x1对y的偏回归系数;同理b2为固定时,x2每增加一个单位对y的效应,即,x2对y的偏回归系数,等等。

如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:其中,b0为常数项,为回归系数,b1为固定时,x2每增加一个单位对y的效应,即x2对y的偏回归系数,等等。

如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:y = b0 + b1x1 + b2x2 + e建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;(3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;(4)自变量应具有完整的统计数据,其预测值容易确定。

多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和()为最小的前提下,用最小二乘法求解参数。

以二线性回归模型为例,求解回归参数的标准方程组为解此方程可求得b0,b1,b2的数值。

亦可用下列矩阵法求得即[编辑]多元线性回归模型的检验[1]多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。

1、拟合程度的测定。

与一元线性回归中可决系数r2相对应,多元线性回归中也有多重可决系数r2,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,R2越大,回归方各对样本数据点拟合的程度越强,所有自变量与因变量的关系越密切。

计算公式为:其中,2.估计标准误差估计标准误差,即因变量y的实际值与回归方程求出的估计值之间的标准误差,估计标准误差越小,回归方程拟合程度越程。

其中,k为多元线性回归方程中的自变量的个数。

3.回归方程的显著性检验回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。

能常采用F检验,F统计量的计算公式为:根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值Fa,若F > F a,则回归方程具有显著意义,回归效果显著;F < Fa,则回归方程无显著意义,回归效果不显著。

4.回归系数的显著性检验在一元线性回归中,回归系数显著性检验(t检验)与回归方程的显著性检验(F检验)是等价的,但在多元线性回归中,这个等价不成立。

t检验是分别检验回归模型中各个回归系数是否具有显著性,以便使模型中只保留那些对因变量有显著影响的因素。

检验时先计算统计量ti;然后根据给定的显著水平a,自由度n-k-1查t分布表,得临界值ta或t a / 2,t > t− a或t a / 2,则回归系数b i与0有显著关异,反之,则与0无显著差异。

统计量t的计算公式为:其中,Cij是多元线性回归方程中求解回归系数矩阵的逆矩阵(x'x)− 1的主对角线上的第j个元素。

对二元线性回归而言,可用下列公式计算:其中,5.多重共线性判别若某个回归系数的t检验通不过,可能是这个系数相对应的自变量对因变量的影平不显著所致,此时,应从回归模型中剔除这个自变量,重新建立更为简单的回归模型或更换自变量。

也可能是自变量之间有共线性所致,此时应设法降低共线性的影响。

多重共线性是指在多元线性回归方程中,自变量之彰有较强的线性关系,这种关系若超过了因变量与自变量的线性关系,则回归模型的稳定性受到破坏,回归系数估计不准确。

需要指出的是,在多元回归模型中,多重共线性的难以避免的,只要多重共线性不太严重就行了。

判别多元线性回归方程是否存在严惩的多重共线性,可分别计算每两个自变量之间的可决系数r2,若r2 > R2或接近于R2,则应设法降低多重线性的影响。

亦可计算自变量间的相关系数矩阵的特征值的条件数k= λ1/ λp(λ1为最大特征值,λp为最小特征值),k<100,则不存在多重点共线性;若100≤k≤1000,则自变量间存在较强的多重共线性,若k>1000,则自变量间存在严重的多重共线性。

降低多重共线性的办法主要是转换自变量的取值,如变绝对数为相对数或平均数,或者更换其他的自变量。

6.D.W检验当回归模型是根据动态数据建立的,则误差项e也是一个时间序列,若误差序列诸项之间相互独立,则误差序列各项之间没有相关关系,若误差序列之间存在密切的相关关系,则建立的回归模型就不能表述自变量与因变量之间的真实变动关系。

D.W检验就是误差序列的自相关检验。

检验的方法与一元线性回归相同。

[编辑]多元线性回归分析预测法案例分析[编辑]案例一:公路客货运输量多元线性回归预测方法探讨[2]一、背景公路客、货运输量的定量预测,近几年来在我国公路运输领域大面积广泛地开展起来,并有效的促进了公路运输经营决策的科学化和现代化。

关于公路客、货运输量的定量预测方法很多,本文主要介绍多元线性回归方法在公路客货运输量预测中的具体操作。

根据笔者先后参加的部、省、市的科研课题的实践,证明了多元线性回归方法是对公路客、货运输量预测的一种置信度较高的有效方法。

二、多元线性回归预测线性回归分析法是以相关性原理为基础的.相关性原理是预测学中的基本原理之一。

由于公路客、货运输量受社会经济有关因素的综合影响。

所以,多元线性回归预测首先是建立公路客、货运输量与其有关影响因素之间线性关系的数学模型。

然后通过对各影响因素未来值的预测推算出公路客货运输量的预测值。

三、公路客、货运输量多元线性回归预测方法的实施步骤1.影响因素的确定影响公路客货运输量的因素很多,主要包括以下一些因素:(1)客运量影响因素人口增长量裤保有量、国民生产总值、国民收入工农业总产值,基本建设投资额城乡居民储蓄额铁路和水运客运量等。

(2)货运量影响因素人口货车保有量(包括拖拉机),国民生产总值,国民收入、工农业总产值,基本建设投资额,主要工农业产品产量,社会商品购买力,社会商品零售总额.铁路和水运货运量菩。

上述影响因素仅是对一般而言,在针对具体研究对象时会有所增减。

因此,在建立模型时只须列入重要的影响因素,对于非重要因素可不列入模型中。

若疏漏了某些重要的影响因素,则会造成预测结果的失真。

另外,影响因素太少会造成模型的敏感性太强.反之,若将非重要影响因素列入模型,则会增加计算工作量,使模型的建立复杂化并增大随机误差。

影响因素的选择是建立预测模型首要的关键环节,可采取定性和定量相结合的方法进行.影响因素的确定可以通过专家调查法,其目的是为了充分发挥专家的聪明才智和经验。

具体做法就是通过对长期从事该地区公路运输企业和运输管理部门的领导干部、专家、工作人员和行家进行调查。

可通过组织召开座谈会.也可以通过采访,填写调查表等方法进行,从中选出主要影响因素为了避免影响因素确定的随意性,提高回归模型的精度和减少预测工作量,可通过查阅有关统计资料后,再对各影响因素进行相关度(或关联度)和共线性分析,从而再次筛选出最主要的影响因素.所谓相关度分析就是将各影响因素的时间序列与公路客货运量的时间序列做相关分杯事先确定—个相关系数,对相关系数小于的影响因素进行淘汰.关联度是灰色系统理论中反映事物发展变化过程中各因素之间的关联程度,可通过建空公路客、货运量与各影响影响因素之间关联系数矩阵,按一定的标准系数舍去关联度小的影响因素.所谓共线性是指某些影响因素之问存在着线性关系或接近于线性关系.由于公路运输经济自身的特点,影响公路客,货运输量的诸多因素之问总是存在着一定的相关性,持别是与国民经济有关的一些价值型指标。

我们研究的不是有无相关性问题而是共线性的程度,如果影响因素之间的共线性程度很高,首先会降低参数估计值的精度。

其次在回归方程建立后的统计检验中导致舍去重要的影响因素或错误的地接受无显著影响的因素,从而使整个预测工作失去实际意义。

关于共线性程度的判定,可利用逐步分析估计法的数理统计理论编制计算机程序来实现。

或者通过比较ri j和R2的大小来判定。

在预测学上,一般认为当ri j > R2时,共线性是严重的,其含义是,多元线性回归方程中所含的任意两个自变量xi,x j之间的相关系数r i j大于或等于该方程的样本可决系数R2时,说明自变量中存在着严重的共线性问题。

2.建立经验线性回归方程利用最小二乘法原理寻求使误差平方和达到撮小的经验线性回归方程:y——预测的客、货运量g——各主要影响因数3.数据整理对收集的历年客、货运输量和各主要影响因素的统计资料进行审核和加工整理是为了保证预测工作的质量。

资料整理主要包括下列内容:(1)资料的补缺和推算。

(2)对不可靠资料加以核实调整.对查明原因的异常值加以修正。

(3)对时间序列中不可比的资料加以调整和规范化;对按当年价格计算的价值指标应折算成按统。

4.多元线性回归模型的参数估计在经验线性回归模型中,是要估计的参数,可通过数理统计理论建立模型来确定。

在实际预测中,可利用多元线性回归复相关分析的计算机程序来实现·5.对模型参数的估计值进行检验。

此项工作的目的在于判定估计值是否满意、可靠。

一般检验工作须从以下几方面来进行。

•经济意义检验关于经济预测的数学模型,首先要检验模型是否有经济意义,γp若参数估计值的符号和大小与公路运输经济发展以及经济判别不符合时,这时所估计的模型就不能或很难解释公路运输经济的一般发展规律.就应抛弃这个模型.需要重新构造模型或重新挑选影响因素。

相关文档
最新文档