多元回归分析报告SPSS

合集下载

SPSS—回归—多元线性回归结果分析

SPSS—回归—多元线性回归结果分析

SPSS—回归—多元线性回归结果分析(二),最近一直很忙,公司的潮起潮落,就好比人生的跌岩起伏,眼看着一步步走向衰弱,却无能为力,也许要学习“步步惊心”里面“四阿哥”的座右铭:“行到水穷处”,”坐看云起时“。

接着上一期的“多元线性回归解析”里面的内容,上一次,没有写结果分析,这次补上,结果分析如下所示:结果分析1:由于开始选择的是“逐步”法,逐步法是“向前”和“向后”的结合体,从结果可以看出,最先进入“线性回归模型”的是“price in thousands"建立了模型1,紧随其后的是“Wheelbase"建立了模型2,所以,模型中有此方法有个概率值,当小于等于0.05时,进入“线性回归模型”(最先进入模型的,相关性最强,关系最为密切)当大于等0.1时,从“线性模型中”剔除结果分析:1:从“模型汇总”中可以看出,有两个模型,(模型1和模型2)从R2 拟合优度来看,模型2的拟合优度明显比模型1要好一些(0.422>0.300)2:从“Anova"表中,可以看出“模型2”中的“回归平方和”为115.311,“残差平方和”为153.072,由于总平方和=回归平方和+残差平方和,由于残差平方和(即指随即误差,不可解释的误差)由于“回归平方和”跟“残差平方和”几乎接近,所有,此线性回归模型只解释了总平方和的一半,3:根据后面的“F统计量”的概率值为0.00,由于0.00<0.01,随着“自变量”的引入,其显著性概率值均远小于0.01,所以可以显著地拒绝总体回归系数为0的原假设,通过ANOVA方差分析表可以看出“销售量”与“价格”和“轴距”之间存在着线性关系,至于线性关系的强弱,需要进一步进行分析。

结果分析:1:从“已排除的变量”表中,可以看出:“模型2”中各变量的T检的概率值都大于“0.05”所以,不能够引入“线性回归模型”必须剔除。

从“系数a” 表中可以看出:1:多元线性回归方程应该为:销售量=-1.822-0.055*价格+0.061*轴距但是,由于常数项的sig为(0.116>0.1) 所以常数项不具备显著性,所以,我们再看后面的“标准系数”,在标准系数一列中,可以看到“常数项”没有数值,已经被剔除所以:标准化的回归方程为:销售量=-0.59*价格+0.356*轴距2:再看最后一列“共线性统计量”,其中“价格”和“轴距”两个容差和“vif都一样,而且VIF 都为1.012,且都小于5,所以两个自变量之间没有出现共线性,容忍度和膨胀因子是互为倒数关系,容忍度越小,膨胀因子越大,发生共线性的可能性也越大从“共线性诊断”表中可以看出:1:共线性诊断采用的是“特征值”的方式,特征值主要用来刻画自变量的方差,诊断自变量间是否存在较强多重共线性的另一种方法是利用主成分分析法,基本思想是:如果自变量间确实存在较强的相关关系,那么它们之间必然存在信息重叠,于是就可以从这些自变量中提取出既能反应自变量信息(方差),而且有相互独立的因素(成分)来,该方法主要从自变量间的相关系数矩阵出发,计算相关系数矩阵的特征值,得到相应的若干成分。

多元线性回归SPSS实验报告

多元线性回归SPSS实验报告
在多重共线性。 第4-10列:各特征根解释各解释变量的方差比。 从方差比看,第5个特征根解释投入普通高校人数96%;发表科技论文数
49%;可以认为:这些变量存在多重共线性。需要建立回归方程。
2.重建回归方程
模型
输入/移去的变量b
输入的变量
移去的变量
方法
1
教职工总数(万
人), 专利申请授
权数(件), 研究
b. 预测变量: (常量), 教职工总数(万人), 专利申请授权数(件), 研究与试验发展机构数(个), 普通高校数(所), 发表 科技论文数量(篇)。 c. 预测变量: (常量), 教职工总数(万人), 专利申请授权数(件), 研究与试验发展机构数(个), 发表科技论文数量(篇)。 d. 预测变量: (常量), 教职工总数(万人), 专利申请授权数(件), 发表科技论文数量(篇)。 e. 预测变量: (常量), 教职工总数(万人), 发表科技论文数量(篇)。 f. 因变量: 毕业生数(万人)
. 输入
a. 已输入所有请求的变量。
模型汇总
模型
R
R 方 调整 R 方 标准 估计的误差
1
.999a
.998
.997
a. 预测变量: (常量), 教职工总数(万人), 专利申请授权数(件), 研究与试验发展机构数(个), 普通高校数(所), 发表科技论文数 量(篇), 在校学生数(万人)。
注解:模型的拟合优度检验:
第五列:回归方程的估计标准误差=
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
6
.000a
残差
7
总计
13
a. 预测变量: (常量), 教职工总数(万人), 专利申请授权数(件), 研究与试验发展机构 数(个), 普通高校数(所), 发表科技论文数量(篇), 在校学生数(万人)。 b. 因变量: 毕业生数(万人)

SPSS多元回归实验报告

SPSS多元回归实验报告

实验八报告一、数据来源Employee data. sav 二、基本结果(1)确定自变量、因变量:)确定自变量、因变量:一般而言,因变量y与各自变量xj(j=1,2,3,…,n)之间的多元线性回归模型:之间的多元线性回归模型:其中:b0是回归常数;b k (k=1,2,3,…,n)是回归参数;e是随机误差。

是随机误差。

根据employee data.sav的数据,其中Y是当前工资salary,X1是起始资金salbegin,X2是工作经验prevexp,X3是工作时间jobtime,X4是工作种类jobcat,X5是受教育年限edcau。

(2)做出因变量与自变量的散点图:)做出因变量与自变量的散点图:从散点图可以看出因变量与各自变量之间存在线性关系。

(3)检验因变量Y是否服从正态分布的模型假定——因变量Y并没有很好地服从正态分布。

地服从正态分布。

的残差图(4)线性回归Y的残差图此标准化残差图表明,此线性回归的标准化残差呈楔形分布而非带状分布,不满足回归模型同方差的假定。

布,不满足回归模型同方差的假定。

当前薪金多元线性回归分析的残差图图当前薪金多元线性回归分析的残差图(5)通过以上检验可以看出,当前薪金并不是好的变量,对当前薪金进行Ln变换(取对数)生成新的随进变量logsale,将logsale作为因变量Y用逐步回归的方法进行回归分析:的方法进行回归分析:1)p-p图:图:较好的服从了正态分布。

发现取对数后,logY较好的服从了正态分布。

2)logY的标准化残差图:的标准化残差图:上图表明因变量Y(logsale)的标准化残差近似呈带状分布,满足模型同方差的假定。

差的假定。

3)逐步回归的判定系数:)逐步回归的判定系数:通过逐步回归,得到方程的判定系数如下表。

R²越接近1,说明回归方程解释了因变量总变异量的绝大部分比例。

本估计的回归方程有一个好的拟合,,可以认为拟合度高。

在模型5中达到0.810,且调整后的R²达到0.808,可以认为拟合度高。

SPSS多元线性回归分析报告实例操作步骤

SPSS多元线性回归分析报告实例操作步骤

SPSS 统计分析多元线性回归分析方法操作与分析实验目的:引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。

实验变量:以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。

实验方法:多元线性回归分析法软件:spss19.0操作过程:第一步:导入Excel数据文件1.open data document——open data——open;2. Opening excel data source——OK.第二步:1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method 选择Stepwise.进入如下界面:2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue.3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.4.点击右侧Save,勾选Predicted Vaniues(预测值)和Residuals(残差)选项组中的Unstandardized;点击Continue.5.点击右侧Options,默认,点击Continue.6.返回主对话框,单击OK.输出结果分析:1.引入/剔除变量表Variables Entered/Removed aModel Variables Entered Variables Removed Method1 城市人口密度(人/平方公里) . Stepwise (Criteria:Probability-of-F-to-enter<= .050,Probability-of-F-to-remove >=.100).2 城市居民人均可支配收入(元) . Stepwise (Criteria:Probability-of-F-to-enter<= .050,Probability-of-F-to-remove >=.100).a. Dependent Variable: 商品房平均售价(元/平方米)该表显示模型最先引入变量城市人口密度(人/平方公里),第二个引入模型的是变量城市居民人均可支配收入(元),没有变量被剔除。

多元线性回归分析spss

多元线性回归分析spss

多元线性回归分析spss
多元线性回归分析是一种常用的统计分析技术,用于对各因素之间的相互关系进行研究。

使用多元线性回归分析,可以检验一个或多个自变量对因变量具有统计学显著性的影响,从而推断出实际世界存在的不同因素可能带来的影响。

在spss中,我们使用下拉菜单选择“分析”>“回归”>“多元”来开始多元线性回归分析。

在多元线性回归窗口中,我们可以在右边的“可用变量”列中选择变量,拖拽到“因变量”和“自变量”栏中。

接下来,我们可以选择要使用的模型类型,其中包括多元线性回归,截距,变量中心以及相关的其他预测结果。

在进行模型拟合之前,我们可以在“多重共线性”复选框中对共线性进行调整,进行预测和显著性检验,并调整“参数估计”和“残差”复选框,自由地绘制结果。

在运行了多元线性回归分析之后,在spss中,我们可以在输出窗口中查看多元回归方程的系数和检验的结果,以及它们对回归系数的影响,残差分布情况,多重共线性分析和其他一些输出参数。

总而言之,spss中多元线性回归分析是一种有效的统计分析方法,可以用来检验多个自变量对回归方程的影响。

它具有许多内置功能,可以容易地针对回归系数和其他参数进行各种分析,提供了可信的结果,帮助人们深入了解各类因素对研究结果的影响。

spss多元回归分析结果解读

spss多元回归分析结果解读

spss多元回归分析结果解读
多元回归分析是一种有益的研究方法,用于研究一个自变量对一种可能多个因素的因变量的影响。

它可以帮助研究人员在复杂的环境中有效地研究变量间的关系,为研究者提供有用的信息。

本文将对SPSS中多元回归分析结果作出解释。

多元回归分析结果包括模型概览、系数表和诊断统计量等。

从模型概览中,可以查看回归的R平方,它代表模型对因变量的解释能力。

另外,如果均方根误差
很小,也可以推断模型具有很好的预测能力。

在系数表中,可以查看每个自变量对因变量的贡献,去查看比较有重要性的变量及它们的系数值。

其中,系数值大小代表着自变量对因变量的影响程度,正负系数代表自变量与因变量之间的负相关或正相关性。

根据系数值,可以得出相关结论,即哪些变量对因变量的影响有重要性,而哪些变量的影响力不大。

此外,诊断统计量给出了模型建立的质量评估。

比如偏差平方,它衡量误差值之平方和占比。

如果拟合度评估值很低,则说明模型效果不佳;如果整个模型的F 值比较大,则说明当前模型是可行的;此外,残差正态分布检验用于判断回归残差是否符合正态分布,如果P值少于0.05,则拒绝原假设(即回归残差不符合正态
分布)。

综上所述,可见多元回归分析可以帮助我们了解自变量和因变量之间的关系,识别影响重要性的变量,并检验模型的统计学合理性以及预测准确性,给出更有用的信息指导研究与决策。

SPSS多元回归分析报告实例

SPSS多元回归分析报告实例

多元回归分析在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。

可以建立因变量y与各自变量x j(j=1,2,3,…,n)之间的多元线性回归模型:其中:b0是回归常数;b k(k=1,2,3,…,n)是回归参数;e是随机误差。

多元回归在病虫预报中的应用实例:某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。

分级别数值列成表2-1。

预报量y:每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。

预报因子:x1诱蛾量0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;x2卵量0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;x3降水量0~10.0毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;x4雨日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。

表2-1x1 x2 x3 x4 y年蛾量级别卵量级别降水量级别雨日级别幼虫密度级别1960 1022 4 112 1 4.3 1 2 1 10 1 1961 300 1 440 3 0.1 1 1 1 4 1 1962 699 3 67 1 7.5 1 1 1 9 1 1963 1876 4 675 4 17.1 4 7 4 55 4 1965 43 1 80 1 1.9 1 2 1 1 1 1966 422 2 20 1 0 1 0 1 3 1 1967 806 3 510 3 11.8 2 3 2 28 3数据保存在“DATA6-5.SAV”文件中。

1)准备分析数据在SPSS数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量,并输入数据。

SPSS实验多元线性回归分析12

SPSS实验多元线性回归分析12
1,确定因变量与自变量,初步设定回归方程。
这里我们以总成绩作为因变量Y,平时成绩和期中成绩分别作为自变量X1,X2,建立的多元回归模型为:
Байду номын сангаас2,估计参数,建立回归预测模型
利用SPSS可得一下结果:
Variables Entered/Removedb
Model
Variables Entered
Variables Removed
1183.800
19
a. Predictors: (Constant),期中成绩,平时成绩
b. Dependent Variable:总成绩
注释:从表中可得拟合方程的F统计量值为7.586,相应的P值为0.000说明,拟合方程是显著的。是具有统计意义的。
Coefficientsa
Model
Unstandardized Coefficients
Method
1
期中成绩,平时成绩a
.
Enter
a. All requested variables entered.
b. Dependent Variable:总成绩
注释:根据这个表的结果我们可以初步的知道,经过检验自变量X1,X2是可以加入到准备估计的回归方程中作为变量的。
Model Summaryb
Standardized Coefficients
t
Sig.
95% Confidence Interval for B
Correlations
Collinearity Statistics
B
Std. Error
Beta
Lower Bound
Upper Bound
Zero-order
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元线性回归分析预测法多元线性回归分析预测法(Multi factor line regression method ,多元线性回归分析法)C3[编辑]多元线性回归分析预测法概述在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。

而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。

例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。

这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。

多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。

当自变量与因变量之间存在线性关系时,称为多元线性回归分析。

[编辑]多元线性回归的计算模型⑴一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。

当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。

设y为因变量,I」-…为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:y = 6()+ ^1X1 + &2为2 丨■…+ b k Xk+ e其中,b o为常数项,•- ' ■「为回归系数,b i为’•' 「固定时,x i每增加一个单位对y的效应,即X i对y的偏回归系数;同理b2为’•二•,固定时,X2每增加一个单位对y的效应,即,X2对y的偏回归系数,等等。

如果两个自变量x i,X2同一个因变量y呈线相关时,可用二元线性回归模型描述为:y = fto 4 &15C1 + 血力!2 + …+ bkXk I E其中,b o为常数项,• • ■ •「为回归系数,b i为固定时,X2每增加一个单位对y的效应,即X2对y的偏回归系数,等等。

如果两个自变量X i,X2同一个因变量y呈线相关时,可用二元线性回归模型描述为:y = b o + b i X i + b2X2 + e建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果变量的选择,,应首先注意自其准则是:(1) 自变量对因变量必须有显著的影响,并呈密切的线性相关;(2) 自变量与因变量之间的线性相关必须是真实的,而不是形式上的;(3) 自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;(4) 自变量应具有完整的统计数据,其预测值容易确定。

多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和(二「)为最小的前提下,用最小二乘法求解参数。

以二线性回归模型为例,求解回归参数的标准方程组为工>=宛馆+加刀巧I检刀牝刀衍“=论刀①1 + %力听+傀刀巧①2 刀x7y= % £叼I加刀①炖I直刀诡解此方程可求得b o,b i,b2的数值。

亦可用下列矩阵法求得多元线性回归模型的检验⑴多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。

1、拟合程度的测定。

与一元线性回归中可决系数 r 2相对应,多元线性回归中也有多重可决系数r 2,它是在因变量的总变化中,由回归方程解释的变动 (回归平方和)所占的比重,R 2越大,回归方各对样本数据点 拟合的程度越强,所有自变量与因变量的关系越密切。

计算公式为:丘2 =刀(@_@)2E(y - y)2=1 E(y-y)2 =E(y-y)2其中,力(妙一 y)2 =工/ —(悅£片+ % £②1“ +址5T ②汕+…+加5T 巩卩)I- y)2 =为『一:(为诉 I V2. 估计标准误差91 21JC-22 ^22£估计标准误差,即因变量y的实际值与回归方程求岀的估计值A之间的标准误差,估计标准误差越小,回归方程拟合程度越程Syy其中,k为多元线性回归方程中的自变量的个数。

3. 回归方程的显著性检验回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。

能常采用F检验,F统计量的计算公式为:= Ed歹尸/氐=页_卯加_应_ 1R2/k(l-7?2)/n-fr-l根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值F a,若F > F a,则回归方程具有显著意义,回归效果显著; F < F a,则回归方程无显著意义,回归效果不显著。

4. 回归系数的显著性检验在一元线性回归中,回归系数显著性检验(t检验)与回归方程的显著性检验(F检验)是等价的,但在多元线性回归中,这个等价不成立。

t检验是分别检验回归模型中各个回归系数是否具有显著性,以便使模型中只保留那些对因变量有显著影响的因素。

检验时先计算统计量t i;然后根据给定的显著水平a,自由度n-k-1查t分布表,得临界值t a或t a / 2,t > t - a或t a / 2,则回归系数b i与0有显著关异,反之,则与0无显著差异。

统计量t的计算公式为:其中,C j是多元线性回归方程中求解回归系数矩阵的逆矩阵(x'x)-1的主对角线上的第j个元素。

对二元线性回归而言,可用下列公式计算:其中,5ii = 52(^1 -xi )2 = ”工 f 一 ](丫3严* If^12 = 刀(衍一們)(叼一勿)=521"①S --土(工叼)(工切5. 多重共线性判别若某个回归系数的 t 检验通不过,可能是这个系数相对应的自变量对因变量的影平不显著所 致,此时,应从回归模型中剔除这个自变量,重新建立更为简单的回归模型或更换自变量。

也可 能是自变量之间有共线性所致,此时应设法降低共线性的影响。

多重共线性是指在多元线性回归方程中,自变量之彰有较强的线性关系,这种关系若超过了因变量与自变量的线性关系,则回归模型的稳定性受到破坏,回归系数估计不准确。

需要指岀的 是,在多元回归模型中,多重共线性的难以避免的,只要多重共线性不太严重就行了。

判别多元 线性回归方程是否存在严惩的多重共线性,可分别计算每两个自变量之间的可决系数 r 2,若r 2 >R 2或接近于R 2,则应设法降低多重线性的影响。

亦可计算自变量间的 相关系数矩阵的特征值的条件数k =入/ p Q 入为最大特征值,k 为最小特征值),k<100,则不存在多重点共线性;若100< k < 1000则自变量间存在较强的多重共线性,若k>1000,则自变量间存在严重的多重共线性。

降低多重共线性的办法主要是转换自变量的取值,如变 绝对数 为相对数或平均数,或者更换其他的自变量。

6. D.W 检验当回归模型是根据动态数据建立的,则误差项e 也是一个 时间序列,若误差序列诸项之间相互独立,则误差序列各项之间没有相关关系,若误差序列之间存在密切的相关关系,则建立的 回归模型就不能表述自变量与因变量之间的真实变动关系。

D.W 检验就是误差序列的自相关检验。

检验的方法与一元线性回归相同。

S22 S11S 滤-呢工(叼一血尸=12^2[编辑]多元线性回归分析预测法案例分析[编辑]案例一:公路客货运输量多元线性回归预测方法探讨[2]一、背景公路客、货运输量的定量预测,近几年来在我国公路运输领域大面积广泛地开展起来,并有效的促进了公路运输经营决策的科学化和现代化。

关于公路客、货运输量的定量预测方法很多,本文主要介绍多元线性回归方法在公路客货运输量预测中的具体操作。

根据笔者先后参加的部、省、市的科研课题的实践,证明了多元线性回归方法是对公路客、货运输量预测的一种置信度较高的有效方法。

二、多元线性回归预测线性回归分析法是以相关性原理为基础的•相关性原理是预测学中的基本原理之一。

由于公路客、货运输量受社会经济有关因素的综合影响。

所以,多元线性回归预测首先是建立公路客、货运输量与其有关影响因素之间线性关系的数学模型。

然后通过对各影响因素未来值的预测推算出公路客货运输量的预测值。

三、公路客、货运输量多元线性回归预测方法的实施步骤1. 影响因素的确定影响公路客货运输量的因素很多,主要包括以下一些因素:(1) 客运量影响因素人口增长量裤保有量、国民生产总值、国民收入工农业总产值,基本建设投资额城乡居民储蓄额铁路和水运客运量等。

(2) 货运量影响因素人口货车保有量(包括拖拉机),国民生产总值,国民收入、工农业总产值,基本建设投资额, 主要工农业产品产量,社会商品购买力,社会商品零售总额•铁路和水运货运量菩。

上述影响因素仅是对一般而言,在针对具体研究对象时会有所增减。

因此,在建立模型时只须列入重要的影响因素,对于非重要因素可不列入模型中。

若疏漏了某些重要的影响因素,则会造成预测结果的失真。

另外,影响因素太少会造成模型的敏感性太强•反之,若将非重要影响因素列入模型,则会增加计算工作量,使模型的建立复杂化并增大随机误差。

影响因素的选择是建立预测模型首要的关键环节,可采取定性和定量相结合的方法进行. 影响因素的确定可以通过专家调查法,其目的是为了充分发挥专家的聪明才智和经验。

具体做法就是通过对长期从事该地区公路运输企业和运输管理部门的领导干部、专家、工作人员和行家进行调查。

可通过组织召开座谈会•也可以通过采访,填写调查表等方法进行,从中选出主要影响因素为了避免影响因素确定的随意性,提高回归模型的精度和减少预测工作量,可通过查阅有关统计资料后,再对各影响因素进行相关度(或关联度)和共线性分析,从而再次筛选出最主要的影响因素•所谓相关度分析就是将各影响因素的时间序列与公路客货运量的时间序列做相关分杯事先确定一个相关系数,对相关系数小于的影响因素进行淘汰•关联度是灰色系统理论中反映事物发展变化过程中各因素之间的关联程度,可通过建空公路客、货运量与各影响影响因素之间关联系数矩阵,按一定的标准系数舍去关联度小的影响因素. 所谓共线性是指某些影响因素之问存在着线性关系或接近于线性关系•由于公路运输经济自身的特点,影响公路客,货运输量的诸多因素之问总是存在着一定的相关性,持别是与国民经济有关的一些价值型指标。

我们研究的不是有无相关性问题而是共线性的程度,如果影响因素之间的共线性程度很高,首先会降低参数估计值的精度。

其次在回归方程建立后的统计检验中导致舍去重要的影响因素或错误的地接受无显著影响的因素,从而使整个预测工作失去实际意义。

关于共线性程度的判定,可利用逐步分析估计法的数理统计理论编制计算机程序来实现。

或者通过比较rj和R2的大小来判定。

相关文档
最新文档