因子分析的方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

三.关于中国民航客运量模型建立与研究

为研究我国民航客运量的变化趋势及其成因,我们以民航客运量作为因变量Y,以国民收入,消费额,铁路客运量,民航航线里程,来华旅游入境人数为影响民航客运量的主要因素。Y表示民航客运量(万人),X1表示国民收入(亿元),X2表示消费额(亿元),X3表示铁路客运量(万人),X4表示民航航线里程(万公里),X5表示来华旅游入境人数(万人)。统计数据如下:

现对该数据进行分析如下:

回归分析

Correlations

y x1 x2 x3 x4 x5

(1)从相关阵看出,y与x1,x2,x4,x5的相关系数都在0.9以上,说明所选自变量与y高度线性相关,用y与自变量作多元线性回归是适当的。

(2)y与x3的相关系数ry3=0.227偏小,P值=0.398,x3是铁路客运量,这说明铁路客运量对民航客运量无显著影响。

Model Summary

Model R R Square Adjusted R

Square

Std. Error of the

Estimate

1 .999a.998 .997 49.49240

a. Predictors: (Constant), x5, x3, x4, x2, x1

ANOVA b

Model Sum of Squares df Mean Square F Sig.

1 Regression 1.382E7 5 2763775.354 1.128E3 .000a

Residual 24494.981 10 2449.498

Total 1.384E7

15

a. Predictors: (Constant), x5, x3, x4, x2, x1

b. Dependent Variable: y

Coefficients a

Model Unstandardized Coefficients

Standardized

Coefficients

t Sig.

B Std. Error

Beta

1

(Constant) 450.909

178.078 2.532 .030 x1 .354 .085 2.447 4.152 .002 x2 -.561 .125 -2.485 -4.478 .001 x3 -.007 .002 -.083 -3.510

.006 x4 21.578 4.030 .531 5.354 .000 x5

.435

.052

.564

8.440

.000

a. Dependent Variable: y

(3)由上图知:回归方程为

y=450.909+0.354x1-0.561x2-0.007x3+21.578x4+0.435x5

(4)复相关系数R=0.999,决定系数R*R=0.998,由决定系数看回归方程高度显著。 (5)有方差分析表可知:F=1128.303,P 值=0.000,表明回归方程高度显著,说明x1,x2,x3,x4,x5整体上对y 有高度显著的线性影响。

(6)回归系数的显著性检验。自变x1,x2,x3,x4,x5对y 均有显著影响,其中x3铁路客运量的P 值=0.006最大,但仍在1%的显著性水平上对y 高度显著,这充分说明在多元线性回归中不能仅凭简单相关系数的大小而决定变量的取舍。

(7)疑问:x2的回归系数为-0.561是负的,x2是消费额,负的回归系数说明与y 呈负相关,显然是不合理的!故进一步分析;由关于相关系数分析表知:其原因是自变量之间的共线性(x1是国民收入,x2是消费额,二者的简单相关系数r12=0.9989,高度相关!),故在多重共线性部分作进一步改进。

多重共线性分析

(8)有上述图表知:VIF1=1963最大,且远大于十,故剔除x1,建立y对四个自变量x2,x3,x4,x5的回归方程后,再求回归方程。

(9)由上述输出结果知:x2的方差扩大因子VIF=77.5为最大,远大于10,并且x2的回归系数B2=-0.053仍然是负值,说明此回归模型仍然存在强多共线性,应继续剔除变量。故再剔除x2,用y与三个自变量x3,x4,x5建立回归方程。

(10)从图表中可看到,3个方差扩大因子都小于10,回归系数也都有合理经济解

释,说明此时的回归模型不存在强多重共线性,可以作为最终回归模型!(11)最终回归方程为

y=591.876-0.01037x3+26.436x4+0.317x5

为了避免量纲的影响对其标准化,则标准化回归方程为

y=-0.119x3+0.650x4+0.411x5

(12)由标准化回归系数看到,对民航客运量影响最大因素是民航航运里程,其次是来华旅游入境人数。民航航运里程每增加1%,民航客运量会增加0.650%。来华旅游入境人数每增加1%,名航客运量会增加0.411%。而铁路客运量对民航客运量影响较小,铁路客运量每增加1%,民航客运量会减少0.119%。

(13)由上图表可知:此回归方程的样本决定系数R*R=0.994;调整的样本决定系数

R1*R1=0.993,其拟合优度仍保持很高,且回归系数有相应合理的经济解释。

因子分析法

因子分析法

(14)由图表知:第一个主成分方差百分比是79.826%,即含有原始五个变量信息量接近80%;第二个主成分方差百分比是18.641%,即含有原始五个变量信息近19%。故二者主成分累计含有原始五个变量信息近98.46%,则可取上述二者主成分足够!

(15)由上表知:

Y1=-2.464+0.00003714x1+0.00005831x2+0.000009394x3+0.01022x4+0.0001957x5 Y2=-8.426-0.00002672x1-0.00003332x2+0.00008851x3-0.009708x4+0.0001105x5 y=1159.125+936.781Y1-185.876Y2

再进行替换知:y=416+0.03976x1+0.06082x2-0.007652x3+11.37x4+0.1628x5. (16)和多重线性分析作比较,我们可以发现,各因素对y影响程度相近,且相应经济解释也合理!

相关文档
最新文档