北航数理统计大作业(逐步回归)

北航数理统计大作业(逐步回归)
北航数理统计大作业(逐步回归)

北京航空航夭大爭

B E I H A N G UNIVERSITY

应用数理统计

第一次大作业

学号: _______

姓名:______________

班级: ___________

20 15年12月

民航客运量得多元线性回归分析

摘要:本文为建立以民航客运量为因变量得多元线性回归模型,选取了199 6年至2013年得统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人数, 城镇居民可支配收入等因素,利用统计?软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型得回归显著性、拟合度以及随机误差得正态性进行了检验,并采用201 4年得数据进行检验,得到得结果达到预期,证明该模型建立就是较为成功得.

关键词:多元线性回归,逐步回归法,民航客运量

0、符号说明

1、引言

随着社会得进步,人民生活水平得提高,如何获得更快捷方便得交通成为人们日益关注得问题.因为航空得安全性,快速且价格水平越来越倾向大众,越来越多得人们选择航空这种交通方式。近年来,我国得航空客运量已经进入世界前列, 为掌握航空客运得动态,合理安排班机数量?科学地对我国民航客运量得影响因素得分析,并得出其回归方程,进而能够估计航空客运量就是非常有必要得。本文收集整理了与我国航空客运量相关得历年数据,运用SPSS软件对数据进行分析,研究199 6年起至20 1 3年我国民航客运量y(万人)与国民生产总值Xi(亿元)、铁路客运量X2(万人)、

民航航线里程X3 (万公里)、入境过夜旅游人数X4 (万人)、城镇居民人均可支配收入X5 (元)得关系。采用逐步回归法建立线性模型,选出较优得线性回归模型。

2、数据得统计与分析

本文在进行统计时,查阅《中国统计摘要》,《中国统计年鉴2 0 14》以及中国知网数据查询中得数据,收集了19 96年至201 3年各个自变量因素得数据,分析它们之间得联系。整理如表1所示。

表1:

年份

民航客运

量(万人)国内生产

总值(亿

元)

铁路客运

量(万人)

民航航线

里程(万

公里)

入境过夜

旅游人数

(丿人

城镇居民

可支配收

入(元)

1 9 96 5555 7 8 973 9 479 7 1 16. 65 1356、26 4838、9 1997 56 3 0 844 0 2、393308 142. 5 157 8、53 51 6 0 . 3

8 967 7 . 1 692. 4

1 998 5755

1 95085 150. 58

5

54 2 5、1

8 847 9 . 176 5 . 25

1 9 99 6 0 94

2

100164 152、22 5 8 54、1

2 4、6 1 0 50 7

3 150、29 1 7 50、96

6280、1

2 55. 2 105155 15 5、36 1880、36 6859、6

20 1 2> 4

2 32、7 1 05606 163、77

5

7702、8

2 22、8 9 7 260 1 74、95 20

3 3. 58 847 2 . 2

2 878、

3 11176

4 204、9 4 2519、89 942 1、6 200

5 > 4 1 1 5 583 199、8 5 2 9 25、63 10493、1 20 0

6 > 4 1 2 5656 2 11、35 3486、45 11 759、5 2 810、3 1 35670 234、3 33 9 8、58 13785、8 2 045、4 1 46 1 93 24 6、1 8 3 6 9 6、 1 5

7 80. 8

71

2 > 1模型得建立

以民航客运量y 为因变量,以上5种影响因素为自变量Xj ,构建回归方程:

其中"0为常数项,£为误差项。

先观察自变量与因变量得关系,用SPSS 得到各个自变量与因变量得散点图:

4CC0D.0-

3CC0D0-

国内生产总值

图1民航客运量与国内生产总值散点图

2

506、9 1524 5 1 234、 51 7

2

983、5

168145 276、5

4 753、84 19109、 4

49 2 4、3 2

2 18 0 9、 2 1

、05

566 8 . 6

8

2 47 0 .1

1893 3 7

32 8 . 0 1 3 24564、7

2

45. 2 2 1 0597 41 0、 6

5 5 62. 39

26955. 1

4025、9 6

17174、 民用航空

客运览

20CODO- 1CCOOO-

100000.0 2DOOCO.O 300CODO 40CODD.0 500300.0 6CODOO.O

民用航空客运鱼40003.0-

30003.0-

20003.0-

10003D-

.0-

80000.0 1000030 120000.0 140000.0 1600030 1EOOOO.O 20CO00.0 220COO.O

铁路客运虽

图2 民航客运量与铁路客运量散点图

O

O

O

O

O

O

0 o

。。/

40000 0-

coooo.o-

20000.0-

10000.0-

0-

1OD .00 200.00 400.00 500.00

300.00

民航航线里程

图3 民航客运量与航线里程散点图

10D10D 2000 00

3:CO£0

400D.0D SC00 00 9:

CC.C0

过夜游客

图4民航客运量与入境过夜人数散点图

10030.0-

.0-

.0

5COO.O

10C0C.0

15000.0

2O3OD.0

25000.0

20COO.O

城镇居民人均可支配牧入

图5 民航客运量与人均可支配收入散点图

从以上五张散点图,我们可以瞧出因变量民航客运量与国内生产总值,入境 过夜旅游人数与城镇居民人均可支配收入均有较好得线性关系,这说明建立线性

4000D.0-*

300000^

:COODO-^

1000D0-

0-

400300

33030.0-

用肌空客运凤

23030.0-

模型就是有意义得。

继续下一步逐步回归分析,逐步回归得基本思想就是将变量逐个引入模型,每引入一个变量后都要进行F检验,并对已经选入得变量逐个进行t检验,当原来引入得变量111于后面变量得引入变得不再显著时,则将其删除。以确保每次引入新得变量之询回归方程中只包含先主动变量。这就是一个反复得过程,直到既没有显著得变量选入回归方程,也没用不显著得变量从回归方程中剔除为止。在SPS S软件中可直接进行逐步回归分析,得出以下结果:

山表2知,逐步回归后得出两个模型,模型1只包含城镇居民可支配收入,其她自变量都没有进入模型,模型2在1得基础上再纳入了过夜入境旅游人数,其她得自变量也都被排除了。

表2

a-因变!R民用航空客运爭

表3

相关主题
相关文档
最新文档