Spss大作业

汽车市场研究

问题描述

以往在我国各地汽车需求量的研究中，主要是根据国家政策、国民经济发展情况、各地区公路状况等，总和不同时期汽车保有量，对汽车市场进行定性分析和决策，这样往往带有主观因素，下面为一组可能影响汽车保有量的数据，部分数据如图，用合理的方法对数据进行研究。

图

一层次聚类

、求解思路

用层次聚类的方法，分析与预测各个地区的汽车市场发展情况。

首先对原始数据进行标准化变换处理，经过运算使得每列数据的平均值为0，方差为1，这样原始数据中5列具有不同比较标准的数据就能放在一起比较；然后用标准化后的30个不同地区数据求出欧式距离；最后采用Wald离差平方和法。

、问题求解与分析

通过SPSS软件求解的结果与分析：

结果分析：图为层次分析的凝聚状态表，第一列为聚类步骤，表示共进行了29个步骤的分析；第二列和第三列表示某部聚类分析中，哪两个样本或聚类成了一类；第四列表示两个样本或类间距，从图看出，距离小的样本之间先聚类；第五列和第六列表示某步聚类分析中，参与聚类的是样本还是类，0表示样本；第七

列表示本步聚类分析结果在下面聚类的第几步中用到。

图

结果分析：图将30个样本分为三类，第一类包括1、2、6、9、10、11，第二类包括3、4、7、12、15、16、18、19、22、26，第三类包括5、8、13、14、17、20、

21、23、24、25、27、28、29、30 。

Cluster Membership

Case 3 Clusters

1:北京1

2:天津1

3:河北2

4:山西2

5:内蒙古3

6:辽宁1

7:吉林2

8:黑龙江3

9:上海1

10:江苏1

11:浙江1

12:安徽2

13:福建3

14:江西3

15:山东2

16:河南2

17:湖北3

18:湖南2

19:广东2

20:广西3

21:海南3

22:四川2

23:贵州3

24:云南3

25:西藏3

26:陕西2

27:甘肃3

28:青海3

29:宁夏3

30:新疆3

图

结果分析：图是层次聚类分析的树形图，由于部分样本或小类之间的距离较小，因此光从该图很难清晰看出哪几个样本先聚类，这时应借助于图进行判别。

* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L

C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *

Dendrogram using Ward Method

Rescaled Distance Cluster Combine

C A S E 0 5 10 15

20 25

Label Num +---------+---------+---------+---------+---------+

安徽12 ─┐

河南16 ─┼─┐

广东19 ─┤│

四川22 ─┘├─────┐

吉林7 ─┐││

陕西26 ─┼─┘├─────────────┐

湖南18 ─┘││

河北 3 ─┐││

山西 4 ─┼───────┘│

山

东15 ─┘├─────────────────────────┐

贵

州23 ─┐│

│

青

海28 ─┼─────────┐│

│

西

藏25 ─┘││

│

黑龙

江8 ─┬─┐├───────────┘

│

宁

夏29 ─┘││

│

内蒙

古 5 ─┐├───────┘

│

新

疆30 ─┤│

│

湖

北17 ─┤│

│

江

西14 ─┼─┘

│

广

西20 ─┤

│

云

南24 ─┤

│

甘

肃27 ─┤

│

福

建13 ─┤

│

海

南21 ─┘

│

天

津 2 ─┐

│

浙

江11 ─┼───┐

│

上

海9 ─┘├───────────────────────────

────────────────┘

北京 1 ─┐│

江苏10 ─┼───┘

辽宁 6 ─┘

图

总分析：第一类反应的是我国经济发展较发达地区与相对欠发达地区。1、2、9代表为北京、天津、上海三个直辖市，在全国具有举足轻重的地位，它们的汽车市场发展仍将处于全国领先水平；6、10、11代表辽宁、江苏、浙江，由于地理、人口、气候及交通等原因，汽车市场的发展将作为今后发展的重要因素，带动这些地区经济的腾飞。第二类中10个元素，分别代表陕西、山东、陕西等，这些地区从经济发展看处于中等水平，将是今后汽车发展的大市场。第三类为内蒙古、

宁夏、新疆等，这些地区相对来说经济发展较慢，汽车发展空间不大。

二多元线性回归分析

求解思路

用多远线性回归的方法，分析国内生产总值、地区人口总数、地区公路长度、全社会货运量对汽车保有量是否有影响。

首先自变量强制进入，不用管个因素质量如何，对回归方程是否有影响；然后选择输出默认输出项，输出回归系数的标准误差、标准回归系数等；最后选择Model fit和Descriptives,输出判定系数、自变量与因变量的均值、标准差等。问题求解与分析

通过SPSS软件求解的结果与分析：

图

结果分析：图为四个自变量和一个因变量的平均值、方差和个案数为30。

图

结果分析：图2. 2中第二列为被引入的变量，第三列为从回归方程中被剔除的各个变量，第四列为进入方式。

图

结果分析：图输出常用统计量关系数R

为，调整的判定系数为，回归估计的标准误差S=。

Residual25

Total29

a. Predictors: (Constant), 全社会货运量（万吨）, 地区公路长度（km）, 国内生产总值（亿元）,

地区人口总数（万人）

b. Dependent Variable: 汽车总保有量（万辆）

图

结果分析：图为方差分析表，统计量F=；相伴概率p=0,说明多个变量与因变量之间存在线性回归关系。

图

结果分析：图为回归系数分析，Unstandardized Coefficients为非标准化系数，Standardized Coefficients为标准化系数，t为回归系数检验统计量，Sig为相伴概率，从图看出各个自变量与因变量的线性回归分析关系不显著。

总分析：四个因变量对因变量的影响作用不显著。