:主成分分析SPSS操作方法09

:主成分分析SPSS操作方法09
:主成分分析SPSS操作方法09

:主成分分析SPSS操作方法09

实验指导之三

主成分分析的SPSS操作方法

以例12.1为例进行主成分分析操作。

1.在SPSS的数据编辑窗口(见图1)点击Analysize →Data Reduction →Factor,打开Factor Analysis对话框如图

2.

图1 主成分分析操作

将参与主成分分析的变量依次选入Variables框中。例12.1中有9个参与主成分分析的变量,故都选入变量框内。

图2 Factor Analysis 对话框

2.单击Descriptives 按钮,打开Descriptives对话框如图3所示。

?Statistics栏,指定输出的统计量。

图3 Descriptives对话框

Univariate descriptives 输出每个变量的基本统计描述;(本例选择)

Initial solution 输出初始分析结果。输出主成分变量的相关或协方差矩阵的对角元素。(本例选择)

?Correlation Matrix栏指定输出考察因子分析条件和方法。

Coefficients相关系数矩阵;(本例选择)

Significance levels 相关系数假设检验的P值;

Determinant 相关系数矩阵行列式的值;

KMO and Bartlett′s test of Sphericity KMO和巴特利检验

KMO值等于变量间单相关系数的平方和与单相关系数平方和加上偏相关系数平方和之比, 值越接近1, 意味着变量间的相关性越强,越适合进行主成分分析, KMO值越接近0, 则变量间的相关性越弱. 越不适合进行主成分分析.

巴特利检验是关于研究的变量是否适合进行主成分分析的检验. 拒绝原假设意味着适合进行主成分分析. 上表中显然拒绝原假设.(本例选择)

Inverse 相关系数矩阵的逆矩阵;

Reproduced 再生相关阵(因子分析);

Anti-image 反映象相关矩阵。

3.单击Extraction 按钮,打开Extraction对话框选项,见图4。

图4 Extraction对话框

?Method栏,指定因子分析方法。点击下拉菜单可以选择需要的方法。

Principal components 主成分分析,系统默认;(本例选择)

Unweighted least square 普通最小二乘法;

Generalized least squares 广义最小二乘法

Maximum likelihood 最大似然法

Principal Axis factoring 主轴因子法

Alpha α因子提取法

Image 映像分析法

?Extract栏,决定提取因子的个数。

Eigenvalue over 指定要提取因子的最小特征值,系统默认值1,也可以自定义特征值的数值。(本例选择)

Number of factors 直接指定提取的因子个数。

?Display栏指定与初始因子有关的输出项

Unrotated factor solution 显示未旋转的因子解。可以自定义特征值的数值。(本例选择)

Scree plot 显示碎石图,可用于决定因子的提取个数。(本例选择)

4.Rotation按钮(在进行主成分分析时此项可省略)。

5.单击Scores按钮,打开Scores对话框选项(见图5)

图5 Scores对话框

?Save as variables 将主成分(因子)得分作为新变量保存在数据文件

中。(用默认的回归方法,本例选择)

?Method栏,指定计算因子值方法

Regression 回归法(本例选择)

Bartlett 巴特利特法

Anderson-Rubin 安德森—鲁宾法

?Display factor Score Coefficient Matrix 输出标准化的因子得分矩阵。

(本例选择)

6.单击Options按钮,打开Options对话框选择项,见图6。

图6 Options对话框

?Coefficient Display Format 栏,指定输出其它因子结果及缺失值的处理

方式。本例不作选择。

Sorted by size 从第一主成分开始,按降序输出因子载荷矩阵。

Suppress absolute Value less than:( ) 在框内输入数值,表示输出大于等于这个值的载荷的变量。

所有选择完成后单击OK得输出结果。

观察输出结果:

Mean Std. Deviation Analysis N

Zscore: 100元固定资产原值实现产值

.0000000 1.00000000 28 (%)

Zscore: 100元固定资产原值实现利税

.0000000 1.00000000 28 (%)

Zscore: 100元资金实现利税(%).0000000 1.00000000 28 Zscore: 100元工业总产值实现利税.0000000 1.00000000 28 Zscore: 100元销售收入实现利税.0000000 1.00000000 28 Zscore: 每吨标准煤实现工业产值(元) .0000000 1.00000000 28

Zscore: 每千瓦时电力实现工业产值

.0000000 1.00000000 28 (元)

Zscore: 全员劳动生产率(元/人·年) .0000000 1.00000000 28 Zscore: 100元流动资金实现产值(元) .0000000 1.00000000 28

Zscore: 每吨标

.920 .886 .797 .115 .175 1.000 .877 .881 .768 准煤实现工业产

值(元)

Zscore: 每千

.899 .804 .736 -.023 .260 .877 1.000 .834 .818 瓦时电力实现工

业产值(元)

Zscore: 全员劳

.873 .926 .881 .211 .479 .881 .834 1.000 .827 动生产率(元/

人·年)

Zscore: 100元

.896 .849 .811 .051 .317 .768 .818 .827 1.000 流动资金实现产

值(元)

a Determinant = 2.580E-08

KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin 度量。.754

Bartlett 的球形度检验近似卡方379.522

df 36

Sig. .000

由上面的检验表得出,本例采用主成分是适合的。

下表是主成分从每个原始变量中提取的信息量。

公因子方差

初始提取

Zscore: 100元固定资产原值实现产值(%) 1.000 .967 Zscore: 100元固定资产原值实现利税 (%) 1.000 .978

Zscore: 100元资金实现利税(%)

1.000 .970 Zscore: 100元工业总产值实现利税 1.000 .799 Zscore: 100元销售收入实现利税 1.000 .543 Zscore: 每吨标准煤实现工业产值 (元) 1.000 .892 Zscore: 每千瓦时电力实现工业产值(元) 1.000 .879 Zscore: 全员劳动生产率 (元/人·年) 1.000 .763 Zscore: 100元流动资金实现产值(元) 1.000 .832

提取方法:主成份分析。

解释的总方差

成份

初始特征值提取平方和载入

合计方差的 % 累积 % 合计方差的 % 累积 %

1 6.150 68.33

2 68.332 6.150 68.332 68.332

2 1.47

3 16.365 84.698 1.473 16.365 84.698

3 .697 7.749 92.447

4 .318 3.531 95.978

5 .190 2.112 98.090

6 .116 1.289 99.379

7 .029 .324 99.703

8 .024 .270 99.973

9 .002 .027 100.000

提取方法:主成份分析。

上表显示各主成分解释原始变量总方差的情况;SPSS默认保留特征根大于1 的主成分,本例保留了两个主成分,这两个主成分集中了原始变量的84.698%

碎石图表现出从第三个主成分开始折线变得平坦,这与提取两个主成分相符。

成份矩阵a((因子载荷矩阵)

成份

因子载荷矩阵中的元素表示的是ii

ki k i k u x y σλρ=

),(,当x 为标准化数据时,有

ii σ=1,所以可得到 931.0),(11111==u x y λρ。由于λ1=6.15,所以

u 11=0.931/15.6,由于u 11为特征向量u 1的第1个分量,所以从因子载荷矩阵中可以求出主成分的特征向量。即用1λ除因子载荷矩阵中第一列,得第一主成分的特征向量,用2λ除因子载荷矩阵中第二列,就得到第二个主成分的特征向量。 第一主成分的线性组合中除了100元工业总产值实现利税和100元销售收入实现利税外,其余变量的系数相当,所以我们可以解释第一主成分可看成是的综合变量。第一主成分主要反映了工业生产中投入的资金、劳动力所产生的效果,它是“投入”与“产出”之比。占信息总量为68.32%。

第二主成分是把工业生产中所得总量(即工业总产值和销售收入)与局部量(即利税)进行比较,反映了“产出”对国家所做的贡献。

Component Score Coefficient Matrix (主成分得分系数矩阵)

成份得分系数矩阵

成份

1

2

Zscore: 100元固定资产原值实现产值(%) .151 -.214 Zscore: 100元固定资产原值实现利税 (%) .159 .111 Zscore: 100元资金实现利税(%)

.151

.219

主成分得分系数是标准化后的主成分Y *

,经变换后,主成分*i i i y y λ=,所以得到主成分得分的线性计算公式为:

9

8765

43211363.0351.0362.0372.0175.0094.0375.0394.0375.0x x x x x x x x x y ++++++++=了

9

8765

43212127.0052.0225.0165.0491.0711.0265.0134.0259.0x x x x x x x x x y ----++++-=

当然,也可以直接用标准化得分系数计算,SPSS 提供了保存标准化主成分得分的功能。

Component Scores.

最后在数据窗口可以得到的每个样品的主成分得分,可以用散布图得出主成

分的得分图。

各样品的因子得分(标准化得分)图

从图中可以得出上海的企业经济效益最好,而青海,内蒙等省份的经济效益最差。

主成分分析案例

姓名:XXX 学号:XXXXXXX 专业:XXXX 用SPSS19软件对下列数据进行主成分分析: ……

一、相关性 通过对数据进行双变量相关分析,得到相关系数矩阵,见表1。 表1 淡化浓海水自然蒸发影响因素的相关性 由表1可知: 辐照、风速、湿度、水温、气温、浓度六个因素都与蒸发速率在0.01水平上显著相关。 分析:各变量之间存在着明显的相关关系,若直接将其纳入分析可能会得到因多元共线性影响的错误结论,因此需要通过主成份分析将数据所携带的信息进行浓缩处理。 二、KMO和球形Bartlett检验 KMO和球形Bartlett检验是对主成分分析的适用性进行检验。 KMO检验可以检查各变量之间的偏相关性,取值范围是0~1。KMO的结果越接近1,表示变量之间的偏相关性越好,那么进行主成分分析的效果就会越好。实际分析时,KMO统计量大于0.7时,效果就比较理想;若当KMO统计量小于0.5时,就不适于选用主成分分析法。 Bartlett球形检验是用来判断相关矩阵是否为单位矩阵,在主成分分析中,若拒绝各变量独立的原假设,则说明可以做主成分分析,若不拒绝原假设,则说明这些变量可能独立提供一些信息,不适合做主成分分析。

由表2可知: 1、KMO=0.631<0.7,表明变量之间没有特别完美的信息的重叠度,主成分分析得到的模型又可能不是非常完善,但仍然值得实验。 2、显著性小于0.05,则应拒绝假设,即变量间具有较强的相关性。 三、公因子方差 公因子方差表示变量共同度。表示各变量中所携带的原始信息能被提取出的主成分所体现的程度。 由表3可知: 几乎所有变量共同度都达到了75%,可认为这几个提取出的主成分对各个变量的阐释能力比较强。 四、解释的总方差 解释的总方差给出了各因素的方差贡献率和累计贡献率。

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下: 第一,将EXCEL中的原始数据导入到SPSS软件中; 【1】“分析”|“描述统计”|“描述”。 【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。 【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。

数据标准化主要功能就是消除变量间的量纲关系,从而使数据具有可比性,可以举个简单的例子,一个百分制的变量与一个5分值的变量在一起怎么比较?只有通过数据标准化,都把它们标准到同一个标准时才具有可比性,一般标准化采用的是Z标准化,即均值为0,方差为1,当然也有其他标准化,比如0--1标准化等等,可根据自己的研究目的进行选择,这里介绍怎么进行数据的Z标准化。 所的结论: 标准化后的所有指标数据。 注意: SPSS 在调用Factor Analyze 过程进行分析时, SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后的变量都是指经过标准化处理后的变量, 但SPSS 并不直接给出标准化后的数据, 如需要得到标准化数据, 则需调用Descriptives 过程进行计算。 factor过程对数据进行因子分析(指标之间的相关性判定略)。 【1】“分析”|“降维”|“因子分析”选项卡,将要进行分析的变量选入“变量”列表;

【2】设置“描述”,勾选“原始分析结果”和“KMO与Bartlett球形度检验”复选框; 【3】设置“抽取”,勾选“碎石图”复选框; 【4】设置“旋转”,勾选“最大方差法”复选框; 【5】设置“得分”,勾选“保存为变量”和“因子得分系数”复选框; 【6】查看分析结果。 所做工作: a.查看KMO和Bartlett 的检验 KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析; Bartlett 球度度检验的Sig值越小于显著水平0.05,越说明变量之间存在相关关系。 所的结论: 符合因子分析的条件,可以进行因子分析,并进一步完成主成分分析。 注意: 1.KMO(Kaiser-Meyer-Olkin) KMO统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。 Kaiser给出了常用的kmo度量标准: 0.9以上表示非常适合;0.8表示适合;0.7表示一般; 0.6表示不太适合;0.5以下表示极不适合。 2.Bartlett 球度检验: 巴特利特球度检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对应的相伴概率值小于用户心中的显著性水平,那么应该拒绝零假设,认为相关系数矩阵不可能是单位阵,即原始变量之间存在相关性,适合于做主成份分析;相反,如果该统计量比较小,且其相对应的相伴概率大于显著性水平,则不能拒绝零假设,认为相关系数矩阵可能是单位阵,不宜于做因子分析。 Bartlett 球度检验的原假设为相关系数矩阵为单位矩阵,Sig值为0.001小于显著水平0.05,因此拒绝原假设,说明变量之间存在相关关系,适合做因子分析。 所做工作: b. 全部解释方差或者解释的总方差(Total Variance Explained)

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下: 公司销售净利率(X1)资产净利率(X2)净资产收益率(X3)销售毛利率(X4) 歌华有线五粮液用友软件太太药业浙江阳光烟台万华方正科技红河光明贵州茅台中铁二局红星发展伊利股份青岛海尔湖北宜化雅戈尔福建南纸43.31 17.11 21.11 29.55 11.00 17.63 2.73 29.11 20.29 3.99 22.65 4.43 5.40 7.06 19.82 7.26 7.39 12.13 6.03 8.62 8.41 13.86 4.22 5.44 9.48 4.64 11.13 7.30 8.90 2.79 10.53 2.99 8.73 17.29 7.00 10.13 11.83 15.41 17.16 6.09 12.97 9.35 14.3 14.36 12.53 5.24 18.55 6.99 54.89 44.25 89.37 73 25.22 36.44 9.96 56.26 82.23 13.04 50.51 29.04 65.5 19.79 42.04 22.72 第一,将EXCEL中的原始数据导入到SPSS软件中; 注意: 导入Spss的数据不能出现空缺的现象,如出现可用0补齐。 【1】“分析”|“描述统计”|“描述”。 【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。 【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。 所做工作: a. 原始数据的标准化处理

SPSS进行主成分分析

实验七、利用SPSS进行主成分分析 【例子】以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。 图1 原始数据(未经标准化) 第二步:打开“因子分析”对话框。 沿着主菜单的“Analyze→Data Reduction→Factor ”的路径(图2)打开因子分析选项框(图3)。 图2 打开因子分析对话框的路径

图3 因子分析选项框 第三步:选项设置。 首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会“Value ”栏。下面逐项设置。 图4将变量移到变量栏以后 ⒈设置Descriptives描述选项。 单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。

图5 描述选项框 在Stat is tic s 统计 栏中选中U niva riate d escript ives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial soluti on 复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。 在C orrel ation M atri x栏中,选中Coe fficien ts 复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Deter minant 复选项,则会给出相关系数矩阵的行列式,如果希望在E xc el中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。 设置完成以后,单击Cont inue 按钮完成设置(图5)。 ⒉ 设置Extra ction 选项。 打开Ext raction 对话框(图6)。因子提取方法主要有7种,在Method 栏中可以看到,系统默认的提取方法是主成分(Pr in ci pa l Compon en ts),因此对此栏不作变动,就是认可了主成分分析方法。 在Ana lyze 栏中,选中Correlatio n ma trix 复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covar iance matri x复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。 在D isplay 栏中,选中U nrotated factor s olu ti on(非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。 选中Scree P lo t(“山麓”图),则在分析结果中给出特征根按大小分布的折线图(形如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。 在Extract 栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eig envalues )的数值,系统默认的是1=c λ。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1=c λ,则所有方差大于等于1的主成分将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将c λ值降低,例如取 9.0=c λ;如果认为最后的提取的主成分数量偏多,则可以提高c λ值,例如取1.1=c λ。 主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值的设定,要在反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临界值(如取

应用统计学因子分析与主成分分析案例解析_SPSS操作分析

因子分析与主成分分析 一、问题概述 现希望对30个省市自治区经济发展基本情况的八项指标进行分析。具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。这是一个综合分析问题,八项指标较多,用主成分分析法进行综合。 二、数据处理与分析 1.因子分析 打开数据后,在SPSS中进行因子分析的步骤如下: 选择“分析---降维---因子分析”,在弹出的对话框里 (1)描述---系数、KMO与Bartlett的球形度检验 (2)抽取---碎石图、未旋转的因子解 (3)旋转---最大方差法、旋转解、载荷图 (4)得分---保存为变量、显示因子得分系数矩阵 (5)选项---按大小排序 点击确定得到如下各图: 图3-1 图3-2 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.620 Bartlett 的球形度检验近似卡方231.285 df 28 Sig. .000 图3-3 公因子方差

图3-6 成份矩阵a

图3-9

(2)因子模型中各统计量的意义 A)因子载荷错误!未找到引用源。:因子载荷错误!未找到引用源。为第i个变量在第j个因子上的载荷,实际上就是错误!未找到引用源。与错误!未找到引用源。的相关系数,表示变量错误!未找到引用源。依赖因子错误!未找到引用源。的程度,反应了第i个变量错误!未找到引用源。对于第j个因子错误!未找到引用源。的重要性。 B)变量错误!未找到引用源。的变量共同度:k个公因子对第i个变量方差的贡献,也称为公因子方差比,记为错误!未找到引用源。,公式为:错误!未找到引用源。=错误!未找到引用源。(j=1,2,….,k)

【精品管理学】spss因子分析案例 共(13页)

[例11-1]下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。

图 ???对话框(图框。 图 钮返回 图11.3?描述性指标选择对话框 ???点击Extraction...钮,弹出FactorAnalysis:Extraction对话框(图11.4),系统提供如下因子提取方法: 图11.4?因子提取方法选择对话框 ???Principalcomponents:主成分分析法;

???Unweightedleastsquares:未加权最小平方法; ???Generalizedleastsquares:综合最小平方法; ???Maximumlikelihood:极大似然估计法; ???Principalaxisfactoring:主轴因子法; ???Alphafactoring:α因子法; ???对话框。 ???5种因图 ???旋转的目的是为了获得简单结构,以帮助我们解释因子。本例选正交旋转法,之后点击Continue钮返回FactorAnalysis对话框。 ???点击Scores...钮,弹出弹出FactorAnalysis:Scores对话框(图11.6),系统提供3种估计因子得分系数的方法,本例选Regression(回归因子得分),之后点击Continue钮返回FactorAnalysis对话框,再点击OK钮即完成分析。

图11.6?估计因子分方法对话框? ?11.2.3?结果解释 ??在输出结果窗口中将看到如下统计数据: ??系统首先输出各变量的均数(Mean)与标准差(StdDev),并显示共有25例观察单位进入分析;接着输出相关系数矩阵(CorrelationMatrix),经Bartlett检验表明:Bartlett值=326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。 好。今KMO值 NumberofCases?=?????25 CorrelationMatrix: X1???????X2???????X3???????X4???????X5???????X6???????X7 X1????????1.00000 X2?????????.58026??1.00000

SPSS主成分分析

主成分分析方法运用案例 1.《自然因素与社会经济因素对耕地质量贡献率研究》 选取了卧龙区为研究分析对象,以 1: 50000土地利用现状图为基础, 通过图形叠加添加土壤图、地貌类型图, 形成2981个评价单元。 (1)选定选取耕地质量的自然因素和社会经济因素。自然因素:土壤质地( X1 )、pH 值(Ⅹ2 )、有机质含量(Ⅹ 3 )、坡度(Ⅹ 4 )、障碍层次(Ⅹ5 )、砾石含量( X6 )、土层厚度(Ⅹ7 )、海拔(Ⅹ 8 ) 社会经济因素:灌溉保证率(Y1 )、田块分散度( Y2 )、地面平整度( Y3 )、中心城镇影响度( Y4 )、外部交通通达度( Y5 )、区域内路网密度(Y6 )、田间道路状况( Y7 ) (2)利用spss的主成分分析功能剔除在主成分中不呈显著性相关关系的因子。 自然因素:剔除了Ⅹ2 与Ⅹ8。剩下影响耕地质量的自然因子6个, 为土壤质地、有机质含量、坡度、障碍层次、砾石含量、土层厚度; 社会经济因素:剔除了 Y3 与Y7 。剩下影响耕地质量的社会经济因子5个, 为灌溉保证率、田块分散度、中心城镇影响度、外部交通通达度、区域内路网密度。 (3)对评价因素进行量化。

区域内路网密度分值: (4)采用特尔菲法确定各个因子的权重。 (5)计算评价单元的自然因素分值和社会经济因素分值。 (6)确定自然因素与社会经济因素贡献率。 2.《中国循环经济发展的空间分异与优化》 本文采取了主成分分析做循环经济发展水平的综合评价。(1)选取循环经济发展水平的因素

(2)采取spss软件进行主成分分析,得出了9个累积贡献率大于85%的主成分指标。(3)确定各主成分的贡献率,即权重。 (4)进行加权求和法计算出各地区循环经济发展能力综合分值。 聚类分析方法运用案例 1.陕西省县域经济发展水平聚类分析 (1)选取聚类的指标

spss主成分分析案例研究

多元统计分析实验报告

实验三、主成分分析 一、实验名称:主成分分析 二、实验目的:通过本实验掌握使用SPSS进行主成分分析 三、主成分分析步骤,我们归纳如下: 1. 根据研究问题选取初始分析变量; 2. 根据初始变量特性判断由协方差阵求主成分还是由相关阵求主成分; 3. 求协差阵或相关阵的特征根与相应标准特征向量; 4. 判断是否存在明显的多重共线性,若存在,则回到第一步; 5. 得到主成分的表达式并确定主成分个数,选取主成分; 6. 结合主成分对研究问题进行分析并深入研究。 四、分析结果: 搜集到有关大学生创业的调查问卷,问卷达到206份,具体数据附表1所示,为了从这些(创业目的、创业类型、创业领域的根据、创业的优势、创业地区、创业方式、)变量中提取主成分,先从做这些变量的相关矩阵: 相关矩阵 创业目的创业类型创业领域的根 据 创业的优势创业方式创业地区 相关创业目的 1.000 .031 .199 .157 .091 -.082 创业类型.031 1.000 -.037 .018 -.071 .077 创业领域的根据.199 -.037 1.000 .102 .128 -.099 创业的劣势.157 .018 .102 1.000 .083 .018 创业方式.091 -.071 .128 .083 1.000 -.127 创业地区-.082 .077 -.099 .018 -.127 1.000 Sig.(单侧)创业目的.272 .000 .001 .037 .054 创业类型.000 .000 .360 .081 .065 创业领域的根据.000 .235 .023 .006 .027 创业的劣势.001 .360 .023 .051 .361 创业方式.037 .081 .006 .051 .006 创业地区.054 .065 .027 .361 .006

SPSS软件进行主成分分析的应用例子修订版

S P S S软件进行主成分分析的应用例子 集团标准化小组:[VVOPPT-JOPP28-JPPTL98-LOPPNN]

SPSS软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下: 1. 第一,将EXCEL中的原始数据导入到SPSS软件中; 【1】“分析”|“描述统计”|“描述”。 【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。 【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。 进行因子分析(指标之间的相关性判定略)。 【1】“分析”|“降维”|“因子分析”选项卡,将要进行分析的变量选入“变量”列表; 【2】设置“描述”,勾选“原始分析结果”和“KMO与Bartlett球形度检验”复选框;

【3】设置“抽取”,勾选“碎石图”复选框; 【4】设置“旋转”,勾选“最大方差法”复选框; 【5】设置“得分”,勾选“保存为变量”和“因子得分系数”复选框;【6】查看分析结果。

【1】将初始因子载荷矩阵中的两列数据输入( 可用复制粘贴的方法) 到数据编辑窗口( 为 中输入“F 1”,然后在数字表达式中输入“V 1 /SQR(λ 1 )”[注:λ 1 =1.897], 即可得到特征向量F 1 ; 【3】然后利用“转换”|“计算变量”, 打开“计算变量”对话框,在“目标变量”文本框 中输入“F 2”,然后在数字表达式中输入“V 2 /SQR(λ 2 )”[注:λ 1 =1.550], 即可得到特征向量F 2 ; 【4】最后得到特征向量矩阵(主成分表达式的系数)。 【1】将得到的特征向量与标准化后的数据相乘, 然后就可以得出主成分函数的表达式; 中输入“Z 1 ”,然后在数字表达式中输入“0.531* Z (销售净利率)+0.594*Z (资产净利 率)+0.261*Z (净资产收益率)+0.546*Z (销售毛利率)” [注:F 1 =0.531,0.594,0.261,0.546], 即可得到特征向量Z 1 ; 【3】同理[注:F 2=-0.412,0.404,0.720,-0.383], 可得到特征向量Z 2 ; 【4】求出16家上市公司的主成分值。

利用SPSS进行主成分分析

利用SPSS进行主成分分析 【例子】 以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。 图1 原始数据(未经标准化) 第二步:打开“因子分析”对话框。 沿着主菜单的“Analyze→Data Reduction→FactorΚ”的路径(图2)打开因子分析选项框(图3)。 图2 打开因子分析对话框的路径

图3 因子分析选项框 第三步:选项设置。 首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会“ValueΚ”栏。下面逐项设置。 图4 将变量移到变量栏以后 ⒈设置Descriptives选项。 单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。

图5 描述选项框 在Statistics 栏中选中Univariate descriptives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution 复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。 在Correlation Matrix 栏中,选中Coefficients 复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant 复选项,则会给出相关系数矩阵的行列式,如果希望在Excel 中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。 设置完成以后,单击Continue 按钮完成设置(图5)。 ⒉ 设置Extraction 选项。 打开Extraction 对话框(图6)。因子提取方法主要有7种,在Method 栏中可以看到,系统默认的提取方法是主成分(Πρινχιπαλ χομπονεντσ),因此对此栏不作变动,就是认可了主成分分析方法。 在Analyze 栏中,选中Correlation matirx 复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covariance matrix 复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。 在Display 栏中,选中Unrotated factor solution (非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。 选中Scree Plot ( “山麓”图),则在分析结果中给出特征根按大小分布的折线图(形如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。 在Extract 栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eigenvalues )的数值,系统默认的是1=c λ。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1=c λ,则所有方差大于等于1的主成分将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将c λ值降低,例如取9.0=c λ;如果认为最后的提取的主成分数量偏多,则可以提高c λ值,例如取 1.1=c λ。主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值 的设定,要在反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临

主成分分析实例

在统计学中,主成分分析(principal components analysis, PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。 在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具 主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。 主成分分析的主要作用体现在五个方面,第一,主成分分析能降低所研究的数据空间的维数。第二,可通过因子负荷的结论,弄清X变量间的某些关系。第三,可用于多为数据的一种图形表现方法。第四,可由主成分分析构造回归模型,即把各个主成分作为新自变量代替原来自变量做回归分析。第五,用主成分分析筛选回归变量。

应用统计学因子分析与主成分分析案例解析+SPSS操作分析

因子分析与主成分分析 摘要:通过搜集相关数据,采用因子分析法和主成份分析法,对我国各个省市自治区经济发展基本情况的八项指标进行分析。具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。这是一个综合分析问题,八项指标较多,用主成分分析法进行综合评价。 关键词:由于样本数比较多,这里不再给出,可参见factor1.sav文件 引言:因子分析是寻找潜在的起支配作用的因子模型的方法。因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低。每组变量代表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。通过因子分析得来的新变量是对每个原始变量进行内部剖析。因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。基本步骤:在SPSS中进行因子分析的步骤如下: 选择“分析---降维---因子分析”,在弹出的对话框里 (1)描述---系数、KMO与Bartlett的球形度检验 (2)抽取---碎石图、未旋转的因子解 (3)旋转---最大方差法、旋转解、载荷图 (4)得分---保存为变量、显示因子得分系数矩阵 (5)选项---按大小排序 点击确定得到如下各图 图3-1

SPSS进行主成分分析(PCA)

利用SPSS进行主成分分析 【例子】以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。 图1 原始数据(未经标准化) 第二步:打开“因子分析”对话框。 沿着主菜单的“Analyze→Data Reduction→Factor ”的路径(图2)打开因子分析选项框(图3)。 图2 打开因子分析对话框的路径

图3 因子分析选项框 第三步:选项设置。 首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会“Value ”栏。下面逐项设置。 图4 将变量移到变量栏以后 ⒈设置Descriptives选项。 单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。

图5 描述选项框 在Statistics 栏中选中Univariate descriptives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution 复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。 在Correlation Matrix 栏中,选中Coefficients 复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant 复选项,则会给出相关系数矩阵的行列式,如果希望在Excel 中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。 设置完成以后,单击Continue 按钮完成设置(图5)。 ⒉ 设置Extraction 选项。 打开Extraction 对话框(图6)。因子提取方法主要有7种,在Method 栏中可以看到,系统默认的提取方法是主成分(∏ρινχιπαλ χομπονεντσ),因此对此栏不作变动,就是认可了主成分分析方法。 在Analyze 栏中,选中Correlation matirx 复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covariance matrix 复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。 在Display 栏中,选中Unrotated factor solution (非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。 选中Scree Plot (“山麓”图),则在分析结果中给出特征根按大小分布的折线图(形如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。 在Extract 栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eigenvalues )的数值,系统默认的是1=c λ。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1=c λ,则所有方差大于等于1的主成分将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将c λ值降低,例如取9.0=c λ;如果认为最后的提取的主成分数量偏多,则可以提高c λ值,例如取 1.1=c λ。主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值 的设定,要在反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临

相关文档
最新文档