spss进行主成分分析的步骤图文)
SPSS进行主成分分析

利用SPSS进行主成分分析【例子】以全国31个省市的8项经济指标为例,进行主成分分析。
第一步:录入或调入数据(图1)。
图1 原始数据(未经标准化)第二步:打开“因子分析”对话框。
沿着主菜单的“Analyze→Data Reduction→Factor ”的路径(图2)打开因子分析选项框(图3)。
图2 打开因子分析对话框的路径图3 因子分析选项框第三步:选项设置。
首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。
在本例中,全部8个变量都要用上,故全部调入(图4)。
因无特殊需要,故不必理会“Value ”栏。
下面逐项设置。
图4 将变量移到变量栏以后⒈设置Descriptives选项。
单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。
图5 描述选项框在Statistics 栏中选中Univariate descriptives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution 复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。
在Correlation Matrix 栏中,选中Coefficients 复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant 复选项,则会给出相关系数矩阵的行列式,如果希望在Excel 中对某些计算过程进行了解,可选此项,否则用途不大。
其它复选项一般不用,但在特殊情况下可以用到(本例不选)。
设置完成以后,单击Continue 按钮完成设置(图5)。
⒉ 设置Extraction 选项。
打开Extraction 对话框(图6)。
因子提取方法主要有7种,在Method 栏中可以看到,系统默认的提取方法是主成分(Principal Components ),因此对此栏不作变动,就是认可了主成分分析方法。
如何利用SPSS进行主成分分析

如何利用SPSS进行主成分分析利用SPSS进行主成分分析【例子】以全国31个省市的8项经济指标为例,进行主成分分析。
第一步:录入或调入数据(图1)。
图1 原始数据(未经标准化)第二步:打开“因子分析”对话框。
沿着主菜单的“Analyze→Data Reduction→Factor ”的路径(图2)打开因子分析选项框(图3)。
图2 打开因子分析对话框的路径图3 因子分析选项框第三步:选项设置。
首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。
在本例中,全部8个变量都要用上,故全部调入(图4)。
因无特殊需要,故不必理会“Value ”栏。
下面逐项设置。
图4 将变量移到变量栏以后⒈设置Descriptives选项。
单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。
图5 描述选项框在Statistics 栏中选中Univariate descriptives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution 复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。
在Correlation Matrix 栏中,选中Coefficients 复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant 复选项,则会给出相关系数矩阵的行列式,如果希望在Excel 中对某些计算过程进行了解,可选此项,否则用途不大。
其它复选项一般不用,但在特殊情况下可以用到(本例不选)。
设置完成以后,单击Continue 按钮完成设置(图5)。
⒉ 设置Extraction 选项。
打开Extraction 对话框(图6)。
因子提取方法主要有7种,在Method 栏中可以看到,系统默认的提取方法是主成分(∏ρινχιπαλ χομπονεντσ),因此对此栏不作变动,就是认可了主成分分析方法。
SPSS进行主成分分析的步骤(图文)

主成分分析の操作過程原始數據如下(部分)調用因子分析模塊(Analyze―Dimension Reduction―Factor),將需要參與分析の各個原始變量放入變量框,如下圖所示:單擊Descriptives按鈕,打開Descriptives次對話框,勾選KMO and Bartlett’s test of sphericity選項(Initial solution選項為系統默認勾選の,保持默認即可),如下圖所示,然後點擊Continue按鈕,回到主對話框:其他の次對話框都保持不變(此時在Extract次對話框中,SPSS已經默認將提取公因子の方法設置為主成分分析法),在主對話框中點OK按鈕,執行因子分析,得到の主要結果如下面幾張表。
①KMO和Bartlett球形檢驗結果:KMO為0.635>0.6,說明數據適合做因子分析;Bartlett球形檢驗の顯著性P值為0.000<0.05,亦說明數據適合做因子分析。
②公因子方差表,其展示了變量の共同度,Extraction下面各個共同度の值都大於0.5,說明提取の主成分對於原始變量の解釋程度比較高。
本表在主成分分析中用處不大,此處列出來僅供參考。
③總方差分解表如下表。
由下表可以看出,提取了特征值大於1の兩個主成分,兩個主成分の方差貢獻率分別是55.449%和29.771%,累積方差貢獻率是85.220%;兩個特征值分別是3.327和1.786。
④因子截荷矩陣如下:根據數理統計の相關知識,主成分分析の變換矩陣亦即主成分載荷矩陣U 與因子載荷矩陣A 以及特征值λの數學關系如下面這個公式:λiiiAU=故可以由這二者通過計算變量來求得主成分載荷矩陣U 。
新建一個SPSS 數據文件,將因子載荷矩陣中の各個載荷值複制進去,如下圖所示:計算變量(Transform-Compute Variables )の公式分別如下二張圖所示:計算變量得到の兩個特征向量U1和U2如下圖所示(U1和U2合起來就是主成分載荷矩陣):所以可以得到兩個主成分Y1和Y2の表達式如下:Y1=0.456X1+0.401X2+0.428X3+0.490X4+0.380X5+0.253X6Y2=-0.367X1+0.322X2-0.323X3-0.303X4+0.453X5+0.602X6由上面兩個表達式,可以通過計算變量來得到Y1、Y2の值。
SPSS进行主成分分析

实验七、利用SPSS 进行主成分剖析【例子】以全国 31 个省市的 8 项经济指标为例,进行主成分剖析。
第一步:录入或调入数据(图 1)。
图 1 原始数据(未经标准化)第二步:翻开“因子剖析”对话框。
沿着主菜单的“ Analyze →Data Reduction→ Factor”的路径(图2)翻开因子剖析选项框(图 3)。
图 2 翻开因子剖析对话框的路径图 3 因子剖析选项框第三步:选项设置。
第一,在源变量框中选中需要进行剖析的变量,点击右侧的箭头符号,将需要的变量调入变量( Variables )栏中(图 3)。
在本例中,所有 8 个变量都要用上,故所有调入(图 4)。
因无特别需要,故不用理睬“ Value ”栏。
下边逐项设置。
图 4 将变量移到变量栏此后⒈设置 Descriptives 描绘选项。
单击 Descriptives按钮(图4),弹出Descriptives对话框(图5)。
图5描绘选项框在 Statistics统计栏中选中Univariate descriptives复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供查验参照);选中Initial solution复选项,则会给出主成分载荷的公因子方差(这一栏数据剖析时实用)。
在 Correlation Matrix栏中,选中Coefficients复选项,则会给出原始变量的相关系数矩阵(剖析时可参照);选中 Determinant 复选项,则会给出有关系数矩阵的队列式,假如希望在 Excel 中对某些计算过程进行认识,可选此项,不然用途不大。
其他复选项一般不用,但在特别状况下能够用到(本例不选)。
设置达成此后,单击Continue 按钮达成设置(图 5)。
⒉设置 Extraction选项。
翻开 Extraction对话框(图6)。
因子提取方法主要有7 种,在 Method 栏中能够看到,系统默认的提取方法是主成分( Principal Components),所以对此栏不作改动,就是认同了主成分剖析方法。
主成分分析SPSS操作步骤

主成分分析SPSS操作步骤以教材第五章习题8的数据为例,演示并说明主成分分析的详细步骤:一.原始数据的输入注意事项:关键注意设置好数据的类型(数值?字符串?等等)以及小数点后保留数字的个数即可。
二.选项操作1. 打开SPSS的“分析”→“降维”→“因子分析”,打开“因子分析”对话框(如下图)2. 把六个变量:食品、衣着、燃料、住房、交通和通讯、娱乐教育文化输入到右边的待分析变量框。
3. 设置分析的统计量打开最右上角的“描述”对话框,选中“统计量”里面的“原始分析结果”和“相关矩阵”里面的“系数”。
(选中原始分析结果,SPSS自动把原始数据标准差标准化,但不显示出来;选中系数,会显示相关系数矩阵。
)。
然后点击“继续”。
打开第二个的“抽取”对话框:“方法”里选取“主成分”;“分析”、“输出”和“抽取”这三项都选中各自的第一个选项即可。
然后点击“继续”。
第三个的“旋转”对话框里,选取默认的也是第一个选项“无”。
第四个“得分”对话框中,选中“保存为变量”的“回归”;以及“显示因子得分系数矩阵”。
第五个“选项”对话框,默认即可。
这时点击“确定”,进行主成分分析。
三.分析结果的解读按照SPSS输出结果的先后顺序逐个介绍1.相关系数矩阵:是6个变量两两之间相关系数大小的方阵。
2.共同度:给出了这次主成分分析从原始变量中提取的信息,可以看出交通和通讯最3.总方差的解释:系统默认方差大于1的为主成分,所以只取前两个,前两个主成分累加占到总方差的80.939%。
并且第一主成分的方差是3.568,第二主成分的方差是1.288。
4. 主成分载荷矩阵:应该特别注意:这个主成分载荷矩阵并不是主成分的特征向量,也就是说并不是主成分1和主成分2的系数,主成分系数的求法是:各自主成分载荷向量除以各自主成分特征值的算术平方根。
那么第1主成分的各个系数是向量(0.925, 0.902, 0.880, 0.878, 0.588, 0.093)除以568.3后得到,即(0.490, 0.478, 0.466, 0.465, 0.311, 0.049)(这才是主成分1的特征向量,满足条件:系数的平方和等于1),分别乘以6个原始变量标准化之后的变量即为第1主成分的函数表达式:燃娱住衣食交Z Z Z Z Z Z Y *049.0*311.0*465.0*466.0*478.0*490.01+++++= 同理可以求出第2主成分的函数表达式。
主成分分析的SPSS实现

数据标准化:
(四)确定主成分个数m:用SPSS软件中表 “Total Variance Explained(总方差解释)” 的主成分方 差累计贡献率 %、结合表“Component Matrix(初始因 子载荷阵)”中变量不出现丢失确定主成分个数m。
(SPSS中选取主成分的方法有两个:一是根据特征根≥1来选 取; 另一种是用户直接规定主成分的个数来选取。)
),得到特征向量Ui,由
(六)主成分Fi命名:用SPSS软件中表 “Component Matrix”中的第 i 列中系数绝对值大的对 应变量对Fi命名(有时命名清晰性低)。
(七)主成分与综合主成分得分(评价值) (这是 SPSS软件及其教科书中没完善的地方):主成分得分是根据 表达式将标准化后的相应数据代入得到的, 在 “transform_compute”中输入主成分的表达式(特征向 量与标准化后的数据相乘),确定后即可得到各主成分 的得分Fi 。
(五)主成分Fi表达式(这是SPSS软件及其教科书中没完善
的地方):经过FACTOR 过程产生的是因子载荷阵,但主 成分分析模型需要的不是因子载荷量而是特征向量,所以 还需将因子载荷量输入数据编辑窗口,利用 “主成分相 应特征根的平方根与特征向量乘积为因子载荷量”的性质 用TRANSFORM——COMPUTE 来计算特征向量,得到主成 分的线性表达式。
主成分分析法和SPSS软件应用时 一对一的正确步骤:
(一)指标的正向化。 指标最好有同趋势化,一般为了评价分析的方便,需
要将逆指标转化为正指标,转化的方式为用逆指标的倒数 值代替原指标。 (二)指标数据标准化(SPSS软件自动执行,下图)。 (三)指标之间的相关性判定:用SPSS软件中表 “Correlation Matrix(相关系数矩阵)”判定。
如何利用SPSS进行主成分分析

利用SPSS进行主成分分析【例子】以全国31个省市的8项经济指标为例,进行主成分分析。
第一步:录入或调入数据(图1)。
图1 原始数据(未经标准化)第二步:打开“因子分析”对话框。
沿着主菜单的“Analyze→Data Reduction→Factor ”的路径(图2)打开因子分析选项框(图3)。
图2 打开因子分析对话框的路径图3 因子分析选项框第三步:选项设置。
首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。
在本例中,全部8个变量都要用上,故全部调入(图4)。
因无特殊需要,故不必理会“Value ”栏。
下面逐项设置。
图4 将变量移到变量栏以后⒈设置Descriptives选项。
单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。
图5 描述选项框在Statistics 栏中选中Univariate descriptives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution 复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。
在Correlation Matrix 栏中,选中Coefficients 复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant 复选项,则会给出相关系数矩阵的行列式,如果希望在Excel 中对某些计算过程进行了解,可选此项,否则用途不大。
其它复选项一般不用,但在特殊情况下可以用到(本例不选)。
设置完成以后,单击Continue 按钮完成设置(图5)。
⒉ 设置Extraction 选项。
打开Extraction 对话框(图6)。
因子提取方法主要有7种,在Method 栏中可以看到,系统默认的提取方法是主成分(∏ρινχιπαλ χομπονεντσ),因此对此栏不作变动,就是认可了主成分分析方法。
主成分分析在SPSS中的操作应用(详细步骤

主成分分析在SPSS中的操作应用(2)SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化处理,所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS不会直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。
图表3 相关系数矩阵图表4 方差分解主成分提取分析表主成分分析在SPSS中的操作应用(3)图表5 初始因子载荷矩阵从图表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。
可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。
主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。
注:特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。
通过图表4(方差分解主成分提取分析)可知,提取2个主成分,即m=2,从图表5(初始因子载荷矩阵)可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息;人均GDP和农业增加值指标在第二主成分上有较高载荷,说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。
所以提取两个主成分是可以基本反映全部指标的信息,所以决定用两个新变量来代替原来的十个变量。
但这两个新变量的表达还不能从输出窗口中直接得到,因为“Component Matrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。
用图表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数[2]。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主成分分析の操作过程
原始数据如下(部分)
调用因子分析模块(Analyze―Dimension Reduction―Factor),将需要参与分析の各个原始变量放入变量框,如下图所示:
单击Descriptives按钮,打开Descriptives次对话框,勾选KMO and Bartlett’s test of sphericity选项(Initial solution选项为系统默认勾选の,保持默认即可),如下图所示,然後点击Continue按钮,回到主对话框:
其他の次对话框都保持不变(此时在Extract次对话框中,SPSS已经默认将提取公因子の方法设置为主成分分析法),在主对话框中点OK按钮,执行因子分析,得到の主要结果如下面几张表。
①KMO和Bartlett球形检验结果:
KMO为0.635>0.6,说明数据适合做因子分析;Bartlett球形检验の显着性P值为0.000<0.05,亦说明数据适合做因子分析。
②公因子方差表,其展示了变量の共同度,Extraction下面各个共同度の值都大於0.5,说明提取の主成分对於原始变量の解释程度比较高。
本表在主成分分析中用处不大,此处列出来仅供参考。
③总方差分解表如下表。
由下表可以看出,提取了特征值大於1の两个主成分,两个主成分の方差贡献率分别是55.449%和29.771%,累积方差贡献率是85.220%;两个特征值分别是3.327和1.786。
④因子截荷矩阵如下:
根据数理统计の相关知识,主成分分析の变换矩阵亦即主成分载荷矩阵U与因子载荷矩阵A以及特征值λの数学关系如下面这个公式:
故可以由这二者通过计算变量来求得主成分载荷矩阵U。
新建一个SPSS数据文件,将因子载荷矩阵中の各个载荷值复制进去,如下图所示:
计算变量(Transform-Compute Variables)の公式分别如下二张图所示:
计算变量得到の两个特征向量U1和U2如下图所示(U1和U2合起来就是主成分载荷矩阵):
所以可以得到两个主成分Y1和Y2の表达式如下:
Y1=0.456X1+0.401X2+0.428X3+0.490X4+0.380X5+0.253X6
Y2=-0.367X1+0.322X2-0.323X3-0.303X4+0.453X5+0.602X6
由上面两个表达式,可以通过计算变量来得到Y1、Y2の值。
需要注意の是,在计算变量之前,需要对原始变量进行标准化处理,上述Y1、Y2表达式中のX1~X9应为各原始变量の标准分,而不是原始值。
(另外需注意,本操作需要在SPSS原始文件中来进行,而不是主成分载荷矩阵の那个SPSS数据表中。
)
调用描述统计:描述模块(Analyze-Descriptive Statistics-Descriptives),将各个原始变量放入变量框,并勾选Save standardized values as variables框,如下图所示:
得到各个原始变量の标准分如下图(部分):
Z人均GDP即为X1,Z固定资产投资即为X2,其余类推。
调用计算变量模块(Transform-Compute Variables),输入公式如下图所示:
计算出来の主成分Y1、Y2如下图所示:
由上述各步骤,我们就求得了主成分Y1和Y2。
通过主成分得分,可以进行聚类分析或者综合评价。
聚类分析不再详述,下面再补充介绍一下综合评价の计算。
根据公式,综合评价得分Y=w1*Y1+w2*Y2,w1、w2の值就是等於旋转之前の方差贡献率(如下图所示),本例中,两个权重w1、w2分别是0.55449和0.29771,故Y=0.55449*Y1+0.29771*Y2。
注意:如果需要对权重进行归一化处理,则w1、w2分别是55.449/85.220和29.771/85.220,则Y=(55.449*Y1+29.771*Y2)/85.220。
以未归一化の权重为例,通过计算变量可以得到主成分综合评价得分Y,操作过程如下图所示:
最终可以得出综合评价得分Y值,如下图所示:。