SPSS因子聚类案例分析报告

合集下载

第九章SPSS的聚类案例

第九章SPSS的聚类案例

样本j
J (i, j) b c abc
样本i 1
10 ab
a为样本i与样本j在所有变量上同时 取1的个数;d为同时取0的个数
特点:排除同时不拥有某特征的情
0 c d 况;取1的状态比取0更有意义(如:
临床检验中的阳性特征);编码方
案会引起系数的变化
分层聚类
(四)品质数据个体间的距离
雅科比(Jaccard)系数:适用二值变量 姓名 手机上网 无线音乐 手机报
d (i, j) b c abcd
样本i 1 0
10 ab cd
a为样本i与样本j在所有变量上同 时取1的个数;d为同时取0的个数
特点:排除同时拥有或同时不拥 有某特征的情况;取0和1地位等 价,编码方案的变化不会引起系 数的变化。
分层聚类
(四)品质数据个体间的距离
简单匹配(simple matching)系数:适用二值变量
3. 不管实际数据中是否存在不同的类别,利用聚 类分析都能得到分成若干类别的解
分层聚类
(一)思路:聚类过程具有一定的层次性 以合并(凝聚)的方式聚类(SPSS采用)
首先,每个个体自成一类 其次,将最“亲密”的个体聚成一小类 然后,将最“亲密”的小类或个体再聚成一类 重复上述过程,即:把所有的个体和小类聚集成越
分类过程中,没有事先指定分类的标准.完全根据样 本数据客观产生分类结果.
(4)SPSS中的聚类方法
分层(二)特点
1. 聚类分析前所有个体所属的类别是未知的, 类别个数一般也是未知的,分析的依据只有 原始数据,可能事先没有任何有关类别的信 息可参考
2. 严格地,聚类分析并不是纯粹的统计技术, 不象其他多元分析,需要从样本去推断总体
一般不涉及统计量分布,也不需显著性检验

spss因子分析案例

spss因子分析案例

spss因子分析案例在进行SPSS因子分析时,我们通常遵循以下步骤:数据准备、因子提取、因子旋转、因子得分和结果解释。

下面是一个因子分析的案例,展示了如何使用SPSS软件进行这一统计分析。

首先,我们需要准备数据。

这通常涉及收集问卷调查数据,其中包含多个项目或变量,这些变量被认为是潜在因子的指标。

在SPSS中,数据应该以数据集的形式输入,每个变量代表一个问卷项目,每个案例代表一个受访者的回答。

接下来,我们进行因子提取。

在SPSS中,我们可以通过“分析”菜单选择“降维”然后选择“因子”来开始因子分析。

在因子分析对话框中,我们需要指定分析的变量,并决定提取因子的方法。

常见的提取方法包括主成分分析和最大似然法。

此外,我们还需要决定因子提取的标准,如特征值大于1的规则或基于特定比例的方差提取。

因子提取后,我们通常需要进行因子旋转。

旋转的目的是使因子结构更加清晰,便于解释。

SPSS提供了多种旋转方法,如正交旋转(如Varimax)和斜交旋转(如Promax)。

旋转后,每个变量的因子载荷(即变量与因子的相关系数)将被重新估计。

然后,我们可以计算因子得分。

因子得分是每个受访者在每个因子上的估计得分,它可以帮助我们了解每个受访者在潜在因子上的位置。

在SPSS中,可以通过“保存”选项来保存因子得分,以便进一步分析。

最后,我们需要解释因子分析的结果。

这包括解释每个因子的含义,以及哪些变量与每个因子最相关。

我们可以通过查看因子载荷矩阵来完成这一步骤。

通常,载荷值较高的变量被认为是该因子的良好指标。

在实际应用中,因子分析可以帮助我们识别数据中的潜在结构,简化数据集,并为进一步的分析提供基础。

例如,在市场研究中,因子分析可以用来识别消费者行为的潜在维度,从而帮助企业更好地理解其客户群体。

通过上述步骤,我们可以使用SPSS软件有效地进行因子分析,从而揭示数据背后的潜在结构,并为决策提供支持。

SPSS聚类分析加具体案例

SPSS聚类分析加具体案例

六、聚类分析(一)概述1.聚类分析的目的根据已知数据,计算样本或者变量之间亲疏关系的统计量(距离或相关系数)。

根据某种准则(最短距离法、最长距离法、中间距离法、重心法),使同一类内的差别较小,而类与类之间的差别较大,最初达到的就是将样本或变量分成若干类。

2.聚类分析的分类3.距离与相似性为了对样本或者变量进行分类,就需要研究样本之间的关系,最常用的方法有两个。

(二)系统聚类1.系统聚类的步骤距离的具体定义及计算方式计算n各样本两两之间的距离将距离接近的数据依次合并为一类,再计算,再合并 画聚类图,解释类与类之间的关系2.亲疏程度度量方法3.系统聚类的分类4.SPSS操作及实例SPSS采用的是凝聚法。

案例:根据30个省的23个主要行业的平均工资情况,通过聚类分析来判断哪些地区平均工资水平高。

SPSS操作及结果:打开SPSS上方菜单栏中的分析->分类->系统聚类选择变量->勾选统计量->在绘制里选择树状图和冰柱图勾选方法(通常使用组间联接)->度量区间->选择标准化方式(全距从0到1)下图为近似矩阵表,标注了相关系数,数值越大,距离越接近下图为聚类分析结果表,第一类表示这是聚类分析的第几步,第二三列表示该步中那几个样本或者小类聚成一类,第四列表示距离,第五六列表示本步骤中参与的是个体还是小类(0表示样本,非0表示第n步生成的小类),第七列表示本步骤的聚类结果将在以下第几步中用到。

下面是冰柱图和树状图的结果,根据树状图可以看出,如果分为三类的话,第一类包括北京上海,第二类包括天津、广东、浙江、江苏、西藏,剩下的归为一类。

(三)快速聚类(适合大样本聚类)1.快速聚类的步骤指定聚类数目K确定K个初始类的中心(自定义或者根据数据中心初步确定)根据距离最近的原则进行分类根据新的中心位置,重新计算每一记录距离新的类别中心的的距离,并重新分类重复步骤4,直到达到标准2.SPSS操作及实例打开SPSS上方菜单栏中的分析->分类->K-均值聚类选择变量->勾选统计量->定义变量值选择迭代次数->选项(勾选初始聚类中心、每个个案的聚类信息)->定义变量值->保存(勾选聚类成员、聚类中心距离)下图为输出的初始聚类中心下图为最终距离中心,第一类平均工资最高,第二类次之,第三类最低下图为每个聚类中的案例数和聚类成员。

SPSS聚类分析实例讲解

SPSS聚类分析实例讲解

SPSS聚类分析实例讲解SPSS是一款功能强大的统计分析软件,可用于数据清洗、描述统计分析、假设检验和聚类分析等。

聚类分析是一种无监督学习方法,其目标是按照数据的相似性度量,将样本数据划分为多个不同的群组。

下面将以一个实例来讲解如何使用SPSS进行聚类分析。

实例描述:假设有一个超市的销售数据,包含了不同商品的销售额、销售量和利润等信息。

我们希望将商品进行聚类分析,找出相似销售特征的商品群组。

步骤一:数据准备首先,将销售数据保存为一个.SP文件,然后打开SPSS软件。

在主界面上选择“文件”-“打开”-“数据库”-“从SPSS文件”,打开数据文件。

步骤二:变量选择在数据文件中,选择出要进行聚类分析的变量。

在“数据视图”中,选择那些代表销售特征的变量,例如“销售额”、“销售量”和“利润”。

在变量列上按住“Ctrl”键,同时点击这些变量名,选中它们。

步骤三:聚类分析点击菜单上的“数据”-“服务”-“聚类分析”进行聚类分析操作。

会弹出“聚类分析”对话框。

在对话框中,将选中的变量移到右侧的“变量”框中,并选择“K均值聚类”作为聚类方法。

K值是指要分成的群组数量,可以根据实际情况设定。

这里假设将商品分成3个群组,因此设置为3步骤四:聚类结果解读点击“确定”按钮,SPSS将自动进行聚类分析。

完成后,SPSS会在数据文件中生成一个新的变量,用于表示每个样本所属的群组。

在下方的“结果视图”中,可以看到聚类结果的统计数据、聚类中心和变量间的距离。

此外,在“分类变量资料”中,还可以看到每个样本所属的群组编号。

步骤五:聚类结果可视化为了更好地理解聚类结果,可以进行可视化展示。

点击菜单上的“图形”-“散点图”,在对话框中依次选择所属群组变量和销售额、销售量这两个变量。

点击“确定”按钮,即可生成散点图。

散点图可以清楚地显示出不同群组之间的差异和相似性。

根据散点图,可以对聚类结果进行解读。

例如,如果不同群组之间的点比较分散,则说明聚类效果较差;而如果不同群组之间的点比较集中,则说明聚类效果较好。

spss聚类分析案例

spss聚类分析案例

spss聚类分析案例SPSS聚类分析案例。

在统计学中,聚类分析是一种常用的数据分析方法,它可以将数据集中的个体或变量进行分组,使得同一组内的个体或变量之间的相似度较高,而不同组之间的相似度较低。

聚类分析在市场分析、社会学调查、医学研究等领域有着广泛的应用。

而SPSS作为一款专业的统计分析软件,提供了丰富的聚类分析功能,能够帮助研究者对数据进行深入的分析和挖掘。

在本案例中,我们将以一个实际的数据集为例,介绍SPSS中如何进行聚类分析,并对分析结果进行解读和讨论。

首先,我们需要加载数据集,然后选择合适的变量进行聚类分析。

在选择变量时,需要考虑变量之间的相关性,避免出现多重共线性的情况。

在本案例中,我们选择了A、B、C三个变量进行聚类分析。

接下来,我们需要进行聚类分析的设置。

在SPSS软件中,可以选择不同的聚类算法和距离度量方法,以及设置聚类的个数。

在本案例中,我们选择了K均值聚类算法,并设置聚类的个数为3。

同时,我们还可以对聚类结果进行验证和评价,以确保聚类结果的准确性和稳定性。

在进行聚类分析后,我们需要对聚类结果进行解读和讨论。

首先,我们可以通过聚类中心和聚类图表来直观地展示不同组之间的差异和相似度。

然后,我们可以对每一组的特征进行分析,找出不同组之间的显著性差异和共性特征。

最后,我们可以将聚类结果与实际情况进行比较,验证聚类结果的有效性和可解释性。

通过本案例的介绍,相信读者对SPSS中的聚类分析方法有了更深入的了解。

在实际应用中,聚类分析可以帮助研究者发现数据中潜在的规律和结构,为决策提供科学依据。

同时,SPSS作为一款功能强大的统计分析软件,为用户提供了丰富的数据分析工具和可视化功能,能够满足不同领域的研究需求。

总之,聚类分析是一种重要的数据分析方法,能够帮助研究者理解数据的内在结构和规律。

而SPSS作为一款专业的统计分析软件,为用户提供了便捷的聚类分析工具,能够帮助用户快速准确地进行数据分析和挖掘。

SPSS因子分析报告法-例子解释

SPSS因子分析报告法-例子解释

因子分析的基本概念和步骤一、因子分析的意义在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。

例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。

虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在:计算量的问题由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。

虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。

变量间的相关性问题收集到的诸多变量之间通常都会存在或多或少的相关性。

例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。

而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。

例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。

类似的问题还有很多。

为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。

为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。

因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。

因子分析的概念起源于20 世纪初Karl Pearson 和Charles Spearmen 等人关于智力测验的统计分析。

spss聚类分析案例

spss聚类分析案例在进行SPSS聚类分析时,我们通常会遵循一系列步骤来确保分析的准确性和有效性。

以下是一个典型的聚类分析案例,展示了如何使用SPSS软件进行数据分析。

首先,我们需要收集数据。

数据可以是定量的,也可以是定性的,但必须与研究问题相关。

例如,如果我们正在研究消费者购买行为,我们可能会收集关于消费者年龄、收入、购买频率和偏好的数据。

接下来,我们将数据导入SPSS。

这可以通过直接输入数据、从Excel文件导入或使用SPSS的数据导入向导来完成。

一旦数据在SPSS中,我们需要检查数据的准确性和完整性,确保没有缺失值或异常值。

在进行聚类分析之前,我们通常需要对数据进行预处理。

这可能包括标准化变量、处理缺失值和异常值,以及可能的变量转换。

标准化是重要的,因为它确保了所有变量在聚类分析中具有相同的权重。

然后,我们选择聚类方法。

SPSS提供了几种聚类方法,包括K-means聚类、层次聚类和双向聚类。

选择哪种方法取决于数据的特性和研究目的。

例如,如果我们有明确的类别数量,K-means聚类可能是合适的;如果我们希望看到数据的层次结构,层次聚类可能更合适。

在选择了聚类方法后,我们需要确定聚类的数量。

这可以通过多种方法来确定,包括肘部方法、轮廓系数或基于信息准则的方法。

确定聚类数量后,我们可以运行聚类算法,并将数据点分配到不同的聚类中。

聚类完成后,我们需要评估聚类的质量。

这可以通过查看聚类的内部一致性和聚类之间的差异来完成。

我们还可以进行统计测试,如ANOVA或卡方检验,来检验聚类是否在统计上显著。

最后,我们解释聚类结果。

这包括识别每个聚类的特征,以及这些特征如何与研究问题相关。

例如,如果我们发现一个聚类主要由高收入、频繁购买的消费者组成,这可能表明这是一个高价值的市场细分。

在整个聚类分析过程中,我们可能会进行多次迭代,调整聚类方法、聚类数量或数据预处理步骤,以获得最佳的聚类结果。

聚类分析是一个动态的过程,需要根据数据和研究目的进行调整。

spss聚类分析与因子分析

基于因子分析的31个省行业就业情况分析摘要:就业问题已经越来越受人重视,通过对31个省的17个就业指标进行因子分析,得出3个因子的较为合理的解释,并结合对31个省的就业情况做出相应的聚类分析,给出相应的综合分析结论。

关键词:因子分析聚类分析1、指标的确定根据《中国统计年鉴2009》中的数据表,选取X1: 农、林、牧、渔业就业人数 X2: 采矿业就业人数X3:制造业就业人数 X4:电力、燃气及水的生产及水的生产和供应业就业人数X5:建筑业就业人数 X6:交通运输、仓储和邮政业就业人数X7:信息传输、计算机服务和软件业就业人数X8:批发和零售业就业人数 X9:住宿和餐饮业就业人数X10:金融业就业人数 X11:租赁和商务服务业就业人数X12:科学研究、技术服务和地质勘查业就业人数X13:水利、环境和公共设施管理业就业人数 X14:教育就业人数X15:卫生、社会保障和社会福利业就业人数 X16:文化、体育和娱乐业就业人数X17:公共管理和社会组织就业人数这17个数据对31个省的就业情况进行相关分析。

2、因子分析及结果先标准化数据,且因子分析过程以特征值大于0为标准提取因子,以主成分法做因子分析,由KMO检验值0.766可判别该问题可使用因子分析。

再考察累计贡献率>85﹪的成分,由图1可知应选择3个因子较为适合。

Total Variance Explained14 .016 .091 99.879 .016 .091 99.87915 .011 .064 99.942 .011 .06499.94216 .008 .045 99.987 .008 .045 99.98717 .002 .013 100.000 .002 .013 100.000图1再次以3个主分做标准做提取因子,并以主成分法做因子分析,采用方差极大化方法对因子载荷矩阵进行旋转,可得旋转后的因子特征值和贡献率(图2)以及旋转后的因子载荷矩阵(图3)。

SPSS因子分析报告法-内容与案例

实验课:因子分析实验目的理解主成分(因子)分析的基本原理,熟悉并掌握SPSS中的主成分(因子)分析方法及其主要应用。

因子分析一、基础理论知识1 概念因子分析(Factor analysis):就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。

从数学角度来看,主成分分析是一种化繁为简的降维处理技术。

主成分分析(Principal component analysis):是因子分析的一个特例,是使用最多的因子提取方法。

它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。

选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。

两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。

2 特点(1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。

(2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。

(3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。

(4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。

在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。

显然,在一个低维空间解释系统要比在高维系统容易的多。

3 类型根据研究对象的不同,把因子分析分为R 型和Q 型两种。

当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。

但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。

使用SPSS软件进行因子分析和聚类分析的方法

使用SPSS软件进行因子分析和聚类分析的方法使用SPSS软件进行因子分析和聚类分析的方法随着统计分析软件的发展,SPSS(Statistical Package for the Social Sciences)软件作为一款功能强大、易于使用的统计分析工具受到广泛欢迎。

它能帮助研究人员进行各种统计分析,其中包括因子分析和聚类分析。

本文将介绍如何使用SPSS软件进行因子分析和聚类分析,并针对每个分析方法提供详细步骤和操作示例。

一、因子分析因子分析是一种常用的统计方法,在数据维度缩减和相关变量结构分析方面具有广泛的应用。

以下是使用SPSS软件进行因子分析的步骤:1. 数据准备首先,需要将原始数据导入SPSS软件中。

可以通过选择“文件”>“打开”>“数据”,然后选择合适的数据文件进行导入。

确保数据是以矩阵的形式存储,每个变量占据一列,每个观察单位占据一行。

2. 因子分析设置在SPSS软件中,选择“分析”>“数据准备”>“特殊分析”>“因子”。

在弹出的对话框中,选择需要进行因子分析的变量,将它们移动到“因子”框中。

然后,选择所需的因子提取方法(如主成分分析或因子分析),并指定所需的因子个数。

可以选择默认值,也可以根据实际需求进行调整。

3. 统计输出完成因子分析设置后,点击“确定”按钮开始分析。

SPSS软件将生成一个因子分析结果报告。

报告中将包含因子载荷矩阵、特征值、解释的方差比例等统计指标。

通过这些指标,可以对变量和因子之间的关系、每个因子的解释能力进行分析。

4. 结果解读对于因子载荷矩阵,可以根据因子载荷的大小来判断变量与因子之间的关系。

一般来说,载荷绝对值大于0.3的变量与因子之间具有显著关联。

解释的方差比例表示每个因子能够解释变量总方差的比例,一般来说,越大越好。

在解读结果时,需要综合考虑因子载荷和解释的方差比例。

二、聚类分析聚类分析是一种用于数据分类的统计方法。

它根据观测值之间的相似性将数据对象分组到不同的类别中。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

喀什大学实验报告 《多元统计分析SPSS》 实 验 报 告

实验课程: 基于SPSS的数据分析 实验地点:现代商贸实训中心 实验室名称:经济统计实验室 学 院: xxx学院 年级专业班: xxx班 学生姓名: xxx 学 号: 20131808015 完成时间: 2016年x月x日 开课时间: 2016 至 2017 学年第 1 学期

成 绩 教师签名 批阅日期 实验项目:中国上市银行竞争力分析 (一)实验目的 本实验目的围绕上市商业银行竞争力这一主线,遵循一般理论、具体分析到对策建议的研究思路,以我国国内上市的十家商业银行为研究对象,采用其2012年度财务报告的数据,从盈利能力、安全能力和发展能力三方面共选取了8个重要指标,试图通过这些指标量化影响竞争力的因素,构建我国上市商业银行的竞争力评价指标体系,并运用因子分析方法,对我国上市商业银行的竞争力状况进行了分析评价。最后针对分析的结果,通过对我国上市银行竞争力进行优劣势比较,提出了提升我国上市商业银行竞争力的一些建议。 (二)实验资料 通过对资产利润率、不良贷款率、资产负债率、资本充足率、每股收益增长

率、贷款增长率、存款增长率、总资产增长率等指标的选择分析不同指标在进行因子分析时所考虑的因素是否存在差异,影响我国上市商业银行的竞争力状况的因素与上述指标是否有关。 具体数据如下所示: 十家同类型上市商业银行2012年指标 盈利能力 安全能力 发展能力 资产利润率 不良贷款率 资产负债率 资本充足率 每股收益增长率 贷款增长率 存款增长率 总资产增长率 平安银行 1.09% 0.95% 94.72% 11.37% 6.07% 16.13% 20.01% 27.69%

浦发银行 1.42% 0.58% 94.29% 12.45% 25.55% 16.01% 15.31% 17.17%

建设银行 1.80% 0.99% 93.20% 14.32% 13.24% 15.64% 13.57% 13.77%

中国银行 1.48% 0.95% 93.21% 13.63% 12.19% 8.23% 4.04% 7.19%

农业银行 1.42% 1.33% 94.33% 12.61% 18.42% 14.10% 12.90% 13.40%

工商银行 1.76% 0.85% 93.77% 13.66% 13.30% 13.00% 10.00% 10%

交通银行 1.43% 0.92% 92.77% 14.07% 7.31% 15.05% 13.56% 14.36%

招商银行 1.75% 0.61% 94.12% 12.14% 25.75% 16.05% 14.07% 21.94%

中信银行 1.41% 0.74% 93.14% 13.44% -7.04% 15.96% 14.59% 7.02%

民生银行 1.58% 0.76% 94.58% 10.75% 27.62% 3.53% 2.76% 8.44% (三)实验步骤 1、选择菜单 2、选择参与因子分析的变量到(变量V)框中

3、选择因子分析的样本 4、在所示窗口中点击(描述D)按钮,指定输出结果,输出基本统计量、图形等

5、在所示窗口中点击(抽取E)按钮指定提取因子的方法为:主成分分析法 6、在所示的窗口中点击(旋转T)按钮选择因子旋转方法 7、在所示窗口中点击(得分S)按钮选择计算因子得分的方法 8、在所示窗口中点击(选项)按钮 (四)实验结果及分析 分析结果如下表所示。

通过观察原始变量的相关系数矩阵,可以看到,矩阵中存在许多比较高的相关系数,并且大多数变量通过了原假设为相应变量之间的相关系数为0的t假设。

相关性矩阵 每股收益增长率 贷款增长率 存款增长率 总资产增长率 相关性 资产利润率 .383 -.144 -.404 -.359 不良贷款率 -.207 -.025 -.009 -.086 资产负债率 .563 -.166 .105 .494 资本充足率 -.479 .357 .044 -.392 每股收益增长率 1.000 -.366 -.345 .159 贷款增长率 -.366 1.000 .922 .551 存款增长率 -.345 .922 1.000 .738 总资产增长率 .159 .551 .738 1.000 显著性 (单尾) 资产利润率 .137 .346 .124 .154 不良贷款率 .283 .472 .490 .407 资产负债率 .045 .323 .386 .073 资本充足率 .081 .155 .452 .131 每股收益增长率 .149 .164 .330

贷款增长率 .149 .000 .049

存款增长率 .164 .000 .007

总资产增长率 .330 .049 .007 相关系数实际上反映的是公共因子起作用的空间,相关系数越大,表明数据适合做因子分析。

KMO 和巴特利特检验 KMO 取样适切性量数。 .518 巴特利特球形度检验 近似卡方 50.188 自由度 28 显著性 .006

同时,KMO级Bartlett检验是否适合做因子分析。以上是KMO级Bartlett检验结果,由表可知:KMO值为0.518,说明该数据适合做因子分析。上表中的巴特利特球体检验的X统计值的显著性概率是O.000,小于1%,因此拒绝原假设,说明数据具有相关性,适宜做因子分析。

反映像矩阵 每股收益增长率 贷款增长率 存款增长率 总资产增长率 反映像协方差矩阵 资产利润率 -.075 -.025 .025 -.005 不良贷款率 .038 .031 -.012 -.031 资产负债率 -.064 -.001 -.007 .027 资本充足率 -.002 -.021 .011 .015 每股收益增长率 .207 -.026 .034 -.107 贷款增长率 -.026 .025 -.021 .018 存款增长率 .034 -.021 .020 -.032 总资产增长率 -.107 .018 -.032 .175 反映像相关性矩阵 资产利润率 -.277 -.273 .306 -.019 不良贷款率 .113 .266 -.114 -.101 资产负债率 -.464 -.031 -.158 .214 资本充足率 -.018 -.524 .307 .146 每股收益增长率 .496a -.358 .533 -.560 贷款增长率 -.358 .496a -.932 .269 存款增长率 .533 -.932 .503a -.542 总资产增长率 -.560 .269 -.542 .651a a. 取样适切性量数 (MSA) 反映像矩阵在其对角线上的数字若大于0.05(出口合同为0.406)则适合因子分析,小于0.05则不适合因子分析。从表中得知,适合做因子分析。

公因子方差 初始 提取 资产利润率 1.000 .818 不良贷款率 1.000 .519 资产负债率 1.000 .912 资本充足率 1.000 .928 每股收益增长率 1.000 .786 贷款增长率 1.000 .953 存款增长率 1.000 .979 总资产增长率 1.000 .865

提取方法:主成分分析法。 变量共同度,它刻划了全部公共因子对各个变量的总方差所作的贡献,也称为公因子方差,从上表中可以得到变量共同度大部分都接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了,也就是说,由原始变量空间转为因子空间转化的性质较好,保留原来信息量多,因此,2hi 是iX方差的重要组成部分。 检验可以做因子分析后,我们通过因子分析得到相应的特征值和对应因子的贡献率,如下表所示

成分 初始特征值 提取载荷平方和 旋转载荷平方和 总计 方差百分比 累积 % 总计 方差百分比 累积 % 总计 方差的 % 累积 % 1 2.800 34.998 34.998 2.800 34.998 34.998 2.664 33.302 33.302

2 2.671 33.383 68.381 2.671 33.383 68.381 2.646 33.070 66.372

3 1.288 16.104 84.485 1.288 16.104 84.485 1.449 18.113 84.485 4 .818 10.225 94.710

5 .221 2.757 97.466

6 .154 1.922 99.389

7 .038 .478 99.867

8 .011 .133 100.000

综合因子F,,F2,F3的特征值大于1,且对原始数据的累积贡献率达到了84.485%,其中F1的贡献率最强,达到了34.998%,F2的贡献率达到了33.383%,F3的贡献率也达到了16.104%。这三个因子的贡献率都远远大于其它因子的贡献率,因此,F1,F2,F3是决定商业银行竞争力强弱的关键因子。

从碎石图中得到,第1个因子的特征值高于其他项,对解释原有变量的贡献最大;

相关文档
最新文档