SPSS因子分析和主成分分析论文【范本模板】
SPSS 因子分析和主成分分析

实验课:因子分析实验目的理解主成分(因子)分析的基本原理,熟悉并掌握SPSS中的主成分(因子)分析方法及其主要应用。
因子分析一、基础理论知识1 概念因子分析(Factor analysis):就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。
从数学角度来看,主成分分析是一种化繁为简的降维处理技术。
主成分分析(Principal component analysis):是因子分析的一个特例,是使用最多的因子提取方法。
它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。
选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。
两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。
2 特点(1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。
(2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。
(3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。
(4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。
在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。
显然,在一个低维空间解释系统要比在高维系统容易的多。
3 类型根据研究对象的不同,把因子分析分为R 型和Q 型两种。
当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。
但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。
spss第8章主成分分析与因子分析

, yn ) 是 n 维随机向量. 若对任
⎛ Cov(x1, y1) Cov(x1, y2 )
⎜ ⎜
Cov(
x2
,
y1
)
Cov(x2 , y2 )
⎜
⎜ ⎝ Cov(xm , y1) Cov( xm , y2 )
⎟ ⎟
⎟
xpn ⎟⎟⎠
(σ ij ) p× p
, F = AX
Cov(F) = Cov(AX, AX) = ACov(X)A′ V (F)
由于 Cov(X) 是非负定对称矩阵,所以存在正交矩阵 U ,使得
⎡λ1 0
0⎤
U−1Cov(X)U
=
⎢ ⎢ ⎢
0
λ2
0
⎥ ⎥
⎥
⎢ ⎣
0
0
λ
p
⎥ ⎦
其中 λ1, λ2, ,λp 为 Cov(X) 的特征根,不妨假设 λ1 ≥ λ2 ≥
(5)若 X 是随机向量, Cov(X) 存在,则 Cov(X) 是非负定矩阵.
后面的推导过程中用到两个线性代数中的 2 个重要结论. 定理 7-2 (1)若 A 是 p 阶实对称阵,则一定可以找到正交阵 U ,使
⎡λ1 0
0⎤
U−1AU
=
⎢ ⎢ ⎢
0
λ2
0
⎥ ⎥
⎥
⎢ ⎣
0
0
λp
⎥ ⎦
其中 λi ,i = 1.2. p 是 A 的特征根.
(3)对任何向量 a = (a1, a2 , , am )′ , b = (b1,b2 , , bn )′ ,有 Cov(a′X, b′Y) = a′Cov(X, Y)b . (4)对任何 p × m 阶矩阵 A , q × n 阶矩阵 B ,有 Cov(AX, BY) = ACov(X, Y)B′
基于SPSS的主成分分析与因子分析的辨析

基于SPSS的主成分分析与因子分析的辨析主成分分析和因子分析是两种常用的多元统计分析方法,用于处理多个变量之间的关系和结构。
尽管它们在一些方面相似,但它们有着不同的目标、假设和应用领域。
主成分分析(PCA)是一种降维技术,旨在将多个相关的变量转化为较少数量的互相无关的新变量,称为主成分。
主成分是原始变量线性组合的结果,它们按照方差的大小递减排序,第一个主成分解释了尽可能多的方差,第二个主成分解释了剩余的方差,依此类推。
主成分分析的目标是找到最重要的成分,以减少数据维度并保留尽可能多的信息。
因子分析(FA)是一种探索性分析方法,旨在找到观察到的变量背后潜在的隐藏因子及其之间的关系。
它假设每个观察到的变量受到几个潜在因子的影响,并通过解释方差-共方差矩阵来确定这些因子。
因子分析的目标是解释数据的系统结构,并识别变量之间的潜在关系。
下面是主成分分析和因子分析的几个区别:1.假设:主成分分析假设所有的变量都是线性相关的,而因子分析假设变量之间存在潜在的隐藏因子。
2.目标:主成分分析的目标是减少数据的维度,使用少量的主成分来解释尽可能多的方差。
因子分析的目标是找出潜在因子,并解释数据的结构。
3.变量解释:在主成分分析中,每个主成分解释了数据中的方差,而在因子分析中,每个因子代表了一个潜在原因,描述了观察到的变量之间的共同性。
4.变换:在主成分分析中,通过线性组合原始变量来创建主成分。
在因子分析中,每个观察到的变量都被假设为由潜在因子和特定的误差项组合而成。
5.前提要求:主成分分析对变量之间的线性关系没有特定的要求,可以处理混合类型的数据。
因子分析假设线性关系是必需的,且数据应满足正态分布。
尽管主成分分析和因子分析在一些方面不同,但它们也有一些共同之处。
它们都可以用于数据降维和构建新的变量,以更好地解释和理解数据。
此外,它们都是无监督学习方法,不需要以前的假设。
在实际应用中,选择主成分分析还是因子分析取决于具体的研究目标和数据属性。
【精品论文】基于SPSS的阜平县旅游游客满意度因子分析

现代经济信息基于SPSS的阜平县旅游游客满意度因子分析李莉 南开大学商学院企业管理专业2008级硕士 300071一、引言河北阜平天生桥国家地质公园位于河北省西部的阜平县西部的高中山区,距县城西约25公里。
植被覆盖率95%以上,同时也是国家级森林公园,享有“五台东门户,京津西花园。
华北古基石,绿水济平川”的盛名。
阜平天生桥国家地质公园集地质、地貌、泉水资源、生态系统、人文历史等旅游资源融为一体,它具有较高的科学价值、观赏价值、生态保护示范价值。
然而,与河北省许多旅游城市相比,阜平县旅游业近几年的发展速度还是比较滞后的。
加强对阜平旅游市场游客满意度的调查和研究工作,有利于系统了解阜平县旅游市场的游客构成、选择偏好和消费行为,也有利于全面掌握阜平县旅游业基础设施的建设水平和服务质量状况,采取相应的改进措施,更好地做好阜平县旅游市场的市场定位和目标市场的选择及市场营销工作,最终促成阜平县良好旅游环境的建设和良好城市旅游形象的塑造。
二、研究综述马秋芳、杨新军、康俊香等选取西安欧美客源为研究对象,运用期望差异模型,对入境旅游游客满意度作出测定和比较;涂玮、任黎秀、吴兰桂、谢雯等在游客市场调查的基础上,运用灰色系统模型计算了处于成熟发展阶段的中山陵园风景名胜区游客满意度并对满意度计算结果给予验证和分析,提出了中山陵园风景名胜区提升游客满意度的措施;王群、丁祖荣、章锦河等运用美国顾客满意度指数(AcsI)模型,从环境感知、旅游期望、游览价值、游客满意度、游客忠诚和游客抱怨等六大影响模块建立了旅游环境游客满意度指数(TSI)测评模型,并对黄山风景区进行实证分析,得出黄山游客总体满意度指数较高的结论;李欠强和陈秋华对满意度与游客满意度的概念进行界定,给出了游客满意度的两种表示方式,提出了研究方法,并选取福州国家森林公园作为实例进行调查研究。
三、研究方法(1)数据采集在2009年春节黄金周期间在阜平县车站、主要宾馆酒店和旅游景点共发放调查问卷400份,收回问卷345份,回收率86.25%,其中有效问卷325份,有效率达到了94.20%。
SPSS因子分析法内容与案例

SPSS因子分析法内容与案例实验课:因子分析实验目的理解主成分(因子)分析的根本原理,熟悉并掌握SPSS中的主成分(因子)分析方法及其主要应用.因子分析、根底理论知识1概念因子分析(Factor analysis):就就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大局部信息的统计学分析方法.从数学角度来瞧,主成分分析就是一种化繁为简的降维处理技术.主成分分析(Principal component analysis):就是因子分析的一个特例,就是使用最多的因子提取方法.它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量.选取前面几个方差最大的主成分,这样到达了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大局部的信息.两者关系:主成分分析(PCA)与因子分析(FA)就是两种把变量维数降低以便于描述、理解与分析的方法,而实际上主成分分析可以说就是因子分析的一个特例.2特点(1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量.(2)因子变量不就是对原始变量的取舍,而就是根据原始变量的信息进行重新组构,它能够反映原有变量大局部的信息.(3)因子变量之间不存在显著的线性相关关系,对变量的分析比拟方便,但原始局部变量之间多存在较显著的相关关系.(4)因子变量具有命名解释性,即该变量就是对某些原始变量信息的综合与反映.在保证数据信息丧失最少的原那么下,对高维变量空间进行降维处理(即通过因子分析或主成分分析).显然,在一个低维空间解释系统要比在高维系统容易的多.SPSS因子分析法内容与案例3类型根据研究对象的不同,把因子分析分为R型与Q型两种.当研究对象就是变量时,属于R型因子分析;当研究对象就是样品时,属于Q型因子分析.但有的因子分析方法兼有R型与Q型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析 ,以示与其她两类的区别.4分析原理假定:有n个地理样本,每个样本共有p个变量,构成一个n x p阶的地理数据矩阵:X ii X12 X ip当p较大时,在p维空间中韦•察问磐比拟麻烦%这就需要进行降维处理,即用较少几个综X2i X22 X2 p合指标代替原来指标,而总使这些综合指标既能尽量多地反映原来指标所反映的信息,同时它们之间又就是彼此独立的.线性组合:记x1,x2,…,xP 肺变标标,z1,x2p…,zm(mw p)为新变量指标(主成分,那么其线性组合为:z1 l11 x1 l 12 x2 l1 p x pLij就是原变量在各主成@上l呼荷l Yz2 21 x1 22 x2 l2p x pzi 111x1 112x2 l1 p x p无论就是哪一种因子分析方法#相昌的因子解用不就是唯一的l因子解中之一. 舍瞌攵2m2% 21mp>pp,主因子解仅仅就是无数zi与zj相互无关;z1就是x1,x2,…,xp的4切㈣mOl合+2^21最大者1mp x z2就是与zi不相关的x1,x2,…的所有线性组合中方差最大者.那么 ,新变量指标z1,z2,…分别称为原变量指标的第一 ,第二,…主成分.Z为因子变量或公共因子,可以理解为在高维空间中互相垂直的m个坐标轴.主成分分析实质就就是确定原来变量xj(j=1,2 ,…,p)在各主成分zi(i=1,2,…,m)上的荷载lij.从数学上容易知道,从数学上也可以证实,它们分别就是相关矩阵的m个较大的特征值所对应的特征向量.5分析步骤5、1确定待分析的原有假设干变量就是否适合进行因子分析(第一步)因子分析就是从众多的原始变量中重构少数几个具有代表意义的因子变量的过程. 其潜在的要求:原有变量之间要具有比拟强的相关性. 因此,因子分析需要先进行相关分析,计算原始变量之间的相关系数矩阵.如果相关系数矩阵在进行统计检验时,大局部相关系数均小于0、3且未通过检验,那么这些原始变量就不太适合进行因子分析.SPSS因子分析法内容与案例差标准化方法,标准化后的数据均值为0,方差为1).SPSS在因子分析中还提供了几种判定就是否适合因子分析的检验方法.主要有以下3种:巴特利特球形检验(Bartlett Test of Sphericity)反映象相关矩阵检验(Anti-image correlation matriX)KMO(Kaiser-Meyer-Olkin)检验(1)巴特利特球形检验该检验以变量的相关系数矩阵作为出发点,它的零假设H0为相关系数矩阵就是一个单位阵,即相关系数矩阵对角线上的所有元素都为1,而所有非对角线上的元素都为0,也即原始变量两两之间不相关.巴特利特球形检验的统计量就是根据相关系数矩阵的行列式得到.如果该值较大,且其对应的相伴概率值小于用户指定的显著性水平,那么就应拒绝零假设H0,认为相关系数不可能就是单位阵,也即原始变量间存在相关性.(2)反映象相关矩阵检验该检验以变量的偏相关系数矩阵作为出发点,将偏相关系数矩阵的每个元素取反,得到反映象相关矩阵.偏相关系数就是在限制了其她变量影响的条件下计算出来的相关系数,如果变量之间存在较多的重叠影响,那么偏相关系数就会较小,这些变量越适合进行因子分析.(3)KMO(Kaiser-Meyer-Olkin)检验该检验的统计量用于比拟变量之间的简单相关与偏相关系数.KMO值介于0-1,越接近1,说明所有变量之间简单相关系数平方与远大于偏相关系数平方与,越适合因子分析.其中,Kaiser给出一个KMO 检验标准:KMO>0、9,非常适合;0、8<KMO<0、9适合;0、7<KMO<0、8,一般;0、6<KMO<0、7,不太适合;KMO<0、5,不适合.5、2构造因子变量因子分析中有很多确定因子变量的方法,如基于主成分模型的主成分分析与基于因子分析模型的主轴因子法、极大似然法、最小二乘法等.前者应用最为广泛.主成分分析法(Principal component analysis):该方法通过坐标变换,将原有变量作线性变化,转换为另外一组不相关的变量Zi(主成分).求相关系数矩阵的特征根入i (入1,入2,…,入p>0)与相应的标准正交的特征向量li;根据相SPSS 因子分析法内容与案例公共因子个数确实定准那么:1〕根据特征值的大小来确定,一般取大于1的特征值对应的几 个公共因子/主成分.2〕根据因子的累积方差奉献率来确定,一般取累计奉献率达 85-95%的特 征值所对应的第一、第二、…、第 m 〔mwp 〕个主成分.也有学者认为累积方差奉献率应在 80%以上.5、3因子变量的命名解释因子变量的命名解释就是因子分析的另一个核心问题.经过主成分分析得到的公共因子/主成分Z1,Z2,…,Zm 就是对原有变量的综合.原有变量就是有物理含义的变量 ,对它们进行线性变换后得到的新的综合变量的物理含义到底就是什么?在实际的应用分析中,主要通过对载荷矩阵进行分析 得到因子变量与原有变量之间的关 系,从而对新的因子变量进行命名.利用因子旋转方法能使因子变量更具有可解释性.计算主成分载荷,构建载荷矩阵A .正交旋转与斜通!转堤是因子旋裂的两类加l 1籍向于保持喻^汕的正交性,因此 使用最多.正本噂翎罚T 渊21多…,典21m 以方假设最历法最内常用.…bmjT方差最大令交旋转〔varimax . orthogonal rotation 〕 ----------------- 根本思想:使公共因子的相对负荷的■ ■■... ... ...方差之与最大,且彳柑寺原劄因子的指交性与今共方差总节不变:可使每l 个因子上的具有最 a p1 Pp1 ... Ppm p1 1 l p1 2... l pm* m大载荷的变量数最小,因此可以简化对因子的解释.斜交旋转〔oblique rotation 〕 ------------ 因子斜交旋转后,各因子负荷发生了变化,出现了两极分 化.各因子间不再相互独立,而就是彼此相关.各因子对各变量的奉献的总与也发生了改变.斜交旋转由于因子间的相关性而不受欢送. 但如果总体中各因子间存在明显的相关关系那么应该考虑斜交旋转.适用于大数据集的因子分析.无论就是正交旋转还就是斜交旋转,因子旋转的目的:就是使因子负荷两极分化 ,要么接近于0,要么接近于1.从而使原有因子变量更具有可解释性.5、4计算因子变量得分因子变量确定以后,对于每一个样本数据,我们希望得到它们在不同因子上的具体数据值 即因子得分.估计因子得分的方法主要有:回归法、Bartlette 法等.计算因子得分应首先将因关系数矩阵的特征根,即公共因子Zj 的方差奉献与〕,计算公共因子Zj 的方差奉献率与累积奉献率.〔等于因子载荷矩阵 L 中第j 列各元素的平方主成分分析I坐标原点与数据^M:心■合.一 〔方差奉献〕与方〔主成分〕所能代表的原始变量信息.,将原始变看 ;第一轴与数与等指标,,使得新的,化最大■向对■. ■!过计算特征根 来判断选取公共因子的数量 k 1 与公共因子SPSS因子分析法内容与案例子变量表示为原始变量的线性组合.即Bartlett 法:Bartlett 因子得分就是无偏的,但计算结果误差*因子得分可用于模型诊断,也可用作进一步分析如聚类分析、回归分析等的原始资料. 关于因子得分的进一步应用将在案例介绍一节分析.5、5结果的分析解释此局部详细见案例分析、案例分析1研究问题石家庄18个县市14个指标因子,具体来说有人均GDP〔元/人/人均全社会固定资产投资额、人均城镇固定资产投资额、人均一般预算性财政收入、第三产业占GDP比重〔%〕、人均社会消费品零售额、人均实际利用外资额〔万美元/人〕、人均城乡居民储蓄存款、农民人均纯收入、在岗职工平均工资、人才密度指数、科技支出占财政支出比重〔%〕、每万人拥有执业医师数量、每千人拥有病床数.要求根据这14项内容进行因子分析,得到维度较少的几个因子.2实现步骤【1】在"Analyze〞菜单“ Data Reduction〞中选择“Factor〞命令,如下列图所示[2]在弹出的下列图所示的Factor Analysis对话框中,从对话框左侧的变量列表中 选择这14个变量,使之添加到Variables 框中.[3]点击 “ Descriptives 〞 按钮,弹出 “Factor Analysis:Descriptives 〞 对木舌框,如图Value..OK Pasie1 r 1 rReset Cancel HelpFactor Analysis人均里枢经囱定奂… 人西城槽固定饶产… 人均一服限篡住附… 第三产业占GDP 出■.. 人均社会清费品零… 人均空布■利用外袋…Seierfion Vsrisble.Statistics框用于选择哪些相关的统计量,其中:Univariate descriptives傥量描述〕:输出变量均值、标准差;Initial solution 〔初始结果〕Correlation Matrix框中提供了几种检验变量就是否适合做引子分析的检验方法其中:Coefficients 〔相关系数矩阵〕Significance leves 一著性水平〕Determinant 〔相关系数矩P$的行列式〕Inverse 〔相关系数矩P$的逆矩阵〕Reproduced再生相关矩阵,原始相关与再生相关的差值〕Anti-image 〔反影像相关矩阵检验〕KMO and Bartlett' s test of sphericity 〔KMO 检验与巴特利特球形检验〕本例中,选中该对话框中所有选项,单击Continue按钮返回Factor Analysis对【4】单击"Extraction〞按钮,弹出“Factor Analysis:Extraction〞对话框,选择因子提取方法,如下列图所示:SPSS因子分析法内容与案例因子提取方法在Method下拉框中选取,SPSS共提供了7种方法:Principle Components Analysis 住成分分析〕Unweighted least square哧力口权最小平方法〕Generalized least square磔合最小平方法〕Maximum likelihood 〔最大似然估价法〕Principal axis factoring 〔主轴因子法〕Alpha factoring 〔〕因子〕Image factoring 〔影像因子〕Analyze框中用于选择提取变量依据,其中:Correlation matrix 〔相关系数矩阵〕Covariance matrix 的方差矩阵〕Extract框用于指定因子个数的标准,其中:Eigenvaluse over 大于特征值〕Number of factors 〔因子个数〕Display框用于选择输出哪些与因子提取有关的信息,其中:Unrotated factor solution 〔未经旋转的因子载荷矩阵〕Screen plot特征值排列图〕Maximun interations for Convergence框用于指定因子分析收敛的最大迭代次数, 系统默认的最大迭代次数为25.本例选用Principal components方法,选择相关系数矩阵作为提取因子变量的依据, 选中Unrotated factor solution与Scree plot项,输出未经过旋转的因子载荷矩阵与其特征值的碎石图;选择Eigenvaluse over®,在该选项后面可以输入1,指定提取特征值大于1的因子.单击Continue按钮返回Factor Analysis对话框.【5】单击Factor Analysis对话框中的Rotation 按钮,弹出Factor Analysis: Rotation 对话框,如下列图所示:SPSS因子分析法内容与案例该对话框用于选择因子载荷矩阵的旋转方法.旋转目的就是为了简化结构以帮助我们解释因子.SPSS默认不进行旋转〔None〕oMethod框用于选择因子旋转方法,其中:None3旋转〕Varimax〔正交旋转〕Direct Oblimin〔直接斜交旋转〕Quanlimax〔四分最大正交旋转〕Equamax〞均正交旋转〕Promax〔M交旋转〕Display框用于选择输出哪些与因子旋转有关的信息,其中:Rotated solution^俞出旋转后的因子载荷矩阵〕Loading plots〔输出载荷散点图〕本例选择方差极大法旋转Varimax,并选中Rotated solution与Loading plot项, 表示输出旋转后的因子载荷矩阵与载荷散点图 ,单击Continue按钮返回Factor Analysis对话框.【6】单击Factor Analysis对话框中的Scores按钮,弹出Factor Analysis: Scores^ 话框,如下列图所示:ED Fjctor Analysis: Factor Store-;回S.ava as variablesrMethod -----------------------------------------G f RegressionQ|国rtl曲匚〕Anderson-RubinH display 伯cttM n心nr外心ceHicient matrixCancel H*ContinueSPSS因子分析法内容与案例该对话框用以选择对因子得分进行设置,其中:Regression回归法〕:因子得分均值为0,采用多元相关平方;Bartlett 〔巴特利法〕:因子得分均值为0,采用超出变量范围各因子平方与被最小化;Anderson-Rubin 〔安德森-洛宾法〕:因子得分均值为0,标准差1,彼此不相关;Display factor score coefficient matrix:选择此项将在输出窗口中显示因子得分系数矩阵.【7】单击Factor Analysis 对话框中的Options 按钮,弹出Factor Analysis: Options 对话框,如下列图所示:该对话框可以指定其她因子分析的结果,并选择对缺失数据的处理方法,其中:Missing Values框用于选择缺失值处理方法:Exclude cases listwise去除所有缺失值的个案Exclude cases pairwis哈有缺失值的变量,去掉该案例Replace with mean用平均值代替缺失值Cofficient Display Format框用于选择载荷系数的显示格式:Sorted by size载荷系数根据数值大小排列Suppress absolute values less thaffi显示绝对值小于指定值的载荷量本例选中Exclude cases listwise项,单击Continue 按钮返回Factor Analysis对话框,完成设置.单击OK,完成计算.3结果与讨论〔1〕SPSS输出的第一局部如下:第一个表格中列出了18个原始变量的统计结果,包括平均值、标准差与分析的个案数.这个就是步骤3中选中Univariate descriptives项的输出结果.〔2〕SPSS输出结果文件中的第二局部如下:该表格给出的就是18个原始变量的相关矩阵Correlation Matrix⑶SPSS输出结果的第四局部如下该局部2&出了KMO检验与Bartlett球度检验结果.其中KMO值为0、551, 根据统计学家Kaiser给出的标准,KMO取值小于0、6,不太适合因子分析.Bartlett球度检验给出白相伴概率为0、00,小于显著性水平0、05,因此才!绝Bartlett 球度检验的零假设,认为适合于因子分析.〔4〕SPSS输出结果文件中的第六局部如下:CommunalitiesExtraction Method: Principal Component Analysis 、这就是因子分析初始结果,该表格的第一列列出了14个原始变量名;第二列就是根据因子分析初始解计算出的变量共同度.利用主成分分析方法得到14个特征值,它们就是因子分析的初始解,可利用这14个初始解与对应的特征向量计算出因子载荷矩阵.由于每个原始变量的所有方差都能被因子变量解释掉,因此每个变量的共同度为1;第三列就是根据因子分析最终解计算出的变量共同度. 根据最终提取的m个特征值与对应的特征向量计算出因子载荷矩阵. (此处由于软件的原因有点小问题)这时由于因子变量个数少于原始变量的个数,因此每个变量的共同度必然小于1. (5)输出结果第六局部为Total Variance Explained表格Extraction Method: Principal Component Analysis 、Total Variance ExplainedExtraction Method: Principal Component Analysis 、该表格就是因子分析后因子提取与因子旋转的结果. 其中,Component列与Initial Eigenvalues歹!J〔第一歹!J至U第四歹U 〕描述了因子分析初始解对原有变量总体描述情况.第一列就是因子分析13个初始解序号.第二列就是因子变量的方差贡献〔特征值〕,它就是衡量因子重要程度的指标,例如第一行的特征值为9、139,后面描述因子的方差依次减少.第三列就是各因子变量的方差奉献率〔% of Variance〕,表示该因子描述的方差占原有变量总方差的比例. 第四列就是因子变量的累计方差奉献率,表示前m个因子描述的总方差占原有变量的总方差的比例.第五列与第七列那么就是从初始解中根据一定标准〔在前面的分析中就是设定了提取因子的标准就是特征值大于1〕提取了3个公共因子后对原变量总体的描述情况.各列数据的含义与前面第二列到第四列相同,可见提取了5个因子后,它们反映了原变量的大局部信息.第八列到第十列就是旋转以后得到的因子对原变量总体的刻画情况.各列的含义与第五列到第七列就是一样的.〔6〕SPSS输出的该局部的结果如下Extraction Method: Principal Component Analysis 、a、13 components extracted 、该表格就是最终的因子载荷矩阵A,对应前面的因子分析的数学模型局部.根据该表格可以得到如下因子模型:X=AF+a &X I=0、959F1-0、075F2+0、015F3+0、158 F4-0、140F5-0、023F6-0、096F7+0、017F8-0、117F9+0、004F10-0、062F11-0、040 F12+0、021 F13aSPSS 因子分析法内容与案例-、116 、046 -、042 、036、044-、005 -、005 -、032 -、006、006 -、101 、023 、110 、039 、055、094 -、059 -、058 、053 -、045、081 、014 、000-、030、050Extraction Method: Principal Component Analysis a. 13 components extracted 、 Component Matrix aExtraction Method: Principal Component Analysis a 、 13 components extracted 、〔7〕SPSS输出的该局部的结果如下:该表格就是根据前面设定的方差极大法对因子载荷矩阵旋转后的结果.未经过旋转的载荷矩阵中,因子变量在许多变量上都有较高的载荷.经过旋转之后,第一个因子含义略加清楚,根本上放映了 “每万人拥有执业医师数量〞、“第三产业占GDP 比重〔%〕〞、“人均实际利用外资额〔万美元/人〕〞;第二个因子根本上反映了 “人 均全社会固定资产投资额〞、“人均城镇固定资产投资额〞 ;第三个因子反映了 “在岗职工平 均工资〞a 人均GDP 〔元/人〕 科技支出占财政支出比重〔%〕在岗职工平均工资农民人均纯收入SPSS因子分析法内容与案例Rotation Method: Varimax with Kaiser Normalizationa、Rotation converged in 7 iterations 、SPSS因子分析法内容与案例Extraction Method: Principal Component AnalysisRotation Method: Varimax with Kaiser Normalizationa、Rotation converged in 7 iterations 、Extraction Method: Principal Component Analysis 、Rotation Method: Varimax with Kaiser Normalization 、a、Rotation converged in 7 iterations 、〔8〕SPSS输出的该局部的结果如下:该局部输出的就是因子转换矩阵,说明了因子提取的方法就是主成分分析,旋转的方法就是方法极大法.Extraction Method: Prin( :ipal Compone snt Analysis 、Rotation Method: Varimax with Kaiser Normalization 、Component Transformation MatrixExtraction Method: Principal Component AnalysisRotation Method: Varimax with Kaiser Normalization(9)SPSS输出的该局部的结果如下Component Plot in Rotated Space该局部就是载荷散点图,这里为3个因子的三维因子载荷散点图,以三个因子为坐 标,给出各原始变量在该坐标中的载荷散点图,该图就是旋转后因子载荷矩阵的图 形化表示方式.如果因子载荷比拟复杂,那么通过该图那么较容易解释. 〔10〕SPSS 输出的该局部的结果如下:Component Score Coefficient MatrixComponent123456人均GDP 〔元/人〕 -、054 、003 、100 -、090 、046-、083 人均全社会固定资产投资额 -、237 、814 -、049 、044 -、064、141 人均城镇固定资产投资额 -、115 、520 -、158 -、164 、205、065 人均一般预算性财政收入 、045 -、143 、164 、148 -、191-、083 第三产业占GDP 比重〔%〕 、522-、062 -、111 -、161 、088-、193人均社会消费品零售额 -、217、017 -、092 、033 -、1942、033人均实际利用外资额〔万美元/ 、198 -、063-、026-、105、057-、231人〕人均城乡居民储蓄存款 、251 -、056 -、057 -、091 、018-、055 农民人均纯收入 、125、045 -、251-、036 1、119 -、657 在岗职工平均工资-、197 -、079 1、205-、096 -、183 -、179 人才密度指数-、099-、088-、021-、051-、068-、4171 .cr£ 0 5-c利打上出占时出点2止中 口 c.tr d E jGDP 〕人均一醺稹以性明 在岗朗「平均■ i ;i理千人相有病底数 士 人北 带度指我人均地; 赢人f 电0 第三产业叶GDP 比Jfi o O O幅i t 心—山 u 人均牡殳消费品单唐璇力美无人〕…邛、社或内泥诧桂箕相 o口人均城相固定镜产出 2收入人均实际利用外便领我民人上 poneni1Extraction Method: Principal Component Analysis 、Rotation Method: Varimax with Kaiser NormalizationComponent Scores 、Rotation Method: Varimax with Kaiser Normalization Component Scores 、Extraction Method: Principal Component Analysis 、Rotation Method: Varimax with Kaiser Normalization 、Component Scores 、该表格就是因子得分矩阵.这就是根据回归算法计算出来的因子得分函数的系数根据这个表格可以瞧出下面的因子得分函数.F I=-0、054x1+0、003x2+0、100x3-0、090X4+0、046x5-0、083x6-0、068x7+0、000x8+3、170x9+ 0、495x10-2、090x11-0、549x12+1、365x13[工定一E_上市H制* 「:事守■SPSS根据这13个因子的得分函数,自动计算2-个样本的3个因子得分,并且将3个引子得分作为新变量,保存在SPSS数据编辑窗口中〔分别为FAC1_1、FAC2_1、FAC3_1、FAC4_1、FAC5_1、FAC6_1、FAC7_1、FAC8_1、FAC9_1、FAC10_1、FAC11_1、FAC12_1、FAC13_1〕〔11〕SPSS输出的该局部的结果如下Extraction Method: Principal Component AnalysisRotation Method: Varimax with Kaiser Normalization Component Scores 、Extraction Method: Principal Component Analysis 、Rotation Method: Varimax with Kaiser Normalization 、Component Scores 、该输出局部就是因子变量的协方差矩阵. 在前面已经说明,所得到的因子变量应该就是正交、不相关的.从协方差矩阵瞧,不同因子之间的数据为0,因而也证实了因子之间就是不相关的.课程作业选择自己感兴趣的数据〔自己建立亦可〕,进行主成分分析,并对结果进行简要SPSS因子分析法内容与案例解释,可将结果与上次课中聚类分析结果进行比照.。
spss统计分析课程论文范文

spss统计分析课程论文范文SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。
下文是店铺为大家整理的关于spss统计分析论文的范文,欢迎大家阅读参考!spss统计分析论文篇1统计分析软件SPSS的特点和应用分析【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。
【关键词】统计分析软件;SPSS;独立样本;非参数检验一、前言统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。
该软件是一款在统计中应用很广的统计分析软件,目前在各专业毕业论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的爱好者。
本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。
二、SPSS软件的特点(一)操作简便SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
(二)编程方便具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。
只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。
对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。
因此,用户无需花大量时间记忆大量的命令、过程、选择项。
(三)功能强大具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。
实验:SPSS主成分分析和因子分析
实验:SPSS主成分分析和因子分析实验:SPSS主成分分析和因子分析实验目的:1、掌握如何确定主成分的个数;2、熟练解释主成分分析的结果:载荷矩阵、共同度、方差贡献率等;3、掌握应用主成分分析进行数据降维和综合评价的方法。
4、了解因子分析法的应用条件5、掌握因子分析法的应用;6、掌握因子分析法输出结果的解释。
实验内容:1、(主成分分析)P253见实验数据8-1 PCA20.sav某公司有20个工厂,现在要对每个工厂作经济效益分析。
从所取得的生产成果和所消耗的人力、物力、财力的比率等指标中,选取5个指标(变量)进行分析。
X1——固定资产的产值率;X2——净产值的劳动生产率;X3——百元产值的流动资金占用率;X4——百元产值的利润率;X5——百元资金的利润率。
现在对这20个工厂同时按照这5项指标收集数据,然后找出1个综合指标对它们的经济效益进行排序,找出经济效益较高的工厂。
应用主成分分析法,要求主成分只要能够反映出全部信息的85%就可以了。
2、(主成分分析)实验数据8-2 给出了中国历年国民经济主要指标统计(2005-2012)。
试用主成分分析法对这些指标提取主成分并写出提取的主成分与这些指标之间的表达式。
3、(因子分析)P281见实验数据8-3 cereals.sav 某市场调查项目需要了解消费者是否偏爱某个谷物品牌。
现有117个受访者对12个销量比较好的谷物产品的25个属性进行评分。
现在用因子分析法对消费者的偏好习惯进行分析。
哪些品牌的谷物产品易受消费者青睐?消费者喜欢哪些属性?这些属性之间有什么关系?4、(因子分析)见实验数据8-4给出了中国历年国民经济主要指标统计(2004-2012)。
试用因子分析法对这些指标提取公因子并写出提取的公因子与这些指标之间的表达式。
实验要求:题目1写一份实验报告;题目3写一份实验报告。
实验数据:见实验八数据文件夹实验步骤、结论:学生填写实验成绩:教师填写。
因子分析与主成分分析
单击此处添加副标题
电子工业出版社
基本原理
01
主成分分析
02
因子分析
03
本章小结
04
提 纲
主成分分析(Primary Component Analysis)主要是通过降维过程,将多个相关联的数值指标转化为少数几个互不相关的综合指标的统计方法,即用较少的指标来代替和综合反映原来较多的信息,这些综合后的指标就是原来多指标的主要成分。
进行分析,按一定标准确定提取的因子数目;
如果进行的是主成分分析,则将主成分存在的新变量用于继续分析,步骤到此结束;
如果进行的是因子分析,则考察因子的可解释性,并在必要时进行因子旋转,以寻求最佳解释方式;
如有必要,可计算出因子得分等中间指标供进一步分析使用。
因子分析
因子分析是多元统计分析的一个重要分支。其主要目的是运用对诸多变量的相关性研究,即可以用假设的少数几个变量来表示原来变量的主要信息,以便浓缩数据(Data Reduction)。
基本原理
因子分析(Factor Analysis)是主成分分析的推广和发展,也是利用降维方法进行统计分析的一种多元统计方法。因子分析研究相关矩阵或协方差的内部依赖关系,由于它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相互关系,故得到了广泛的应用。
因子分析一般要求提取出的公因子有实际含义,如果分析中各因子难以找到合适的意义,则可以运用适当的旋转,以改变信息量在不同因子上的分析,最终方便对结果的解释。
因子分析
在理论分析和具体SPSS操作方面,因子分析过程需经过如下几个重要步骤。 因子提取。 因子旋转。 计算因子得分。
因子分析
依次单击菜单“分析→降维→因子分析”命令,打开 “因子分析”主对话框
spss主成分分析报告.docx
实用标准文档实验目的:原始数据中每一所高校具有20个相关性很高的变量,利用主成分分析法用较少的变量去解释原来资料中的大部分变异,将手中的众多变量转化成彼此相互独立或不相关的个数较少的变量,即所谓主成分,并用以解释资料的综合性指标,其实质的目的是降维原始数据截屏:操作方法:1.描述性统计SPSS在调用因子分析过程进行分析时,SPSS会自动对原始数据进行标准化处理,所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS不会直接给出标准化后的数据,然后后期的计算需得到标准化数据,则需调用“描述” 过程进行计算,为了看到标准化数据,所以采用描述性统计下的描述操作获得标准化后的变量数据标准化数据:文案大全I <05λ-!i⅛i⅛⅛.M030^CM44⅛Sz≡α⅞hS Z∣4i⅛2 ⅛台计稈÷⅜ZΛ4⅛⅛.⅜⅛⅛⅛⅛U=,那lF⅞⅛τ∙.⅛⅛⅛予Γ5Φ⅛tτ⅛⅛s⅛⅛E生均雷书zι⅛⅛r.∙m4"irτ Zl事11翳辭⅛1 I-69799-1 3751? -T 47121-75372 1 S79O0-1 08609-T 060M-1 391 Bl214834939932■69799U 9189? -1 50230「75372570«” 9020?X<06(MM■1 2383134^0T80β8 369W50TM ・ 1 1t36713171%933T«052如隔2^73M3T3 469799 1 27D*2■9S93175372■2 16701I 2541150WT-1 1231158750 1 16775 5■開TW1∣2034■ 5737?¢753? -7J3⅛0 1 ?160J■1 23MB44-707-1.T6l5t疔畑KM3覆£■6⅛T99-吃"4■ 2+315-T2Q1? -7?330-72S⅛■1 0⅛D? 2 14266∣S15T4807?7? 183 7• 69799•9QT70 ・5074?■- 75372 - 7?330-f5034-1 0?4731tBD910402fi9τaεJ45S3 B6979959924 3^201C9T45 -7?33C 2 03837 1 SSZtB T 5T46Q舁OS4Θ153CTI93159 9«9799T5813I伽72T5372 7?330 1 ¢7262■5952430643■1 SOeM I 2995924W2 ID■ «9799T6Γ0705220T20∣? -723M14803I 147J419539'1.1®M306⅛3-1 11233 11∙∙≡的≡22-1 0M4C-T537? - 753»-朋舟Q-59^24-.1 IflOS-1123191刚2■ 33«3 12■ 6SJ41-025?3 59620-T5372 - '139f7¢1483-IT^B62:4F-3⅛4D6-1 19012-19037 13O?41L #0664 2?32Q d9TT??ESSS-91735-3≡2B”777 刖 1 847132494?14 d Q535d W50T7612■ 96ITJ 1 392163692B09*44・544€7因子分析操作过程:选取变量:X1:科研经费得分X2:国家人文社科重点研究基地得分X3:院士总数得分X4:生均图书得分X5:研究中心数得分X6:国家重点实验室得分X7:生均教学科研仪器设备得分X8:生均教育事业经费得分X9:精品课程得分X10:优秀博士生论文总分X11:人才得分X12: 二级学科建设得分X13:生均固定资产得分X14:科研论文得分X15:博导及相关合计得分X16:教师中博士学位比重得分X17: 一级学科得分X18:高级职称比重得分X19:师资总分X20:SCl 数量这里分析采用相关系数矩阵,输出选择为未旋转的因子解,并选择碎石图,抽取过程选择基于特征值(特征值大于1),最大收敛迭代次数:25,点击确定。
主成分分析和因子分析的spss操作
一、参考文献:主成分分析在SPSS中的操作应用张文霖理论与方法2005利用SPSS进行主成分分析佚名计量经济分析方法与建模高铁梅2009二、数据选用张文霖文中的数据GDP PGDP NYZJZ GYZJZ DSCY GDZCTZ JBJSTZ SHXF HGCK DFCZSR 5458.2 13000 14883.3 1376.2 2258.4 1315.9 529 2258.4 123.7 399.7 10550 11643 1390 3502.5 3851 2288.7 1070.7 3181.9 211.1 610.2 6076.6 9047 950.2 1406.7 2092.6 1161.6 597.1 1968.3 45.9 302.3 2022.6 22068 83.9 822.8 960 703.7 361.9 941.4 115.7 171.8 10636 14397 1122.6 3536.3 3967.2 2320 1141.3 3215.8 384.7 643.7 5408.8 40627 86.2 2196.2 2755.8 1970.2 779.3 2035.2 320.5 709 7670 16570 680 2356.5 3065 2296.6 1180.6 2877.5 294.2 566.9 4682 13510 663 1047.1 1859 964.5 397.9 1663.3 173.7 272.9 11770 15030 1023.9 4224.6 4793.6 3022.9 1275.5 5013.6 1843.7 1202 2437.2 5062 591.4 367 995.7 542.2 352.7 1025.5 15.1 186.7三、首先,在SPSS中操作3.1 操作步骤第1步选择【Analyze】下拉菜单,并选择【Data Reduction-Factor】,进入主对话框第2步在主对话框中将所有原始变量选入【Variables】第3步点击【Descriptives】,在【correlation Matrix】下选择【Coefficients】,点击【Continue】回到主对话框第4步点击【Extraction】,在【Display】下选择【ScreePlot】,点击【Continue】回到主对话框第5步点击【Rotation】,在【方法】下选择【无】,点击【Continue】回到主对话框第6步点击【得分】,在【保存为变量】前打勾,在【方法】中选择【回归】,在【显示因子得分系数矩阵】前打勾3.2 步骤结果解释第3步的结果变量之间的存在较强的相关关系,适合作主成分分析是以自变量X 作为被解释变量,对应的公共因子载荷平方之和。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于因子分析的我国经济发展状况实证分析摘要:选取了2013年我国31个省、直辖市、自治区经济发展的10项指标作为研究对象,运用因子分析的方法,利用spss对数据进行计算,依据因子分析的结果对我国各省的经济发展做出综合评价,得出了这31各省份经济发展状况的综合排名,广东、江苏、山东、浙江、北京排在前5位,是中国各省、直辖市、自治区沿海经济发展较好的地区;甘肃、海南、青海、宁夏、西藏排在后5位,是西部地区经济发展较落后的地区,较为客观反映了中国各省、直辖市、自治区的综合经济实力,为中国各省、直辖市、自治区今后的经济发展提供了理论依据。
关键词:经济发展;因子分析;综合评价;主成分法一、引言我国地域辽阔,由于历史、地理位置及经济基础等原因,各地经济发展水平差异很大。
改革开放以来,特别是实施西部大开发、振兴东北地区等老工业基地、促进中部地区崛起、鼓励东部地区率先发展的区域发展总体战略以来,各地经济社会发展水平有了很大提高,人民生活也有了很大改善。
但区域发展不协调、发展差距拉大的趋势仍未根本改变。
本文从我国31 个省市自治区经济的发展视角入手,运用对应分析方法对我国各地区经济发展状况进行统计分析,用以说明我国各地区经济发展不协调的现状。
由于衡量各地区经济发展的指标有很多,故选取了比较有代表性的十个指标。
二、相关统计指标与数据的选取本文运用了因子分析的方法对我国31个省、直辖市、自治区的经济发展状况进行评价。
选取了10项经济指标:第一产业增加值(X1);第二产业增加值(X2);第三产业增加值(X3);地方财政预算收入(X4);地方财政预算支出(X5);固定资产投资额(X6);社会消费品零售总额(X7);货物进出口总额(X8);在岗职工平均工资(X9);城乡居民储蓄年末余额(X10).X2,X3,X4 反映的是经济总量中构成三大产业的不同增加值;X5,X6 反映的是地方财政预算收支;X7 反映的是居民的购买能力;X8反映的是对外贸易;X9,X10反映的是居民的收入与储蓄.本文数据资料来源于《中国统计年鉴》(2013年),具体数据资料见表1。
表1 各地区经济发展状况(2013)三、数据分析过程(一)相关性分析用SPSS21。
0数据处理系统将10项经济指标处理后,得到相关系数矩阵、巴特利特球度检验和KMO检验方法进行分析。
分析结果见表2和表3.根据表2原有变量的相关系数矩阵,可以看到:大部分的相关系数都较均大于0.3,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。
表3 KMO 和 Bartlett 的检验Bartlett检验的F值等于541。
977,F值显著,Sig。
(显著性)小于0。
005,表明所取的数据满足正态总体分布;KMO值等于0。
74,大于0。
7,说明变量之间的相关性可以被其他变量解释,因此适合做因子分析。
(二)提取主因子根据原有变量的相关系数矩阵,采用主成分分析法提取因子并选取大于1的特征值,得出公因子差和分析结果如下表4。
表4 公因子差从表中可以看出,10个变量的共同度基本都在80%以上,即这些变量的信息丢失较少,变量都能被因子解释,本次因子提取的总体效果较理想。
一般情况下,确定因子个数时,累计贡献率达到85%以上,本文提取特征值大于1的特征值,得到2个主因子代替原来的10个因子累计贡献率达90.22%,因此取出的2个主因子基本上包括了X1~X10的大量信息。
分析结果见表5。
表5 解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的 %累积 % 合计方差的%累积%1 7。
068 70.681 70。
681 7。
068 70。
681 70.681 6。
842 68.417 68.4172 1.954 19。
541 90。
222 1.954 19。
541 90。
222 2。
180 21。
805 90。
2223 。
397 3.971 94.1934 。
291 2.912 97.1065 .122 1.221 98。
3276 .074 。
743 99。
0707 .049 。
485 99.5558 .032 .323 99。
8789 。
008 .078 99.95610 .004 .044 100。
000由表5可知,第一个公因子的方差贡献率为70.681%,前两个公共因子的累计方差献率已达到90。
22>85%,即前两个公共因子已代表了原始数据的绝大部分信息。
因子分析效果较理想。
在因子旋转后总的累计方差贡献率没有改变,没有影响到原有变量的共同度,但重新分配了各个因子解释原有变量的方差,改变了各因子的方差贡献,使得因子更易于理解.图1图1中,横坐标为因子数目,纵坐标为特征值。
可以看到:第一个因子的特征值较高,对解释变量的贡献最大;第三个以后的因子特征值都较小,对解释原有变量的贡献很小,已经成为可被忽略的“高山脚下的碎石”,因此提取两个因子适合的。
(三)因子旋转及公因子命名因为因子意义不明显,对初始因子进行旋转。
本文采用旋转因子模型的方法是方差最大正交旋转,旋转后,得到因子载荷矩阵(见表6)。
由旋转后的因子载荷矩阵可以看出,第1主因子第二产业增加值(X2)、第三产业增加值(X3)、地方财政预算收入(X4)、地方财政预算支出(X5)、社会消费品零售总额(X7)、货物进出口总额(X8)、城乡居民储蓄年末余额(X10)这7个指标上的载荷较大,集中反映了第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄这7个方面,因此将其定义为Fac1。
第2主因子在在岗职工平均工资(X9)这个指标上的载荷较大,因此,第2因子可定义为在岗职工工资Fac2。
这2个主因子的性质及其顺序较好地体现了影响我国各省、直辖市、自治区经济发展的因素,也完全符合社会经济发展的规律。
另外还可以看到:这两个因子的实际含义比较模糊。
表6 旋转后因子模型成份12 X1 .362 。
798 X2 。
815 。
402 X3 。
978 .051 X4 。
989 -.062 X5 .923 。
267 X6 。
754 。
591 X7 .957 。
239 X8 .876 —.346 X9 -.261 .880 X10.970.060(四)计算因子得分为了考察各省、直辖市、自治区的经济发展状况,并对其进行分析和综合评价,采用回归法求出因子得分函数,由系数矩阵将2个主因子表示为10项指标的线性组合.因子得分的函数为:2个主因子分别从不同的方面反映了我国各省、直辖市、自治区经济发展状况,但1098765432110987654321060.0880.0346.0239.0591.0267.0062.0051.0402.0798.02970.0261.0876.0957.0754.0923.0989.03978.0815.0362.01X X X X X X X X X X Fac X X X X X X X X X X Fac ++-+++-++=+-+++++++=单独使某一主因子并不能对我国各省、直辖市、自治区经济发展状况作出综合的评价,因此按各公因子对应的方差贡献率为权数计算综合统计量为:通过计算可以得到综合因子得分,并对各城市的综合因子得分排序(见表7)。
表7 主因子得分、综合因子得分及排名21218.0684.0Fac Fac Fac +=从上述因子分析看第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄、在岗职工平均工资成为我国各省、直辖市、自治区2013年经济发展差异的主要解释成分,从统计意义上看,它们解释了这种差异90.22%的程度.深入分析还可以得出因子中的第一产业、外贸是我国各省、直辖市、自治区发展的前提条件,反映地方财政收入与支出可以理解国家、地方实施西部大开策略的资金投入力度.表7是由加权的最后因子得分表达式计算出的我国各省、直辖市、自治区的综合因子得分,从结果看,还是符合我国西部城市经济发展实际情况的。
第一主因子反映第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄方面,广东、江苏、山东排在前3位;第二主因子反映在岗职工平均工资方面,山东、河南、河北排在前3位。
2个主要因子的综合因子得分中,广东、江苏、山东、浙江、北京排在前5位,这也是中国各省、直辖市、自治区沿海经济发展较好的地区,这些地区经济发展速度较快,第二、第三产业发达,地方财政收入与支出、社会消费品零售、货物进出口、城乡居民储蓄都相对较高;甘肃、海南、青海、宁夏、西藏排在后5位,这也是西部地区经济发展较落后的地区,相应的财政收入与支出、居民消费水平相对较低,进出口贸易不是很发达,制约了该地区经济的发展。
四、结论及建议本文通过对我国31个省、直辖市、自治区经济发展状况的因子分析。
证实了影响我国经济发展状况的因素主要有2大类,分别是第二、三产业、地方财政收入与支出、社会消费品零售、货物进出口与城乡居民储蓄、在岗职工平均工资方面。
这2个主因子的方差贡献率达90.22%。
我国经济发展既有差异也有相似性,广东、江苏、山东、浙江、北京经济发展的整体水平最高,甘肃、海南、青海、宁夏、西藏的经济发展状况已经存在比较突出的问题。
我国的经济发展的差异已经相当显著,在一定时期内还有可能继续扩大,可以从第二、三产业、地方财政收入与支出、货物进出口方面寻求突破,通过具体的针对性措施刺激第二、三产业、对外贸易的发展,调整产业结构,为外商提供较多的优惠政策。
同时,政府还可以进一步加强对经济落后地区的财政支出,推动我国经济均衡发展。
参考文献[1]薛薇。
基于SPSS的数据分析[M] .北京:中国人民大学出版社, 2006:107 -121。
[2]于秀林, 任雪松。
多元统计分析[M]。
北京:中国统计出版社, 2006:171 —184。
[3]Johnson。
实用多元统计分析[M]。
北京:清华大学出版社, 2004:388 —425。
[4]刘新华。
因子分析中数据正向化处理的必要性及其软件实现[J] .重庆工学院学报:自然科学版, 2009,23(9):152 -155.[5]刘照德。
因子分析在企业技术创新能力评价中的应用[J] .重庆师范大学学报:自然科学版, 2006, 23(2):75 —89。
[6]韩芳艳,张孝友.重庆市上市公司财务业绩评价—基于21家公司2007年财务数据的因子分析[J] 。
重庆三峡学院学报, 2009, 25(2):110 —113.[7]聂勇。
因子分析在我国工业企业经济效益分析中的应用[J]。
重庆文理学院学报:自然科学版, 2009, 28(1):35 —38.[8]叶宗文.重庆城镇居民消费结构变动的因子分析[J] .重庆师范大学学报:自然科学版, 2004, 21(4):71 -73。