毕业设计因子分析资料
因子分析因素分析详解

5色5变量
5色5主成分
一、案例引读
二、基本原理
三、历史渊源 四、分析步骤
五、案例详解
因素分析(Factor Analysis)就是将错综复杂的实测变量归结为 少数几个因子的多元统计分析方法。其目的是揭示变量之间的内在 关联性,简化数据维数,便于发现规律或本质。
因素分析的基本原理是根据相关性大小把变量分组,使得同组变 量之间的相关性较高,不同组变量之间相关性较低。每组变量代表 一个基本结构,这个结构用公共因子来进行解释。
一、案例引读
二、基本原理 三、历史渊源
四、分析步骤
五、案例详解
xi=aiF+ei
因子旋转
因子得分
因子负荷
F→F’ 主成分法 便于解释 样本的优劣
一、案例引读
二、基本原理 三、历史渊源
四、分析步骤
五、案例详解
因子负荷 主成分法
因子旋转
F→F’
利用主成分分 析把前几个主成分 作为未旋转的公共 因子。
案例 1
(3)设置对因素的抽取选项:单击图1-1对话框中的“Extraction…”按钮,弹出 “Factor Analyze:Extraction”(因素分析:萃取)对话框。 ① “Method”(方法)选项框:下拉式选项内 有其中抽取因素的方法: A “Principal components”法:主成份分析 未旋转因子解 共变异数矩阵 法抽取因素,此为SPSS默认方法。 陡坡图 相关矩阵 B “Unweighted least squares”法:未加权 特征值 最小平方法。 因子个数 C “Generalized least square”法:一般化最 小平方法。 图1-3 Factor Analyze:Extraction对话框 D “Maximum likelihood”法:最大概似法。 ② “Analyze”(分析)选项框 E “Principal-axis factoring”法:主轴法。 A “Correlation matrix”(相关矩阵) F “Alpha factoring”法:α因素抽取法。 :以相关矩阵来抽取因素。 G “Image factoring”法:映像因素抽取法。 B “Covariance matrix”(共变异数矩 ④ “Extract”(抽取)选项框 阵):以共变量矩阵来抽取因素。 A “Eigenvalues over”(特征值):后面的空 ③ “Display”(显示)选项框 格默认为1,表示因素抽取时,只抽取特征值 大于1者,使用者可随意输入0至变量总数之间 A “Unrotated factor solution”(未 旋转因子解):显示未转轴时因素负 的值。 荷量、特征值及共同性。 B “Number of factors”(因子个数):选取 此项时,后面的空格内输入限定的因素个数。 B “Scree plot”(陡坡图):陡坡图。
毕业论文中如何正确运用相关性分析和因子分析

毕业论文中如何正确运用相关性分析和因子分析在毕业论文中,正确运用相关性分析和因子分析是非常重要的。
相关性分析是一种用于确定变量之间关系的统计方法,而因子分析则是用于确定潜在因素的方法。
本文将探讨如何正确运用这两种分析方法,并提供几个例子来说明它们在毕业论文中的应用。
第一部分:相关性分析相关性分析是通过计算变量之间的相关系数来确定它们之间关系的一种方法。
相关系数的范围从-1到+1,-1表示完全负相关,+1表示完全正相关,0表示没有相关性。
在毕业论文中,相关性分析可以用于研究两个或多个变量之间的关系。
例如,在教育领域的研究中,一个研究者可能对学生的成绩和参与课外活动之间的关系感兴趣。
通过进行相关性分析,可以确定这两个变量之间的关系强度和方向。
在运用相关性分析时,研究者需要注意以下几点:1. 确定要分析的变量:在进行分析之前,需要明确要研究的变量。
在上述例子中,研究者需要确定他们要分析的是学生的成绩和参与课外活动。
2. 收集数据:研究者需要收集相关的数据,例如学生的成绩和他们的课外活动参与情况。
数据可以通过问卷调查、观察或其他方法获得。
3. 计算相关系数:通过计算相关系数,研究者可以确定变量之间的相关性。
常用的相关系数有皮尔逊相关系数和斯皮尔曼相关系数。
皮尔逊相关系数适用于连续变量,而斯皮尔曼相关系数适用于有序变量。
举个例子,研究者收集了100名学生的成绩和他们的课外活动参与情况。
通过计算皮尔逊相关系数,研究者发现成绩和课外活动参与之间存在正相关关系,相关系数为0.7,说明两者之间的关系较为密切。
第二部分:因子分析因子分析是一种用于确定潜在因素的方法。
在毕业论文中,因子分析可以用于确定一组变量背后的共同因素。
它可以帮助研究者简化数据集,并找到隐藏的模式和关联。
在运用因子分析时,研究者需要注意以下几点:1. 确定要进行因子分析的变量:在进行因子分析之前,需要明确要进行分析的变量。
例如,在心理学研究中,研究者可能想要确定一组变量(如压力水平、焦虑水平和抑郁水平)背后的共同因素。
因子分析实验报告

因子分析实验报告因子分析实验报告引言:因子分析是一种常用的统计分析方法,用于探索变量之间的内在关系。
通过因子分析,我们可以找到隐藏在观测变量背后的潜在因素,从而更好地理解数据的结构和解释变量之间的关系。
本实验旨在通过因子分析方法,对某一特定数据集进行分析,以探索其内在因素和变量之间的关系。
实验设计:本实验选取了一个涉及消费者购买行为的数据集,包含了多个观测变量,如消费金额、购买频率、品牌忠诚度等。
我们希望通过因子分析,找出这些变量背后的潜在因素,以便更好地理解消费者购买行为的本质。
实验步骤:1. 数据准备:首先,我们收集了一份关于消费者购买行为的数据集,包含了1000个样本和10个观测变量。
这些变量包括消费金额、购买频率、品牌忠诚度等。
我们将这些变量进行了标准化处理,以消除量纲差异。
2. 因子提取:接下来,我们使用主成分分析方法进行因子提取。
主成分分析是一种常用的因子提取方法,通过线性变换将原始变量转化为一组互相无关的主成分。
我们计算了每个主成分的特征值和特征向量,并选取了特征值大于1的主成分作为因子。
3. 因子旋转:在因子提取后,我们进行了因子旋转,以使得因子更易于解释。
常用的因子旋转方法有方差最大旋转和极大似然旋转等。
在本实验中,我们选择了方差最大旋转方法,以最大化因子的方差。
4. 因子解释:最后,我们对提取出的因子进行解释。
通过观察每个因子所对应的变量载荷,我们可以确定每个因子的含义和影响因素。
同时,我们还计算了每个因子的方差贡献率,以评估其在解释总体方差中的贡献程度。
实验结果:经过因子分析,我们成功地提取出了3个主要因子,并对其进行了旋转和解释。
这些因子分别代表了消费者的购买能力、购买偏好和品牌忠诚度。
具体而言,第一个因子与消费金额和购买频率相关,代表了消费者的购买能力;第二个因子与购买偏好和购买意愿相关,代表了消费者的购买偏好;第三个因子与品牌忠诚度相关,代表了消费者对品牌的忠诚程度。
因子分析ppt课件

(3)因子旋转
通过正交旋转或斜交旋转使提取出的因子具有可解 释性。
(4)计算因子得分
通过各种方法求解各样本在各因子上的得分,为进 一步分析奠定基础。
❖ 2、因子分析前提条件——相关性分析:
分析方法主要有:
(1)计算相关系数矩阵(correlation coefficients matrix)
1 2 为p的特0 征根,
标准化特征向量,则
为u对1 , 应u2 的,, up
1
Σ = U
2
U AA + D
p
u1 u2
up
1
0
1u1u1 2u2u2
0
u1 u2
p
up
mumum m1um1um1
1u1
2u2
pu p
1u1
2
u2
p
因子分析的基本理论 ❖ 3、因子分析的目的:
因子分析的目的之一,简化变量维数。即要使因素结 构简单化,希望以最少的共同因素(公共因子),能 对总变异量作最大的解释,因而抽取得因子愈少愈好, 但抽取因子的累积解释的变异量愈大愈好。
在因子分析的公共因子抽取中,应最先抽取特征值最 大的公共因子,其次是次大者,最后抽取公共因子的 特征值最小,通常会接近0。
(3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释; 而主成分分析对提取的主成分的解释能力有限。
因子分析的基本理论
❖ 5、因子分析模型: 设 Xi (i 1,2,个,变p)量p,如果表示为
X i i ai1F1 aimFm i (m p)
X1 1 11 12
或
X
2
因子分析资料报告实验资料报告材料

电子科技大学政治与公共管理学院本科教学实验报告(实验)课程名称:数据分析技术系列实验电子科技大学教务处制表电子科技大学实验报告学生:晨飞学号:27指导教师:高天鹏一、实验室名称:电子政务可视化实验室二、实验项目名称:因子分析三、实验原理使用SPSS软件的因子分析对数据样本进行分析相关分析的原理:步骤一:将原始数据标准化。
因子分析的第一步是主成分分析,将总量较多的因素通过线性组合的方式组合成几个因素,且这些因素之间相互独立。
步骤二:建立变量的相关系数矩阵RAnalyse->Dimention Ruduction-> Fctor ->Extraction->勾选Correlation matrix 可以输出相关系数矩阵,相关系数矩阵计算了变量之间两两的pearson相关系数。
步骤三:适用性检验使用Bartlett球形检验或者KMO球形检验来检验样本是否适合进行因子分析。
评价标准:KMO检验用于检验变量间的偏相关系数是否过小,一般情况下,当KMO大于0.9时效果最佳,小于0.5时不适宜做因子分析。
Bartlett球形检验用于检验相关系数矩阵是否是单位阵,如果结论是不拒绝该假设,则表示各个变量都是各自独立的。
步骤四:根据因子贡献率选取因子,特征值和特征向量构建因子载荷矩阵A。
处于简化和抽取核心的思想,一般会按照某种标准选取前几个对观测结果影响较大的因素构建因子载荷矩阵,一般的标准是选取特征根大于1的因子。
并要求累积贡献率达到90%以上。
步骤五:对A进行因子旋转因子旋转的目的是使因子载荷矩阵的结构发生变化,使每个变量仅在一个因子上有较大载荷。
是将因子矩阵在一个空间里投影,使单个向量的投影在仅在一个变量的方向有较大的值,这样做可以简化分析。
步骤六:计算因子得分:计算因子得分是计算在不同样本水平下观测指标的水平的方式。
计算因子得分需要用到因子得分计算函数,这个计算的结果是无量纲的,仅表示各因子在这个水平下观测指标的值,这也是因子分析的目标,将不可观测的目标观测量用一个函数与可以观测的变量联系起来。
因子分析(因子评价)

因子分析一.因子分析原理因子分析是根据相关性大小把原始变量进行分组,使得同组内的变量之间相关性高,而不同组的变量之间的相关性低。
每组变量代表一个基本结构(即公共因子),并用一个不可观测的综合变量来表示。
对于所研究的某一具体问题,原始变量分解为两部分之和。
一部分是少数几个不可观测的公共因子的线性函数,另一部分是与公共因子无关的特殊因子。
从全部计算过程来看作R 型因子分析与作Q 型因子分析都是一样的,只不过出发点不同,R 型从相关系数矩阵出发,Q 型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析因子模型的性质:模型不受变量量纲的影响;因子载荷不是唯一的。
二.因子分析的数学模型设有p 个指标,则因子分析数学模型为:11111221221122221122p p p pp p p pp p X r Y r Y r Y X r Y r Y r Y X r Y r Y r Y=+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ 其中,12,,,p X X X 是已标准化的可观测的评价指标。
12,,,k F F F 出现在每个指标i X 的表达式中,称为公共因子,公共因子是不可观测的,其含义要根据具体问题来解释。
i ε是各个对应指标i X 所特有的因子,故称为特殊因子,它与公共因子之间彼此独立。
ij r 是指标i X 在公共因子j F 上的系数,称为因子载荷,因子载荷ij r 的统计含义是指标i X 在公共因子j F 上的相关系数,表示i X 与j F 线性相关程度。
用矩阵形式表示为:X AF ε=+其中12(,,,)p X X X X '=,12(,,,)k F F F F '=,12(,,,)p εεεε'=,111212122212m m p p pm r r r r r r A rr r ⎛⎫⎪⎪= ⎪ ⎪ ⎪⎝⎭,A 称为因子载荷矩阵。
其统计含义是:A 中的第i 行元素12,,,i i im r r r 说明了指标i X 依赖于各个公共因子的程度。
主成份分析因子分析毕业论文终稿

主成份分析因子分析毕业论文终稿学科分类号110 黑龙江科技大学本科学生毕业论文题目主成分与因子分析对黑龙江省城市经济发展水平的评价The principal components and factor analysisof urban economic development levelevaluation of heilongjiang province姓名学号院(系)理学院专业、年级数学与应用数学指导教师2014年6月12日摘要经济是指一个国家国民经济的总称。
我们要提高某地方人民的生活水平,要更好更快地发展某个地区,就必须充分了解这个地区现有的经济发展状况。
因此,现有的经济发展状况研究对将来的发展有着非常重要的指导意义。
主成分分析也称主分量分析,就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。
因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子的相互关系,同时根据不同因子还可以对变量进行分类。
主成分分析与因子分析都是多元分析中处理降维的一种统计方法。
本文通过学习与查阅相关资料找到黑龙江省12个地级市的10个具有代表性指标,运用spss统计分析软件对这些指标进行主成分分析和因子分析得到特征值、方差贡献率及公共因子等相关数据。
并利用这些数据对12个市经济水平划分等级。
关键词主成分分析因子分析经济spss统计分析软件IAbstractEconomy refers to the floorboard of the national economy of a country. We will improve the level of a local people's life, to somewhere better and faster development, we must fully understand the current situation of economic development. Therefore, the existing research on the development of future economic development has a very important guiding significance.Principal component analysis (also called principal component analysis, is to try the original index combined into a new set of several comprehensive index instead of the original index has nothing to do with each other, at the same time, according to the actual need to recommend a few less comprehensive response as much as possible the original information of indicators. Is a generalization of the principal component analysis and factor analysis, it is also will have the intricate relationship between variables comprehensive to a small number of several factors, and to recreate the relationship of the original variables and factor, at the same time according to different factors can also categorize variables,. Principal component analysis and factor analysis is a multivariate analysis of a statistical method of dealing with the dimension reduction. In this article, through learning and access to relevant data found nine representative indexes of 12 cities in heilongjiang province, using the SPSS statistical analysis software to the indicators of principal component analysis and factor analysis of the characteristic value, the variance contribution rate and public factor and related data. And using the data of 13 cities economic grade level.Key words Principal component analysis Factor analysis Economic SPSS statistical analysis softwarII目录摘要 (I)Abstract (II)第1章绪论 (1)1.1 选题的背景和提出 (1) (1) (2)1.2 选题的意义和目的 (3) (3) (3)1.3 主成分分析和因子分析的发展及应用 (4) (4) (4)1.4 本文主要研究内容 (5)第2章主成分与因子分析 (6)2.1 主成分分析的内容 (6) (6) (6) (8)2.2 主成分分析的求解方法和数学模型 (8)2.3 主成分分析的基本步骤 (11)2.4 因子分析的内容 (13) (13) (13)III2.5 因子分析的求解方法和数学模型 (14) (14) (15) (16)2.6 计算步骤 (16)第3章主成分与因子分析在黑龙江省城市经济水平研究中的应用 (17)3.1主成分分析法 (18)3.2 因子分析法 (22)3.3 综合评价结果分析 (26)结论 (28)致谢 (29)参考文献 (30)IVContentsAbstract....................................................................................... 错误!未定义书签。
因子分析毕业论文

因子分析毕业论文因子分析是一种统计方法,用于分析大量变量之间的关系,发现变量之间的共性和区别,从而将它们归纳为较少的几个因子。
因子分析在社会科学和行为科学的研究中得到广泛应用。
本文将探讨因子分析在毕业论文中的应用。
一、研究背景以社会心理学专业为例,毕业论文往往需要对大量变量进行研究,例如心理健康状况、人际关系、工作压力等。
这些变量之间相互影响,因此需要运用因子分析方法对它们进行整合和分析。
二、研究内容1、变量选择首先需要选择研究变量,这些变量应具有相关性,而且不能过于冗余。
变量选择可能需要通过文献调研或问卷调查获取。
在选择变量时,还需要注意其度量方式是否合适。
2、因子提取在变量选择后,需要进行因子提取,以发现变量之间的共性。
常用的因子提取方法有主成分分析和最大似然因子分析。
主成分分析主要通过找到最能解释原始变量方差的变量线性组合,将原始变量简化为若干个组合变量。
而最大似然因子分析则是通过最大化样本协方差矩阵的似然函数来得到因子。
3、因子旋转因子提取后,还需要进行因子旋转,以便于理解和解释因子。
因子旋转会使因子之间的相关性尽可能小,从而会更清晰地呈现不同因子之间的差异。
常见的因子旋转方法有正交和斜交旋转。
正交旋转所得到的因子之间无相关性,而斜交旋转可考虑因子之间的相关性。
4、解释因子在进行因子分析后,需要对结果进行解释。
每个因子代表原始变量中的某种共性,可通过对因子载荷进行解释。
因子载荷是指变量与因子之间的相关性,载荷值越大则变量在因子中的贡献越大。
因子载荷的大小还可以用于确定变量是否适合聚合成因子或是否应该从因子中排除。
三、研究实例为了更好地理解因子分析在毕业论文中的应用,以社会心理学专业为例,假设研究目的为分析网络使用对大学生心理健康的影响,选择了以下8个变量:使用时间、使用频率、网络成瘾情况、焦虑情绪、人际互动、自我调节、自我安慰、自我意识。
这些变量既有数量型变量,也有分类型变量,需要通过适当转换进行分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章 因子分析§8.1 什么是因子分析及基本思想1904年Charles Spearman 发表一篇著名论文《对智力测验得分进行统计分析》视为因子分析的起点。
因子分析的形成和发展有相当长的历史,最早用以研究解决心理学和教育学方面的问题,由于计算量大,又缺少高速计算的设备使因子分析的应用和发展受到很大的限制,甚至停滞了很长时间。
后来由于电子计算机的出现,才使因子分析的理论研究和计算问题,有了很大的进展。
目前这一方法的应用范围已十分广泛,在经济学、社会学、考古学、生物学、医学、地质学以及体育科学等各个领域都取得了显著的成绩。
1 什么是因子分析因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中处理降维的一种统计方法。
例如,某公司对100名招聘人员的知识和能力进行测试,出了50道题的试卷,其内容包括的面较广,但总的来讲可归纳为六个方面:语言表达能力、逻辑思维能力、判断事物的敏捷和果断程度、思想修养、兴趣爱好、生活常识等,我们将每一个方面称为因子,显然这里所说的因子不同于回归分析中因素,因为前者是比较抽象的一种概念,而后者有着极为明确的实际意义,如人口密度、工业总产值、产量等。
假设100人测试的分数{}100,,1, =i X i 可以用上述六个因子表示成线性函数:,1001,i 662211 =++++=i i i i i F a F a F a X ε其中61,,F F 表示六个因子,它对所有X i 是共有的因子,通常称为公共因子,它们的系数61,i i a a 称为因子载荷,它表示第i 个应试人员在六个因子方面的能力。
i ε是第i 个应试人的能力和知识不能被前六个因子包括的部分,称为特殊因子,通常假定),0(~2i i N σε,仔细观察这个模型与回归模型在形式上有些相似,实质很不同。
这里的61,,F F 的值未知的,并且有关参数的统计意义更不一样。
因子分析的任务,首先是估计出{}ij a 和方差{}2i σ,然后将这些抽象因子{}i F 赋予有实际背景和因子之间的相互关系,以达到降维和对原始变量进行分类的目的。
因子分析的内容十分丰富,本章仅介绍因子分析常用的两种类型:R 型因子分析(对变量作因子分析)和Q 型因子分析(对样品作因子分析)。
2 基本思想因子分析的基本思想是通过变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间的相关(相似)关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。
然后根据相关性(或相似性)的大小把变量(或样品)分组,使得同组内的变量(或样品)之间相关性(或相似性)较高,但不同组的变量相关性(或相似性)较低。
从全部计算过程来看作R 型因子分析与作Q 型因子分析都是一样的,只不过出发点不同,R 型从相关系数矩阵出发,Q 型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定哪一类型的因子分析。
§8.2 因子分析的数学模型1 数学模型(正交因子模型) R 型因子分析数学模型⎪⎪⎩⎪⎪⎨⎧++++=++++=++++=p m pm p p p m m m m F a F a F a X F a F a F a X F a F a F a X εεε 2211222221212112121111 用矩阵表示:⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡+⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡p m pm p p m m p F F F a a a a a a a a a X X X εεε 212121222211121121简记为)1()1()()1(⨯⨯⨯⨯+=p m m p p F AX ε且满足:1)p m ≤ii )0),(=εF Cov 即F 和ε是不相关的;iii )mI F D =⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=10101)( 即F 1…F m 不相关且方差皆为1。
⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=2222100)(P D σσσε 即pεε,,1 不相关,且方差不同。
其中),(1'=p X X X 是可实测的p 个指标所构成p 维随机向量,),,(1'=m F F F 是不可观测的向量,F 称为X 的公共因子或潜因子,即前面所说的综合变量,可以把它们理解为在高维空间中的互相垂直的m 个坐标轴;a ij 称为因子载荷是第i 个变量在第j 个公共因子上的负荷,如果把变量X i 看成m 维因子空间中的一个向量,则ij a 表示X i 在坐标轴F j 上的投影,矩阵A 称为因子载荷矩阵;ε称为X 的特殊因子,通常理论上要求ε的协方差阵是对角阵,ε中包括了随机误差。
由上述模型满足的条件可知:m F F F ,,,21 是不相关的。
若m F F F ,,,21 相关时,则D(F)就不是对角阵,这时的模型称为斜交因子模型,本章将不讨论这种模型。
类似地,Q 型因子分析数学模型为:⎪⎪⎩⎪⎪⎨⎧++++=++++=++++=nm nm n n n m m m m F a F a F a X F a F a F a X F a F a F a X εεε 2211222221212112121111 此时X 1, X 2, …, X n 表示n 个样品。
因子分析的目的就是通过模型ε+=AF X 代替X ,由于n m p m <<,,从而达到简化变量维数的愿望。
因子分析和主成分分析有很多相似之处,在求解过程中二者都是从一个协方差阵(或相似系数阵)出发,但这两种模型是有区别的,主成分分析的数学模型实质上是一种变换,而因子分析模型是描述原指标X 协方差阵∑结构的一种模型,当p m =时,主不能考虑ε,此时因子分析也对应于一种变量变换,但在实际应用中,m 都小于p ,且为经济起见总是越小越好。
另外在主成分分析中每个主成分相应的系数ij a 是唯一确定的,即因子戴荷阵不是唯一的,若Γ为任一个m m ⨯阶正交阵,则因子模型ε+=AF X 可写成:ε+Γ'Γ=))((F A X ,仍满足约束条件,即0),(),(,)()(=Γ'=Γ'=ΓΓ'=Γ'εεF Cov F Cov I F D F D m ,所以F Γ'也是公共因子,ΓA 也是因子载荷阵。
因子载荷这个不唯一性,从表面上看是不利的,但后面将会看到当因子载荷阵A 的结构不够简化时,可对A 实行变换以达到简化目的,使新的因子更具有鲜明的实际意义。
从因子分析的数学模型上看,它与多变量回归分析也有类似之处,但本质的区别是因子分析模型作为“自变量”的F 是不可观测的。
2 因子模型中公共因子、因子载荷和变量共同度的统计意义 为了便于对因子分析计算结果做解释,将因子分析数学模型中各个量的统计意义加以说明是十分必要的。
假定因子模型中,各个变量以及公共因子、特殊因子都已经是标准化(均值为0,方差为1)的变量。
(1)因子戴荷的统计意义 已知模型:i m im j ij i i i F a F a F a F a X ε++++++= 2211两端后乘F j 得:j i j m im j ij j i j i j i F F F a F F a F F a F F a F X ε++++++= 12211于是)()()()()()(2211j i j m im j j ij j i j i j i F E F F E a F F E a F F E a F F E a F X E ε++++++=由于在标准化下有:1,0)(,1)(,0)(,0)(=====i i i VarX X E Var E F E εε因此j i j i F F j i F X j i F r F E r F F E r F X E j i j i εε===)(,)(,)(所以上式可写成:ij F F F im F F ij F F i F F i F X a r r a r a r a r a r j i j m j j j j i =++++++=ε 12121(因为各因子不相关,所以相关系数为0)故因子载荷ij a 的统计意义就是第i 个变量与第j 个公共因子的相关系数即表示X i 依赖F j 的份量(比重)。
因此用统计学的术语应该叫作权,但由于历史的原因,心理学家将它叫做载荷,即表示第i 个变量在第j 个公共因子上的负荷,它反映了第i 个变量在第j 个公共因子上的相对重要性。
(2)变量共同度的统计意义所谓变量X i 的共同度定义为因子载荷阵A 中第i 行元素的平方和,即∑===mj ij i ah 122p ,1,i为了说明它的统计意义,将下式两边求方差,即i m im i i i F a F a F a X ε++++= 2211)()()()()(2222121i m im i i i Var F Var a F Var a F Var a X Var ε++++= V222221i im i i a a a σ++++=22i i h σ+=由于X i 已标准化了,所以有221i i h σ+=此式说明变量X i 的方差由两部分组成:第一部分为共同度2i h ,它刻划全部公共因子对变量X i 的总方差所作的贡献,2i h 越接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了,如97.02=i h 则说明X i 的97%的信息被m 个公共因子说明了,也就是说由原始变量空间转为因子空间转化的性质越好,保留原来信息量多,因此2i h 是X i 方差的重要组成部分。
当02≈i h 时,说明公共因子对X i 影响很小,主要由特殊因子i ε来描述。
第二部分2i σ是特定变量所产生的方差,称为特殊因子方差仅与变量X i 本身的变化有关,它是使X i 的方差为1的补充值。
(3)公因子F j 的方差贡献的统计意义 将因子载荷矩阵中各列元素的平方和记为∑===pi ij j aS 12p,1,j称S j 为公共因子F j 对X 的贡献,即S j 表示同一公共因子F j 对诸变量所提供的方差贡献之总和,它是衡量公共因子相对重要性指标。
§8.3 因子载荷阵的估计方法要建立某实际问题的因子模型,关键是要根据样本数据矩阵估计因子载荷矩阵A 。
对A 的估计方法有很多,这里仅介绍使用较为普遍的主成分法。
设随机向量),,(1'=p X X X 的协差阵为0,21>≥≥≥∑p λλλ 为∑的特征根,p e e ,,1 为对应的标准正交化特征向量(只要特征根不等,对应的单位特征向量一定是正交的),则根据线性代数知识∑可分解为:∑='='⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=∑pi i i i p e e U U 1100λλλ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡''=p p p p e e e e λλλλ 1111),,(上面的分解式恰是公共因子与变量个数一样多且特殊因子的方差为0时,因子模型中协差阵的结构。