数学建模之因子分析法
因子分析法详细步骤

• Heywood现象 • 残差矩阵
五、因子旋转
• 目的:使因子负荷两极分化,要么接近于0,要么接近于1。 • 常用的旋转方法:
(1)方差最大正交旋转(varimax orthogonal rotation) • 基本思想:使公共因子的相对负荷(lij/hi2)的方差之和最大,且保持原公共因子的正交性和
• 确定公共因子数; • 计算公共因子的共性方差hi2; • 对载荷矩阵进行旋转,以求能更好地解释公共因子; • 对公共因子作出专业性的解释。
四、因子分析提取因子的方法 • 主成分法(principal component factor)
aij jlji
i 1,2,..., p; j 1,2,...,m
因子分析法详细步骤
二、因子分析模型
一般地,设X=(x1, x2, …,xp)’为可观测的随机变量,且有 • f=(f1,f2,…,fm)’为公共(共性)因子(common factor),简称因子(factor)
X ii a i1 f1 a i2 f2 a im fm e i
• e=(e1,e2,…,ep)’为特殊因子(specific factor) f和e均为不可直接观测的随机变量 • μ=(μ1,μ2,…,μp)’为总体x的均值 • A=(aij)p*m为因子负荷(载荷)(factor loading)矩阵
通常先对x作标准化处理,使其均值为零,方差为1.这样就有
假定(1)fi的均数为0,方差为1;
(2)ei的均数为0,方差为δi;
x af af af e (3) fi与ei相互独立.
因子分析数学模型

因子分析数学模型1、因子分析看基本思想因子分析是一种旨在寻找隐藏在多变量数据中,无法直接观察到却影响或支配可观测变量的潜在因子,并估计潜在因子对可观测变量的影响程度,以及潜在因子之间的相关性的一种多元统计分析方法。
其基本思想是从分析多变量数据的相关关系入手,找到支配这种相关关系的少数几个相关独立的潜在因子,并通过建立起这些潜在因子与原变量之间的数量关系来预测潜在因子的状态,帮助发现隐藏在原变量之间的某种客观规律性。
因子分析和主成分分析都能起到清理多个原始变量内在结构关系的作用,但主成分分子重在综合原始变量信息,而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法。
因子分析法就是这些潜在因子的数学模型方法,它是在主成分的基础上构筑若干个意义较为明确的潜在因子,以它们为框架分析原变量,以考察原变量间的联系与区别。
2、因子分析的基本原理3、因子分析的数学模型假设对n例样品观测了p个指标,即,,…,,得到观测数据。
我们的任务就是从一组观测数据出发,通过分析各指标,,…,之间的相关性,找出支配作用的潜在因子,使得这些因子可以解释各个指标之间的相关性。
因子分析模型描述如下:(1)X=(,,…,)是可观测随机变量,均值向量E(X)=0,协方差Cov(X)与相关矩阵R相等,(只要将变量标准化即可实现)。
(2)F=(,,…,)(m<=p)是不可测的向量,其均值E(F)=0,协方差矩阵Cov(F)=1,即向量的各分量是独立的。
(3)e=(,,…,)与F相互独立,且E(e)=0,e的协方差矩阵是对角矩阵,即各分量e之间是相互独立的。
则因子分析的数学模型如下:由于该模型是针对变量进行的,各因子是正交的,所以也称为R型正交因子模型。
其矩阵形式为:X=AF+e。
其中:X= A= F= ,e=对于因子分析,要求数据和模型满足以下假设条件:●是均值为0、方差为1的随机变量;●是均值为0 ,方差为常数的正太随机变量。
因子分析数学模型

因子分析数学模型因子分析是一种统计方法,用于研究多个变量间的关系,并将其通过线性组合的方式转化为少数几个影响变量的因子。
因子分析模型是一种数学模型,旨在解释变量之间的相关性,找出潜在的因子影响变量的变异程度。
因子分析的数学模型可以分为两个阶段。
第一阶段是提取因子,通过主成分分析的方法从原始变量中提取出少数几个因子。
主成分分析的核心是将原始变量进行线性组合,使得新的变量能够解释尽可能多的原始变量的变异。
主成分分析将提取的因子按照解释的变异程度排序,选择解释性较好的因子作为主成分。
第二阶段是因子旋转,通过变换因子的坐标轴方向,使得因子能够具有较好的解释性和可解释性。
因子旋转可以使用正交旋转或斜交旋转的方法进行。
正交旋转将因子的坐标轴变换为正交的坐标轴,使得因子之间没有相关性;斜交旋转将因子的坐标轴变换为斜交的坐标轴,使得因子之间可以存在相关性。
根据具体问题的需求,选择适当的旋转方法。
因子分析的数学模型可以表示为:Y=λ1F1+λ2F2+…+λnFn+e其中,Y是观测变量的向量,包括m个变量;F是因子的向量,包括n个因子;λ是因子载荷的矩阵,表示观测变量对因子的影响程度;e是误差项。
因子载荷矩阵λ可以用来衡量观测变量与因子之间的关系,越大表示对应观测变量越受该因子的影响。
因子分析的数学模型还可以进一步扩展为混合因子分析模型。
混合因子分析模型考虑了因子间的相关性和观测变量间的相关性,通过引入协方差矩阵和错误项协方差矩阵,对因子和观测变量的相关性进行建模。
混合因子分析模型可以更准确地描述变量之间的关系,并提供更可靠的因子载荷和因子得分。
总之,因子分析是一种通过线性组合的方式转化变量间关系的统计方法,其数学模型可以用来解释变量之间的相关性,并提取出影响变量的少数几个因子。
因子分析的数学模型在社会科学、市场调研等领域具有广泛的应用价值。
数学模型中的因子分析法

数学模型中的因子分析法因子分析是一种常用的数学模型,用于解释多个变量之间的关系和发现潜在的因素。
它是一种降维技术,旨在将众多变量转化为较少数量的无关因子。
因子分析在统计学、心理学和市场研究等领域广泛应用,可用于数据降维、消除多重共线性、提取潜在特征、构建模型等等。
在因子分析中,有两种主要类型:探索性因子分析(Exploratory Factor Analysis,EFA)和验证性因子分析(Confirmatory Factor Analysis,CFA)。
探索性因子分析用于发现数据中的潜在因素,而验证性因子分析则用于验证已经提出的因素模型是否符合实际数据。
探索性因子分析的步骤如下:1.提出假设:确定为什么要进行因子分析以及预期结果,用于指导后续的数据分析。
2.数据准备:收集和整理要进行因子分析的数据,确保数据的可用性和准确性。
3.因子提取:通过主成分分析或最大似然法等方法,提取出能够解释数据变异最大的因子。
4.因子旋转:因子旋转是为了使提取出的因子更易于解释和理解。
常用的旋转方法有正交旋转和斜交旋转等。
5.因子解释和命名:对于每个提取出的因子,需要根据变量的载荷矩阵和旋转后的载荷矩阵进行解释和命名。
载荷矩阵表示每个因子与每个变量之间的关系。
6.结果评估:对于提取出的因子,需要进行信度和效度的评估。
信度评估包括内部一致性和稳定性等指标;效度评估包括构造效度和相关效度等指标。
验证性因子分析通常用于验证已经提出的因子模型是否符合实际数据。
其步骤包括:1.提出假设:确定已存在的因子模型,并对其进行理论和实际的验证。
2.选择分析方法:确定适合验证性因子分析的模型拟合方法,如最大似然法或广义最小二乘法等。
3.构建模型:将因子模型转化为测量模型,并建立测量方程。
4.模型拟合:对构建的测量模型进行拟合,评估模型的拟合度,如χ²检验、准则拟合指数(CFI)等。
5.修正模型:根据拟合域冒去改进模型的拟合,如剔除不显著的路径、修正测量方程等。
《因子分析数学模型》课件

总结与展望
因子分析数学模型是一种强大的数据分析工具,可以揭示变量间的潜在结构和关系,帮助决策者做出准确和可靠的 决策。 未来,随着数据科学和人工智能的发展,因子分析将在更多领域得到应用,成为决策支持和问题解决的重要手段。
参考文献
• 附录1:相关数学知识 • 附录2:实例数据和代码 • 附录3:常见因子分析软件介绍
3
最似然法(MLE)
MLE基于概率统计理论,通过最大化观测数 据与模型之间的似然函数来估计因子载荷。
主因子法(PAF)
PAF基于向量之间的相关系数,寻找具有最 大因子载荷的主要因子,从中提取对观测变 量具有最大解释力的因子。
因子分析的实例分析
数据准备及预 处理
根据特定问题的需求, 选择合适的数据集,并 对数据进行清理、转换 和标准化,以满足因子 分析的假设。
因子数的确定 和选择
根据特征值、解释度方 差贡献率、Scree图等 指标,确定最合适的因 子数,以提取最重要的 信息。
因子旋转和解 释度分析
使用旋转方法(如 Varimax、Promax等), 优化因子结构,同时通 过解释度判断模型的质 量和合理性。
结果分析和解读
对提取的因子模式进行 解释,结合领域知识和 实际情境,解读因子的 含义和影响,提出相关 建议和决策。
特征值和特征向量
特征值用于衡量因子的重要性, 而特征向量表示因子的方向和 权重。
旋转和解释度
旋转可以优化因子的解释度, 使其更易理解和解释,用以提 高模型的可解释性和可靠度。
因子分析的模型方法
1
主成分分析法(PCA)ቤተ መጻሕፍቲ ባይዱ
2
PCA通过线性变换将观测变量转化为无关变
量的线性组合,从中提取主要特征,以解释
第6章 因子分析法

数学模型
因子 分析 的模 型
为什么要旋转因子 建立了因子分析模型的目的不仅仅 要找出公共因子以及对变量进行分 组,更重要的要知道每个公共因子的 意义,以便进行进一步的分析,如果 每个公共因子的含义不清,则不便于 进行实际背景的解释。由于因子载荷 阵是不惟一的,所以应该对因子载荷 阵进行旋转。使因子载荷阵的结构简 化,使载荷矩阵中每列或行的元素平 方值向0和1两极分化。
几个重要概念:
(1). 某个因子与某个原变量的相关系数,主要反映该公共 (1).因子载荷: 因子载荷: 某个因子与某个原变量的相关系数,主要反映该公共
因子对相应原变量的贡献力大小。 因子对相应原变量的贡献力大小。
(2). 对某一个原变量来说,其在所有因子上的载荷的平 (2).变量共同度: 变量共同度: 对某一个原变量来说,其在所有因子上的载荷的平
KMO统计量 (2)
生育率的影响因素分析
生育率受社会、经济、文化、计划生育政策等很多 因素影响,但这些因素对生育率的影响并不是完全独立 的,而是交织在一起,如果直接用选定的变量对生育率 进行多元回归分析,最终结果往往只能保留两三个变量,其他变 量的信息就损失了。因此,考虑用因子分析的方法,找出变量 间的数据结构,在信息损失最少的情况下用新生成的因子对生 育率进行分析。 选择的变量有:多子率、综合节育率、初中以上文化程度比 例、城镇人口比例、人均国民收入。下表是1990年中国30个 省、自治区、直辖市的数据。
没有旋转的因子结构 Factor1 x1 x2 x3 x4 x5 -0.76062 0.56898 0.89184 0.87066 0.89076 Factor2 0.55316 -0.76662 0.25374 0.34618 0.36962
数学模型中的因子分析法

'
'
1
2
p
A a ij
称为因子载荷阵
pm
X AF
• 因子分析步骤: • 前四步骤不主成分步骤相同,在此略。 5.求初始因子载荷阵A。 6.若公因子的含义丌清楚,丌便于实际解释时,将 初始因子阵作旋转处理,直到达到要求。 7.根据因子载荷大小说明因子具体含义。 • 将因子表示成原指标变量线性组合,估计因子得 分。 • 用每个因子的贡献率作权数,给出多指标综合评 价值。
6
3
0 . 959439 X
5
0 . 0 . 055029 X
• • • • • • • • • • • • • • • • •
Obs
Prin1 Prin2 1 -0.38118 2 0.57795 3 0.69219 4 0.22635 5 -0.82981 6 -1.19410 7 -1.63568 8 0.95195 9 0.46501 10 -1.45693 11 -0.29401 12 0.08041 13 -2.11628 14 -0.94513 15 6.74015 16 -0.88090
• 主成分分析法:就是设法将原来的具有一定相关 性的变量戒者指标,重新组成一组新的相互无关 的少数几个综合变量戒指标,以此代替原来的变 量戒指标。简单的说就是降维。 • 应用:综合评价(系统评估)
例:对我国上市公司的经济效益进行综合评判。
上市公司 qinghua beida 资金利税率 x1 产值利税率 x2 百元销售成 本利润x3 百元销售收 入利税x4 流动资金周 转次数x5 主营利润增 长率x6
5.41 7.21
因子分析数学模型

因子分析数学模型因子分析是一种常用的多元统计分析方法,主要用于分析多个观测变量之间的相关关系。
它通过寻找潜在因子,将多个观测变量转化为较少的几个因子,从而减少变量间的复杂性,进而更好地解释观测数据。
因子分析的数学模型可以表示为:X=ΛF+Ψ其中,X是一个n×p的数据矩阵,表示n个观测对象对p个观测变量的测量结果。
Λ是一个n×m的因子载荷矩阵,表示每个观测变量与每个因子之间的线性关系。
F是一个m×p的因子矩阵,表示每个观测对象在每个因子上的得分。
Ψ是一个n×p的特殊因子载荷矩阵,表示每个观测变量与测量误差的关系。
在因子分析模型中,通过最小化测量误差来确定因子载荷矩阵Λ和特殊因子载荷矩阵Ψ。
最小化误差的方式通常使用最小二乘法,目标函数可以表达为:min(Ψ, Λ) = ∑[x_i - (λ_i1f_1i + λ_i2f_2i + ... +λ_imf_m_i)]^2其中,x_i是观测对象i的观测数据,λ_ij是观测变量j与因子i 的载荷系数,f_ij是观测对象i在因子j上的得分。
通过最小化目标函数,可以得到最优的因子载荷矩阵Λ和特殊因子载荷矩阵Ψ,从而揭示出观测变量之间的潜在因子结构。
在因子分析模型中,还存在一些特殊的情况,包括主成分分析和确认性因子分析。
主成分分析是因子分析的一种特殊情况,它假设所有的观测变量都与因子完全相关,即Ψ为零矩阵。
主成分分析通过计算特征值和特征向量来确定因子载荷矩阵Λ,并选择前几个最大的特征值对应的特征向量作为因子。
确认性因子分析则是在因子分析的基础上进行参数约束,通过设定因子载荷矩阵和特殊因子载荷矩阵的一些限制来验证和验证潜在因子结构的模型。
因子分析是一种灵活性较高的统计方法,可以应用于很多领域,如心理学、教育学、市场营销和金融等。
通过因子分析,我们可以更好地理解和解释观测数据之间的关系,并提取出具有实际意义的因子。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因子分析
因子分析就是一种降维、简化数据的技术。
它通过研究众多变量之间的部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。
这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。
原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。
1.因子分析法的应用
①汽车行业业绩评价研究(下载文档), ②上市公司盈利能力及资本结构实证分析, ③生育率影响因素分析。
2.步骤
①对原始数据进行标准化处理 用12,,
,m x x x 表示因子分析指标的m 个变量,评价对象有n 个,ij a 表示第i
个评价对象对应于第j 个指标的取值。
将每个指标值ij a 转化为标准化指标ij a ,即
,(1,2,
,;1,2,
,)ij j
ij j
a a i n j m s μ-=
==
式中:11n j ij i a n μ==∑,21
1()1n
j ij j i s a n μ==--∑ 相应地,标准化指标变量为
,(1,2,
,)j j
j j
x x j m s μ-=
=
②计算相关系数矩阵R
()ij m m R r ⨯=
1
,(,1,2,
,)1
n
ki
kj
k ij a
a r i j m n =⋅=
=-∑
式中:1,ii ij ji r r r ==,ij r 是第i 个指标和第j 指标之间的相关系数。
③计算初等载荷矩阵
解特征方程0=-R I λ,得到特征值(1,2,,)i i m λ=12,0m λλλ≥≥≥≥,再
求出相对应的特征值i λ的特征向量(1,2,,)i u i m =,其中12(,,,)T j j j mj u u u u =,
得到初等载荷矩阵为
11,
,m m u λ⎤Λ=⎦
④ 确定主因子的个数()k k m ≤ 一般选取使得累计贡献率11
85%k
m
i
i
i i λλ
==≥∑∑的这k 个主因子,对k 个因子载
荷矩阵作旋转,用()
1k Λ表示1Λ的前k 列,T 表示正交矩阵,则得矩阵()21k T Λ=Λ,建立因子模型,即
1111111,
.
k k m
m mk k x F F x F F αααα=++⎧⎪
⎨⎪=++⎩ ⑥计算因子得分,作出综合评价
求出单个因子的得分函数ˆj F ,用ˆij F 表示第i 个样本对第j 个因子的得分估计值,Y 表示原始数据标准化后的矩阵,则总得分为
1ˆˆ()ij n k k
F F YR -⨯==
Λ 例题
我国上市公司赢利能力与资本结构的实证分析已知上市公司的数据见表1
表1 上市公司数据
试用因子分析法对上述企业进行综合评价。
模型的建立
①对原始数据进行标准化处理 用12,,
,m x x x 表示因子分析指标的m 个变量,评价对象有n 个,ij a 表示第i
个评价对象对应于第j 个指标的取值。
将每个指标值ij a 转化为标准化指标ij a ,即
,(1,2,
,;1,2,
,)ij j
ij j
a a i n j m s μ-=
==
式中:11n j ij i a n μ==∑,21
1()1n
j ij j i s a n μ==--∑ 相应地,标准化指标变量为
,(1,2,
,)j j
j j
x x j m s μ-=
=
②计算相关系数矩阵R
()ij m m R r ⨯=
1
,(,1,2,
,)1
n
ki
kj
k ij a
a r i j m n =⋅=
=-∑
式中:1,ii ij ji r r r ==,ij r 是第i 个指标和第j 指标之间的相关系数。
③计算初等载荷矩阵
解特征方程0=-R I λ,得到特征值(1,2,,)i i m λ=12,0m λλλ≥≥≥≥,再
求出相对应的特征值i λ的特征向量(1,2,,)i u i m =,其中12(,,,)T j j
j mj u u u u =,
得到初等载荷矩阵为
11,
,m m u λ⎤Λ=⎦
④ 确定主因子的个数()k k m ≤ 一般选取使得累计贡献率11
85%k
m
i
i
i i λλ
==≥∑∑的这k 个主因子,对k 个因子载
荷矩阵作旋转,用()
1k Λ表示1Λ的前k 列,T 表示正交矩阵,则得矩阵()21k T Λ=Λ,建立因子模型,即
1111111,.
k k m
m mk k x F F x F F αααα=++⎧⎪
⎨⎪=++⎩ 模型的求解:
我们选取两个主因子。
利用MATLAB 程序计算得旋转后的因子贡献及贡献率见表2,因子载荷阵见表3。
表2 贡献率数据
表3 旋转因子分析表
计算因子得分,作出综合评价
我们用回归方法求单个因子得分函数
11
ˆ,1,2,,j j jm m F b x b x j k =++=
用ˆij
F 表示第i 个样本对第j 个因子的得分估计值,则 11
ˆ,(1,2,,;1,2,,)ij j i jm im F b x b x i n j k =++==
即
1121
112222112k k m m
km b b b b b x R B b b x -⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦ 用Y 表示原始数据标准化后的矩阵,则总得分为
1ˆˆ()ij n k
F F YR B -⨯== 计算得出各个因子得分函数为
1123421234
0.5310.16150.18310.50150.0450.51510.5810.0199F x x x x F x x x x =+-+=-++-
总得分为
12
44.4941.886.17
F F F +=
计算出16家上市公司赢利能力的综合得分见表4。
表416家上市公司赢利能力的综合得分。