面板数据的因子分析
多元统计分析之因子分析

多元统计分析之因子分析因子分析是一种常用的多元统计分析方法,旨在从大量观测指标中发现其背后的基本因素或维度,以简化数据分析的复杂性,并提供关于样本之间的隐含结构的信息。
本文将对因子分析的概念、原理、步骤以及其在研究中的应用进行详细介绍。
一、概念和原理因子分析是一种研究多个变量之间关系的统计技术,它通过寻找多个变量之间的共同特征,将它们归纳为较少的无关因素或构念。
这些无关因素或构念称为因子,它们是通过将原始变量进行数学转换而得到的。
因子分析通过发现这样的因子,帮助研究者识别数据中潜在的结构和模式。
因子分析的基本原理是假设多个变量之间存在共同的潜在因素,并试图将这些变量映射到较少的综合因素上。
这些潜在因素无法被直接观察到,因此需要通过数学上的推导和计算才能确定它们的存在。
因子分析的目标是找到能够解释原始变量之间的相关性的最小数目的因子。
二、步骤因子分析通常包括以下步骤:1.收集数据:收集包含多个观测指标的数据,这些指标应当反映被研究对象的多个方面。
2.确定分析的类型:根据研究目的和数据特点,确定主成分分析还是常规因子分析。
3.确定因子数目:使用合适的统计方法(如特征值、解释方差等)确定需要提取的因子数目。
4.提取因子:通过数学计算,将原始变量转换为较少的无关因子。
5.因子旋转:为了使因子更易于解释,通常进行因子旋转,以最大化因子之间的独立性并减少因子与原始变量之间的关联性。
6.解释因子:解释提取的因子,确定它们的意义和作用。
7.评估结果:评估因子分析的效果,并根据需要进行调整和修正。
三、应用因子分析广泛应用于社会科学、市场调研、心理学等领域。
以下列举一些常见的应用场景:1.人格特征研究:通过对多个问卷调查指标进行因子分析,识别人格特征的维度和结构。
2.战略管理:通过对市场指标、经济指标等进行因子分析,发现不同因素对企业发展的影响程度,从而制定合理的战略决策。
3.客户满意度调查:通过对客户满意度调查指标进行因子分析,发现影响客户满意度的各因素,并为改善客户满意度提供指导。
数据分析中的因子分析与主成分分析

数据分析中的因子分析与主成分分析在当今信息爆炸的时代,数据分析已经成为了各行各业中不可或缺的一部分。
在数据分析的过程中,因子分析和主成分分析是常用的两种统计方法。
它们可以帮助我们理解数据背后的隐藏规律和关联性。
本文将介绍因子分析和主成分分析的基本概念、应用场景以及它们之间的区别。
一、因子分析因子分析是一种用于探索多个变量之间关系的统计方法。
它的基本思想是将多个相关的变量归纳为少数几个潜在因子,从而简化数据的复杂性。
通过因子分析,我们可以找到隐藏在数据背后的共性因素,并将其用较少的变量来代表。
在因子分析中,我们需要确定两个重要的概念:因子载荷和公因子。
因子载荷表示变量与因子之间的相关性,取值范围为-1到1。
而公因子则是指影响多个变量的共同因素。
通过因子分析,我们可以得到每个变量对于每个公因子的因子载荷,从而得知变量之间的相关性以及它们与公因子的关系。
因子分析在实际应用中有着广泛的用途。
例如,在市场调研中,我们可以利用因子分析来确定消费者对于某个产品的偏好因素;在心理学研究中,我们可以通过因子分析来探索人们的个性特征。
因子分析的结果可以帮助我们更好地理解数据,为进一步的分析提供基础。
二、主成分分析主成分分析是一种用于降维的统计方法。
它的目标是通过线性组合将原始变量转化为一组新的互相无关的变量,即主成分。
主成分分析通过保留原始数据的大部分信息,同时减少数据的维度,从而达到简化数据和减少冗余的目的。
在主成分分析中,我们首先需要计算协方差矩阵。
然后,我们通过求解协方差矩阵的特征值和特征向量,得到主成分。
特征值表示主成分的重要性,而特征向量则表示主成分的方向。
通过选择特征值较大的主成分,我们可以保留较多的原始数据信息。
主成分分析在实际应用中也有着广泛的用途。
例如,在金融领域,我们可以利用主成分分析来构建投资组合,降低风险;在图像处理中,我们可以利用主成分分析来提取图像的特征。
主成分分析可以帮助我们更好地理解数据的结构,发现数据中的重要特征。
数据分析中的因子分析方法介绍

数据分析中的因子分析方法介绍数据分析是指利用各种统计方法和技术处理大量数据,从中提取有用信息、发掘潜在关系、预测未来趋势等。
在数据分析的过程中,因子分析是一种重要的数据降维技术,可以将大量变量降维为较少的几个因子,从而更好地理解数据背后的结构和关系。
本文将介绍因子分析的基本概念、应用领域以及常见的因子分析方法。
一、基本概念1. 因子在因子分析中,因子是指能够解释变量之间共同方差的潜在变量。
通过因子分析,我们可以将多个变量归纳为较少的无关因子。
因子分析的目标是找到这些因子,并且解释它们与原始变量之间的关系。
2. 公因子公因子是指共同影响多个变量的因子。
当一个因子对多个变量有较高的贡献时,我们可以将其归为公因子。
3. 特殊因子特殊因子是指只对某个特定变量有影响的因子。
它们通常与其他变量无关,只会对单个变量产生影响。
4. 因子载荷因子载荷是指变量与因子之间的相关性。
它表示变量与因子之间的线性关系强度,取值范围从-1到1。
二、应用领域因子分析在许多领域具有广泛的应用,以下列举几个常见的应用领域:1. 金融领域在金融领域,因子分析可以用来发现股票投资组合的共同因子。
通过对大量的股票数据进行因子分析,可以找出一些主要影响股票表现的共同因子,例如利率变动、经济数据等。
这样的分析可以帮助投资者更好地理解市场动态,优化投资组合。
2. 人力资源管理在人力资源管理中,因子分析可以用来识别员工满意度的关键因素。
通过收集员工满意度调查数据,并应用因子分析方法,可以发现一些共同的影响因素,例如工作环境、薪酬福利等。
这样的分析可以帮助企业识别问题,并制定相应的改进措施。
3. 市场调研在市场调研中,因子分析可以用来分析消费者行为和偏好。
通过收集消费者调查数据,并应用因子分析方法,可以找出一些共同的因子,例如价格敏感性、产品功能等。
这样的分析可以帮助企业了解消费者需求,优化产品设计和市场定位。
三、常见的因子分析方法1. 主成分分析(PCA)主成分分析是因子分析中最常用的方法之一。
面板数据的因子分析

第26卷第6期贵州大学学报(自然科学版)Vol.26No.6 2009年 12月Journal of Guizhou University(Natural Sciences)Dec.2009文章编号 1000-5269(2009)06-0010-04面板数据的因子分析王 培3,王焱鑫,崔 巍(贵州大学理学院,贵州贵阳550025)摘 要:主要应用多元数理统计中的因子分析方法,对多指标面板数据进行了分析,并应用综合评分法对各地区的工业企业生产效率进行了分类。
结果表明,应用因子分析的结果与现实基本相符。
关键词:面板数据;因子分析中图分类号:O212 文献标识码:A 因子分析是主成分分析的推广和发展,也是多元统计分析中降维的一种方法。
因子分析是研究相关阵或协方差阵的内部依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系[1]。
面板数据是同一截面单元数据集上对不同时间段上的重复观测值,是时间序列和截面数据的混合数据。
面板数据的独特优点,使之在理论及应用领域都得到了长足的发展。
然而,很少有学者考虑面板数据在多元统计中的分析。
从Bonze D.C和Her2 mosilla A.Y开创性的将多元统计的方法引入到面板数据的分析中来,并用概率连接函数和遗传算法改进了聚类分析的算法,此后,国外对相关问题的研究一直停滞不前;国内学者朱建平、郑兵云分别对单指标面板数据及多指标面板数据的聚类分析进行了一定的研究,并做了实证分析[2,3]。
本文将因子分析与面板数据结合,利用实例解释面板数据的因子分析的结果。
1 因子分析的基本原理1.1 正交因子模型设X=(X1,…,X p)′是观测的随机向量, E(X)=μ,D(X)=∑,且设F=(F1,…,F m)′, (m<p)是不可观测的随机向量,E(F)=0, D(F)=I m.又设ε=(ε1,…,εp)′与F互不相关,且E(ε)=0,D(ε)=d iag(σ21,…,σ2p)≡D假定随机向量X满足以下模型:X1-μ=a11F1+a12F2+…+a1m F m+ε1X2-μ=a21F1+a22F2+…+a2m F m+ε2… … … … … … …X p-μ=a p1F1+a p2F2+…+a p m F m+εp(1)以上模型(1)称为正交因子模型,用矩阵表示如下 X=μ+A F+ε(2)其中F1,…,F m称为X的公共因子;ε1,…,εp 称为X的特殊因子。
数据分析中的因子分析和主成分分析

数据分析中的因子分析和主成分分析在数据分析领域,因子分析和主成分分析是两种常用的多变量分析方法。
它们可以用来处理大量的数据,找出数据的内在规律,并将数据简化为更少的变量。
本文将介绍因子分析和主成分分析的定义、应用以及它们在数据分析中的区别和联系。
一、因子分析因子分析是一种用于研究多个变量之间的潜在因素结构及其影响的统计方法。
它通过将多个观测变量转化为少数几个无关的因子,来解释变量之间的相关性。
因子分析的基本思想是将多个相关观测变量归因于少数几个潜在因子,这些潜在因子不能被观测到,但可以通过观测变量的变化来间接地推断出来。
因子分析通常包括两个主要步骤:提取因子和旋转因子。
提取因子是指确定能够解释原始变量方差的主要共性因子,常用的方法有主成分分析法和最大似然估计法。
旋转因子是为了减少因子之间的相关性,使得因子更易于解释。
常用的旋转方法有正交旋转和斜交旋转。
因子分析的应用非常广泛,可以用于市场研究、社会科学调查、心理学、金融等领域。
例如,在市场研究中,因子分析可以用来确定消费者购买行为背后的潜在因素,从而更好地理解市场需求。
二、主成分分析主成分分析是一种通过线性变换将原始变量转化为一组线性无关的主成分的统计方法。
主成分是原始变量的线性组合,具有较大的方差,能够尽可能多地解释原始数据。
主成分分析的主要思想是将原始变量投影到一个新的坐标系中,使得新坐标系上的第一主成分具有最大方差,第二主成分具有次最大方差,以此类推。
通过选择解释原始数据方差较多的前几个主成分,我们可以实现数据的降维和主要信息提取。
主成分分析在数据降维、特征提取和数据可视化等领域有广泛的应用。
例如,在图像处理中,主成分分析可以用来压缩图像数据、提取重要特征,并且可以在保留图像主要信息的同时减少存储空间的需求。
三、因子分析和主成分分析的区别和联系因子分析和主成分分析在某些方面有相似之处,但也存在明显的区别。
首先,因子分析是用于研究多个观测变量之间的潜在因素结构,而主成分分析是通过线性变换将原始变量转化为一组线性无关的主成分。
因子分析

因子分析因子分析是一种常用的统计方法,广泛应用于社会科学、经济学、心理学等领域。
它可以帮助研究者找出数据中的主要因素,并将原始变量转化为更少的几个综合指标,从而简化数据分析和解释。
本文将介绍因子分析的基本原理、应用场景以及一些常见的因子分析方法。
一、因子分析的基本原理因子分析基于一种潜在变量模型,假设观察到的一组变量是由少数几个潜在的因子所决定的。
这些潜在因子无法直接观察到,但可以通过观察到的变量来推断。
通过因子分析,我们可以找出这些潜在因子,并将原始变量转化为这些因子的得分。
在因子分析中,我们假设每个潜在因子与一组观察到的变量相关联,这些变量称为因子载荷。
因子载荷可以解释变量之间的协方差结构,反映了变量与潜在因子之间的相关程度。
我们可以通过计算因子载荷矩阵来评估这种关系。
同时,我们还假设观察到的变量之间相互独立,即不存在多重共线性。
多重共线性会使得因子分析的结果不准确,因此在进行因子分析之前,我们需要先进行相关性分析和多重共线性检验。
二、因子分析的应用场景因子分析在许多领域都有广泛的应用。
以下是其中一些常见的应用场景:1.心理学研究:因子分析可以帮助心理学家理解人类行为的潜在因素。
例如,在人格心理学中,我们可以使用因子分析来研究人格特征的结构,并找出彼此相关的因素。
2.市场研究:因子分析可以帮助市场研究人员理解消费者行为的背后因素。
例如,在消费者调查中,我们可以使用因子分析来提取消费者购买决策中的主要影响因素,并根据这些因素进行市场定位和目标群体选择。
3.经济学研究:因子分析可以帮助经济学家理解经济变量之间的关系。
例如,在宏观经济学中,我们可以使用因子分析来提取经济增长、通货膨胀和失业率等变量的主要因素,并分析它们之间的相互作用。
4.社会科学研究:因子分析可以帮助社会科学家理解社会现象的潜在因素。
例如,在教育研究中,我们可以使用因子分析来研究学生学习成绩的主要影响因素,并提供相应的教学策略。
三、常见的因子分析方法在因子分析中,有许多不同的方法可以选择。
数据分析知识:数据分析中的因子分析和主成分分析
数据分析知识:数据分析中的因子分析和主成分分析数据分析是一门应用数学的新兴学科,在大数据、人工智能和互联网技术的推动下,日益受到企业和科学家的青睐。
数据分析的基本任务是研究数据间的关系,找出隐藏在数据背后的规律和模式,为决策提供支持和指导。
因子分析和主成分分析是常用的数据分析方法,在广泛的领域中得到了应用和发展。
因子分析和主成分分析是两种线性变换技术,即将多维数据降维,从而减少数据冗余和噪声,提取数据的本质信息,简化数据的处理和分析。
它们的具体实现方式不同,但是目标相同:寻找数据背后的共性因素,构建潜在变量模型,提高数据的可解释性和预测性。
一、因子分析因子分析是一种结构方程模型,旨在研究一组观测变量之间的关系,找出其中的基本因素,以便于描述和解释数据中的变化。
它可以用于数据降维、变量筛选、因果推断、模式识别、分类聚类、信用评估、意见调查等方面。
因子分析的基本思路是将若干观测变量表示成少数几个共同的因素,从而减少变量的数量和复杂度。
这些因素具有一定的统计意义和实际意义,反映了数据中的基本结构和变化。
因子分析的前提是变量之间存在相关性和模式,但是不了解具体的本质方式和机制。
因子分析的方法流程如下:1、确定因子个数:可以通过特征值、平行分析、KMO检验等方法,来选择合适的因子个数。
2、提取因子:可以使用主成分分析和极大似然估计等方法,将原始变量投影到因子空间中。
3、旋转因子:可以使用正交旋转和斜交旋转等方法,来调整因子间的关系,使因子间的相关性更清晰和明确。
4、解释因子:可以使用重载矩阵、公共度、因子载荷、因子得分等方法,来识别每个因子的内涵和实际意义,并解释数据中的变化。
基于以上步骤,因子分析可以将原始数据转化为因子得分并展示数据的本质结构和变化,从而更好地理解数据的特点和规律。
同时,因子分析可以消除冗余信息和噪声,提高数据的清晰度和稳定性,有利于数据清洗、预测和模型构建。
二、主成分分析主成分分析是一种多元统计技术,在数据分析领域中具有重要的应用和价值。
统计学中的因子分析
统计学中的因子分析统计学中的因子分析是一种用于确定数据中隐藏关系或共同因素的方法。
它可以帮助我们简化数据集,从而更好地理解数据背后的结构和模式。
因子分析广泛应用于社会科学、市场研究、心理学等领域,对于数据分析和模型建立具有重要意义。
一、因子分析的基本概念因子分析是一种统计学方法,旨在通过找到潜在因子来解释数据集中的变异。
潜在因子是指能够解释变量共同变异的一组变量(因素),它们在统计分析中无法直接观测到。
因子分析的目标是通过识别和描述这些潜在因子来简化数据集。
在因子分析中,我们假设观测到的变量与潜在因子之间存在线性关系。
通过因子分析,我们可以确定每个观测变量与每个因子之间的关系强度(因子载荷)以及每个观测变量的因子载荷。
二、因子分析的应用1. 社会科学领域在社会科学中,因子分析被广泛用于测量和理解复杂的社会现象。
例如,在调查研究中,因子分析可以用于分析问卷调查中的多个变量,并识别这些变量背后的共同因素。
通过因子分析,我们可以将大量的变量简化为更少的几个因子,从而更好地理解调查数据。
2. 市场研究领域因子分析在市场研究中也有广泛的应用。
例如,通过对消费者行为数据进行因子分析,可以识别潜在的购买动机和偏好因子。
这有助于市场研究人员理解消费者行为背后的动因,从而更好地制定营销策略。
3. 心理学领域在心理学研究中,因子分析被广泛用于测量和理解人的特质和态度。
通过因子分析,研究人员可以识别潜在的心理特征或因素,如个人素质、人格特征等。
这些因子对于了解人的行为和心理状态非常重要。
三、因子分析的步骤因子分析可以分为以下几个基本步骤:1. 建立模型在进行因子分析之前,我们需要明确研究的目的,并选择合适的因子分析模型。
常用的因子分析模型包括主成分分析和最大似然估计法。
2. 数据准备数据准备是因子分析的重要一步。
我们需要确保数据的可靠性和可用性,包括数据的完整性、一致性和合适的缺失值处理。
3. 因子提取在因子提取阶段,我们尝试从原始数据中提取最重要的因子。
因子分析方法
因子分析方法因子分析是一种常用的统计分析方法,它可以用来揭示数据之间的内在结构和关系。
在实际研究中,因子分析方法被广泛应用于心理学、教育学、市场调研等领域。
本文将介绍因子分析的基本概念、步骤和应用,帮助读者更好地理解和运用这一方法。
首先,我们来看一下因子分析的基本概念。
在统计学中,因子分析是一种用于探索多个变量之间关系的方法。
通过因子分析,我们可以找出一组潜在的因子,这些因子可以解释观察到的变量之间的共变异。
换句话说,因子分析可以帮助我们发现隐藏在数据背后的模式和结构。
接下来,我们将介绍因子分析的步骤。
首先,我们需要选择合适的因子分析模型,常见的模型包括主成分分析和常规因子分析。
然后,我们需要进行数据准备,包括数据清洗、变量选择和数据标准化。
接着,我们进行因子提取,找出能够最好解释变量之间关系的因子。
最后,我们进行因子旋转,以便更好地解释因子之间的关系。
通过这些步骤,我们可以得到一组能够解释数据变异的因子。
最后,让我们来看一下因子分析的应用。
因子分析可以帮助我们简化数据,减少变量的数量,从而更好地理解数据的结构。
在心理学中,因子分析可以用来研究个体的心理特质和行为特征;在教育学中,因子分析可以用来分析学生的学习成绩和学习行为;在市场调研中,因子分析可以用来发现消费者的偏好和行为模式。
通过因子分析,我们可以更深入地理解数据,从而更好地指导实际问题的解决。
综上所述,因子分析是一种重要的统计分析方法,它可以帮助我们发现数据背后的模式和结构。
通过本文的介绍,相信读者对因子分析有了更深入的理解,希望能够在实际研究中更好地运用这一方法。
因子分析的原理及步骤
因子分析的原理及步骤因子分析是一种多变量统计方法,用于探索观测数据背后的潜在结构,包括变量之间的关系和潜在因子的存在。
在因子分析中,我们希望将多个观测变量解释为较小数量的潜在因子,这有助于简化数据和理解数据背后的结构。
因子分析的基本原理是假设观测变量通过潜在因子来解释,这些潜在因子无法直接观测到,只能通过观测变量的共同方差来间接体现。
根据这个假设,因子分析通过对观测变量之间的协方差矩阵进行分解,得到潜在因子与观测变量之间的关系,以及每个观测变量对于每个潜在因子的贡献。
因子分析的步骤如下:1. 收集数据:首先,需要收集包含多个观测变量的数据集。
这些变量可以是定量的,如身高、体重等,也可以是分类变量,如性别、职业等。
数据集应该是相对完整和可靠的。
2. 确定分析目标:在进行因子分析之前,需要明确分析的目标。
例如,我们可能希望找到最能解释原始数据的因子数目,或者找到最能准确预测观测变量的因子。
3. 数据预处理:在进行因子分析之前,需要对数据进行预处理。
常见的预处理方法包括标准化、缺失值处理等。
标准化可以使得不同变量之间的量级一致,从而减少因子分析结果的偏差。
4. 估计因子载荷:因子载荷是指每个观测变量对于每个因子的贡献。
通过估计因子载荷,我们可以了解每个观测变量与每个因子之间的关系强度。
常用的估计方法包括主成分分析和最大似然估计。
5. 确定因子数目:在因子分析中,一个重要的问题是如何确定因子的数目。
常用的方法有Kaiser准则和屏蔽图。
Kaiser准则认为,仅保留特征值大于1的因子。
屏蔽图则通过观察各个因子的特征值曲线,选择特征值明显下降的截止点。
6. 解释因子:在确定了因子数目之后,我们可以解释每个因子所代表的含义。
这需要仔细研究每个因子的载荷矩阵和观测变量之间的关系。
通常,我们将大于0.4的载荷定义为显著载荷,表示该观测变量对该因子的贡献较大。
7. 旋转因子:旋转因子是为了更好地解释因子结构而进行的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第26卷第6期贵州大学学报(自然科学版)Vol.26No.6 2009年 12月Journal of Guizhou University(Natural Sciences)Dec.2009文章编号 1000-5269(2009)06-0010-04面板数据的因子分析王 培3,王焱鑫,崔 巍(贵州大学理学院,贵州贵阳550025)摘 要:主要应用多元数理统计中的因子分析方法,对多指标面板数据进行了分析,并应用综合评分法对各地区的工业企业生产效率进行了分类。
结果表明,应用因子分析的结果与现实基本相符。
关键词:面板数据;因子分析中图分类号:O212 文献标识码:A 因子分析是主成分分析的推广和发展,也是多元统计分析中降维的一种方法。
因子分析是研究相关阵或协方差阵的内部依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系[1]。
面板数据是同一截面单元数据集上对不同时间段上的重复观测值,是时间序列和截面数据的混合数据。
面板数据的独特优点,使之在理论及应用领域都得到了长足的发展。
然而,很少有学者考虑面板数据在多元统计中的分析。
从Bonze D.C和Her2 mosilla A.Y开创性的将多元统计的方法引入到面板数据的分析中来,并用概率连接函数和遗传算法改进了聚类分析的算法,此后,国外对相关问题的研究一直停滞不前;国内学者朱建平、郑兵云分别对单指标面板数据及多指标面板数据的聚类分析进行了一定的研究,并做了实证分析[2,3]。
本文将因子分析与面板数据结合,利用实例解释面板数据的因子分析的结果。
1 因子分析的基本原理1.1 正交因子模型设X=(X1,…,X p)′是观测的随机向量, E(X)=μ,D(X)=∑,且设F=(F1,…,F m)′, (m<p)是不可观测的随机向量,E(F)=0, D(F)=I m.又设ε=(ε1,…,εp)′与F互不相关,且E(ε)=0,D(ε)=d iag(σ21,…,σ2p)≡D假定随机向量X满足以下模型:X1-μ=a11F1+a12F2+…+a1m F m+ε1X2-μ=a21F1+a22F2+…+a2m F m+ε2… … … … … … …X p-μ=a p1F1+a p2F2+…+a p m F m+εp(1)以上模型(1)称为正交因子模型,用矩阵表示如下 X=μ+A F+ε(2)其中F1,…,F m称为X的公共因子;ε1,…,εp 称为X的特殊因子。
公共因子一般对X的每一个分量Xi都有作用,而εi只对Xi起作用[1,4]。
1.2 模型的参数主成分估计方法1)由样本数据阵X计算样本均值X_、样本协差阵S、样本相关阵R.2)求相关阵R的特征值和标准化特征向量。
记λ1≥λ2≥…≥λp≥0为R的特征值,其相应的单位正交特征向量为l1,l2,…l p.3)求因子的载荷矩阵AⅠ确定公因子的个数m(如m=2).Ⅱ令ai=λi l i(i=1,2,…m),则A=(a1,…,am)为因子的载荷矩阵。
4)估计特殊因子方差σi^和共同度h2i,其中h2i =∑mj=1a2ij(i=1,2,…p).5)对公共因子做解释。
以上是因子分析的基本原理,关于因子分析的收稿日期:2009-08-25基金项目:贵州省自然科学基金项目(700121);贵州省教育厅基金项目(2008043)作者简介:王 培(1987-),女,江苏淮安人,硕士研究生,研究方向:应用数理统计,Email:pei w ang1129@. 3通讯作者:王 培,Email:pei w ang1129@.其他内容请参阅参考文献[1][4].2 面板数据的因子分析2.1 面板数据的数据结构多指标面板数据的数据结构相对于单指标面板数据要复杂的多,不同于单指标面板数据的二维表格而言,多指标面板数据除了具有截面维度和时间维度外,还增加了指标维度,因此多指标面板数据实际上是一张三维表格。
在平面上的表示如表1[3]。
设总体由N个体组成,每个个体的特征含有p项指标,时间长度为T,则X ij(t),i=1,2,…n;j =1,2,…p;t=1,2,…T表示第i个个体第j个指标在时刻t的数值。
表1 多指标面板数据的数据结构 样本编号测量时间与各指标测量值1…t…TX1…X j…X p…X1…X j…X p…X1…X j…X p1X11(1)…X1j(1)…X1p(1)…X11(t)…X1j(t)…X1p(t)…X11(T)…X1j(T)…X1p(T)…… … … … … ……… … … … ……… … … … …i X i1(1)…X ij(1)…X ip(1)…X i1(t)…X ij(t)…X ip(t)…X i1(T)…X ij(T)…X ip(T)……… … … … ……… … … … ……… … … … …n X n1(1)…X nj(1)…X np(1)…X n1(t)…X nj(t)…X np(t)…X n1(T)…X nj(T)…X np(T) 面板数据的因子分析相对于多元统计中的总体及样本的因子分析要复杂很多,目前没有现成的软件可供使用,本文试图寻求一种途径将多指标面板数据的结构转换为现有软件能够处理的数据类型。
这是一种“降维”的思想,即当我们多研究问题的要求不是非常严格时,我们可以通过取均值的方法将多指标面板数据的三维表格降为二维表格。
具体的做法如下,对每一个指标在时间维度上取均值,抽象为某一个特定时刻的情形,从而消去时间维度的影响,退化成截面数据。
显然地,这种“降维”的处理方法主要存在两个缺陷。
第一,信息损失,均值只能描述平均动态,不能反映其他统计特征,如方差等;第二,这样的方法存在一种潜在的假设,即各个体在每一相同指标在时间维度上的变化方向相同,否则会出现错误[3]。
本文将利用Evie ws 软件对以上分析进行验证。
2.2 实例应用国有及规模以上的非国有企业在工业经济中占有绝对比重,国家每年都对这类企业进行详细的调查。
本文仍将选取这类企业作为研究对象;选取全员劳动生产率、固定资本占有率、流动资本占有率三个指标考察国有及规模以上非国有企业的生产效率。
本文使用的数据来自中国统计年鉴(2001年—2006年)。
通过对2000至2005年31个地区的三个指标的面板数据观测,能够看出这六年来工业全员劳动生产率不断提高,但固定资本及流动资本的占有率却呈降低趋势。
文献[3]用聚类分析的方法对各地区工业生产效率的层次及类型进行了粗略的判别。
本文采用因子分析的方法给出各地区工业生产效率的综合得分,从而指出造成文献[3]中分类结果的根本原因。
1)应用K MO和球形Bartlett检验数据因子分析适应性。
结果如表2所示。
由检验结果可以看出,应拒绝各变量独立的假设,因子分析的方法值得尝试。
2)应用碎石图判断各因子的特征根大小及因子的重要程度。
由图1可以很明显的看出结果。
表2 K MO和球形Bartlett检验结果相关矩阵 全员劳动生产率固定资本占有率流动资本占有率相关 全员劳动生产率1.000-.179-.202 固定资本占有率-.1791.000.906 流动资本占有率-.202.9061.000K MO和Bartlett的检验取样足够度的Kaiser-M eyer-OLkin度量.520 Bartlett的球形度检验 近似卡方49.653 df3 Sig.000图1 各因子的碎石图·11·第6期王 培等:面板数据的因子分析 3)计算因子载荷矩阵及因子空间载荷图,如表3及图2所示。
表3 因子载荷矩阵成份矩阵a成份123全员劳动生产率-.373.928.006固定资本占有率.957.194-.216流动资本占有率.962.168.217提取方法:主成分分析法。
(a )已提取了3个成份。
旋转成份矩阵a成份123全员劳动生产率-.096.995.003固定资本占有率.974-.087-.209流动资本占有率.969.110.223提取方法:主成分分析法。
旋转法:具有Kaiser标准化的正交旋转法。
a .旋转在此次迭代后收敛。
图2 因子空间载荷图 4)因子得分及因子表达式,如表4所示。
表4 因子得分矩阵成份得分系数矩阵成份123全员劳动生产率.1021.015.054固定资本占有率.536.044-2.302流动资本占有率.504.0562.321提取方法:主成分分析法。
旋转法:具有Kaiser 标准化的正交旋转法。
构成得分。
成份得分协方差矩阵成份12311.000.000.0002.0001.000.0003.000.0001.000提取方法:主成分分析法。
旋转法:具有Kaiser 标准化的正交旋转法。
构成得分。
利用表4中的因子得分系数矩阵可以写出各公因子表达式如下:F 1=0.102x 1+0.536x 2+0.504x 3F 2=1.015x 1+0.044x 2+0.055x 3F 3=0.054x 1-2.302x 2+2.321x 35)结合表3、4可以看出以上三个因子分别从不同方面反映了我国工业企业生产效率水平。
单独使用某一个指标不能对工业企业的生产效率做出正确的评价,这里我们按各公因子的对应方差贡献率为权重计算综合评价统计量:F =λ1λ1+λ2+λ3F 1+λ2λ1+λ2+λ3F 2+λ3λ1+λ2+λ3F3(3)6)利用公式对我国31个地区的工业企业生产效率进行综合评分排名,并按评分结果进行分类,见表5.表5 各地区工业生产效率分类第一类第二类第三类地区排名地区排名地区排名山东1安徽11甘肃22江苏2北京12内蒙古23广东3江西13云南24浙江4吉林14新疆25福建5广西15山西26河北6重庆16贵州27河南7辽宁17陕西28天津8湖北18宁夏29上海9黑龙江19青海30湖南10海南20西藏31四川21 从分类结果可以看出,首先,工业企业的生产效率具有较强的地区差异。
经济较发达地区生产效率一般较高,这是因为经济发达地区一般拥有丰富及高水平的人力物力,在第一类中我们可以看出山东、江苏、、浙江在这方面的优势。
其次经济开放程度对工业生产效率也有一定的正面影响,经济开放程度越高,特别是外资的流入,一定程度上提高了经济效益及生产效率。
在分类中可以看出广东、上海、天津等地合理的利用开放带来的优势,提高了生产效率。
最后,经济欠发达地区也有一些例外,如云南、新疆、贵州等地的工业企业生产效率表现优于山西、陕西,这是因为云南的烟草加工、新疆的食品加工、贵州的军工企业在我们选取的各指标上一直表现良好,并且在各地的整个企业中所占份额较大。
·21·贵州大学学报(自然科学版)第26卷3 结论与展望从以上的分析我们看出,由于我们选取的三个指标:全员劳动生产率、固定资本占有率及流动资本占有率在因子中的得分不同,为我们进行分类提供了依据。