问卷分析方法
问卷调查结果分析指南:方法与技巧解析

问卷调查结果分析指南:方法与技巧解析问卷调查是一种常见的数据收集方式,广泛用于市场调研、科研、员工幸福评估等各个领域。
但是,问卷的数据收集只是第一步,分析这种数据至关重要。
问卷调查该怎么分析结果?首先要进行数据清理,然后对数据展开叙述,进行单一变量分析、相关性分析、回归性分析以及可视化分析,最后综合考虑各种其他因素。
接下来我们具体聊一聊该怎么分析。
一、数据清理:在分析以前,首先清除收集的数据。
数据清理的目的是消除异常值、缺失值和其它对结果有不利影响的信息。
针对异常值,能通过比较和均值之间的差别来判定。
针对缺失值,可以选择删除或应用插值添充。
数据清理的目的是保证数据的准确性和完整性,并促进后面表述。
二、数据叙述:在进行深入分析以前,有必要对数据开展基本叙述。
主要包含样本数量、使用率、被访者相关信息等。
依据样本数量和使用率的描写,能够评定样版的代表性和调查的稳定。
叙述被访者相关信息,如性别、年纪、教育程度等,能够帮助分析师把握调查样本的特点和分布特征。
(延伸阅读:进行调查问卷有什么技巧?)三、分析方法1、单一变量分析:单独变量分析是指对单独变量开展统计和说明性分析。
重要方法包括频率分布、百分数、均值、标准差等。
依据对单个变量的描述,我们能了解不同变量的分布特征,如较大频率选项和均分。
这有助于给予相关样本的总体特点和观察的集中趋势。
2、相关性分析:相关性分析用以区分不同变量之间是否存在关联性。
重要方法包括相关系数和卡方检验。
相关系数可以选择2个持续变量之间的相关性,而卡方检验则适用分析2个归类变量之间的相关性。
相关性分析的结果能够帮助分析师了解不同变量之间的关系水准,及其这些关系是否具备统计意义。
3、回归分析:回归分析用于研究一个或多个预测变量和一个预测变量之间的关系。
创建回归方程可以根据变量预测或表述因变量的改变。
回归分析能够帮助分析师了解不同变量对因变量的影响程度,及其这些影响是否具备统计意义。
4、可视化分析:可视化分析是由图表和图形显示数据,使数据更真实、更容易理解。
问卷分析方法

问卷分析方法问卷调查是一种常用的数据收集方法,通过问卷可以获取大量的信息和数据,但如何对问卷进行有效的分析是至关重要的。
本文将介绍几种常用的问卷分析方法,希望能对您的研究工作有所帮助。
首先,问卷调查的数据分析可以采用描述性统计方法。
描述性统计是通过对问卷数据中的各项指标进行统计描述,包括频数分布、均值、标准差等。
通过描述性统计,可以直观地了解被调查对象的一些基本情况,比如年龄分布、性别比例、受教育程度等,这些信息对于后续的分析和研究具有重要意义。
其次,问卷数据的分析还可以采用相关性分析方法。
相关性分析可以帮助我们了解问卷中各项指标之间的相关关系,包括正相关、负相关以及相关程度。
通过相关性分析,可以找出问卷中不同指标之间的内在联系,为后续的研究提供重要参考。
此外,因子分析也是一种常用的问卷分析方法。
因子分析是通过分析问卷中各项指标之间的相关性,将它们归纳为几个较为独立的因子,从而简化数据结构。
因子分析可以帮助我们找出问卷中隐藏的结构和规律,为研究提供更深层次的信息。
最后,问卷数据的分析还可以采用回归分析方法。
回归分析可以帮助我们了解问卷中各项指标之间的因果关系,找出影响因变量的自变量,并建立相应的数学模型。
通过回归分析,可以深入挖掘问卷数据中的信息,为研究提供更为精确的结论。
总之,问卷分析是问卷调查工作中至关重要的一环,不同的分析方法可以帮助我们从不同角度了解问卷数据,为研究提供有力支持。
希望本文介绍的问卷分析方法能对您的工作有所启发,也希望您能在实际工作中灵活运用这些方法,取得更好的研究成果。
调查问卷结果分析

调查问卷结果分析调查问卷是一种常见的数据收集方式,通过分析问卷结果,可以获取有关特定主题或问题的数据,用于制定更准确的决策或做出更好的业务决策。
本文将着重探讨问卷结果分析方法、分析结果和应用。
一、问卷结果分析方法1. 描述性统计分析描述性统计分析是从问卷中获得数字量的一种方法。
它包括数量的频率分布、平均数、中位数、众数、标准差等。
统计分析的结果可用于对各种数据进行比较和理解差异。
2.因素分析因素分析通过分析咨询问卷中固有的差异,将它们分解为几个公共因素。
然后,该分析把各个问题分配到一个或多个因素上。
因素分析能够使因素的数量最小化,并在处理问卷结果时更加有效地工作。
3. 重点分析和比较重点分析和比较是确定一些揭示有关特定主题或问题的数据的有效方法。
这些分析方法可以使决策者集中精力于最关键的数据,并得出建议和办法。
4. 回归分析回归分析是研究特定的因变量与一个或多个自变量之间的关系的一种统计方法。
在问卷结果分析中,回归分析将从问卷获得的数据作为因变量和自变量之间的相关性研究。
二、分析结果1.问题收集在对调查问卷结果进行分析前,需要将问卷问题集中起来,形成一份清晰的问题列表。
这样可以让决策者更好地理解问题,并确定哪些问题是最具代表性的。
2.分组对于问卷结果分析来说,分组是一项重要的操作。
它能够帮助决策者将数据分成互不相同的组别、追踪有关数据,并制定决策策略。
3.模式识别模式识别是将数据与某种行为或事件相关联的过程。
在问卷结果分析中,模式识别可以帮助决策者排除没有意义的数据、确认实时趋势,并确定特定的商品或服务以及哪些市场正在流行。
4.利用工具和软件利用数据分析工具和软件可以更好地对调查问卷结果进行分析。
例如,Microsoft Excel 可以使用其分析工具快速分析数据,确定各种差异和热点问题。
此外,也有许多专业的数据分析软件能够协助决策者轻松地分析数据结果。
三、应用1.提高市场组合策略分析问卷结果有利于帮助企业了解市场情况,在此基础上改进营销策略实现市场扩增。
调查问卷中的统计分析方法

调查问卷中的统计分析方法一、数据类型的分类在进行统计分析之前,我们需要了解问卷数据所属的数据类型。
常见的数据类型主要可以分为四类:名义型、顺序型、区间型和比率型数据。
名义型数据是最基本的数据类型,它仅表示分类或标记的信息。
例如,在一份调查问卷中,我们可以使用“是”和“否”的选项来表示一个问题的答案。
顺序型数据则在名义型数据的基础上增加了顺序关系的信息。
例如,我们使用“非常不满意”、“不满意”、“一般”、“满意”和“非常满意”的五个选项来衡量一个产品的满意度。
区间型数据是一种有序的连续数据,它的测量单位是固定的,但没有一个确定的零点。
例如,我们对一组人群的年龄进行调查,得到的数据是区间型数据。
最后,比率型数据在区间型数据基础上添加了一个确定的零点,可以进行加减乘除等运算。
例如,我们可以统计一组人的身高、体重等信息。
二、描述性统计分析方法描述性统计分析方法能够总结和展示数据的基本特征,帮助我们对数据有一个整体的认识。
常用的描述性统计分析方法包括频数分析、百分比分析、中心位置分析和离散程度分析等。
频数分析是统计各个变量取值的频数,它可以直观地了解到数据中各个不同取值的个数。
百分比分析可以进一步对频数进行转化,得到各个取值的百分比。
中心位置分析可以帮助我们了解数据的集中趋势,常用的指标有均值、中位数和众数等。
均值是指将所有数据加起来后除以数据个数得到的平均数;中位数则是将数据按照大小排列后找到中间位置的数;众数是指在一组数据中出现次数最多的数。
离散程度分析可以帮助我们了解数据的分散程度,常用的指标有方差和标准差等。
方差是各个数据与均值之差的平方的平均值;标准差是方差的平方根,它可以反映数据的离散度。
通过以上的描述性统计分析方法,我们可以对调查问卷中的数据进行初步的了解和总结。
三、推断统计分析方法描述性统计分析方法能够对数据进行总结,但无法做出具有代表性和普遍性的推断。
而推断统计分析方法可以通过对样本数据进行分析,从而推断出与总体数据相关的结论。
问卷分析方法

数据分析与统计软件一、问卷的设计(一)问卷中的题目设计分为单选题和多选题,其中单选题的设计一般采用李克特(Likert)五点量表法。
(二)问卷分析的步骤:拟编预试问卷—预试—整理问卷与编号—项目分析—因素分析—信度分析—再测信度1.项目分析目的:利用t检验方法对预试问卷中的题目进行筛选。
步骤:P41-42(吴)2.因素分析(效度分析、维度分析)(1)探索性因素分析目的:利用因子分析方法(主成分)对预试问卷的效度进行分析。
(2)验证性因素分析目的:利用因子分析方法(主成分)对预试问卷的效度进行验证。
3.信度分析目的:利用信度分析方法对预试问卷调查所得数据的可信性进行分析。
4.再测信度目的:利用相关分析方法对预试问卷的前后两次调查所得数据的可信性进行分析。
二、问卷数据的分析1.多重响应分析:Analyze→Multiple Response作用:分析多项选择题,包括多项选择题题集的定义及频数分析。
特别:列联表分析:Analyze→Descriptive Statistics →Crosstabs 作用:分析属性变量间是否相互独立。
2.均值检验(t-检验)3.方差分析4.协方差分析5.相关分析6.回归分析(路径分析)7.聚类分析多重响应分析多重响应分析也称为多(复)选题分析。
在量化研究中,除了单选题、李克特量表外,常见的回答发生即是复选题。
所谓复选题即是题目的可选答案不止一个,答案的选项可以多重选择或者题项可勾选其中多个选项。
下面是一份问卷(其中部分):1.您的性别:□男□女2.您对数学学习的兴趣:□非常感兴趣□一般□无兴趣3.您平时喜欢的文学作品:(1)□外国的(2)□中国的(3)□古代的(4)□近代的(5)□现代的4.您平时喜欢的体育项目:(1)□爬山(2)□游水(3)□跑步(4)□打篮球其中1、2题为单选题,3、4题为多(复)选题。
下面介绍与单、多选题有关的软件处理方法。
一、变量的编码方法1.对单选题一个题目用一个变量即可。
问卷调查的数据分析方法

问卷调查的数据分析方法标题:问卷调查的数据分析方法引言:随着社会的发展和科技的进步,问卷调查已经成为研究和了解人们意见、态度和行为的常用方法之一。
然而,仅仅收集到大量的数据并不能帮助我们深入理解和分析问题。
在这篇文章中,我们将探讨一些常用的数据分析方法,以助于更好地理解问卷调查结果。
一、数据整理与预处理在开始数据分析之前,我们需要进行数据整理与预处理,以确保数据的可靠性和一致性。
首先,我们应该检查数据是否完整,是否存在缺失值或异常值。
其次,对于多选题或开放式问题,我们需要对回答进行分类和编码,以便后续的统计和分析。
二、描述性统计分析描述性统计分析是对数据进行总结和描述的方法,通常包括计算平均数、中位数、众数、标准差等统计指标。
通过这些指标,我们可以了解数据的分布、集中趋势和离散程度。
此外,我们还可以通过绘制条形图、饼图、频率分布图等图表来直观地展示数据特征。
三、关联分析关联分析是研究不同变量之间关系的方法,一般利用相关系数或卡方检验等统计方法进行计算。
通过关联分析,我们可以了解不同变量之间的相关性强弱程度,判断它们之间是否存在显著关联。
这对于了解问题的核心因素、解释变量之间的作用关系非常重要。
四、回归分析回归分析是研究因变量与自变量之间关系的方法,通过构建数学模型进行预测和解释。
常见的回归方法包括线性回归、逻辑回归等。
通过回归分析,我们可以深入探讨各个自变量对因变量的影响程度和方向,帮助我们理解问题的本质和原因。
五、聚类分析聚类分析是将相似的个体归为一类,不相似的个体归为不同类别的方法。
通过聚类分析,我们可以进行数据的分类与整理,发现数据集中的分组结构和内部规律。
对于大规模问卷调查数据,聚类分析可以帮助我们减少数据的复杂性,提取出主要特征。
六、主成分分析主成分分析是一种降维方法,通过将原始变量进行线性组合,得到新的综合指标(主成分),从而降低数据维度并保留较多信息。
主成分分析可以帮助我们理解变量之间的相关性和重要性,发现隐藏在数据背后的潜在因素。
调查问卷的分析方法有

调查问卷的分析方法有调查问卷是一种常用的数据收集工具,被广泛应用于社会科学研究、市场调研、教育评估等领域。
在进行问卷调查后,如何对收集到的数据进行分析是至关重要的。
本文将介绍几种常见的调查问卷分析方法。
首先,我们可以使用描述性统计分析方法来对问卷数据进行整体的概括和描述。
这种方法可以计算出各个问题的频数、百分比、均值、中位数、标准差等统计指标,帮助我们了解被调查对象的整体情况。
通过描述性统计分析,我们可以得出被调查对象的一般特征和整体趋势。
其次,卡方检验是一种常用的统计方法,适用于分析两个或多个分类变量之间的关系。
通过卡方检验,我们可以判断两个变量之间是否存在相关性。
例如,我们可以使用卡方检验来分析性别与购买决策之间的关系,以了解性别是否对购买行为有影响。
另外,因子分析是一种用于探索数据结构的多变量统计方法。
通过因子分析,我们可以将众多变量归纳为少数几个因子,从而简化数据分析过程。
例如,我们可以将多个问题关于消费者偏好的变量进行因子分析,得出几个主要的消费者偏好因子,以便更好地理解消费者的行为和需求。
此外,回归分析是一种常见的统计方法,用于探究自变量与因变量之间的关系。
通过回归分析,我们可以建立模型,预测因变量的变化情况,并确定自变量对因变量的影响程度。
例如,我们可以使用回归分析来探究广告投入与销售额之间的关系,以了解广告对销售的贡献度。
最后,我们还可以使用质性分析方法来对问卷数据进行分析。
质性分析强调对数据的深入理解和解释,通过对文本或图像数据的分析,挖掘出隐藏的信息和主题。
例如,我们可以对问卷中的开放性问题进行质性分析,探索被调查对象的意见、看法和感受。
综上所述,调查问卷的分析方法有多种选择,包括描述性统计分析、卡方检验、因子分析、回归分析和质性分析等。
选择合适的分析方法取决于研究目的、研究问题和数据类型。
研究人员应根据实际情况灵活运用这些方法,以得出准确、可靠的结论。
问卷调查分析方法

问卷调查分析方法
在兼职时候,肯定有碰到让你去做市场调研,做问卷调查、回收并整理好数据提交一份分析报告吧。
派发问卷和回收都没有很大难度,但当你回收完准备整理资料时候是不是觉得很苦恼不知道从何入手呢?问卷的准确分析可以说是整个过程里的重中之重了,前面所做的都是为了得出一份准确的分析。
那么如何正确的分析调查问卷呢,下面我们将整理出一份新手入门问卷分析的方法,供大家参考。
一、首先一定要明确自己调查的目的,全程要带着目的围绕主要问题去分析
二、根据调查结果对主要问题的回答情况进行统计,通过这些数据可以直观看出调查者的心理状况和对这个调查的认知程度
三、这个是问卷法里最重要的,就是对收集到的一系列数据进行整理和分析,因为从得出的数据反映出的情况就是问卷发布想要得到的结果。
根据统计分析原理划分的两类:定性分析和定量分析
定性分析
定性分析的特点是具有探索性的一种调研方法。
虽然定性分析的目的是为了对问题定位和启动能有更深入的认识和理解,但其准确性会比较模糊不定,因为选取的样本数量比较少,比较依赖于统计者的天赋眼光和对资料特殊的理解,所以定性分析需要有一定的专业水平才能去做的。
定量分析
定量分析分为简单定量分析和复杂定量分析,简单定量分析就是对调查问卷做一些比较简单的分析,例如平均数、百分比、频数这些来进行比较基础的分析;复杂定量分析会涉及到常用的两种,就是多元分析和正交设计分析,但在我们常见的一些兼职中,简单的定量分析就已经足够我们做回收的问卷调查结果了,所以下面主要是解释怎么用简单定量分析去分析问卷。
对封闭问题的定量分析:题目里已经将问题答案都给出,调查者只能从选项里选出答案。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据分析与统计软件一、问卷的设计(一)问卷中的题目设计分为单选题和多选题,其中单选题的设计一般采用李克特(Likert)五点量表法。
(二)问卷分析的步骤:拟编预试问卷—预试—整理问卷与编号—项目分析—因素分析—信度分析—再测信度1.项目分析目的:利用t检验方法对预试问卷中的题目进行筛选。
步骤:P41-42(吴)2.因素分析(效度分析、维度分析)(1)探索性因素分析目的:利用因子分析方法(主成分)对预试问卷的效度进行分析。
(2)验证性因素分析目的:利用因子分析方法(主成分)对预试问卷的效度进行验证。
3.信度分析目的:利用信度分析方法对预试问卷调查所得数据的可信性进行分析。
4.再测信度目的:利用相关分析方法对预试问卷的前后两次调查所得数据的可信性进行分析。
二、问卷数据的分析1.多重响应分析:Analyze→Multiple Response作用:分析多项选择题,包括多项选择题题集的定义及频数分析。
特别:列联表分析:Analyze→Descriptive Statistics →Crosstabs 作用:分析属性变量间是否相互独立。
2.均值检验(t-检验)3.方差分析4.协方差分析5.相关分析6.回归分析(路径分析)7.聚类分析多重响应分析多重响应分析也称为多(复)选题分析。
在量化研究中,除了单选题、李克特量表外,常见的回答发生即是复选题。
所谓复选题即是题目的可选答案不止一个,答案的选项可以多重选择或者题项可勾选其中多个选项。
下面是一份问卷(其中部分):1.您的性别:□男□女2.您对数学学习的兴趣:□非常感兴趣□一般□无兴趣3.您平时喜欢的文学作品:(1)□外国的(2)□中国的(3)□古代的(4)□近代的(5)□现代的4.您平时喜欢的体育项目:(1)□爬山(2)□游水(3)□跑步(4)□打篮球其中1、2题为单选题,3、4题为多(复)选题。
下面介绍与单、多选题有关的软件处理方法。
一、变量的编码方法1.对单选题一个题目用一个变量即可。
如第1题用A1(取值为1或者2——要做标签)第2题用A2(取值为1或2或3——要做标签)。
2.对多选题一个题目用一个代码,该题目下的一个选项为另一代码,由这两个代码组成该题的变量。
如:第3题用代码A3,选项(1)——(5)的代码分别是M1—M5,于是该题的变量有5个:A3M1, A3M2, A3M3, A3M4, A3M5,它们构成了第3题的变量集,集合名为A3。
第4题用代码A4,选项(1)——(4)的代码分别是M1——M4,于是该题的变量有4个:A4M1,A4M2,A4M3,A4M4,它们构成了第4题的变量集,集合名为A4。
注:以上多选题的选项,选中的记为1,不选中的记为0。
二、定义多选题题集A4M1,A4M2,A4M3,A4M4为例,它们是同以题目的4个可复选的选项,它们组成一个集合,集合名为A4。
★【Analyze】→【Multiple Response 】→【Define Sets】★把A4M1,A4M2,A4M3,A4M4 选入“Variables in Set’的方框中。
★在给出集合名A4即可。
注:每一个复选题都要定义题集。
三、多选题的频数分布★Analyze→Multiple Response →Frequencies★把每一个题的题集选入“Table(s) for”的方框中;★点击OK即可。
四、多选题的列联表及其检验因为列联表的行和之和=列和之和所以,在●单选题与单选题;●单选题与复选题中的一个选项所构成的列联表进行(独立性)检验。
其方法是进入Analyze→Descriptive Statistics →Crosstabs过程。
量表分析一.李克特(Likert)五点量表法此量表的填答方式,以五点量表最为常用,因为它的内部一致性较好,常用的选项名称如下:●非常符合5 ,符合4,有时符合3,不符合2,非常不符合1。
●总是如此5,时常如此4,有时如此3,很少如此2,从未如此1。
●非常同意5,同意4,不能确定3,不同意2,极不同意1。
●非常重要5,重要4,不能确定3,不重要2,极不重要1。
二.量表分析步骤1.项目分析;2.效度分析;3.信度分析.三.项目分析1.编制数据文件一份量表,一般分为若干个层面,每个层面有若干调查题项。
如1: 学校办学水平意见调查表,分两个层面编制。
第一层面: 教师工作满意度,有若干题项;第二层面:教师教学投入,有若干题项。
如2: 父母影响调查表: 第一层面: 父母压力(A)第二层面: 心理支持(B)第三层面: 作业协助(C)编制数据文件时,变量名可以是: A层面:A1,A2,A3,…B层面:B1,B2,B3,…C层面:C1,C2,C3,….也可以是题序号。
2.项目分析目的:将不适合的题项删除。
“不合适”标准: ★标准一: 在高分组与低分组中,无显着性差异(无区分能力)的题项。
★标准二: 与总分相关不显着的题项。
●标准一的统计处理:(1)计算总分T 方法:Tranform →Compute(2)对总分排序方法: Data→Sort cases(3)按总分分别取前(或后)的27~30(%)样本作为高分组与低分组。
(4)在数据文件中设立一个分组变量,高分组的样本记为1,低分组的样本记为2。
(5)进行t检验。
●高分组与低分组差异不显着的题项应该去掉或者修改。
●标准二的统计处理:用总分T对所有题项作相关分析(即求相关系数)Analyze→Correlate →Bivariate注意:把t放在第一行,易读结果。
●与总分相关不显着的题项应该去掉或者修改标准一与标准二所得的结果不一定相同,作项目分析时,只需说明是用什么标准即可.四.效度分析效度有内容效度,效标关联效度与建构效度之分(近来还倡导专家效度)。
此处介绍:建构效度——指测验能够测量出理论的特征或概念的程度。
如果我们根据理论的假设结构,编制一份量表或测验,经实际测验结果——受试者所得的实际分数,经统计检验结果能有效解释受试者的心理特征,则此测验或量表即具有良好的建构效度,当然说明建构效度好,内容效度也好,因为内容效度是通过题目的合理性来判断的。
(一)总量表的效度分析此处所用的方法是因子分析法(因素分析法)按因子分析的原理及效度分析的含义,此处因子分析时因素(公因子)个数应是量表设计时的层面数。
如果量表效度高,应说是一个层面的含义就是一个公因子,如: A1,A2,A3,…. 的公因子应解释为家长压力B1,B2,B3,……的公因子应解释为心理支持C1,C2,C3,……的公因子应解释为作业协助注意到:●因子分析的含义是由已知的A1,A2,A3,….找未知公因子。
●效度分析的含义是由已知的公因子来判定量表编制的题项A1,A2,A3,….是否能说明公因子。
●所取定因子分析中累计贡献率为因子分析的解释率,解释率越高,量表的效度越高。
(二)各层面的因子(素)分析提取一个公因子,观测其与该层面各题目的相关系数,以说明题项是否合适,其累计贡献率为该层面的解释率。
五.信度分析指量表或试卷的可靠性(一)总量表的信度Analyze→Scale →Reliability Analysis在主对话框中的Model选Alpha,点击子对话框Statistics,选○Scale if item deleted。
注:各题项在Alpha if Item Deleted 的值与Alpha 进行比较,也可以作为判断该题项是否合适的标准之一。
(二).各层面的信度分析注: (1)信度高,有时也称为内部一致性高。
(2)一般而言,总量表的题项多,其信度系数通常会大于各分量表(层面)的信度系数。
第十四章因子分析一般书中提到:将主成分分析再向前推进一步,就是因子分析。
也就是说,要了解因子分析,必须对主成分分析有所了解。
事实上,在因子分析的讨论中,所用到的因子提取方法,常用的是用主成分分析的方法来提取。
因此,在介绍因子分析之前,先简单地介绍一下主成分分析。
一、主成分的直观含义1.处理实际问题的一对矛盾一方面,对实际问题需要有更全面的了解,必须测量其多项指标(即变量多);另一方面,变量过多,不但给统计处理带来很多麻烦,还可能抓不到本质。
2.解决这对矛盾的方法方法之一:把原始变量综合成较少的几个“综合变量(指标)”。
“综合指标”的含义:(1)尽可能多地原始指标的信息;(2)“综合指标”之间相互无关(这样会给解释综合指标的含义带来方便)。
3.主成分满足(1)、(2)的“综合指标”称为原来指标的主成分。
例如,了解数学系学生的学习能力,可以选择他们所学过的所有的专业课成绩(原始变量),这将有二十个左右,根据专业的特点,应该有几个“综合指标”(主成分):空间想象能力,逻辑推理能力,记忆能力。
二、主成分的求法设x1,x2,…,x p为原始变量,f1,f2,…,f q为主成分,当然q≤p。
主成分f j是原变量x1,x2,…,x p的线性组合f j =a j ’x=a 1x 1+a 2x 2+…+a p x p其中x=(x 1,x 2,…,x p )’ , a j =(a 1j ,a 2j ,…,a pj )’,j=1,2,…,q 。
第一主成分满足D(f 1)=max{D(f j ),j=1,2,…,q}第二主成分满足D(f 2)=max{D(f j ),j=2,…,q}且Cov(f 1,f 2 )=0,即f 1与f 2不相关。
第三主成分满足D(f 3)=max{D(f j ),j=3,4,…,q}且Cov(f 1,f 3 )=0,Cov(f 2,f 3 )=0。
如此下去,得到q 个公因子。
主成分个数的确定方法:满足下式子 q f D f D f D f D f D f D p q 等)的最小的给定数值(如85.0)()()()()()(2121≥++++++ΛΛ上式中左边的式子称为的累计贡献率。
第一节 因子分析模型一、 基本问题1.模型如果从x 1,x 2,…,x p 中提取了主成分f 1,f 2,…,f q ,从数学上讲,原变量x i 应可由f 1,f 2,…,f q 线性表出,即 x i =αi1f 1+αi2f 2+…+αiq f q +εi , i=1,2,…,p (1)其中附加一个εi,可以理解为f1,f2,…,f q未包含x i的特殊信息或者是随机误差。
例如,x1,x2,x3分别表示数分、高代、解几的成绩(原变量),f1,f2,f3分别表示空间想象能力,逻辑推理能力,记忆能力(主成分)。
如果我们想分别了解以上课程对的f1,f2,f3依赖程度(或这三个公因子在以上课程成绩上的体现情况),这样就有了(1)式的出现。
一般地,称(1)式为因子分析模型。
●因子分析模型(1)在形式上象多元线性回归模型,但它与线性回归模型有本质的差异,这是因为公因子是f1,f2,…,f q不可观测的,所以(1)不能用多元线性回归模型的方法去处理。