SPSS软件中对应分析
对应分析的spss操作

对图形的分析
• 在第一个维度中取值较低的为:金色、蓝色、红色。取值居中的 为:棕色,取值较高的:深色、黑色。在第一维度中从左至右的 趋势:颜色在慢慢加深,故第一维度的可能解释:颜色的深浅。 • 第二维度中取值较低的有:发金色、发黑色,取值较高的有发棕 色,眼棕色。第二维度方向上,难以找到一个合理的解释。(维 度没有任何解释也是可以接受的) • 在对应分析的空间里,散点的分布比较分散,没有发现聚在一起 不能明确分开的迹象。
对应分析SPSS操作
对应分析(一):简单对应分析
• 案例1:
• 研究者收集了苏格兰北部Caithness郡5387名小学生眼睛与头发颜色的数据, 见下表,期中眼睛有深、棕、蓝、浅四种颜色,头发有金、红、棕、深、黑 五种颜色。研究者希望知道头发和眼睛的颜色间存在何种关联,即某种头发 颜色的人的眼睛更倾向于何种颜色?
>避免错误的解释
• 错误的解释:金色头发的儿童中蓝色、浅色眼镜者居多
• 正确的解释:相对于平均水平而言,金色头发的儿童中蓝色、浅 色眼睛的比例要高一些,也就是高于其他颜色头发的儿 童。
对应分析中应注意的问题
• 分析目的:重在观察行、列变量间的联系
• 数据类型:无序分类较佳,如果均为有序分类,且变量较多时, 采用多维偏好分析更合适
对图形的分析
• 两变量之间的关联如何考虑: • 第四象限中:发深色、眼深色、发黑色在相同方向上并在大致相 同的区域,说明三者之间有一定的关联,都偏离原点较远,说明 关联性较强 • 原点上方:发棕色、眼棕色距离较近,偏离原点较远,且两个散 点距离比较近,说明两者间是有关联的。 • 在左下方,可看到发金色、眼蓝色、眼浅色离原点比较远,彼此 之间距离比较近,说明这些特征之间之间是有关联的。 • 发红色与眼浅色较靠近,但是发红色与原点比较近,又因为原点 的周围是没有倾向性的区域,因而不作解释(易出错)。
第15章spss21教程完整版

对应分析的基本原理
简单对应分析
Optimal Scaling过程
15.2 简单对应分析
15.2.1 对应分析过程
选择菜单“分析→降维→对应分析” 。 1.变量设置 • • • 行、列栏用于选入对应哪个分析的行变量和列变量。选入变量以后,单击“定义范 围”按钮则弹出如图15-2所示对话框。 最小值和最大值分别表示相应分类变量的最小值和最大值,此处只可以输入整数, 输入后单击“更新”按钮则进行确认。 类别约束栏用于设置分类变量取值的约束条件,其下列表框显示的是当前分类变量 的取值列表。选中框中的一个值,然后单击右侧的三个单选框设置其约束条件。 “无”表示不作任何的约束;“类别必须相等”表示等同约束,表示各类别必须有 相同的得分;“类别为补充型”表示增补约束,增补的种类不影响分析过程和种类 维数,但会在有效种类的定义空间里被描述。
4.选项设置 ① 补充对象栏,设置增补观测在数据集里的记录号,可以通过“更改”、“删除”按 钮进行更改或删除。 • 个案全距:指定第一个和最后一个,然后单击“添加”按钮加入到下面的增补列表; • 单个个案:设置特定的行号,单击“添加”按钮加入增补列表中。 ② 正态化方法栏,设置变量或者观测得分的正态化方法,如图15-24所示下拉菜单。 • 主要变量:相当于简单对应分析Column Principal方法; • 主要对象:相当于简单对应分析的Row Principal方法; • 对称:相当于简单对应分析的Symmetrical方法; • 因变量:相当于简单对应分析的Principal方法; • 设定:相当于简单对应分析的Custom方法。 ③ 标准栏,用来设置模型的拟合标准。“收敛性”用来 指定收敛的临界值;“最大迭代”用来指定的循环次数。 ④ 标注图栏,用来设置输出图形的显示方式。 • 变量标签或值标签:显示变量标签或变量值,其下 • 的标签长度的限制用来指定变量标签的最大长度; • 变量名称或值:显示变量名或变量值。 ⑤ 图维数栏,设置输出图形的维数,与图15-5的设置方法一样。 ⑥ 配置栏,用来设置从一个文件读入坐标的结构信息,单击“文件”按钮则选择文件。
Chap13_SPSS_对应分析

对应分析的目的是以低维空间的形式展现变量之间的关系。
5
第13章 对应分析
13.1 13.2 13.3 13.4 问题的提出 对应分析的基本思想 对应分析的方法的原理 实例
6
对应分析的基本原理
首先绘制出两变量相应的交叉表,然后计算各单元格内的标准化残差:
标准化残差=
观察频数-理论频数 理论频数
-1.0 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0
Dimension 1
14
对应分析中应注意的问题
分析目的:重在观察行、列变量间的联系
数据类型:无序分类较佳,如果均为有序分类,且变量较多时,采 用多维偏好分析更合适
样本量:对极端值敏感,分析时有必要去除频数过少的单元格 对于小样本不推荐使用 变量间关联:不能将对应分析作为筛选相关变量的方法,变量纳入 前最好先做卡方检验
9
研究者收集了苏格兰北部 Caithness 郡 5387 名小学 生眼睛与头发颜色的数据,见下表,其中眼睛有深、棕、 蓝、浅四种颜色,头发有金、红、棕、深、黑五种颜色。 研究者希望知道头发和眼睛的颜色间存在何种关联,即某 种头发颜色的人起眼睛更倾向于何种颜色? (hair&eye.sav)
头发颜色与眼睛颜色的交叉表 头发颜色 红色 棕色 深色 48 403 681 84 909 412 38 241 110 116 584 188 286 2137 1391 合 计 1315 1774 718 1580 5387
3
第13章 对应分析
13.1 13.2 13.3 13.4 问题的提出 对应分析的基本思想 对应分析的方法的原理 实例
4
对应分析基本思想
SPSS因子分析与对应分析

e a 7 8 91 1 0 1 1 .6 7 6 9 5 0 0 0 5 3 5 6 9 35 3 8 2 48 . 0 4 3 9 1 5 9 2 0 1 0 3 5 2 9 3 6 5 7 3 9 0 2 3 0 7 7 5 2 9 1 0 4 9 1 1 6 98 64 02 14 21 20 0 6 4 8 5 3 5 0 6 8 3 1 4 3 3 8 2 3 9 1 7 7 7 5 a 8 4 1 0 1 9 5 1 5
以编号标识的散点图
以类号标识的散点图
返回
排序后的数据
返回
市场研究中的顾客偏好分析输出1
初始因子载荷阵
前3个因子(成分)方差解释
T o ta l V a ri a n c e E x p l a in e d Extraction Sums of Squared Loadings Component Total % of Variance Cumulative % 1 10.837 43.348 43.348 2 5.802 23.207 66.555 3 2.060 8.240 74.795 Extraction Method: Principal Component Analysis.
返回
市场研究中的顾客偏好分析输出2
特征值散点图
返回
市场研究中的顾客偏好分析输出3
数据文件中的三个新变量—因子得分
返回
17种车型的因子得分散点图
返回
25个顾客的偏好散点图
返回
对应分析
概述(略)
返回
对应分析菜单
返回
对原始数据加权对话框
返回
对应分析主对话框 定义行变量
返回
指定行变量的数值范围对话框
11.3 对应分析的应用举例_例说SPSS统计分析_[共10页]
![11.3 对应分析的应用举例_例说SPSS统计分析_[共10页]](https://img.taocdn.com/s3/m/b5e7ef0749649b6649d7473c.png)
例说SPSS统计分析H时,2χ服从自由度为(n-1)(m-1)的2χ明,在n足够大的情况下,当原假设为分布。
通过对2χ的检验,可以判断两个分类变量是否独立,而当拒绝原假设后,要了解两个分类变量及分类变量各个状态之间的相关关系,可以采用对应分析方法。
对应分析利用降维思想,通过分析原始数据结构,以简洁明了的方式揭示属性变量之间及属性变量各种状态之间的相互关系,其特点是在一张二维图上同时表示出两类属性变量的各种状态,直观地描述原始数据结构。
11.2 对应分析的基本操作下面以SPSS 15为例,介绍对应分析的基本操作流程。
首先单击“Analyze”下“Data Reduction”里的“Correspondence Analysis”,指定行列变量到“Row(Column)”列表框里,并指定对应的行列变量范围,如图11-1所示。
图11-1 对应分析基本操作流程图11.3 对应分析的应用举例对某公司不同职业类型的人员吸烟行为进行调查,共调查有效数据193例,如表11-3所示。
被调查者职业分为5个层次,分别为高级管理者、初级管理者、高级职员、初级职员和文秘,表中用数字1~5表示;吸烟行为分为4种类型,分别为不吸烟、轻微、中等和严重,利用数字1~4表示。
利用对应分析研究职业类型和吸烟行为之间的关系。
(数据来源:SPSS15帮助实例文件smoking.sav)。
表11-3 吸烟行为和职业调查数据职业类型吸烟行为人数职业类型吸烟行为人数1 1 4 3 3 121 2 2 3 4 41 3 3 4 1 181 42 4 2 242 1 4 43 332 234 4 132 3 7 5 1 102 4 4 5 2 63 1 25 5 3 73 2 10 54 2执行〖Analyze〗/〖Data Reduction〗/〖Correspondece Analysis〗命令,弹出“Correspondece Analysis”主对话框,如图11-2所示。
【SPSS统计挖掘】第25章 对应分析

第25章 对应分析
• 对应分析又称为相应分析,是指通过分析由定性变量构成的交互汇 总表来揭示变量间的联系。它是于1970年由法国统计学家J. P. Beozecri提出来的,是在R型和Q型因子分析基础上发展起来的一种 多元统计方法。
• 简单对应分析是分析某一研究事件两个分类变量间的关系,其基 本思想以点的形式在较低维的空间中表示联列表的行与列中各元素的 比例结构,可以在二维空间更加直观的通过空间距离反映两个分类变 量间的关系。属于分类变量的典型相关分析。
设置多重对应分析的要求。
• 3.“离散化”按钮
• 单击“离散化”按钮,弹出图2513所示的“MAC:离散化”对话 框,在变量列表中选中某个变量 后,可以在方法的下拉菜单选择 离散化的方法,将不符合要求的 变量进行转换。
• 4.“缺失”按钮 • 单击“缺失”按钮,弹出图
25-14所示的“MAC:缺失值” 对话框。
• (3)对极端值敏感,应尽量避免极端值的存在。如有取值为 零的数据存在时,可视情况将相邻的两个状态取值合并。
• (4)原始数据的无量纲化处理。运用对应分析法处理问题时, 各变量应具有相同的量纲(或者均无量纲)。
• 2.“定义”按钮 • 单击“定义”按钮,弹出图25-11所示的“定义”对话框,用于
• 例25-3:31个高一同学的期末考试成绩,比较各个同学的考试情况。 详见25-3.sav。
•THE END
Байду номын сангаас
注意事项
• (1)对应分析不能用于相关关系的假设检验。它虽然可以揭 示变量间的联系,但不能说明两个变量之间的联系是否显著, 因而在做对应分析前,可以用卡方统计量检验两个变量的相关 性。
• (2)对应分析输出的图形通常是二维的,这是一种降维的方 法,将原始的高维数据按一定规则投影到二维图形上。而投影 可能引起部分信息的丢失。
人力资源第12章SPSS的对应分析

人力资源第12章 SPSS的对应分析第12章 SPSS的对应分析12.1 对应分析概述12.1.1 对应分析的提出研究两个或多个品质型变量之间的相关关系,例如研究储户收入水平与所选择的储蓄种类间是否存在联系的问题,再如分析顾客职业与购买汽车的品牌之间的关系等。
分析品质变量之间的关系通常从编制两变量的交叉列联表入手,并通过对列联表的进一步研究探究变量间的联系。
常见的方法有列联表的卡方检验等。
在变量分类值较多时,上述分析方法通常较难直观地揭示出变量之间的联系以及变量各分类之间的联系。
对应分析正是解决该类问题的一种基于图形分析的直观有效的多元统计分析方法。
12.1.2 对应分析的基本思想对应分析以两变量的交叉列联表为研究对象,利用“降维”的方法,通过图形的方式,直观揭示变量不同类别之间的联系,特别适用于多分类品质型变量的研究。
对应分析的基本思想是:首先编制两品质型变量的交叉列联表,将交叉列联表中的每个数据单元看成两变量在相应类别上的对应点;然后,对应分析将变量及变量之间的联系同时反应在一张二维或三维的散点图,即对应分布图上,并使联系密切的类别点较集中,联系疏远的类别点较分散;最后,通过观察对应分布图就能直观地把握变量类别之间的联系。
12.2 对应分析的基本操作及案例 12.2.1 对应分析的基本操作步骤(1)选择菜单Analyze?Data Reduction?Correspondence,出现窗口如图所示(2)将行变量选择到Row框中,将列变量选择到Column框中,并分别单击Define Range按钮指定行列变量的分类值范围。
在Minimum value框后输入分类最小值,在Maximum框后输入分类最大值,并单击Update按钮,于是各分类值会依次显示在窗口下方的框中;Category Constraints框中的选项,None表示不再对分类值重新分组,Categories must beequal表示指定将哪些分类值合并为一类,Category is supplemental表示指定某些分类值不参与分析。
对应分析的spss操作课堂

>避免错误的解释
? 错误的解释:金色头发的儿童中蓝色、浅色眼镜者居多 ? 正确的解释色眼睛的比例要高一些,也就是高于其他颜色头发的儿 童。
15
对应分析中应注意的问题
? 分析目的:重在观察行、列变量间的联系 ? 数据类型:无序分类较佳,如果均为有序分类,且变量较多时,
了全国29个省、市、自治区(未包括香港、澳门、台湾地区及海 南、青海、西藏数据)当年的城市市政工程建设状况,具体有如 下6个指标:road(年末实有道路长度)、 area(年末实有道路面 积)、bridge(城市桥梁数)、 under(城市下水道长度)、 water (城市污水处理能力)、 lamp(城市路灯数)。现希望考察各省 (市)城市设施水平的建设情况差异,特别是各地区在这些指标 上分别存在着哪些优势和不足之处。
采用多维偏好分析更合适 ? 样本量:对极端值敏感,分析时有必要去除频数过少的单元格
(对于小样本不推荐使用) ? 变量间关联:不能将对应分析作为筛选相关变量的方法,变量纳
入前最好先做卡方检验
16
? 案例2(基于均数的对应分析): ? 本数据来自《 2000年中国统计年鉴》,见文件 mean.sav 。共记录
同的区域,说明三者之间有一定的关联,都偏离原点较远,说明 关联性较强 ? 原点上方:发棕色、眼棕色距离较近,偏离原点较远,且两个散 点距离比较近,说明两者间是有关联的。 ? 在左下方,可看到发金色、眼蓝色、眼浅色离原点比较远,彼此 之间距离比较近,说明这些特征之间之间是有关联的。 ? 发红色与眼浅色较靠近,但是发红色与原点比较近,又因为原点 的周围是没有倾向性的区域,因而不作解释(易出错)。
最高维数为:总体样本量—1
8
由表中的卡方值(1240.39)和p值(小于0.05)知行列变量之间存在一定的相 关性。 从表格中可以看出,原始交叉表中最多可以提取三个维度,因为第一维度与 第二个维度已经可以解释99.6% 的信息了,而第三个维度只携带0.4%的信息, 所以第三个维度可以忽略,只考察前两个维度的信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对应分析当A 与B 的取值较少时,把所得的数据放在一张列联表中,就可以很直观的对A 与B 之间及它们的各种取值之间的相关性作出判断,当ij P 较大时,则说明属性变量A 的第i 状态与B 的第j 状态之间有较强的依赖关系.但是,当A 或者B 的取值比较多时,就很难正确的作出判断,此时就需要利用降维的思想简化列联表的结构.几个基本定义:我们此处讨论因素A 有n 个水平,因素B 有p 个水平。
行剖面:当变量A 的取值固定为i 时(i=1,2,…,n ),变量B 的各个状态相对出现的概率情况,即:可以方便的把第i 行表示成在p 维欧氏空间中的一个点,其坐标为:),,,(..2.1i ip i i i i rip p p p p p p = ,i=1,2,… , n ,实际上,该坐标可以看成p 维超平面121=+++p x x x 上的点。
记n 个行剖面的集合为n(r)。
由于列联表行与列的地位是对等的,由上面行剖面的定义方法,可以很容易的定义列剖面。
列剖面:),,,(..2.1j njj j j j cjp p p p p p p = ,j=1,2,… , p,实际上,该坐标可以看成n 维超平面121=+++n x x x 上的点。
记p 个列剖面的集合为p(c)。
定义了行剖面和列剖面之后,我们看到属性变量A 的各个取值情况可以用p 维空间的n 个点来表示,而B 的不同取值情况可以用n 维空间上的p 个点来表示。
而对应分析就是利用降维思想,把A 的各个状态表现在一张二维图上,又把B 的各个状态表现在一张二维图上,且通过后面的分析可以看到,这两张二维图的坐标有着相同的含义,即可以把A 的各个取值与B 的各个取值同时在一张二维图上表示出来。
距离:通过行剖面与列剖面的定义,A 的不同取值可以利用P 维空间中的不同点表示,各个点的坐标分别为ri P (i=1,2,…,n )。
而B的不同取值可以用n 维空间中的不同点表示,各个点的坐标分别为cj P (j=1,2,…,p )。
对此,就可以引入距离概念来分别描述A 的各个状态之间与B 的各个状态之间的接近程度。
定义A 的第k 状态与第l 状态之间的加权距离为:21..2)(),(..∑=-=pj j lj j kj l k p p p p p p l k D ,该距离也可以看做是坐标为:),,,(...2.2.1.1i p ipi i i i p p p p p p p p p ,i=1,2,…,n (1)的任意两点之间的普通欧式距离。
类似的,定义属性变量B 的两个状态s ,t 之间的加权距离为:21...2)(),(.∑=-=ni ti iti isp p p p p p t s D s总惯量:根据上面的准备,可以给出行剖面集合n(r)的总惯量的定义: 由(1)式定义的n 个点与其重心的欧式距离之和称为行剖面集合n(r)的总惯量,记为I I 。
注意:(1)总惯量类似方差,反映差异信息。
(2)经过数学分解,我们可以得知,总惯量与2χ统计量仅相差一个常数,而由前面列联表的分析我们知道,2χ统计量反映了列联表横栏与纵栏的相关关系。
对应分析就是在总惯量信息损失最小的前提下,简化数据结构以反映两属性变量之间的相关关系。
实际上,总惯量的概念类似于主成分分析或因子分析中方差总和的概念。
在SPSS 软件中进行对应分析,系统会给出对总惯量的提取情况。
完全对应的,我们对列进行相应分析,可以得到列剖面集合的总惯量为:21χnI I I J ==SPSS 中有一个概念:惯量:相当于因子分析中的特征根,用于说明对应分析各个维度的结果能够解释列联表中两变量联系的程度。
对应分析基本理论:经过上述变化后,就可以直接计算属性变量各个状态之间的距离,通过距离大小反映各个状态之间的接近程度,同类型的状态之间距离应当较短,而不同类型的状态之间距离应当较长,据此可以对各个状态之间进行分类以简化数据结构。
但是,这样做不能对两个属性变量同时进行分析。
因此,我们不计算距离,代之求协方差矩阵,进行主成分分析,提取主成分,用主成分所定义的坐标轴作为参照系,对两个变量的各个状态进行分析。
计算行剖面的协方差矩阵Z Z r '=∑,列剖面的协方差矩阵Z Z c '=∑。
具体分解过程可参考《多元统计分析》,何晓群。
由矩阵的知识可知,Z Z r '=∑,Z Z c '=∑有相同的非零特征根。
j j j j r u u Z Z u λ='=∑ ,对该式两边左乘矩阵Z ',有 )()(j j j u Z u Z Z Z '=''λ ,即)()(j j j c u Z u Z '='∑λ。
该式表明:对于因素A 降维,投影方向为 ,,21u u ,对于因素B 降维,投影方向为 ,,21'u Z u Z ' ,这两个直角坐标重合。
这样,因素A 和因素B 降维后可以在同一个坐标轴中表示出来,只不过对坐标轴有一个拉伸。
注意: r ∑与c ∑具有相同的非零特征根,而这些特征根正是各个公因子所解释的方差,或提取的总惯量的份额,即有:J I ri iI I ==∑=1λ。
那么变量B 的第一主成分、第二主成分…….直到第r 个主成分与变量A 的相对应的各个主成分在总方差中所占的百分比完全相同。
这样就可以用相同的坐标轴同时表示两个属性变量的各个状态,把两个变量的各个状态同时反映在具有相同坐标轴的因子平面上,以直观的反映两个属性变量及各个状态之间的相关关系。
一般情况下,我们取两个,这样就可以在一张二维图上同时画出两个变量的各个状态。
对应分析的优点:结果直观、简单;适用于研究较多分类变量; 对应分析的缺点:不能进行具体联系的检查,本质是一种统计描述方法; 无法自动判断最佳维度数;分析结果对极端值敏感。
所以数据量不能太少,样本量越大越好。
例题讲解:这里以较为经典的头发颜色与眼睛颜色的研究案例说明SPSS 中对应分析的实现方法,该数据由Fisher 在1940年首次引用。
研究者收集了苏格兰北部Caithness 郡5387名小学生眼睛与头发颜色的数据。
研究者希望直到头发与眼睛的颜色存在何种关联,即某种头发颜色的人更倾向于何种颜色? 数据见文件hair&eye 。
(1) 对数据的初步分析按照常规方法,采用列联分析,crosstabulation,结论:存在明显相关关系。
看看从图表方式能否看出具体的关联方式:graph——bar——stacked,然后双击图,options,scales to 100%利用统计图,做出条图和马赛克图.结果显示:随着头发颜色有金色、红色逐渐变为深色、黑色,人群中眼睛颜色为浅色的比例越来越低,而眼睛深色的比例越来越高。
显然,这一信息提示头发颜色和眼睛颜色之间是有关联的。
以上信息是通过对样本直接观察得到的,这种联系是真实存在还是由抽样误差导致的假象?这可以通过检验加以证实。
对于两变χ检验来证实。
但是究竟是怎样的联系方量关联问题一般使用2χ式?是其中仅某两类中存在联系,还是两两都有联系?这是2检验不能回答的,需要采用更复杂的分析方法才能得到进一步的分析结果,而对应分析就是一个很好的选择。
结果难点讲解:结果汇总表:(1)奇异值:Z矩阵分解过程中产生,他的平方就是inertia. (2)行变量各类别的分析结果状况Mass:各类别的组成,发色为金色的占总人口的27%Scores in dimension:给出各类别在相关维度上的评分。
金色在2维空间中的坐标值(-0.814,-0.417),依次类推。
然后给出惯量在行变量中的分解情况。
数值越大,说明该类别对惯量的贡献越大。
此处贡献最大的是深色。
Contribution:首先给出各维度信息量在各类别间的分解情况,本例中可见第一维度的信息主要被金色、深色和黑色3各类别所携带,意味着,这三个类别在第一维度区分度较好。
同理,在第二维度上金色和棕色区分度较好。
随后给出各类别的信息在各个维度上的分布比例。
如金色的总信息量中90.7%分布在第一维度,只有9.3%分布在第二维度。
最后一栏是信息量之和。
(3)图中,红色离原点太近,说明两个维度上对红色的信息提取不够,我们只能说明头发颜色金色和眼睛颜色深色、浅色关系较强。
所以我们选择3个维度进行分析。
从图形可以看出,红色离其它颜色都较远,无法作出合理判断。
说明我们选取两个维度分析就足够了。
实际上对于对应分析而言,所有信息主要反映在图中,因此多数分析报告均只使用图进行描述。
进一步分析:当参与对应分析的变量其类别间可能存在某种内在的次序关系时,分析者往往希望在表格中直接观察到这种次序。
对应分析可以提供这种输出。
由于各个类别在各个维度上已经算出相应的坐标值,因此只需要将各个类别按照坐标值从小到大排列即可。
选项:statistic ,permutations我们发现:眼睛颜色和头发颜色都是按照坐标值(降维后)从小到大进行排列。
更为重要的是:表格中的频数会集中在主对角线上,使得对应关系比原来清楚。
如现在我们可以立刻发现,头发黑色与眼睛深色、棕色有较强关联。
在model模块中,还有很多菜单选项没有给大家讲解。
这些模块主要适用于基于均数的对应分析范围,但个人认为这种方法很不成熟,效果做出来也不是很理想,所以没有给大家介绍。
有兴趣的同学可以参考张文彤高级篇。
多重对应分析在前面的分析中,考察的都是一个二维交叉表中行、列变量间各类别的联系情况,我们希望能够同时考察多个分类变量类别取值间的联系。
例如性别、职业、学历等和职务级别之间的关系如何。
显然对应分析也可以解决此类问题,但是简单对应分析只能对两个分类变量进行分析,这里涉及多个分类变量,我们可以进行多重对应分析。
虽然名为多重对应分析,但是这一方法和前述的简单对应分析完全不同。
最突出的部分表现在它的算法和简单对应分析完全不同,它会首先对各个变量进行最优尺度变换,以尽量凸显类别间的差异,然后再按照标准的对应分析算法进行计算。
这使得即使在两变量的情况下,这两个过程的结果也不会完全等价。
不过,主要使用正确,两个结果在解释上是基本一致的。
在SPSS分析菜单下选择降维(Data Redaction-数据消减)后选择最优尺度算法,该选项下,根据数据集和数据测量尺度不同有三种不同的高级定类分析算法,主要包括:多重对应分析、分类(非线性)主成分分析、非线性典型相关分析。
当变量都是多重名义型数据,则自动采用多重对应分析方法;当某些变量不是多重名义型,则自动采用分类(非线性)主成分分析;当变量集合多于一个,则采用非线性典型相关分析。
例题数据mcorres.Sav。
变量全部进入analysis variables模块;补充变量的含义是如果有哪个变量你并不想作为对应分析的变量,而只是作为附属变量表现在对应图上可以加入。