5第五章交叉表分析
5.交叉汇总分析

实用性表格2 实用性表格
a6房房房房 * b16 现现现现现现现现 Crosstabulation % within b16 现现现现现现现现 b16 现现现现现现现现
原 始 输 出 表 格
•
其中, 房屋结构”为行变量, 其中,“房屋结构”为行变量, “现 使用人从业状况”为列变量。在每一格中, 使用人从业状况”为列变量。在每一格中, 第一行数据为分组后的频次, 第一行数据为分组后的频次,第二行数据 称为行百分比,第三行数据称为列百分比 称为行百分比, (一般是比较列百分比,横向比较),第 一般是比较列百分比,横向比较),第 ), 四行称为总百分比。 四行称为总百分比。
•
•
百分比的计算方向—— 百分比的计算方向 计算百分比通常按照自变量的方 即列的方向, 向(即列的方向,应该使得每列的百 分比之和是100% 100%)。 分比之和是100%)。
因为研究的目的是要了解自变量对因变量的影响, 因为研究的目的是要了解自变量对因变量的影响, 应此应该计算在自变量的不同取值情况下因变量 的变化情况如何。 的变化情况如何。但当因变量在样本内的分布不能代
表其在总体内的分布时, 表其在总体内的分布时,百分比就要按照因变量的方向进 行计算。 行计算。
行百分比
列联表的格式
高高五高
因变量
自变量
列百分比 性性 * 文文文文 Crosstabulation
文文文文 高初初高高 初初 初中 大高五五
163 25.9% 53.1% 13.0% 144 23.2% 46.9% 11.5% 307 24.5% 100.0% 24.5%
16现使用人从业情况 a 6 房屋结构 * b 16现使用人从业情况 Crosstabulation 在岗 113 14.5% 17.7% 3.9% 191 21.8% 29.9% 6.6% 210 28.1% 32.9% 7.2% 96 26.7% 15.0% 3.3% 28 20.6% 4.4% 1.0% 638 22.0% 100.0% 22.0% b16现使用人从业情况 不在岗 离退休 309 245 39.5% 31.3% 38.8% 10.6% 233 26.5% 29.3% 8.0% 155 20.7% 19.5% 5.3% 59 16.4% 7.4% 2.0% 40 29.4% 5.0% 1.4% 796 27.4% 100.0% 27.4% 21.1% 8.4% 347 39.5% 29.9% 12.0% 333 44.6% 28.7% 11.5% 186 51.7% 16.0% 6.4% 51 37.5% 4.4% 1.8% 1162 40.0% 100.0% 40.0% 其它 115 14.7% 37.5% 4.0% 107 12.2% 34.9% 3.7% 49 6.6% 16.0% 1.7% 19 5.3% 6.2% .7% 17 12.5% 5.5% .6% 307 10.6% 100.0% 10.6% Total 782 100.0% 26.9% 26.9% 878 100.0% 30.2% 30.2% 747 100.0% 25.7% 25.7% 360 100.0% 12.4% 12.4% 136 100.0% 4.7% 4.7% 2903 100.0% 100.0% 100.0%
交叉分析法怎么分析

交叉分析法怎么分析交叉分析法是一种常用的统计分析方法,用于研究不同变量之间的关系及其影响因素。
本文将介绍交叉分析法的基本原理、分析步骤和应用场景,帮助读者了解如何进行交叉分析。
一、交叉分析法简介交叉分析法是一种基于交叉表格的统计分析方法。
它通过将要研究的多个变量以表格的形式进行归类和统计,进而揭示出变量之间的相互关系。
交叉分析法主要用于描述和分析多个变量之间的联系和影响。
二、交叉分析法的基本原理交叉分析法的基本原理是建立和分析交叉表。
交叉表是一种以行和列展示多个变量交叉情况的表格,可以清晰地展示各个变量之间的关系。
通过统计不同交叉点的频数或百分比,可以进一步分析各个变量之间的相关程度。
三、交叉分析法的分析步骤1. 确定研究目的:首先需要明确分析的目的,明确想要研究的变量和关系。
2. 数据收集和整理:收集相关数据,并整理成表格的形式,通常以行为一个变量、列为另一个变量的形式进行排列。
3. 构建交叉表:根据收集到的数据,在表格中填写各个变量的交叉点数据,可以使用频数或百分比。
4. 分析交叉表:通过对交叉表中的数据进行统计分析,揭示出变量之间的关系和影响。
常用的统计指标包括卡方检验、列联表分析等。
5. 结果解释和总结:根据分析得到的结果,进行解释和总结,得出结论。
四、交叉分析法的应用场景1. 市场调研:可以通过交叉分析法分析不同人群对商品或服务的偏好和需求,从而为市场定位和产品策划提供参考。
2. 教育评估:可以利用交叉分析法分析不同学习方法、教育资源对学生成绩的影响,为教育改革和评估提供依据。
3. 社会调查:可以使用交叉分析法分析不同群体在社会问题上的态度和观点,为社会政策的制定提供参考。
4. 经济研究:可以通过交叉分析法分析不同经济因素对于经济增长或商业活动的影响,为经济预测和政策制定提供支持。
五、注意事项1. 数据收集的准确性和全面性对于分析结果的可信度具有重要影响,因此要确保数据的来源可靠,样本覆盖面广。
交叉分析法怎么分析

交叉分析法怎么分析交叉分析法是一种常用的数据分析方法,主要用于对多个变量之间的关系进行分析。
采用交叉分析法可以发现不同变量之间的相互影响和作用方式,从而更好地理解数据背后的规律和特征。
在下面的文章中,我们将介绍交叉分析法的具体分析流程和注意事项,帮助读者更好地了解和应用这种方法。
一、交叉分析法的定义交叉分析法,也称为交叉表法或列联表法,是一种通过将不同变量交叉排列建立交叉表的方法来研究变量之间相关性的一种统计方法。
交叉分析法根据样本数据构造一个列联表,以便比较各个不同维度之间的差异,从而进一步发现其内在联系和潜在规律。
二、交叉分析法的分析流程1. 选取研究对象和指标首先需要确定研究对象和研究指标。
在选择研究对象时,要确保大样本数量和充分代表性,以免数据偏误。
在选择指标时,应该着重考虑研究目的,避免指标内部关联性太强而导致冗余信息。
2. 建立交叉表将所选变量进行顺序或随机排列,形成一个行×列的交叉表。
在表格中,每一行代表一种分类变量的不同组别,每一列代表另一种分类变量的不同组别。
然后根据实际情况,填入相应的数据或统计概率。
3. 描述表格特征通过观察交叉表格中的特征,了解各个指标之间的关系和变化趋势。
这可以从几个方面来分析,例如行、列、总体、对角线等方面考虑。
归纳总结这些特征,可以为后续分析提供有力支撑。
4. 进行自由度统计自由度(df)指代两种分类变量所构成的列联表中具有独立划分的单元格个数。
在使用交叉分析法时,通常需要根据列联表的大小和分类变量的个数计算可用的自由度。
一般来说,自由度等于“列数-1×行数-1”。
5. 计算卡方值和P值卡方值是用来衡量观察值与理论值之间差异的一个指标。
在进行交叉分析时,一般会使用χ^2检验计算卡方值。
当卡方值越大时,表明所观察到的差异也越大。
在计算卡方值之后,还需要计算对应的P值。
P值是一个统计学上的重要指标,用于表示样本与总体误差概率大小。
如果P 值小于等于0.05,可以认为差异显著,反之则不显著。
交叉分析法怎么分析

交叉分析法怎么分析交叉分析法是一种常用的数据分析方法,通过对不同因素之间的关系进行交叉比较和分析,帮助研究者发现变量之间的联系和差异。
本文将介绍交叉分析法的基本概念和步骤,并以具体案例进行说明。
一、交叉分析法概述交叉分析法(Cross-Tabulation Analysis)也被称为列联表分析(Contingency Table Analysis),是一种定量分析方法,用来研究两个或更多变量之间的关系。
通过构建列联表,对不同变量之间的交叉频数进行统计和比较,可以揭示变量之间的关联性和差异性。
二、交叉分析法步骤1. 确定研究问题:明确研究问题并选择需要分析的变量。
例如,假设我们想研究消费者对不同手机品牌的偏好与性别之间的关系。
2. 构建列联表:根据所研究的变量,构建列联表(也称为交叉表)。
横列为一个变量的不同水平(例如手机品牌),纵列为另一个变量的不同水平(例如性别)。
在交叉点上填写交叉频数。
3. 计算频数和比例:根据列联表,计算每个交叉点上的频数和比例。
频数表示各组别的数量,比例表示各组别所占比例。
4. 绘制图表:通过绘制图表,直观地展示不同变量之间的关系。
常用的图表包括堆叠柱状图、簇状柱状图、饼图等。
5. 进行统计检验:为了验证变量之间的关系是否显著,可以进行统计检验,如卡方检验。
卡方检验可以检验各组别之间的差异是否由随机因素引起。
6. 分析结果和讨论:根据交叉分析的结果,进行结果分析和讨论。
解释变量之间的关系和差异,并提出合理的解释和解决方案。
三、交叉分析方法案例以消费者对不同手机品牌的偏好与性别之间的关系为例,进行交叉分析。
我们调查了300名消费者,结果如下表所示:--------------------------------------------------| Apple | Samsung | Huawei | Others--------------------------------------------------男性 | 50 | 30 | 20 | 10--------------------------------------------------女性 | 20 | 40 | 50 | 20--------------------------------------------------根据上表,我们可以计算出各组别的频数和比例,如下所示:--------------------------------------------------| Apple | Samsung | Huawei | Others--------------------------------------------------男性 | 50 | 30 | 20 | 10--------------------------------------------------女性 | 20 | 40 | 50 | 20--------------------------------------------------| 70(23%) | 70(23%) | 70(23%) | 30(10%)--------------------------------------------------通过绘制堆叠柱状图,我们可以直观地看到不同手机品牌在不同性别中的偏好程度。
交叉分析法怎么分析

交叉分析法怎么分析交叉分析法是一种常用的研究方法,它用于识别和分析不同变量之间的关系。
通过交叉分析,我们可以深入了解变量之间的相互影响,并做出相关的决策和预测。
本文将介绍交叉分析法的基本原理、步骤和应用示例。
一、交叉分析法概述交叉分析法是一种多变量分析方法,它通过对不同变量之间的交叉关系进行统计分析,从而揭示变量之间是否存在相关性。
交叉分析法一般通过列联表或交叉表来展示分析结果,以便更直观地展示变量之间的关系。
二、交叉分析法步骤1. 确定研究目的:在进行交叉分析之前,需要明确研究的目的和问题,明确要分析的变量以及它们之间的关系。
2. 收集数据:根据研究目的,收集相关的数据。
数据可以来自于调查问卷、实验记录、观察等多种来源。
3. 构建交叉表:根据收集到的数据,构建交叉表。
交叉表的构建要考虑变量之间的相关性,选择合适的交叉方式,以展示变量之间的关系。
4. 进行统计分析:利用适当的统计方法对交叉表进行分析。
常用的统计方法包括卡方检验、t检验、方差分析等。
根据研究问题的不同,选择合适的统计方法。
5. 解读分析结果:根据统计分析的结果,解读变量之间的关系。
根据交叉分析的目的,对结果进行合理的解读,得出结论并提出相应的建议。
三、交叉分析法应用示例以某饮品公司为例,假设该公司希望了解不同性别消费者对其产品包装的偏好程度。
1. 确定研究目的:分析不同性别消费者对产品包装的偏好程度。
2. 收集数据:通过问卷调查收集不同性别的消费者对产品包装的评价数据。
3. 构建交叉表:根据收集到的数据,构建一个二维交叉表,将性别作为一列,将产品包装偏好程度(如喜欢、一般、不喜欢)作为另一列。
4. 进行统计分析:利用卡方检验或t检验等方法,分析不同性别消费者对产品包装的偏好程度是否存在显著差异。
5. 解读分析结果:根据统计分析的结果,判断是否存在显著差异。
例如,统计分析结果显示不同性别消费者对产品包装的偏好程度存在显著差异,女性消费者更倾向于喜欢产品包装,而男性消费者对产品包装的评价较为一般。
多变量描述统计分析——交叉表分析法

多变量描述统计分析交叉表分析法一、交叉表分析法的概念交叉表(交叉列联表) 分析法是一种以表格的形式同时描述两个或多个变量的联合分布及其结果的统计分析方法,此表格反映了这些只有有限分类或取值的离散变量的联合分布。
当交叉表只涉及两个定类变量时,交叉表又叫做相依表。
交叉列联表分析易于理解,便于解释,操作简单却可以解释比较复杂的现象,因而在市场调查中应用非常广泛。
频数分布一次描述一个变量,交叉表可同时描述两个或更多变量。
交叉表法的起点是单变量数据,然后依研究目的将这些数据分成两个或多个细目。
下面是一个描述交叉表法应用的例子。
某保险公司对影响保户开车事故率的因素进行调研,并对各种因素进行了交叉表分析。
表1 驾驶员的事故率类 别 比率,%无事故 61至少有一次事故 39样本总数,人 17800从初始表1中可以看出,有61%的保险户在开车过程中从未出现过事故。
然后,在性别基础上分解这个信息,判断是否在男女驾车者之间有差别。
这样就出现了二维交叉表2。
表2 男女驾驶员的事故率类 别 男,% 女,%无事故 56 66 至少有一次事故 44 34样本总数,人 9320 8480这个表的结果令男士懊恼,因为他们的事故率较女士驾车时涉及的事故率要高。
但人们会提出这样的疑问而否定上述判断的正确性,即男士的事故多,是因为他们驾驶的路程较长。
这样就引出第三个因素"驾驶距离",于是出现了三维交叉表3。
表3 不同驾驶距离下的事故率类 别 男,% 女,%驾驶距离 >1万公里 <1万公里 >1万公里 <1万公里 无事故 51 73 50 7349 27 50 27至少有一次事故样本总数,人7170 2150 2430 6050结果表明,男士驾驶者的高事故率是由于他们的驾驶距离较女士长,但并没有证明男士和女士哪个驾驶得更好或更谨慎,仅证明了驾车事故率只与驾驶距离成正比,而与驾驶者的性别无关。
二、两变量交叉列联表分析例如,研究城镇居民在某地的居住时间与其对当地百货商场的熟悉程度之间的关系,对“居住时间”和“熟悉程度”这两个变量进行交叉列联分析。
交叉分析表详解

例如在前例“品牌倾向交叉居住地区”表内,列百分比可用来分析 各地区的品牌倾向高低;行百分比可用来分析同一个品牌倾向的消费 者所在地区的分布情况 假设想在原来建立的“品牌倾向与居住地区”交叉表内,加入列百 分比,其操作步骤如下: 1用鼠标单击数据透视表内任意一个单元格 2执行“数据>数据透视表和数据透视图”,或单击 按钮,然后按下“数据透视表向导”按钮,转入“数据透视表和数据 透视图向导-3步骤3”对话框 3单击“布局”按钮,转入“数据透视表和数据透视图向导-布局” 对话框,再一次将“性别”拖拽到“数据”位置,使“数据”位置拥 有两个内容
6-5区间分组
无论是文本、日期或数字,在数据透视表中,都是将不重复出现的 内容视为一个类别,去计算交叉表的相关统计数字。比如“水电费” 可能会由于组数太多,数据分析并无多大作用,教理想的方式是将水 电费分组,以缩减其组数。 假设我们将每月水电费分为<-20,20~0,0~20,20~40,40~80,80~120,120以上,七个组
6-4加入分页依据
数据透视表内允许加入分页项目(如:性别),作为交叉表的上 一层分组依据,以便查阅不同性别即各地区的品牌倾向。 假设想在前面所说的透视表内加入“性别”作为分页依据,其处 理步骤如下 1用鼠标单击数据透视表内任意一个单元格 2执行“数据透视表>数据透视表向导”,单击“布局”按钮 3将“性别”拖拽至“页(p)”位置,单击“确定”“完成”即可 此时,透视表上方,会有一下拉式选择表 这表示数据表内显示的是全部数据的交叉分析结果,要查阅不同性别 数据时可单击下拉箭头,选择要分析的性别
由于复选题有三个答案所以先求性别交叉第一个上网原因的答案数及其百分比5单击确定完成设置将其安排在h3单击完成获得性别交叉第一个上网原因的答案数及其列百分比6回到原问卷数据的任意一个单元格再执行数据数据透视表和数据透视图单击下一步按钮将先显示下图7单击否往后的操作与前面相同所以接着在h29求性别交叉第二个上网原因的答案数及其列百分比8仿照前面的方法在h55求性别交叉第三个上网原因的答案数及其百分比9在n5右下输入标题答案性别内容及其对应编号10在q8中输入getpivotdata答案数h3原因1n8性别q6getpivotdata答案数h29原因2n8性别q6getpivotdata答案数h55原因3n8性别q6得到男生选择第一个原因的总数然后用公式拖拽的方式将其复制到q911停在q9执行编辑查找替换在查找内容中输入答案数在替换为输入单击替换按钮可将公式内的答案数全改为单击关闭按钮结束求出3个表中性别为1q6上网原因答1n9的的和12将q9的格式设置成百分比的样式13选取q8
交叉表分析

data05-02为某公司工资数据(n=15)。
使用变量性别sex、收入高低earnings分析男女经理间薪金是否平等。
可以利用data05-01中的数据,使用变量occcat80为工作性质分类,region为地区,childs 为每个家庭的孩子数。
将childs为行变量,occcat80为列变量,region为控制变量选入Layer of框中,进行交叉表分析。
列联表(交叉表)分析1、项目名称Crosstabs过程4、实训原理Crosstabs过程用于定类数据和定序数据进行统计描述和简单的统计推断。
在分析时可以产生二维至n维列联表,并计算相应的百分数指标。
4-1 列联表分析的含义与任务在实际分析中,当问题涉及到多个变量时,我们不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多变量的联合分布特征,进而分析变量之间的相互影响和关系。
很明显,如果还采用单纯的频数分析方法显然不能满足要求。
因此,我们需要借助交叉分组下的频数分析,即列联表分析。
列联表分析的主要任务有两个:(1)根据样本数据产生二维或多维交叉列联表。
交叉列联表是两个或两个以上变量交叉分组后形成的频数分布表。
(2)在交叉列联表的基础上,分析两变量之间是否具有独立性或一定的相关性。
4-2 卡方检验的原理为了理解列联表中行变量(Row)和列变量(Column)之间的关系,我们需要借助非参数检验方法。
通常采用的方法是卡方检验。
和一般假设检验一样,卡方检验主要包括三个步骤:(1)建立零假设:行变量和列变量相互独立。
(2)选择和计算检验统计量。
列联表分析中的检验统计量是Pearson卡方统计量。
其公式为:()∑∑==-=r i cj eij e ij o ijf f f1122χ(4-9-1)其中,r 为列联表的行数,c 为列联表的列数,0f 为实际观测频数,e f 期望观测频数。
期望频数的计算公式为:nCTRT f e ⨯=(4-9-2) 其中,RT 是指定单元格所在行的观测频数合计,CT 是指定单元格所在列的观测频数合计,n 是观测频数的合计。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 交叉表格的独立性检验及效应量计算
一般交叉表分析使用的数据形式有两种情况: ① 第一种情况是已整理的汇总表数据; ② 第二种情况是对原始数据进行交叉表分析。
以下分别举例。交叉表分析的类型变量水平无 论是2*2,还是R*C(R>2, C>2),都是使用相 同的SPSS菜单命令。
5.1.1 汇总表数据的交叉表分析及效应量计算
计算效应量和统计检验力。
第一步:“性别”=女、“性别”=男、总计三个栏目的效 应量克莱姆 V系数分别为:0.321,0.481,0.413。
在本例中,需要定义两个变量“焦虑情况”,“ 患胃病情况”;变量“焦虑情况”有两个水平:1 为精神焦虑,2为非精神焦虑;“患胃病情况”有 两个水平:1为患病,2为不患病;变量“人数” 为计数频数。
第2步:进行人数加权。在单击菜单命令【数据 】【个案加权】,打开【个案加权】对话框。
第3步:启动分析过程。点击菜单【分析】【 描述统计】【交叉表】菜单命令
第四个表格:对称测量
计算皮尔逊卡方检验的卡方值的效应量和统计检 验力,其统计原理与计算公式可参见参考胡竹菁《心理
统计学》的第十一章第三节(胡竹菁. 心理统计学. 2010 年,第1版. 北京: 高等教育出版社)。
第三步:根据克莱姆 V系数值的大小和自由度查表确定克莱 姆 V系数的统计检验力。在本例中,由前面计算的效应量, 和第二步查询评定表的结果,可知卡方检验为小效应量,总 自由度为(2-1)*(2-1)=1,总体N为339,查询表5-3 统计检验力表,可知统计检验力为大约0.29,也就是说,本 例中精神焦虑与患慢性胃病这两个变量之间存在着关联,其 可能性为29%左右。 总之,在本例中,统计量检验显著(P小于0.05,拒绝原假 设),并且是小效应量。此时说明统计结论的可靠性较低, 还需进一步的研究资料佐证此结论,研究结果推广时要慎重。
第4步:设置分析变量。选择 “焦虑情况”变量 选入“行:”变量框中。选择“患胃病情况”变 量选入“列:”变量框中。
第5步:输出复式条形图和分布表。选中“ 显 示簇状条形图”复选框。
第6步:统计量选择。点击【统计】按钮,弹出 “交叉表:统计”的对话框
第7步:设置交叉表的显示。
第8步:设置输出格式。
SPSS操作步骤如下:
第1步:打开分析数据。打开“大学生学习与消 费调查问卷.sav”文件。
第2步:启动分析过程。点击【分析】【描述 统计】【交叉表】菜单命令.
第3步:设置分析变量。
第4步:输出复式条形图和分布表。选中“ 显示
簇状条形图”复选框。
第5步:统计量选择。点击【统计】按钮,弹出“ 交叉表:统计”的对话框。本例选中“ 卡方”, 表示将进行卡方检验分析。其他复选框都不选择。
案例:【例5-3】为了解大学生的专业承诺、与
大学生的学习兴趣、学习成绩之间的关系,通过 问卷调查获得了数据文件“专业承诺与学习兴趣 、学习成绩的关系.sav”。考虑的男女性别可能 有差异,性别可能是一个额外变量或控制变量, 因此将性别变量作为分层变量。
第1步:打开分析数据。打开“专业承诺与学习 兴趣、学习成绩的关系.sav”文件。
如果分层卡方分析的分层变量在几个分层之间的 分布不均,既可能削弱了原本存在的行变量与列 变量之间的关系,也可能使得原本不存在关系的 两个变量的关系呈现统计学显著性存在关系。因 此有利有弊。为了避免分层卡方分析带来的误差 ,分层卡方分析往往需要大样本数据。用于分层 的变量往往是性别、年级、职业、地区等人口学 变量。
由以上计算可知,在本例中,统计量检验显著(P小于0.05 ,拒绝原假设),并且是中效应量。此时说明统计结论(拒 绝原假设的结论)的可靠性尚可,基本可以认同此结论(拒 绝原假设)
第四个表格:交叉表(省略)。 第五个表格:性别与考研意向类型的卡方检验表。
[分析]:在性别与考研意向类型的卡方检验表中,皮尔逊 卡方检验的卡方值为2.857,显著值Sig值为0. 240>0.05, 接受原假设,即性别与考研意向类型之间是独立的,两变 量之间不存在着关联。换句话说,男女性别在考研意向上 不存在差异。
计算性别与英语四级的卡方值的效应量和统计检验力。
第一步:效应量克莱姆V系数为0.279。
第二步:根据Cohen(1992) 对克莱姆V系数效应量大小的 评定表(查询表5- 2),效应量0.279,很接近0.30,为中 效应量。
第三步:根据克莱姆V系数值的大小和自由度查表确定统计 检验力。这里卡方检验为中效应量,总自由度为(2-1)* (2-1)=1,总体N为286,查询表5-3统计检验力表,可知 统计检验力为大约0.99,即99%左右。
由【例5-1】的原始资料录入为原始数据文件“精神焦虑 与慢性胃病的调查原始信息数据.sav”,在SPSS中一行代 表一个被试记录,请对原始数据文件分析精神焦虑与慢性 胃病是否存在联系;并与【例5-1】的分析结果对比,比 较两种情况下的统计结果是否有差异。
第
五 章
第一节 交叉表格的独立性检验及效应量计算
第2步:启动分析过程。点击【分析】【描述统 计】【交叉表】菜单命令。
第3步:设置分析变量。选择 “专业承诺”变量选入“行
:”变量框中。选择“学习兴趣”、“学习成绩”变量选 入“列:”变量框中。 此外,在“层1的1”框内,将性别 变量从左边选择到分层变量框内。
第4步:统计量选择。点击【统计】按钮,弹出“交叉表
案例【例5-1】探讨慢性胃病的影响因素,研究
者调查了339人,得到调查数据初步汇总情况如下:
患慢性胃病 未患慢性胃病
精神焦虑患者
43
162
非精神焦虑患者
13
121
SPSS操作步骤如下:
第1步:输入数据。怎样将实际问题中的数据准 确转化、表达为SPSS中的数据,也是SPSS学习过 程中需要注意学习的一个方面,这是由实际问题 到数据处理、研究分析的一个“桥梁”。
第9步:在主对话框中点击【确定】按钮,提交 执行。
第10步:结果分析。
第一个表格:统计摘要表。(略) 第二个表格:精神焦虑与患胃病情况的交叉表。
第三个表格:卡方检验。
从表中可看出,皮尔逊卡方检验的卡方值为7.469,显著值Sig值为 0.006<0.05,应拒绝原假设,即认为精神焦虑与患慢性胃病是不独立的, 两变量之间存在着关联。
:统计”的对话框。本例选中“ 卡方”复选框, , “ 柯 克兰和曼特尔-亨塞尔统计”,其他复选框都不选择。
第5步:设置交叉表的显示。点击【单元格】按钮,弹出
“交叉表:单元显示”的对话框。 在“计算”栏内: 在 本例中,选中“ 实测”。其他复选框在本例中,均不选 择。
第6步:设置输出格式。点击【格式】按钮,弹出对话框
交 第二节 分层交叉表的独立性检验
叉 表
第三节 一致性卡方检验
分 析
第四节 列联表的品质相关分析
第五节 交叉表格分析的报告参考样例
第二节 分层交叉表的独立性检验
分层交叉表分析也可称为分层卡方分析,分层卡 方检验是把对象分解成不同的层次,每层分别研 究检验行变量与列变量的独立性。
第五章 交叉表分析
第一节 交叉表格的独立性检验及效应量计算 第二节 分层交叉表的独立性检验 第三节 一致性卡方检验 第四节 列联表的品质相关分析 第五节 交叉表格分析的报告参考样例
交叉表是指两个或多个分类变量各水平的频数 分布表,又称频数交叉表,列联表。
本章交叉表分析过程,既可以对数据进行汇总 ,也可以包括了独立性卡方检验、品质相关性 检验( Phi相关检验)。卡方检验、Phi相关检 验是分析交叉表资料常用的假设检验方法,这 两类分析处理的数据都是属于类别数据(名义 变量数据)。
计算性别与消费倾向类型的卡方值的效应量和统计检验力。
第一步:效应量克莱姆V系数为0.10。
第二步:根据Cohen(1992)对克莱姆V系数值效应量大小的 评定表(查询表5- 2),本例中更小自由度为1,在该评定 表中的第一行中查找,克莱姆V系数等于0.10,也就是说, 为小效应量。此时统计检验力则不需要查询。
【思考题】
在实际应用中,大部分测量数据都是获得原始数据,即获 得每个作答的具体信息,在SPSS录入的数据集中,一个被 试占一行记录。当然,有时也会获得的是计数数据,例如 统计满意度调查,或者简要汇总某些教育信息时。无论是 原始数据、还是汇总数据,最后所得的卡方检验结果是一 样的。不同的是,汇总数据在SPSS操作时,需要对“人数 ”等变量进行加权。
第6步:设置交叉表的显示。点击【单元格】按钮 ,弹出“交叉表:单元显示”的对话框。 在“计 算”栏内: 在本例中,选中“ 实测” 、“ 期望”。在“百分比”栏内: 选中“ 行”。其 他复选框在本例中,均不选择。
第7步:设置输出格式。 第8步:点击【确定】按钮,提交执行。 第9步:结果分析。
由以上计算可知,本例的统计量检验不显著(P大于0.05, 接受原假设),并且是小效应量。此时可以认同此统计结论 (接受原假设),在此情境下不需要进一步探讨研究。
第六个表格:性别与消费倾向类型的交叉表。(省 略)
第七个表格:性别与消费倾向类型的卡方检验表。 (省略)
具体分析,由同学们思考。
。 在本例中,按系统默认选择“⊙ 升序”。
第7步:在主对话框中点击【确定】按钮。 第8步:结果分析。。
第 二个表格:专业承诺 * 学习兴趣 * 性别的交叉表检验表
第四个表格:对称测量
表中“总计”所对应的卡方检验值,也就是未分层前的卡 方检验值。
一、独立性检验:是指两个或两个以上的分类 变量之间是相互独立的或者是相互联系的假设 检验。独立性检验,在有些研究中也称为同质 性检验。原假设 为:所观测的两个分类变量之 间没有关联。备择假设 为:所观测的两个分类 变量之间有关联,或存在相关。