交叉汇总与关联分析Crosstabs的应用
5.交叉汇总分析

实用性表格2 实用性表格
a6房房房房 * b16 现现现现现现现现 Crosstabulation % within b16 现现现现现现现现 b16 现现现现现现现现
原 始 输 出 表 格
•
其中, 房屋结构”为行变量, 其中,“房屋结构”为行变量, “现 使用人从业状况”为列变量。在每一格中, 使用人从业状况”为列变量。在每一格中, 第一行数据为分组后的频次, 第一行数据为分组后的频次,第二行数据 称为行百分比,第三行数据称为列百分比 称为行百分比, (一般是比较列百分比,横向比较),第 一般是比较列百分比,横向比较),第 ), 四行称为总百分比。 四行称为总百分比。
•
•
百分比的计算方向—— 百分比的计算方向 计算百分比通常按照自变量的方 即列的方向, 向(即列的方向,应该使得每列的百 分比之和是100% 100%)。 分比之和是100%)。
因为研究的目的是要了解自变量对因变量的影响, 因为研究的目的是要了解自变量对因变量的影响, 应此应该计算在自变量的不同取值情况下因变量 的变化情况如何。 的变化情况如何。但当因变量在样本内的分布不能代
表其在总体内的分布时, 表其在总体内的分布时,百分比就要按照因变量的方向进 行计算。 行计算。
行百分比
列联表的格式
高高五高
因变量
自变量
列百分比 性性 * 文文文文 Crosstabulation
文文文文 高初初高高 初初 初中 大高五五
163 25.9% 53.1% 13.0% 144 23.2% 46.9% 11.5% 307 24.5% 100.0% 24.5%
16现使用人从业情况 a 6 房屋结构 * b 16现使用人从业情况 Crosstabulation 在岗 113 14.5% 17.7% 3.9% 191 21.8% 29.9% 6.6% 210 28.1% 32.9% 7.2% 96 26.7% 15.0% 3.3% 28 20.6% 4.4% 1.0% 638 22.0% 100.0% 22.0% b16现使用人从业情况 不在岗 离退休 309 245 39.5% 31.3% 38.8% 10.6% 233 26.5% 29.3% 8.0% 155 20.7% 19.5% 5.3% 59 16.4% 7.4% 2.0% 40 29.4% 5.0% 1.4% 796 27.4% 100.0% 27.4% 21.1% 8.4% 347 39.5% 29.9% 12.0% 333 44.6% 28.7% 11.5% 186 51.7% 16.0% 6.4% 51 37.5% 4.4% 1.8% 1162 40.0% 100.0% 40.0% 其它 115 14.7% 37.5% 4.0% 107 12.2% 34.9% 3.7% 49 6.6% 16.0% 1.7% 19 5.3% 6.2% .7% 17 12.5% 5.5% .6% 307 10.6% 100.0% 10.6% Total 782 100.0% 26.9% 26.9% 878 100.0% 30.2% 30.2% 747 100.0% 25.7% 25.7% 360 100.0% 12.4% 12.4% 136 100.0% 4.7% 4.7% 2903 100.0% 100.0% 100.0%
spss中的学习

Kappa值的应用:交叉表分析(Crosstabs,Cross-tabulation,列联表分析)可计算Kappa(Cohen κ系数),此外诊断一致性检验还可以选用两相关样本非参数检验(Two-Related-Samples Test)中的McNemar检验(McNemar Test)(用于二分数据)和边际同质性检验(Marginal Homogeneity Test)(用于非二分数据)。
此外,向你推荐一本书:电子工业出版社出版的《PASW/SPSS Statistics中文版统计分析教程(第3版)(含CD光盘1张)》,该书有不少医学例子。
(如:Kappa系数,在列联表分析中评价一致性(agreement)程度的指标,适用于行与列有相同的分类,分为未加权和加权两种。
例:共40例数据,A和B两个观察者判断其结果阴性或者阳性,分析A与B判断的一致性。
据我说知,一般用于2人评价的契合度,若是3人及以上高维的数据很少见,可以考虑分别每次2人的对比,当然这样会引入误差。
)。
交叉分析法怎么分析

交叉分析法怎么分析交叉分析法是一种常用的数据分析方法,通过对不同因素之间的关系进行交叉比较和分析,帮助研究者发现变量之间的联系和差异。
本文将介绍交叉分析法的基本概念和步骤,并以具体案例进行说明。
一、交叉分析法概述交叉分析法(Cross-Tabulation Analysis)也被称为列联表分析(Contingency Table Analysis),是一种定量分析方法,用来研究两个或更多变量之间的关系。
通过构建列联表,对不同变量之间的交叉频数进行统计和比较,可以揭示变量之间的关联性和差异性。
二、交叉分析法步骤1. 确定研究问题:明确研究问题并选择需要分析的变量。
例如,假设我们想研究消费者对不同手机品牌的偏好与性别之间的关系。
2. 构建列联表:根据所研究的变量,构建列联表(也称为交叉表)。
横列为一个变量的不同水平(例如手机品牌),纵列为另一个变量的不同水平(例如性别)。
在交叉点上填写交叉频数。
3. 计算频数和比例:根据列联表,计算每个交叉点上的频数和比例。
频数表示各组别的数量,比例表示各组别所占比例。
4. 绘制图表:通过绘制图表,直观地展示不同变量之间的关系。
常用的图表包括堆叠柱状图、簇状柱状图、饼图等。
5. 进行统计检验:为了验证变量之间的关系是否显著,可以进行统计检验,如卡方检验。
卡方检验可以检验各组别之间的差异是否由随机因素引起。
6. 分析结果和讨论:根据交叉分析的结果,进行结果分析和讨论。
解释变量之间的关系和差异,并提出合理的解释和解决方案。
三、交叉分析方法案例以消费者对不同手机品牌的偏好与性别之间的关系为例,进行交叉分析。
我们调查了300名消费者,结果如下表所示:--------------------------------------------------| Apple | Samsung | Huawei | Others--------------------------------------------------男性 | 50 | 30 | 20 | 10--------------------------------------------------女性 | 20 | 40 | 50 | 20--------------------------------------------------根据上表,我们可以计算出各组别的频数和比例,如下所示:--------------------------------------------------| Apple | Samsung | Huawei | Others--------------------------------------------------男性 | 50 | 30 | 20 | 10--------------------------------------------------女性 | 20 | 40 | 50 | 20--------------------------------------------------| 70(23%) | 70(23%) | 70(23%) | 30(10%)--------------------------------------------------通过绘制堆叠柱状图,我们可以直观地看到不同手机品牌在不同性别中的偏好程度。
交叉列联分析

由于观察频数的总数为n ,所以f11 的期望频数 e11 应为
期望频数的分布
一分公司
二分公司 三分公司 四分公司
实际频数
68
赞成该 方案
期望频数
66
75
57
79
80
60
73
实际频数
32
反对该
方案
期望频数
34
45
33
31
40
30
37
检验统计量
在零假设成立时,该统计量近似服从自由度为(r1)×(s-1)的c2分布。当该统计量的值很大(或p值 很小)时,就可以拒绝零假设,认为这两个变量 不相互独立。
– 列观察值的合计数的分布 – 四个公司接受调查的人数分别为100人
列边缘分布
描述统计-百分比分布
• 在相同的基数上进行比较,可以计算相应的百
分比,称为百分比分布
– 行百分比:行的每一个观察频数除以相应的行合计 数(fij / ri)
– 列百分比:列的每一个观察频数除以相应的列合计 数( fij / cj )
期望频数的分布
一分公司 二分公司 三分公司 四分公司 合计
赞成该方案
68
75
57
79
279
反对该方案
32
45
33
31
141
合计
100
120
90
110
420
例如,第1行和第1列的实际频数为 f11 ,它落在第1行 的概率估计值为r1/n;它落在第1列的概率的估计值为 c1/n 。根据概率的乘法公式,该频数落在第1行和第1列 的概率应为
复式柱状图
61 70
49 60
50
VBA中的数据透视表和交叉表的应用

VBA中的数据透视表和交叉表的应用数据透视表和交叉表是VBA中非常有用的功能,可以帮助用户对数据进行分析和汇总。
在本文中,我将介绍如何使用VBA编写代码来创建、修改和操作数据透视表和交叉表。
首先,让我们来了解一下数据透视表和交叉表的定义和用途。
数据透视表是一种功能强大的数据分析工具,可用于快速总结和汇总大量数据。
它允许用户以不同的方式组织和展示数据,以便更好地理解数据的关系和趋势。
比如,我们可以通过透视表轻松地对销售数据进行汇总,以便了解哪个地区和哪个产品线的销售额最高。
交叉表是一种将数据以不同方式组织和显示的方法,通常用于数据的横向和纵向比较。
它将数据按照行和列分组,并在交叉点上进行分析。
例如,我们可以使用交叉表来比较不同销售人员的销售记录,以确定谁的业绩最好。
现在,让我们来看一些如何在VBA中使用数据透视表和交叉表的示例代码。
首先,我们需要创建一个数据透视表。
可以使用以下代码片段来创建一个新的数据透视表:```vbaSub CreatePivotTable()Dim ws As WorksheetDim rng As RangeDim pt As PivotTable'设置数据源范围Set ws = ThisWorkbook.Sheets("Sheet1")Set rng = ws.Range("A1:D10")'创建数据透视表Set pt = ws.PivotTableWizard(SourceType:=xlDatabase, SourceData:=rng, TableDestination:=ws.Range("F5"))End Sub```在上面的示例中,首先我们定义了一个工作表变量 `ws`,将其设置为需要创建数据透视表的工作表。
然后,我们定义一个 `rng`变量,并设置其为数据源范围。
接下来,我们使用`ws.PivotTableWizard` 方法创建了一个新的数据透视表,并将其放置在工作表的 F5 单元格中。
交叉列联分析

行边缘分布
一分公司 赞成该方案 反对该方案 二分公司 三分公司 四分公司
合计 279 141 420
68 32
75 45
57 33
79 31
100 合计 • 列边缘分布
120
90
110
• 列观察值的合计数的分布 • 四个公司接受调查的人数分别为 四个公司接受调查的人数分别为100人 人 120人,90人,110人 人 人 人
• 2、样本量大小的问题 、
110
例如,第1行和第 列的实际频数为 f11 ,它落在第 行 行和第1列的实际 它落在第1行 例如, 行和第 列的实际频数为 它落在第 的概率估计值为r ; 它落在第 列 的概率估计值为 1/n;它落在 第 1列的概率的估计值为 c1/n 。 根据概率的乘法公式 , 该频数落在第 行和第 根据概率的乘法公式,该频数落在第1行和第 行和第1 列的概率应为 由于观察频数的总数为n ,所以f11 的期望频数 e11 应为 由于观察频数的总数为 所以
• 检验行变量与列变量是否独立 • 拟合优度检验(多个总体的比例是否相等) 拟合优度检验(多个总体的比例是否相等)
独立性检验(基本原理) 独立性检验(基本原理)
• 原假设:行变量和列变量是相互独立的 原假设: • 前提成立的情况下,每个单元格的频数期望值称 前提成立的情况下, 之为期望频数e 之为期望频数 ij,
列联表中的数字为交叉单元格中的频数或频率
大城市 价格 品牌 款式
中小城市
乡镇
农村
• 以列联表为基础可以对两个变量之间的关系进行多种 统计检验
列联表举例
条件频数—酒店管理专业的男生 人 条件频数 酒店管理专业的男生2人 酒店管理专业的男生
利用交叉分析进行市场数据关联

利用交叉分析进行市场数据关联交叉分析是一种常用的统计分析方法,也是市场研究中常用的一种技术手段。
它可以帮助我们分析市场数据之间的关联关系,并且通过对比不同维度数据的交叉组合,帮助我们发现市场中的一些隐含规律和趋势。
在本文中,我们将探讨交叉分析在市场数据关联方面的应用以及如何进行一次有效的交叉分析。
首先,我们需要明确研究的目的和问题。
在市场营销领域,交叉分析可以帮助我们探究不同变量之间的关系,例如产品销量与广告投放、消费者人群与购买行为等。
通过交叉分析,我们可以更好地理解市场中的细分群体,了解他们的需求和购买习惯,从而优化产品与服务的提供。
接下来,我们需要选择合适的数据集进行分析。
市场数据的种类繁多,包括销售数据、消费者调查数据、竞争对手数据等。
选择合适的数据集非常关键,数据集应当具有代表性,并且覆盖多个维度,以便我们能够进行综合的交叉分析。
在进行交叉分析之前,我们需要对数据进行预处理,以确保数据的准确性和一致性。
这包括数据清洗、数据整理和数据标准化等步骤。
例如,对于销售数据,我们需要处理缺失值、异常值和重复值,将数据转换为适合分析的形式,并确保不同数据源之间的单位一致。
接下来,我们可以利用适当的统计方法进行交叉分析。
常用的交叉分析方法包括卡方检验、相关系数分析和方差分析等。
这些方法可以帮助我们计算不同维度数据之间的相关性、差异性和影响程度。
在进行交叉分析时,我们需要根据具体的问题和研究目的选择合适的统计指标和分析工具。
例如,如果我们想要研究不同广告投放方式对产品销量的影响,可以使用方差分析来比较不同广告投放组别的销量差异是否显著。
而如果我们想要研究不同年龄段消费者的购买行为差异,可以使用卡方检验来比较不同年龄组别的购买偏好是否存在显著性差异。
进行交叉分析时,我们还需要注意样本大小和分组方式对结果的影响。
确保样本具有代表性,并且分组方式合理,以充分反映不同维度数据之间的关系。
同时,交叉分析结果的统计显著性并不代表因果关系,我们需要结合实际情况进行合理解读。
实验9 交叉表

实验编号:9四川师大SPSS实验报告2017 年6 月28 日计算机科学学院2015级5班实验名称:交叉表和关联分析姓名:唐雪梅学号:2015110538 指导老师:__朱桂琼___ 实验成绩:___实验九交叉表和关联分析一.实验目的及要求1.了解SPSS 特点结构操作2.利用SPSS进行简单数据统计二.实验内容1.某企业发现近期员工工作积极性较低,为了查找原因找到应对之策,对员工进行了员工满意度和工作压力的调查,对调查结果进行汇总分析得到了如下统计三、实验主要流程、基本操作或核心代码、算法片段(该部分如不够填写,请另加附页)1.打开spss,建立数据库2.分析原假设:工作满意度和工作压力是独立的两个变量步骤:Analyze->Descriptive Statistics->Crosstabs选中Display clustered bar charts选项,在Statistics对话框中选择Chi-square选项,在Cells对话框中选择Observed、Expected选项。
3.结果分析皮尔逊卡方检验的Sig.=1,似然比卡方检验的Sig.=1,都大于0.05,应该接收原假设故认为工作满意度与工作压力之间没有关系。
线性关联检验的Sig.=1,大于0.05,表明两变量间不存在显著的线性关系。
四、实验结果的分析与评价(该部分如不够填写,请另加附页)1.交叉表(crosstabs):也称为交互表或列联表,主要用于定性变量进行统计描述和简单的统计推断,由行列组成。
其中行列分别对应定性变量。
列联表分析的主要任务有两个:(1)根据样本数据产生二维或多维交叉列联表。
(2)在交叉列联表的基础上,分析两变量之间是否具有独立性或一定的相关性。
2.为了理解列联表中行变量(Row)和列变量(Column)之间的关系,需要借助非参数检验方法。
通常采用的方法是卡方检验。
卡方检验主要包括的步骤:(1)建立原假设H0:行变量和列变量之间没有关系,或行变量和列变量相互独立。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六讲交叉汇总与关联分析(Crosstabs的应用)主要用于研究两个变量之间是相互独立还是存在某种关系,有没有关系,关系程度怎么样。
最适合于分析两个定类变量之间的关系,但是通过对变量的处理,也可以适合于分析测量层次更高级别的变量。
一、变量及其测量层次变量:被操作化了的概念,是可以直接观察的,在经验研究中,在不同的状态下有不同的属性,科学研究一定要使用变量的语言,一定要有操作化。
变量从它测量的层次上看,可以区分为四种类型:定类变量(Nominal ):区分现象、事物的不同性质,而不能从规模大小等方面进行区分,=≠性别(男,女)收入(有收入,无收入)、民族等定序变量(Ordial):当变量不仅区分了对象的属性、特征,还区分出大小、强弱、高低次序时,就是定序变量。
=≠< >如社会地位、文化水平、社会态度、收入等定距变量(Interval):除了类别、次序属性以外,取值之间的距离还可以用标准化的距离去测量,可以进行加减的运算。
年龄定比变量(Ratio):除了以上三类变量提到的属性,定比变量取值可以构成一个有意义的比率。
如智商。
各个变量之间的关系及其测量:定类——定类——列联表、交互分析定序——定序——等级分析定距——定距——回归与相关(简单与多元)定类——定距——方差分析定类——定序——非参数检验二、交叉汇总表的一般形式及其特点的上面,因变量放在表的旁边条件分布:将其中一个变量控制起来,再看另外一个变量的分布,可以得到条件分布,如可以对自变量的同一取值作条件分布,进行分析。
三、如何获得交叉汇总表Analyze-----Descriptives----Crosstabs----出现对话框:●ROWS这个框中的变量作为交互表中的行变量(一般放因变量Y,y1, y2,y3--)●Column框,这个框中的变量作为交互表中的列变量(一般放自变量X,x1,x2,x3…)●Layer框:框中的变量作为控制变量,决定交互表的层,可以多个控制变量。
●Display Clustered bar chats选中这个框,将显示每一组中各个变量的分类条形图●Suppress tables选中这个框,只输出统计量,不输出多维列联表●Statistics 统计量●Cell display对话框——确定要输出的列联表——观测量数、百分比、残差以自变量作为计算百分率的方向,是社会学研究的常规,当然,也有例外的情况:如果因变量在样本内的分布不能代表其在总体内的分布,则百分率的计算要根据因变量的方向(见李沛良书P74。
)比较时采用行百分比还是列百分比?原则上是没有自变量与因变量的区分。
如看职业流动表中的流出率,选Row百分比,得行的百分比,行加起来为100%若选column——列百分比,列若是儿子职业,则列百分比可以看某一职业类别到底由什么人构成,职业流动表中的流入率。
做目前职业身份与父亲从事职业的关系交互表Rows――父亲从事工作Columns――目前身份Cells――row――问:父亲是农民的那些被调查者,他们目前的身份与父亲是高级管理人员者比有什么特点?如果cells-column――问目前身份是一线工人的人,他们的父亲都是干什么的?四、如何看一张交叉汇总表(一)Cell功能键observed:观察值的实际数expected:如果行和列在统计上是独立的或不相关的,那么会在单元格中输出期望的观察值的数量。
Row:行百分比Column:列百分比Unstandardized:计算非标准化残差,残差是观察值与期望值之差,正的残差意味着在行列变量相互独立时,单元格中的观察值比期望值大。
Standardized:标准化残差, 它的值是残差除于标准差,其均值是0,标准差等于1。
Adj standardized调整后的残差。
以社会统计学教材P295表10-2为例1.联合分布、边缘分布与条件分布Analyze-----Descriptives----Crosstabs--- Cells ――Total――OK2.列联表中变量的相互独立性――社会统计学教材表10-15分析,可以通过SPSS的如下程序进行操作Analyze-----Descriptives----Crosstabs--- Cells ――Column(求列百分比)――OKAnalyze-----Descriptives----Crosstabs--- Cells ――Column(求行百分比)――OK期望分布―――Analyze-----Descriptives----Crosstabs--- Cells ――expected――Column(求列百分比)――OK五.定类——定类——列联表交互分析――是否相关 (一)交互表的检验——两个变量之间是否相关一般用x 2来检验,检验的原来假设是:两个变量之间没有关系,研究假设或称为备择假设是两个变量之间有关系。
检验的方法是: Pearson Chi-Squarex 2 的自由度是(r-1)(c-1)n ij 是观察的样本频次 如果x 2 检验sig <.05,拒绝原假设,即认为两个变量之间相关 如果x 2 检验sig >.05,接受原假设,即认为两个变量之间不相关 注意:对于2×2的列联表,格数过少,为减少偏差,对x 2 进行修正,x n E E ij ij ijj ri c 221105=--==∑∑(.)x 2检验适合于单变量二项总体或者多项总体的检验。
例子:看子辈职业与父辈职业之间是否相关1.数据2.检验结论:由于sig.小于.05,所以,子辈职业与父辈职业之间是相关的注意:在这些检验结果中,我们一般用Pearson Chi-SquareLikelihood Ratio对数似然比方法计算的卡方;Linear-by-Linear Association:线性相关的卡方值。
六、两个定类变量之间相关的强度(一)相关系数1.Phi系数描述2×2数据相关程度最常用的一种相关系数Φ=x n 2对于一个具体的2×2维列联表X1 X2Y1 a bY2 c dΦ=-++++ad bca b c d a c b d ()()()()2.列联系数当一张表格超过2维时,Phi的值不一定是在0---1之间,为了获得0≤Phi≤1,皮尔逊建议用列联系数Cxx N =+22C 的最高限取决于行数和列数,一般达不到上限1,对于一个4×4表格,最高限为0.873.Cramer’s V 系数)1(),1min[(2--Φ=c r VV 的最高上限可以达到1,但是不是很直观4.Lambda, Tau-y 系数(具有PRE 性质的系数)PRE 数值的意义:就是用一个现象(如变量X )来预测另一个现象(如变量Y )时能够减除百分之几的误差。
PRE=(E1—E2)/E1E1:当不知道X 变量去估计Y 变量时所产生的误差(全部误差) E2:知道X 变量再去估计Y 变量产生的误差 E1—E2为剩余的误差如果两个变量都是定类测量层次,可以用Lambda, Tau-y 系数 [1] Lambda 相关测量法这种相关测量法也叫做Cuttman’s coefficient of predictability ,它的基本的逻辑是计算以一个定类变量的值来预测另一个定类变量的值时,如果以众值作为预测的准则,可以减除多少误差。
消减的误差再全部误差中所占的比例越大,表示两个变量之间相关的程度越大。
Lambda 系数有两种形式: 对称形式(symmetrical version ):特点是两个变量之间的关系是对称的,也就是不分自变量与因变量λ =每列与每项最高频次之和边缘和边缘和中最高频次观察总数边缘和与边缘和中最高频次-⨯-X Y X Y 2(见李沛良书P81)不对称形式(asymmetrical version ):要求一个是自变量(X ),另一个是因变量(Y )。
λy Y Y =--每列最高频次之和边缘和中最高频次观察总数边缘和中最高频次当自变量与因变量位置互换时,Lambda 的值会不一样。
SPSS 给出的是不对称的Lambda 系数,有两个。
分子就是根据X 值来预测Y 的众值所能够消减的误差(E1-E2)分母就是在不知道X 值的情况下来预测Y 的众值时所产生的全部误差 Lambda 的取值是(0,1)Lambda 系数是以众值作为预测的准则,不理众值以外的次数的分布,如果全部众值集中在条件次数表的同一列或同一行,那么Lambda 系数可能等于0——而这往往并不表示两个变量之间没有关系,实际上我们发现是有关系的,当我们把频次转换为百分比计算的时候,可以清楚地看出他们之间的关系。
因此,Lambda 系数的敏感性有时候实际上是有问题的,因此社会学研究中有时采用Goodman 和 Kruskal 的 Tau-y 系数 [2] Goodman and Kruskal 的 Tau-y 系数这个系数的敏感度高于Lambda 系数,但只适合于分析不对称的关系,属于不对称相关测量法,要求两个定类变量中有一个是自变量,有一个是因变量,Tau-y 系数的值是界于0—1之间,具有消减误差比例的意义,这个系数的特色是在计算时会包括所有的边缘次数和条件次数Tau-y=E E E n nnn n nn ij ji i 12111222-=--∑∑∑∑***E nF F ny y1=-∑()E F f fF x x2=-∑() ()n F ny -表示如果不知道变量值(男或女),那么每次预测某个Y 变量的错误机率,再乘上F y ,表示预测这个Y 值的错误总数,Y 变量有多个值,把各个值的预测错误总数加起来,就是E1F y ——Y 变量的某个边缘次数F x ——X 变量的某个边缘次数f 某条件次数在那么多相关系数中,在进行研究时,一般选择哪一个比较好?在定类——定类关系中,如果是不对称关系,最好选择用的是 Tau-y ,如果是对称的关系,择最好选择用的是Lambda 系数,Phi 、C 、V 系数没有消减误差比例的意义,而且假定两个变量之间的关系是对称的。
在这三个系数中,由于V 不受表的大小的影响,因此用得比较多,也比较适合于进行社会学研究。
不确定系数:uncertainty coefficient :表示用一个变量来预测其他变量时降低误差的机率。
如不确定系数在83%时,表示已知一个变量知识在预测其他变量时,可以减少85%的误差。
是一个具有消减误差比例意义的系数。
SPSS 中给出的相关系数:Phi 系数、列联系数、Cramer V 系数、Lambda, Tau-y 系数(有两个)、uncertainty coefficient例子:社会统计学教材表10-34,求各类系数(二)对相关系数进行检验看相关系数的显著性就可以,如果显著性小于.05,则有统计意义,如果大于.05,则没有统计意义(三)统计意义与实际意义七、定序——定序列联表、交互分析(一)相关系数1. Kendall 的 tau 系数——适合于分析对称关系tau 系数的基本逻辑是计算同序对数与异序对数的差在全部可能对数中所占比例。