卡方检验1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十三节卡方检验(1)
一、概述
用于分类计数资料的假设检验方法,属非参数检验。检验的是样本分布偏离理论分布的严重程度,即检验的是分布,不是总体参数。
Crosstabs过程用于对计数资料和有序分类资料进行统计描述和简单的统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。
统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。
原理:检验两个(或多个)样本率或构成比之间差别是否有统计学意义,从而推断两个(或多个)总体率或构成比之间是否有统计学意义。若P<0.05,拒绝无效假设H0,做出总体上差异有显著性意义的结论。
多组间的两两比较,必须重新规定检验水准。
分类:行×列表x2检验、四格表x2检验、配对x2与一致性检验、分层x2检验
二、界面介绍
1、分类资料数据录入格式简介
在定量资料中,一般每个观察对象的变量值都不一样,记录格式为一个观察病例一条记录。而在分类资料中,所有的变量值都限于很少的几个类别。为记录方便,常常采用频数表格式来记录数据,一条记录对应多个观察病例。对频数资料,分析时需用Weight Cases过程指定一下频数变量用于记录加权。
2、Crosstabs过程界面说明:
【Rows框】用于选择行*列表中的行变量。
【Columns框】用于选择行*列表中的列变量。
【Layer框】Layer 指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用 Previous 和 Next 钮设为不同层。Layer在这里用的比较少,在多元回归中我们将进行详细的解释。
【Display clustered bar charts复选框】显示重叠条图。
【Suppress table复选框】禁止在结果中输出行*列表。
【Exact钮】针对2*2以上的行*列表设定计算确切概率的方法,可以是近似概率(Asymptotic only)、蒙特卡罗模拟概率(Monte Carlo)或确切概率计算(Exact)。蒙特卡罗模拟默认进行10000次模拟,给出99%可信区间;确切计
算默认计算时间限制在5分钟内。这些默认值均可更改。如果你在安装SPSS时没有安装EXACT模块,则此处对话框中不会出现Exact钮。
【Statistics钮】弹出Statistics对话框,用于定义所需计算的统计量。
●Chi-square复选框:计算X2值。
●Correlations复选框:计算行、列两变量的Pearson相关系数和
Spearman等级相关系数。
●Norminal复选框组:选择是否输出反映分类资料相关性的指标,很
少使用。
✓Contingency coefficient复选框:即列联系数,其值界于
0~1之间;
✓Phi and Cramer's V复选框:这两者也是基于X2值的,Phi
在四格表X2检验中界于-1~1之间,在R*C表X2检验中界
于0~1之间;Cramer's V 则界于0~1之间;
✓Lambda复选框:在自变量预测中用于反映比例缩减误差,
其值为1时表明自变量预测应变量好,为0时表明自变量
预测应变量差;
✓Uncertainty coefficient复选框:不确定系数,以熵为标
准的比例缩减误差,其值接近1时表明后一变量的信息很
大程度来自前一变量,其值接近0时表明后一变量的信息
与前一变量无关。
●Ordinal复选框组:选择是否输出反映有序分类资料相关性的指标,
很少使用。
✓Gamma复选框:界于0~1之间,所有观察实际数集中于左
上角和右下角时,其值为1;
✓Somers'd复选框:为独立变量上不存在同分的偶对中,同
序对子数超过异序对子数的比例;
✓Kendall's tau-b复选框:界于-1~1之间;
✓Kendall's tau-c复选框:界于-1~1之间;
●Eta复选框:计算Eta值,其平方值可认为是应变量受不同因素影
响所致方差的比例;
【Cells钮】弹出Cells对话框,用于定义列联表单元格中需要计算的指标:
●Counts复选框组:是否输出实际观察数(Observed)和理论数
(Expected);
●Percentages复选框组:是否输出行百分数(Row)、列百分数(Column)
以及合计百分数(Total);
Residuals复选框组:选择残差的显示方式,可以是实际数与理论数的差值(Unstandardized)、标化后的差值(Standardized,实际数
与理论数的差值除理论数),或者由标准误确立的单元格残差(Adj.
Standardized);
【Format钮】用于选择行变量是升序还是降序排列。
三、结果分析
从左到右:检验统计量值、自由度、双侧近似概率、双侧精确概率、单侧精确概率
从上到下:Pearson卡方、连续性校正卡方、对数似然比卡方、Fisher’s 确切概率法、线性相关卡方、有效记录数
当n≥40且所有T≥5时,用普通的卡方检验。若所得P≈α,改用确切概率法;
当n≥40但有1≤T<5时,用校正的卡方检验;
当n<40或有T<1时,改用确切概率法
有观点认为,实际应用中对数似然比卡方比确切概率法更准确。
注意:对行列表卡方检验进行两两比较时,因为重复多次的假设检验,将使第一类错误扩大,因此必须重新规定检验水准,不能再用原来的检验水准α=0.05作为拒绝的标准。校正方法:
四、实例分析
例8.1 在“EG0201.sav”中分析如下问题:
感染组与非感染组,其输血次数是否有显著性差异?
不同手术方式之间,其输血次数是否有显著性差异?(行列表卡方检验)例8.2 研究亚洲、欧洲、北美洲地区的人群血型分类构成是否一样。(卡方检验中的两两比较)
例8.3 研究单用某种药物与药物加化疗两种处理方法对某种癌症的疗效比较。(四格表卡方检验)
例8.4 在“EG0201.sav”中,研究不同性别的感染率有无显著性差异。(四格表校正卡方检验)