SPSS学习系列24. 卡方检验
卡方检验SPSS操作

卡方检验SPSS操作卡方检验是一种统计方法,用于比较观察频数与期望频数之间的差异是否显著。
它适用于比较两个或多个分类变量之间的关系,并确定这些变量是否相互独立。
在SPSS中,可以使用交叉表和卡方检验命令来执行卡方检验。
首先,打开SPSS软件并导入待分析的数据文件。
然后,选择“数据”菜单中的“交叉表”选项。
在弹出的交叉表对话框中,将要分析的变量拖拽到“行”和“列”的方框中。
假设我们要比较性别和喜好电影类型之间的关系,那么将性别拖拽到“行”,将电影类型拖拽到“列”。
接下来,在交叉表对话框中,点击“统计”按钮。
在弹出的统计对话框中,选择“卡方”选项,并点击“继续”按钮。
然后,点击“确定”按钮生成交叉表。
SPSS将显示交叉表的结果,包括观察频数、期望频数、卡方值和p值等。
在卡方检验中,我们通过观察频数和期望频数之间的差异来判断两个变量是否相关。
如果差异较大,卡方值较大,p值较小,则说明两个变量之间存在显著关系。
不管是使用交叉表还是描述统计方法进行卡方检验,都需要注意以下几点:1.样本数据应该是随机抽取的,并且足够大。
2.对于交叉表中的每个单元格,期望频数应当大于等于5,以确保卡方检验的可靠性。
3.卡方检验只能检验两个或多个分类变量之间的关系,不能用于比较连续变量。
4.如果卡方检验结果显著,表明两个变量之间存在关联,但不能确定关联的性质或因果关系。
卡方检验在数据分析中有着广泛的应用,可以用于医学研究、市场调查、社会科学等领域。
通过SPSS软件的操作,可以便捷地进行卡方检验,并获取检验结果。
SPSS卡方检验,免费

二、确切概率法:数据输入
二、确切概率法:指定频数
二、确切概率法:进行确切概率计算
二、确切概率法:概率计算方法选择
二、确切概率法:统计方法选择
二、确切概率法:结果解读
二、确切概率法:这么计算对吗?
二、确切概率法:这么计算对吗?
三、配对卡方检验:实例
பைடு நூலகம்
实例:两位放射科医生对一批矽肺片独自 做出矽肺分级诊断,结果如下表,请问他 们的诊断结果是否基本一致,诊断水平有 无差别。 医生乙诊断结果
2 2 服从卡方分布,计算 出值后,查表判断这么大的 是否为小概率
一、四格表卡方检验:实例
实例:某医生用国产呋喃硝胺治疗十二指 肠溃疡,以甲氰咪胍作对照组,请问两方 法治疗效果有无差别(《医学统计学》p37)
处理 呋喃硝胺 甲氰咪胍 未愈合 8 20 愈合 54 44 合计 62 64
合计
四、分层卡方检验:数据输入
四、分层卡方检验:指定频数变量
四、分层卡方检验:按某一变量分层
四、分层卡方检验:统计方法选择
四、分层卡方检验:结果解读(一)
四、分层卡方检验:结果解读(二)
四、分层卡方检验:结果解读(三)
结束语
行列表卡方检验要求理论频数不宜太小, 否则就会导致分析的偏倚。 一般认为行列表中不宜有1/5以上的理论频 数小于5或有一个理念频数小于1。 当行列表两变量单向或双向有序,比较组 间有无差别时,则宜用Ridit分析、秩和检验、 行列表评分卡方检验、等级相关分析等。
A:表示实际频数,即实际观察到的例数。T:理论频数,即如果假设 检验成立,应该观察到的例数。 :求和符号。 R:行数, C:列 数。自由度: R 1 C 1 2 A T 如果假设检验成立,A与T不应该相差太大。理论上可以证明 T
卡方检验SPSS操作

鳞癌 腺癌 腺鳞 癌 小细 胞癌
e ffe ct
表达
不表 达
95
40
65
30
20
10
10
10
1 90
90
T o ta l 1 35 95 30 20 2 80
Chi-Square Tests
Pearson Chi-Square
Value 3.348a
df 3
Asymp. Sig. (2 -si d e d) .341
Value 24.894b
22.817
df 1 1
Asymp. Sig. (2 -si d e d) .000
.000
Exact Sig. Exact Sig. (2-sided) (1-sided)
Likelihood Ratio
26.229
1
.000
Fisher's Exact Test
.000
42
步骤: 2、变量加权:按频数加权
43
步骤:3、分析:选 Analyze Descriptive
Statistics
crosstabs…
用Statistics 选择要输出的统计量, 选择Chi-square 。 44
检验结果
Count
group T o ta l
患者 健康 人
group * 血 型 Cross tabulation
A法 T o ta l
阳 阴性
B法 阳性
70 5
75
阴性 20 5 25
T o ta l 90 10
100
Chi-Square Tests
McNemar Test
Value
卡方检验spss步骤

卡方检验spss步骤咱先来说说啥是卡方检验吧。
卡方检验就是一种统计方法,用来分析两个分类变量之间有没有关系。
比如说,你想知道男生和女生对某种颜色的喜好有没有差别呀,就可以用这个卡方检验。
那在SPSS里怎么做呢?一、数据准备你得先把数据都整理好。
就像你要去旅行,得先把行李收拾好一样。
数据得是那种每个观测值对应着不同变量的情况。
比如说你有一个变量是性别,男或者女,还有一个变量是对颜色的喜好,红、蓝、绿啥的。
这些数据要整整齐齐地放在SPSS的数据视图里。
如果数据乱七八糟的,那卡方检验可就没法好好做啦。
二、打开分析菜单在SPSS的界面里呢,你要找到“分析”这个菜单。
这个菜单就像是一个装满了各种工具的魔法盒子,卡方检验这个小魔法就在里面呢。
你轻轻一点这个“分析”菜单,就会看到好多选项冒出来。
三、选择描述统计里的交叉表在这个分析菜单里,有个叫“描述统计”的部分,在那里你能找到“交叉表”这个选项。
这就像是在一堆糖果里找到你最爱的那一颗一样。
点了“交叉表”之后,会弹出一个新的窗口。
四、设置变量在这个新窗口里呀,你要把你的两个分类变量分别放到行和列里面。
比如说,你把性别放到行里,把颜色喜好放到列里。
这就像是给每个小玩具找到它该待的小格子一样。
这个步骤很重要哦,要是放错了地方,结果可就不对啦。
五、点击统计量按钮在这个交叉表的窗口里,你能看到一个叫“统计量”的按钮。
点这个按钮就像是打开一个神秘的小盒子,里面藏着卡方检验这个宝贝呢。
在统计量的选项里,你要找到“卡方”这个选项,然后把它勾上。
就像你在菜单里点了你最爱吃的菜一样。
六、确定并查看结果勾好卡方检验之后呢,你就可以点“确定”按钮啦。
然后SPSS 就会像个勤劳的小蜜蜂一样,开始计算结果。
结果出来之后呢,你要看一个叫“卡方检验”的表格。
这个表格里会告诉你卡方值、自由度还有显著性水平这些东西。
如果显著性水平小于0.05,那就说明这两个分类变量之间是有关系的哦。
如果大于0.05呢,那可能就没什么关系啦。
卡方检验的SPSS实现课件

设置卡方检验参数
01 在卡方检验对话框中,选择要进行卡方检验的变 量。
02 选择卡方检验的类型,如独立样本、配对样本或 交叉表等。
03 根据需要设置其他参数,如期望值、行百分比等 。
运行卡方检验并解读结果
点击“运行”按钮,开始进行卡方检验。
在结果窗口中,查看卡方值、自由度、显著性水平等指标,以评估卡方检 验的结果。
06
案例分析
案例一:性别与职业倾向的卡方检验
总结词
性别与职业倾向之间是否存在显著关联
详细描述
通过卡方检验,分析性别与职业倾向之间的关联程度,判断是否存在显著差异 。
案例二:学历与工作收入的卡方检验
总结词
学历高低是否影响工作收入
详细描述
通过卡方检验,分析不同学历人群在工作收入方面的分布情况,判断学历是否为影响工 作收入的重要因素。
它基于卡方统计量,通过计算观察频 数与期望频数之间的差异程度,评估 分类变量之间的关联程度。
卡方检验的适用范围
01
当需要比较两个分类变量的关联程度时,可以使用 卡方检验。
02
它适用于样本量相对较小的情况,通常样本量在30 及以上时较为适用。
03
卡方检验不适用于连续变量或等级变量,只适用于 离散的分类变量。
卡方值
表示实际观测频数与期望频数之间的差异程 度。
自由度
表示独立变量的个数。
显著性水平
表示检验结果的可靠性,通常以0.05为标准 。
卡方检验结果的解读注意事项
01
注意卡方检验的假设条件,如数据独立性、期望频数
不能太小等。
02
结合其他统计方法,如事后检验、趋势卡方检验等,
进行更深入的数据分析。
SPSS卡方检验步骤

effect
阴转人数 阳性数
30
14
9
36
39
50
T o tal 44 45 89
Chi-Square Tests
Pearson Chi-Square Continuity Correctiona
Value 20.979b
19.068
df 1 1
Asymp. Sig. (2 -si d e d) .000
A 47 52 99
血型 B
66 54 120
AB 20 19 39
O 106 62 168
T o ta l 239 187 426
Chi-Square Tests
Pearson Chi-Square
Value 6.755a
df 3
Asymp. Sig. (2 -si d e d) .080
X2=20.687,p=0.000,按a=0.05水 准,拒绝H0,接受H1,差异有统计 学意义,可认为试验组有效率高于对 照组。
P440 第5题 配对设计卡方检验 步骤: 1、定义变量
11
步骤: 2、输入数据
12
步骤: 3、变量加权
13
步骤: 3、变量加权:按频数加权
14
步骤: 4、分析:选 Analyze
35
X2=20.979,p=0.000,按a=0.0167水 准,拒绝H0,接受H1,差异有统计 学意义,可认为甲、乙两种疗法对尿 路感染治疗效果有差别,甲疗法优于 乙疗法。
36
甲、丙检 验结果
group * effect Crosstabulation
Count
group 甲 丙
T o tal
卡方检验SPSS操作ppt课件
2.行×列表: 有无1/5格子的理论频数大于1小于5或有
一个格子T<1。若有,则考虑 (1)增加样本; (2)相邻组进行合理合并; (3)采用确切概率法。
3.SPSS不会自动做两两比较
3
一、四格表资料x2检验(两样本率比较) 第9-1题,P84
4
步骤: 1、定义变量
5
步骤: 2、输入数据
34
做出统计结论和专业结论
因x2=297.38,p=0.000<0.05,按a=0.
05水准,拒绝H0,差别有统计学意 义,可认为三个不同地区的人群血型 分布不同。
35
作业 P94 第2、4、6题
36
要获得卡方值,需用非参数检验中的非参数配对检验中的
McNemar检验(其实也是常用的配对卡方检验)
19
20
21
非参数配对检验中的 McNemar检验,得到卡方值 和p值。 ( b+c>25时,可获得卡方值)
22
三、行×列表资料的x2检验 例8-3,P154
23
其 (SPSS的操作步骤与四格表相同)
实习 x2检验 一、目的要求: ●x2检验的基本思想 ●四格表资料x2检验(两样本率比较) ●配对设计四格表资料x2检验(两样本率比较) ●行×列表资料的x2检验(多个样本率比较) ●样本构成比的比较 ●四格表资料的确切概率法
1
注意事项: 1.四格表:⑴a、b、c、d四个基本数据是否给出?
⑵是否需要校正? 四格表资料检验条件: (1)当n≥40且所有T≥5,用普通X2检验 (2)当n≥40,但1≤T<5时, 用校正的X2检验 (3)当n<40 或 T ≤ 1时,用四格表资料的确切概率法。 (4)若P≈α,改用四格表资料的确切概率法 (5)配对设计中25≤ b+c<40,需校正;b+c<25时,用配 对设计四格表资料的确切概率法
卡方检验(RxC)-SPSS教程
卡方检验(R×C)-SPSS教程一、问题与数据某研究人员拟分析血型和职业之间的关系,共招募了333位研究对象,收集他们的血型(blood_type)和职业(occupation)信息。
其中血型分为A、B、AB、O型共4种,职业分为律师(Lawyer)、医生(Doctor)、教师(Teacher)和工人(Worker),部分数据图1。
图1 部分数据二、对问题分析研究者想分析血型与职业类型的关系,建议使用卡方检验(R×C),但需要先满足3项假设:假设1:存在两个无序多分类变量,如本研究中血型和职业类型均为无序分类变量。
假设2:具有相互独立的观测值,如本研究中各位研究对象的信息都是独立的,不会相互干扰。
假设3:样本量足够大,最小的样本量要求为分析中的任一单元格期望频数大于5。
经分析,本研究数据符合假设1和假设2,那么应该如何检验假设3,并进行卡方检验(R×C)呢?三、SPSS操作在主页面点击Analyze→Descriptive Statistics→Crosstabs,弹出Crosstabs 对话框。
将变量blood_type和occupation分别放入Row(s)栏和Column(s)栏,如图2。
图2 Crosstabs点击Statistics后,弹出的对话框中点击Chi-square,并点击Nominal栏中的Phi and Cramer’s V。
如图3。
图3 Crosstabs: Statistics点击Continue→Cells,在弹出的对话框中,点击Counts栏Expected选项,并点击Percentages栏中的Row和Column选项,Residuals栏中的Adjusted Standardized,点击Continue→OK。
如图4。
图4 Crosstabs: Cell Display经上述操作,SPSS输出预期频数结果如图5。
图5 Crosstabulation结果显示,本研究最小的期望频数是8.4,大于5,满足假设3,具有足够的样本量。
spss卡方检验
spss卡方检验SPSS卡方检验SPSS(统计软件包 for the Social Sciences)是一种功能强大的统计软件,在社会科学、商业智能和市场调研等领域得到广泛应用。
其中,卡方检验是SPSS中常用的统计方法之一。
本文将介绍SPSS 中使用卡方检验进行数据分析的基本步骤、原理和注意事项。
一、卡方检验的基本概念卡方检验,又称为卡方拟合优度检验,用于比较观察样本与理论预期分布之间的差异。
它基于卡方统计量,可以用于分析分类数据的关联性和独立性。
卡方检验的结果可以帮助研究人员判断观察数据与理论模型之间的差异程度以及独立性。
二、SPSS中进行卡方检验的步骤1. 收集数据并导入到SPSS中。
2. 在SPSS中选择“分析”菜单,点击“描述统计”下的“交叉表”。
3. 在交叉表对话框中,选择需要比较的两个变量。
4. 点击“统计”按钮,选择“卡方”选项。
5. 点击“继续”按钮,然后点击“OK”按钮生成交叉表结果。
三、SPSS卡方检验的原理SPSS中的卡方检验基于卡方统计量,该统计量用于衡量观察值与理论期望值之间的差异。
卡方统计量的计算公式如下:\\[ X^2 = \\sum \\frac{(O-E)^2}{E} \\]其中,O表示观察值,E表示理论期望值。
卡方统计量服从自由度为(k-1) × (m-1)的卡方分布,其中k表示列数,m表示行数。
通过计算卡方统计量,可以得到卡方值和P值。
如果P值小于设定的显著性水平(通常为0.05),则认为观察值与理论期望值存在显著差异,拒绝原假设。
四、卡方检验的应用场景卡方检验通常用于以下几种情况:1. 检验分类变量之间的关联性。
例如,研究某一地区的居民性别与吸烟习惯之间的关系。
2. 检验分类变量与某一特定属性的关联性。
例如,研究某个产品的用户满意度与不同年龄段之间的关系。
3. 检验分类变量的分布是否服从某一特定的理论分布。
例如,研究某一地区的选民支持率是否符合某个政党的预期。
卡方检验的SPSS实现
卡方检验的SPSS实现简介卡方检验是一种统计方法,用于检验两个或多个分类变量之间是否存在相关性。
它基于观察值与期望值之间的差异,判断两个变量是否独立。
SPSS是一款常用的统计分析软件,提供了强大的功能来执行卡方检验以及其他统计分析任务。
本文将介绍如何使用SPSS进行卡方检验,并提供详细的步骤和示例。
步骤步骤一:导入数据在SPSS软件中,首先需要导入包含要进行卡方检验的数据集。
数据集可以是以.csv、.xlsx或者其他常用格式保存的文件。
1.打开SPSS软件。
2.选择“文件”菜单,然后点击“打开”选项。
3.在弹出的文件选择框中,找到并选择要导入的数据文件。
4.点击“打开”按钮,导入数据文件。
步骤二:选择变量在执行卡方检验之前,需要选择要分析的变量。
1.在SPSS软件中,选择“数据视图”选项卡,显示数据集的表格视图。
2.找到包含要分析的变量的列,将其选中。
可以按住Ctrl键选择多个变量。
3.点击菜单中的“分析”选项,然后选择“描述统计”子菜单。
4.在弹出的描述统计对话框中,选择“交叉表”选项,然后点击“统计量”按钮。
5.在统计量对话框中,选中“卡方”复选框,然后点击“确定”按钮。
步骤三:执行卡方检验选择变量之后,可以执行卡方检验。
1.在描述统计对话框中,点击“OK”按钮,开始执行卡方检验。
2.SPSS将生成一个交叉表,显示各个变量之间的交叉频数和期望频数。
3.检查交叉表中的卡方值和p值。
卡方值表示观察值与期望值之间的差异程度,p值表示该差异是否显著。
4.如果p值小于设定的显著性水平(通常为0.05),则拒绝原假设,即认为两个变量之间存在相关性。
步骤四:解读结果根据执行卡方检验的结果,可以得出一些结论。
1.如果卡方值较小,且p值较大,说明观察值与期望值之间的差异较小,两个变量之间可能独立。
2.如果卡方值较大,且p值较小,说明观察值与期望值之间的差异较大,存在一定程度的相关性。
需要注意的是,卡方检验只能判断两个变量之间是否存在相关性,不能说明变量之间的因果关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
24. 卡方检验卡方检验,是针对无序分类变量的一种非参数检验,其理论依据是:实际观察频数f 0与理论频数f e (又称期望频数)之差的平方再除以理论频数所得的统计量,近似服从2χ分布,即)(n f f f ee 2202~)(χχ∑-= 卡方检验的一般是用来检验无序分类变量的实际观察频数和理论频数分布之间是否存在显著差异,二者差异越小,2χ值越小。
卡方检验要求:(1)分类相互排斥,互不包容; (2)观察值相互独立;(3) 样本容量不宜太小,理论频数≥5,否则需要进行校正(合并单元格、增加样本数、去除样本法、使用校正公式校正卡方值)。
卡方校正公式为:∑--=ee f f f 202)5.0(χ卡方检验的原假设H 0: 2χ= 0; 备择假设H 1: 2χ≠0; 卡方检验的用途:(1)检验某连续变量的数据是否服从某种分布(拟合优度检验); (2)检验某分类变量各类的出现概率是否等于指定概率; (3)检验两个分类变量是否相互独立(关联性检验); (4)检验控制某几个分类因素之后,其余两个分类变量是否相互独立;(5)检验两种方法的结果是否一致,例如两种方法对同一批人进行诊断,其结果是否一致。
(一)检验单样本某水平概率是否等于某指定概率一、单样本案例例如,检验彩票中奖号码的分布是否服从均匀分布(概率=某常值);检验某产品市场份额是否比以前更大;检验某疾病的发病率是否比以前降低。
有数据文件:检验“性别”的男女比例是否相同(各占1/2)。
1. 【分析】——【非参数检验】——【单样本】,打开“单样本非参数检验”窗口,【目标】界面勾选“自动比较观察数据和假设数据”2.【字段】界面,勾选“使用定制字段分配”,将变量“性别”选入【检验字段】框;注意:变量“性别”的度量标准必须改为“名义”类型。
3. 【设置】界面,选择“自定义检验”,勾选“比较观察可能性和假设可能性(卡方检验)”;4. 点【选项】,打开“卡方检验选项”子窗口,本例要检验男女概率都=0.5,勾选“所有类别概率相等”;注:若有类别概率不等,需要勾选“自定义期望概率”,在其表中设置各类别水平及相应概率。
点【确定】回到原窗口,点【运行】得到双击上表,得到更多的描述:结果说明:(1)男生的观察频数为28,理论频数为25,残差=3;女生的观察频数为22,理论频数为25,残差=-3;可以计算卡方值=[32+(-3)2]/25=0.72(2)卡方检验的P值=0.396>0.05, 故接受原假设H0,即认为男女性别人数无差异。
注:卡方检验的P值是近似P值,若用“二项分布检验”计算出精确P值=0.480. 另外,上述卡方检验也可以用:【分析】——【非参数检验】——【旧对话框】——【卡方】得到的结果是一致的。
二、两样本或多样本案例——比较不同类的构成比或发生率的差异问题:两组收入不同的受访家庭其轿车拥有率的比较。
使用【交叉表】的卡方检验来实现,需要注意:若交叉表中存在有序分类变量,则适合用秩和检验而不是卡方检验。
有数据文件:变量O1表示是否拥有轿车:“1=有,2=没有”;变量Ts9表示收入级别:“1=4.8万以上,2=4.8万以上”。
1. 【分析】——【描述统计】——【交叉表】,打开“交叉表”窗口,将变量“Ts9收入级别”选入【行】框,将变量“O1是否拥有轿车”选入【列】框,根据需要勾选“显示复式条形图”;2. 点【统计量】,打开“统计量”子窗口,勾选“卡方”表示进行卡方检验;3. 点【继续】回到原窗口,点【单元格】打开“单元显示”窗口,【计数】输出观察频数和理论频数,默认勾选“观察值”;【百分比】勾选“行”;【非整数权重】设置小数权重问题,保持默认;注:“残差”设置残差的输出方式;“z-检验”对多于两组的数据做两两组间比较;点【继续】回到原窗口,点【确定】得到低收入家庭有9.6%拥有轿车;高收入家庭34.4%拥有轿车。
脚注a说明没有单元格的期望频数<5, 满足Pearson卡方检验要求,故看Pearson卡方检验结果即可:P值=0<0.05, 拒绝原假设H0,即高低收入不同的家庭轿车拥有上的差异有统计学意义。
注:(1)“Pearson卡方”:最标准最常用;(2)“连续校正”:只适用于4格表,样本量>40, 所有期望频数都>1, 只有1/5以下的单元格期望频数<5;(3)“Fisher精确检验”:不需要近似,结果最精确,但耗时多;若样本量<40,有单元格的期望频数<1的4格表,需要用该检验;若有单元格的期望频数<1, 或<5的期望频数较多,也可采用该检验;(4)“似然比”:用似然比公式计算卡方,在处理多维表是有更大优势;(5)“线性卡方”:检验的原假设H0是行列变量间无线性相关,在列联表分类变量中很少用,更多用于连续变量。
(三)检验两分类变量间的关联程度例如,进行客户满意度研究中,价格、质量、服务都与总体满意度相关,哪项与总体满意度关系更密切?卡方值的大小可以粗略地反映两变量联系的强弱,更精确的描述可以用“相对危险度”和“优势比”。
(1)相对危险度(RR )实验组人群反应阳性概率与对照组人群反应阳性概率的比值,即//t tc cP a n RR P c n == 用于反应实验因素与反应阳性的关联程度,RR=1表明二者无关联;RR<1表明实验因素导致反应阳性的发生率降低。
(2)优势比(OR )有时反应阳性概率的估计值很难求得(如回顾性研究),往往使用优势比代替RR 值。
优势比是反应阳性人群中实验因素有无的比例与反应阴性人群中实验因素有无的比例之比,即//a b adOR c d bc==若OR>1, 则表明实验因素更容易导致结果为阳性,或者说“采用的实验因素”与“结果为阳性”有关联。
注:当反应阳性概率<0.1时,OR 可作为RR 的近似。
优势比是两个比数之比,例如,女性购买与不购买某产品的比数是男性该比数的3倍。
问题:描述家庭收入级别与拥有轿车的关联程度1. 【分析】——【描述统计】——【交叉表】,打开“交叉表”窗口,将变量“Ts9收入级别”选入【行】框,将变量“O1是否拥有轿车”选入【列】框;2. 点【统计量】,打开“统计量”子窗口,勾选“风险”用来计算OR值和RR值;点【继续】回到原窗口,点【确定】得到(1)优势比OR是两个比数之比:低收入家庭拥有轿车的比例为9.6%,没有轿车的比例是90.4%,其比数为9.6% / 90.4% = 0.106; 高收入家庭的比数为:34.4% / 65.6% = 0.524; 故OR值=0.106/0.524=0.201该值的95%置信区间=[0.135, 0.3], 不包含1(有统计学意义);(2)相对危险度RR1是两组人群拥有轿车的概率之比,其估计值为9.6% / 34.4% = 0.278, 说明高收入家庭拥有轿车的概率是低收入家庭的1 /0.278 = 3.597倍,RR1值的95%置信区间=[0.196, 0.392], 不包含1(有统计学意义);(3)相对危险度RR2是两组人群没有轿车的概率之比,估计值为90.4% / 65.6% = 1.379.注:上述三个指标实际上是等价的;另外,OR值也等于有车与无车的相对危险度之比(0.278 / 1.379 = 0.201)。
(四)分层卡方检验前文已经得到家庭收入级别会影响轿车拥有情况,那么进一步,不同城市是否存在差异?即“城市”因素是否也是影响轿车拥有的协变量?另外“学历”因素呢?分层卡方检验就是解决上述问题常用的一种方法。
问题:在前文的基础上,进一步在控制“城市”的影响的前提下,更准确地描述家庭收入与轿车拥有的关联程度。
1.【分析】——【描述统计】——【交叉表】,打开“交叉表”窗口;将变量“Ts9收入级别”选入【行】框,将变量“O1是否拥有轿车”选入【列】框;将变量“s1城市”选入【层1的1】框;2. 点【统计量】,打开“统计量”子窗口,勾选“风险”、“Cochran’s and Mantel-Haenszel统计量”,点【继续】;点【确定】,得到结果家庭收入2级* O1. 是否拥有家用轿车* S1. 城市交叉制表计数S1. 城市O1. 是否拥有家用轿车合计有没有100北京家庭收入2级Below 48,000 9 93 102Over 48,000 83 134 217 合计92 227 319200上海家庭收入2级Below 48,000 4 103 107Over 48,000 70 160 230 合计74 263 337300广州家庭收入2级Below 48,000 19 107 126Over 48,000 72 135 207 合计91 242 333合计家庭收入2级Below 48,000 32 303 335Over 48,000 225 429 654 合计257 732 989风险估计S1. 城市值95% 置信区间下限上限100北京家庭收入2级 (Below 48,000 / Over48,000) 的几率比.156 .075 .326 用于 cohort O1. 是否拥有家用轿车= 有.231 .121 .440 用于 cohort O1. 是否拥有家用轿车= 没有1.477 1.308 1.666 有效案例中的 N 319200上海家庭收入2级 (Below 48,000 / Over48,000) 的几率比.089 .031 .251 用于 cohort O1. 是否拥有家用轿车= 有.123 .046 .328 用于 cohort O1. 是否拥有家用轿车= 没有1.384 1.261 1.519 有效案例中的 N 337300广州家庭收入2级 (Below 48,000 / Over48,000) 的几率比.333 .189 .586 用于 cohort O1. 是否拥有家用轿车= 有.434 .275 .683 用于 cohort O1. 是否拥有家用轿车= 没有1.302 1.151 1.474 有效案例中的 N 333合计家庭收入2级 (Below 48,000 / Over48,000) 的几率比.201 .135 .300 用于 cohort O1. 是否拥有家用轿车= 有.278 .196 .392 用于 cohort O1. 是否拥有家用轿车= 没有1.379 1.291 1.472 有效案例中的 N 989由于设置了分层变量,故按分层变量的水平值单独对每一层进行风险估计。
上海的OR值=0.089,而广州的OR值=0.333,说明是有地区差异的。
几率比的均一性检验卡方df 渐进 Sig. (双侧)Breslow-Day 6.165 2 .046Tarone 的 6.161 2 .046层间差异的检查结果(不同城市家庭收入与轿车拥有的联系是否相同),原假设H0: 层间无差异;P值=0.046<0.05, 拒绝原假设H0, 即不同城市是有差异的,因此不能简单地将不同城市数据总体处理得到结果。