多个样本率的卡方检验及两两比较 之 spss 超简单
多个样本率地卡方检验及两两比较 之 spss 超简单

SPSS:多个样本率的卡方检验及两两比较来自:医咖会医咖会之前推送过“两个率的比较(卡方检验)及Fisher精确检验的SPSS教程”,小伙伴们都掌握了吗?如果不止两个分组,又该如何进行卡方检验以及之后的两两比较呢?来看详细教程吧!1、问题与数据某医生拟探讨药物以外的其他方法是否可降低患者的胆固醇浓度,如增强体育锻炼、减少体重及改善饮食习惯等。
该医生招募了150位高胆固醇、生活习惯差的受试者,并将其随机分成3组。
其中一组给予降胆固醇药物,一组给予饮食干预,另一组给予运动干预。
经过6个月的试验后,该医生重新测量受试者的胆固醇浓度,分为高和正常两类。
该医生收集了受试者接受的干预方法(intervention)和试验结束时胆固醇的风险程度(risk_level)等变量信息,并按照分类汇总整理,部分数据如下:注释:本研究将胆固醇浓度分为“高”和“正常”两类,只是为了分析的方便,并不代表临床诊断结果。
2、对问题的分析研究者想判断干预后多个分组情况的不同。
如本研究中经过降胆固醇药物、饮食和运动干预后,比较各组胆固醇浓度的变化情况。
针对这种情况,我们建议使用卡方检验(2×C),但需要先满足5项假设:假设1:观测变量是二分类变量,如本研究中试验结束时胆固醇的风险程度变量是二分类变量。
假设2:存在多个分组(>2个),如本研究有3个不同的干预组。
假设3:具有相互独立的观测值,如本研究中各位受试者的信息都是独立的,不会相互干扰。
假设4:研究设计必须满足:(a) 样本具有代表性,如本研究在高胆固醇、生活习惯差的人群中随机抽取150位受试者;(b) 目的分组,可以是前瞻性的,也可以是回顾性的,如本研究中将受试者随机分成3组,分别给予降胆固醇药物、饮食和运动干预。
假设5:样本量足够大,最小的样本量要求为分析中的任一预测频数大于5。
经分析,本研究数据符合假设1-4,那么应该如何检验假设5,并进行卡方检验(2×C)呢?3、思维导图4、SPSS操作4.1 数据加权在进行正式操作之前,我们需要先对数据加权,如下:(1)在主页面点击Data→Weight Cases弹出下图:(2)点击Weight cases by,激活Frequency Variable窗口(3)将freq变量放入Frequency Variable栏(4)点击OK4.2 检验假设5数据加权之后,我们要判断研究数据是否满足样本量要求,如下:(1)在主页面点击Analyze→Descriptive Statistics→Crosstabs弹出下图:(2)将变量intervention和risk_level分别放入Row(s)栏和Column(s)栏(3)点击Statistics,弹出下图:(4)点击Chi-square(5)点击Continue→Cells(6)点击Counts栏中的Expected选项(7)点击Continue→OK经上述操作,SPSS输出预期频数结果如下:该表显示,本研究最小的预测频数是24.7,大于5,满足假设5,具有足够的样本量。
用SPSS进行不同变量多组间两两比较卡方检验

用SPSS进行不同变量多组间两两比较卡方检验在使用SPSS进行不同变量多组间两两比较卡方检验时,我们可以按照以下步骤进行操作:一、实验设计在进行卡方检验之前,需要明确变量的分类和分组情况。
假设我们有一个调查数据集,其中包含一个自变量(X)和一个因变量(Y),分别有三个水平(A、B、C)和四个水平(D、E、F、G)。
我们的目标是检验自变量(X)的不同水平对因变量(Y)的影响是否显著。
二、导入数据将收集到的数据导入SPSS软件。
确保数据格式正确,变量的水平设置正确。
三、设置分析参数在SPSS的菜单栏选择“分析(Analyze)” - “描述统计(Descriptive Statistics)” - “交叉表(Crosstabs)”。
四、选择变量在交叉表对话框中,将因变量(Y)拖入“行”框中,自变量(X)拖入“列”框中。
点击“统计”按钮。
五、设置统计参数在统计对话框中,选择需要计算的统计量。
在这里,我们需要进行卡方检验,因此选择“卡方(Chi-square)”选项。
点击“继续”按钮。
六、进行卡方检验点击“OK”按钮,SPSS将生成卡方检验结果表格。
此表格显示了各个变量水平之间的卡方值、自由度和显著性水平。
七、结果解读根据卡方检验结果表格,我们可以判断各个变量水平之间的差异是否显著。
卡方值越大,说明差异越显著;相应地,显著性水平(p-value)越小,说明差异越显著。
如果p-value小于设定的显著性水平(通常为0.05),则可以拒绝原假设,即认为变量之间存在显著差异。
八、结果报告根据卡方检验结果生成一个简明的报告。
报告应包括所使用的统计方法,统计检验结果和结论。
可以用表格或图表展示数据,以便更直观地描述结果。
以上是使用SPSS进行不同变量多组间两两比较卡方检验的步骤。
通过这些步骤,我们可以得出结论,确定各个变量水平之间是否存在显著差异。
这为我们研究相关问题提供了可靠的数据支持。
多个样本率地卡方检验及两两比较 之 spss 超简单

SPSS:多个样本率的卡圆考验及二二比较之阳早格格创做去自:医咖会医咖会之前推支过“二个率的比较(卡圆考验)及Fisher 透彻考验的SPSS教程”,小伙陪们皆掌握了吗?如果不只二个分组,又该怎么样举止卡圆考验以及之后的二二比较呢?去瞅仔细教程吧!1、问题与数据某医死拟探讨药物以中的其余要领是可可落矮患者的胆固醇浓度,如巩固体育锻炼、缩小体沉及革新饮食习惯等.该医死招募了150位下胆固醇、死计习惯好的受试者,并将其随机分成3组.其中一组赋予落胆固醇药物,一组赋予饮食搞预,另一组赋予疏通搞预.通过6个月的考查后,该医死沉新丈量受试者的胆固醇浓度,分为下战平常二类.该医死支集了受试者交受的搞预要领(intervention)战考查中断时胆固醇的危害程度(risk_level)等变量疑息,并依照分类汇总整治,部分数据如下:注释:本钻研将胆固醇浓度分为“下”战“平常”二类,不过为了分解的便当,本去不代表临床诊疗截止.2、对于问题的分解钻研者念推断搞预后多个分组情况的分歧.如本钻研中通过落胆固醇药物、饮食战疏通搞预后,比较各组胆固醇浓度的变更情况.针对于那种情况,咱们修议使用卡圆考验(2×C),然而需要先谦脚5项假设:假设1:瞅测变量是二分类变量,如本钻研中考查中断时胆固醇的危害程度变量是二分类变量.假设2:存留多个分组(>2个),如本钻研有3个分歧的搞预组.假设3:具备相互独力的瞅测值,如本钻研中诸位受试者的疑息皆是独力的,不会相互搞扰.假设4:钻研安排必须谦脚:(a) 样本具备代表性,如本钻研正在下胆固醇、死计习惯好的人群中随机抽与150位受试者;(b) 手段分组,不妨是前瞻性的,也不妨是回瞅性的,如本钻研中将受试者随机分成3组,分别赋予落胆固醇药物、饮食战疏通搞预.假设5:样本量脚够大,最小的样本量央供为分解中的任一预测频数大于5.经分解,本钻研数据切合假设1-4,那么该当怎么样考验假设5,并举止卡圆考验(2×C)呢?3、思维导图4、SPSS支配4.1 数据加权正在举止正式支配之前,咱们需要先对于数据加权,如下:(1)正在主页里面打Data→Weight Cases弹出下图:(2)面打Weight cases by,激活Frequency Variable窗心(3)将freq变量搁进Frequency Variable栏(4)面打OK4.2 考验假设5数据加权之后,咱们要推断钻研数据是可谦脚样本量央供,如下:(1)正在主页里面打Analyze→Descriptive Statistics→Crosstabs弹出下图:(2)将变量intervention战risk_level分别搁进Row(s)栏战Column(s)栏(3)面打Statistics,弹出下图:(4)面打Chi-square(5)面打Continue→Cells(6)面打Counts栏中的Expected选项(7)面打Continue→OK经上述支配,SPSS输出预期频数截止如下:该表隐现,本钻研最小的预测频数是24.7,大于5,谦脚假设5,具备脚够的样本量.Chi-Square Tests 表格也对于该截止搞出提示,如下标注部分:即正在本钻研中,不小于5的预测频数,不妨曲交举止卡圆考验(2×C).那么,如果存留预测频数小于5的情况,咱们该当怎么办呢?普遍去道,如果预测频数小于5,便需要举止Fisher透彻考验(2×C),咱们将正在后里推支的真质中背大家仔细介绍.4.3 卡圆考验(2×C)的SPSS支配(1)弹出下图:(2)(3)(4)(5)面打Percentage栏中的Column选项(6)4.4 组间比较(1)弹出下图:(2)面打Cells,弹出下图:(3)面打z-test栏中的Compare column proportions战Adjust p-values (Bonferroni method)选项(4)5、截止阐明5.1 统计形貌正在举止卡圆考验(2×C)的截止分解之前,咱们需要先对于钻研数据有个基础的相识.SPSS输出截止如下:该表提示,本钻研公有150位受试者,根据搞预办法均分为3组.正在考查中断时,药物搞预组的50位受试者中有16位胆固醇浓度下,饮食搞预组的50位受试者中有28位胆固醇浓度下,而疏通搞预组的50位受试者中有30位胆固醇浓度下,如下标注部分:由此可睹,药物搞预比饮食或者疏通搞预的疗效更佳.共时,该表也提示,药物搞预组的50位受试者中有34位胆固醇浓度下落,饮食搞预组的50位受试者中有22位胆固醇浓度下落,而疏通搞预组的50位受试者中惟有20位胆固醇浓度下落,如下标注部分:然而是,当各组样本量分歧时,频数会误导人们对于数据的明白.果此,咱们推荐使用频次去分解截止,如下标注部分:该表提示,药物搞预组的50位受试者中68%胆固醇浓度下落,饮食搞预组的50位受试者中44%胆固醇浓度下落,而疏通搞预组的50位受试者中惟有40%胆固醇浓度下落,提示药物搞预比饮食战疏通搞预更灵验.然而是那种曲交的数据比较大概受到抽样缺面的效率,可疑性不强,咱们还需要举止统计教考验.5.2 卡圆考验(2×C)截止本钻研中任一预测频数均大于5,所以根据Chi-Square Tests表格分解各组的不共.SPSS输出考验截止如下:卡圆考验(2×C)截止隐现χ2=9.175,P = 0.010,证明本钻研中各组之间率的好值与0的好别具备统计教意义,提示药物搞预与饮食、疏通搞预正在落矮受试者胆固醇浓度的效率上存留分歧.如果P>0.05,那么便证明各组之间率的好值与0的好别不统计教意义,即不认为各组之间存留好别.5.3 卡圆考验(2×C)中的成对于比较分解如果卡圆考验(2×C)的P<0.05,证明起码有二组之间的好别存留统计教意义.SPSS输出的risk_level * intervention Crosstabulation表格通过数字标记表记标帜提示了二二比较的截止,如下标注部分:大家大概会注意到,每组数据的标记表记标帜相共(即上下二止的标记表记标帜相共),那么咱们只消知讲组间标记表记标帜的效率即可.那么,risk_level * intervention Cross tabulation表格的标记表记标帜是什么意义呢?第一种情况,各组间无好别,如下:如上图,各组间标记表记标帜普遍,证明各组之间无好别.第二种情况,任性二组之间均存留好别,如下:即每组标记表记标帜字母均不相共,证明任性二组之间的好别均存留统计教意义.第三种情况,有些组之间存留好别,而另一些组之间的好别不统计教意义,如下:如果任二组之间标记表记标帜字母相共,证明那二组之间的好别不统计教意义;如果二组标记表记标帜字母分歧,证明那二组之间的好别存留统计教意义.根据那一准则,分解本钻研截止如下:该表证明,正在本钻研中,药物搞预的落胆固醇效率(“a”)与饮食搞预的落胆固醇效率(“b”)的好别存留统计教意义(P<0.05),药物搞预的落胆固醇效率(“a”)也与疏通搞预的落胆固醇效率(“b”)的好别存留统计教意义(P<0.05),而饮食搞预(“b”)与疏通搞预(“b”)正在落胆固醇的效率上不好别.6、撰写论断6.1 若卡圆考验(2×本钻研招募150位下胆固醇、死计习惯好的受试者,随机分组后分别赋予药物、饮食战疏通搞预.考查中断时,药物搞预组有34位(68%)胆固醇浓度下落,饮食搞预组有22位(44%)胆固醇浓度下落,而疏通搞预组有20位(40%)胆固醇浓度下落,三组好别具备统计教意义(P=0.010).成对于比较截止提示,药物搞预的落胆固醇效验佳于饮食或者疏通搞预(P<0.05),而饮食与疏通搞预正在落矮胆固醇浓度上的效率无好别(P>0.05).6.2 若卡圆考验(2×C)的P≥本钻研招募150位下胆固醇、死计习惯好的受试者,随机分组后分别赋予药物、饮食战疏通搞预.考查中断时,药物搞预组有24位(48%)胆固醇浓度下落,饮食搞预组有22位(44%)胆固醇浓度下落,而疏通搞预组有20位(40%)胆固醇浓度下落,三组截止的好别不统计教意义(P=0.620).。
SPSS如何实现多个样本率多重比较

SPSS实现多组率的两两比较多组率的比较是在医学研究中常常会遇到的问题,其通常被列为R×2表进行χ2检验,其结果仅能说明多个率间的差别有统计学意义,并不能对两两之间差别做出检验。
而将其分割成2 ×2表虽可行两两比较,但不宜用独立四格表的显著界值。
针对这个问题,本文就如何使用国际通用SPSS软件实现该方法,给出具体解决方案。
如图1一组病例资料。
拟对上述资料进行统计分析。
将上述资料按图2进行SPSS录入。
要求:将各组按观察率从小到大排列,本例有效率恰好已是升序排列,故无需再排序。
经过交叉表对三组资料进行卡方检验后,具有统计学意义。
下一步进行两两比较。
操作步骤①权变量:由于“数据”变量中数据并非真正的每条记录数据,而是频数资料,所以要加权,其步骤如下:Data→Weight Case→选择⊙weight case by单选按钮→将“数据”变量添加到Frequency Variable框内→OK。
②选择记录:根据杜养志法,需分别将G1组与第Gi ( i = 2, 3, ⋯⋯k)组进行非独立2 ×2表,步骤如下:Data→Select Case→选择⊙If condition is satisfied单选按钮→点击其下方的If⋯⋯按钮→在右上方框体内录入引号内的内容:“行变量= 1 or行变量= i”( i根据所比的具体组的序数而定) →continue→OK。
③卡方检验: Analyze →Descrip tive Statisics →Crosstable→将“行变量”放入Row框体中→将“列变量”放入column框体中→Statisics→选择Chi - square→continue→OK。
④重复选择记录步骤,选择新的比较组,再行卡方检验,直到所有组均与G1比较过为止。
经过分析后,得出下图结果。
然后根据下图“杜养志非独立的2 ×2表的χ2 值著界值表”确定界值。
卡方检验SPSS操作

鳞癌 腺癌 腺鳞 癌 小细 胞癌
e ffe ct
表达
不表 达
95
40
65
30
20
10
10
10
1 90
90
T o ta l 1 35 95 30 20 2 80
Chi-Square Tests
Pearson Chi-Square
Value 3.348a
df 3
Asymp. Sig. (2 -si d e d) .341
Value 24.894b
22.817
df 1 1
Asymp. Sig. (2 -si d e d) .000
.000
Exact Sig. Exact Sig. (2-sided) (1-sided)
Likelihood Ratio
26.229
1
.000
Fisher's Exact Test
.000
42
步骤: 2、变量加权:按频数加权
43
步骤:3、分析:选 Analyze Descriptive
Statistics
crosstabs…
用Statistics 选择要输出的统计量, 选择Chi-square 。 44
检验结果
Count
group T o ta l
患者 健康 人
group * 血 型 Cross tabulation
A法 T o ta l
阳 阴性
B法 阳性
70 5
75
阴性 20 5 25
T o ta l 90 10
100
Chi-Square Tests
McNemar Test
Value
SPSS卡方检验

• 结果3:OR的均一性检验,用两种方法比较 性别之间OR是否存在差异(p=0.001)。 说明男性高于女性
• 结果4:又称协变量分析,将性别当做协变 量,即剔除性别这个影响后吸烟与肺癌的 关系。结果显示在剔除性别影响后,吸烟 和肺癌仍然显著相关,即吸烟史导致肺癌 的危险因素。
• 结果5:又称公共OR值估计,合并OR值为2.812,95%置 信区间不包括1,且与1相比差异有显著性(p=0.000) • 注意:经OR值均一性检验各层OR值有显著差异时,不宜 计算公共OR值
关于OR值
• Odds Ratio:相对危险度(也称比值比、优 势比) • 指病例组中暴露人数与非暴露人数的比值 除以对照组中暴露人数与非暴露人数的比 值。 • 涵义:暴露者的疾病危险度为非暴露者的 多少倍。OR>1说明疾病的危险度因暴露而 增加,暴露与疾病为“正”关联。OR<1说 明疾病的危险度因暴露而减少,“负”关 联
• 1.相关性:计算Pearson和 Spearsmen相关系数,用以 说明行变量和列变量的相关 程度。 • 2相依系数:又称列联系数。 也是用来说明相关性。 • 3.Gamma :测量两个等级变 量之间关联度的统计量 • 4.Kappa:Kappa系数,见 下文
• • • •
观察值:观察频数 期望值:期望频数 行百分比:给出行变量百分比 列百分比:给出列变量百分比
(4)结果解释:
Pearson 卡方:非校正卡方检验 连续校正:仅适用于四格表
Fisher 的精确检验:Fisher确切概率检验,也仅 适用于四格表资料 似然比:似然比卡方检验,适用
R C表资料
线性和线性组合:线性相关性检验,两变量均为 等级变量,且从小到大排列时方有意义,其他 情况忽略
SPSS卡方检验

• 结果3:OR的均一性检验,用两种方法比较 性别之间OR是否存在差异(p=0.001)。 说明男性高于女性
• 结果4:又称协变量分析,将性别当做协变 量,即剔除性别这个影响后吸烟与肺癌的 关系。结果显示在剔除性别影响后,吸烟 和肺癌仍然显著相关,即吸烟史导致肺癌 的危险因素。
• 结果5:又称公共OR值估计,合并OR值为2.812,95%置 信区间不包括1,且与1相比差异有显著性(p=0.000) • 注意:经OR值均一性检验各层OR值有显著差异时,不宜 计算公共OR值
'
k(k 1 )/21
例 3个实验组间的两两比较,其检验水准 面公式估计如下
'
'
用上
0 . 0 1 2 5 3 ( 3 1 ) /2 1
2.实验组与同一个对照组的比较 公式如下
2( k 1)
'
SPSS进行两两比较
有两种方式 1.第一种,直接通过“选择个案“来筛选数据。
spss18.0卡方检验
主要内容
• 1.两独立样本率比较的卡方检验
• 2.配对计数资料的卡方检验 • 3.分层资料的卡方检验
• 4.卡方的两两比较
一、两独立样本的卡方检验
列联表资料:指两个或者多个分类变量各水平组合频数分 布表,又称频数交叉表,简称交叉表(Crosstabs)。 下表为四格表
操作过程 (1)建立数据文件(chi2_2.sav) 数据格式:4行3列(如下图)
• 第二种方法:SPSS语法修改。 选择“黏贴”选项,进行修改。
• 通过修改个案选择和黏贴交叉表的语法 • 也可以直接进行交叉表语法的修改
练习
• 练习一:某医院欲比较异梨醇口服液(实 验组)和氢氯噻嗪+地塞米松(对照)降低 颅内压的疗效。将200例颅内压增高患者随 机分为两组。见下表。问两组降低颅内压 的总体有效率有无差别
多个样本率的卡方检验及两两比较之spss超简单

多个样本率的卡方检验及两两比较之s p s s超简单Document number【SA80SAB-SAA9SYT-SAATC-SA6UT-SA18】S P S S:多个样本率的卡方检验及两两比较来自:医咖会医咖会之前推送过“两个率的比较(卡方检验)及Fisher精确检验的SPSS教程”,小伙伴们都掌握了吗如果不止两个分组,又该如何进行卡方检验以及之后的两两比较呢来看详细教程吧!1、问题与数据某医生拟探讨药物以外的其他方法是否可降低患者的胆固醇浓度,如增强体育锻炼、减少体重及改善饮食习惯等。
该医生招募了150位高胆固醇、生活习惯差的受试者,并将其随机分成3组。
其中一组给予降胆固醇药物,一组给予饮食干预,另一组给予运动干预。
经过6个月的试验后,该医生重新测量受试者的胆固醇浓度,分为高和正常两类。
该医生收集了受试者接受的干预方法(intervention)和试验结束时胆固醇的风险程度(risk_level)等变量信息,并按照分类汇总整理,部分数据如下:注释:本研究将胆固醇浓度分为“高”和“正常”两类,只是为了分析的方便,并不代表临床诊断结果。
2、对问题的分析研究者想判断干预后多个分组情况的不同。
如本研究中经过降胆固醇药物、饮食和运动干预后,比较各组胆固醇浓度的变化情况。
针对这种情况,我们建议使用卡方检验(2×C),但需要先满足5项假设:假设1:观测变量是二分类变量,如本研究中试验结束时胆固醇的风险程度变量是二分类变量。
假设2:存在多个分组(>2个),如本研究有3个不同的干预组。
假设3:具有相互独立的观测值,如本研究中各位受试者的信息都是独立的,不会相互干扰。
假设4:研究设计必须满足:(a) 样本具有代表性,如本研究在高胆固醇、生活习惯差的人群中随机抽取150位受试者;(b) 目的分组,可以是前瞻性的,也可以是回顾性的,如本研究中将受试者随机分成3组,分别给予降胆固醇药物、饮食和运动干预。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS:多个样本率的卡方检验及两两比较来自:医咖会
医咖会之前推送过“两个率的比较(卡方检验)及Fisher精确检验的SPSS教程”,小伙伴们都掌握了吗如果不止两个分组,又该如何进行卡方检验以及之后的两两比较呢来看详细教程吧!
1、问题与数据
某医生拟探讨药物以外的其他方法是否可降低患者的胆固醇浓度,如增强体育锻炼、减少体重及改善饮食习惯等。
该医生招募了150位高胆固醇、生活习惯差的受试者,并将其随机分成3组。
其中一组给予降胆固醇药物,一组给予饮食干预,另一组给予运动干预。
经过6个月的试验后,该医生重新测量受试者的胆固醇浓度,分为高和正常两类。
该医生收集了受试者接受的干预方法(intervention)和试验结束时胆固醇的风险程度(risk_level)等变量信息,并按照分类汇总整理,部分数据如下:
注释:本研究将胆固醇浓度分为“高”和“正常”两类,只是为了分析的方便,并不代表临床诊断结果。
2、对问题的分析
研究者想判断干预后多个分组情况的不同。
如本研究中经过降胆固醇药物、饮食和运动干预后,比较各组胆固醇浓度的变化情况。
针对这种情况,我们建议使用卡方检验(2×C),但需要先满足5项假设:
假设1:观测变量是二分类变量,如本研究中试验结束时胆固醇的风险程度变量是二分类变量。
假设2:存在多个分组(>2个),如本研究有3个不同的干预组。
假设3:具有相互独立的观测值,如本研究中各位受试者的信息都是独立的,不会相互干扰。
假设4:研究设计必须满足:(a) 样本具有代表性,如本研究在高胆固醇、生活习惯差的人群中随机抽取150位受试者;(b) 目的分组,可以是前瞻性的,也可以是回顾性的,如本研究中将受试者随机分成3组,分别给予降胆固醇药物、饮食和运动干预。
假设5:样本量足够大,最小的样本量要求为分析中的任一预测频数大于5。
经分析,本研究数据符合假设1-4,那么应该如何检验假设5,并进行卡方检验(2×C)呢
3、思维导图
4、SPSS操作
数据加权
在进行正式操作之前,我们需要先对数据加权,如下:
(1)在主页面点击Data→Weight Cases
弹出下图:
(2)点击Weight cases by,激活Frequency Variable窗口
(3)将freq变量放入Frequency Variable栏
(4)点击OK
检验假设5
数据加权之后,我们要判断研究数据是否满足样本量要求,如下:
(1)在主页面点击Analyze→Descriptive Statistics→Crosstabs
弹出下图:
(2)将变量intervention和risk_level分别放入Row(s)栏和Column(s)栏
(3)点击Statistics,弹出下图:
(4)点击Chi-square
(5)点击Continue→Cells
(6)点击Counts栏中的Expected选项
(7)点击Continue→OK
经上述操作,SPSS输出预期频数结果如下:
该表显示,本研究最小的预测频数是,大于5,满足假设5,具有足够的样本量。
Chi-Square Tests 表格也对该结果做出提示,如下标注部分:
即在本研究中,没有小于5的预测频数,可以直接进行卡方检验(2×C)。
那么,如果存在预测频数小于5的情况,我们应该怎么办呢一般来说,如果预测频数小于5,就需要进行Fisher精确检验(2×C),我们将在后面推送的内容中向大家详细介绍。
卡方检验(2×C)的SPSS操作
(1)
弹出下图:
(2)
(3)
(4)
(5)点击Percentage栏中的Column选项
(6)
组间比较
(1)
弹出下图:
(2)点击Cells,弹出下图:
(3)点击z-test栏中的Compare column proportions和Adjust p-values (Bonferroni method)选项
(4)
5、结果解释
统计描述
在进行卡方检验(2×C)的结果分析之前,我们需要先对研究数据有个基本的了解。
SPSS 输出结果如下:
该表提示,本研究共有150位受试者,根据干预方式均分为3组。
在试验结束时,药物干预组的50位受试者中有16位胆固醇浓度高,饮食干预组的50位受试者中有28位胆固醇浓度高,而运动干预组的50位受试者中有30位胆固醇浓度高,如下标注部分:
由此可见,药物干预比饮食或运动干预的疗效更好。
同时,该表也提示,药物干预组的50位受试者中有34位胆固醇浓度下降,饮食干预组的50位受试者中有22位胆固醇浓度下降,而运动干预组的50位受试者中只有20位胆固醇浓度下降,如下标注部分:
但是,当各组样本量不同时,频数会误导人们对数据的理解。
因此,我们推荐使用频率来分析结果,如下标注部分:
该表提示,药物干预组的50位受试者中68%胆固醇浓度下降,饮食干预组的50位受试者中44%胆固醇浓度下降,而运动干预组的50位受试者中只有40%胆固醇浓度下降,提示药物干预比饮食和运动干预更有效。
但是这种直接的数据比较可能受到抽样误差的影响,可信性不强,我们还需要进行统计学检验。
卡方检验(2×C)结果
本研究中任一预测频数均大于5,所以根据Chi-Square Tests表格分析各组的差别。
SPSS输出检验结果如下:
卡方检验(2×C)结果显示χ2=,P = ,说明本研究中各组之间率的差值与0的差异具有统计学意义,提示药物干预与饮食、运动干预在降低受试者胆固醇浓度的作用上存在不同。
如果P>,那么就说明各组之间率的差值与0的差异没有统计学意义,即不认为各组之间存在差异。
卡方检验(2×C)中的成对比较分析
如果卡方检验(2×C)的P<,说明至少有两组之间的差异存在统计学意义。
SPSS输出的risk_level * intervention Crosstabulation表格通过数字标记提示了两两比较的结果,如下标注部分:
大家可能会注意到,每组数据的标记相同(即上下两行的标记相同),那么我们只要知道组间标记的作用即可。
那么,risk_level * intervention Cross tabulation表格的标记是什么意思呢第一种情况,各组间无差异,如下:
如上图,各组间标记一致,说明各组之间无差异。
第二种情况,任意两组之间均存在差异,如下:
即每组标记字母均不相同,说明任意两组之间的差异均存在统计学意义。
第三种情况,有些组之间存在差异,而另一些组之间的差异没有统计学意义,如下:
如果任两组之间标记字母相同,说明这两组之间的差异没有统计学意义;如果两组标记字母不同,说明这两组之间的差异存在统计学意义。
根据这一原则,分析本研究结果如下:
该表说明,在本研究中,药物干预的降胆固醇作用(“a”)与饮食干预的降胆固醇作用(“b”)的差异存在统计学意义(P<,药物干预的降胆固醇作用(“a”)也与运动干预的降胆固醇作用(“b”)的差异存在统计学意义(P<,而饮食干预(“b”)与运动干预(“b”)在降胆固醇的作用上没有差异。
6、撰写结论
若卡方检验(2×C)的P<
本研究招募150位高胆固醇、生活习惯差的受试者,随机分组后分别给予药物、饮食和运动干预。
试验结束时,药物干预组有34位(68%)胆固醇浓度下降,饮食干预组有22位(44%)胆固醇浓度下降,而运动干预组有20位(40%)胆固醇浓度下降,三组差异具有统计学意义(P=。
成对比较结果提示,药物干预的降胆固醇效果好于饮食或运动干预(P<,而饮食与运动干预在降低胆固醇浓度上的作用无差异(P>。
若卡方检验(2×C)的P≥
本研究招募150位高胆固醇、生活习惯差的受试者,随机分组后分别给予药物、饮食和运动干预。
试验结束时,药物干预组有24位(48%)胆固醇浓度下降,饮食干预组有22位(44%)胆固醇浓度下降,而运动干预组有20位(40%)胆固醇浓度下降,三组结果的差异没有统计学意义(P=)。