第8章卡方检验 SPSS卫生统计学_

合集下载

统计学方法总结2spss做卡方检验的方法

统计学方法总结2spss做卡方检验的方法

统计学方法总结2spss做卡方检验的方法第一篇:统计学方法总结2spss做卡方检验的方法通过看网上的spss教程,发现用spss做卡方检验有俩种方法,特简单介绍下,若有错漏请补充,安江。

以比较两个组别(实验组与对照组)的男女差异为例。

方法一、 如下图所示设置三个变量(组别、性别、人数)再给“组别”以及“性别”变量添加值点输入数据(我是随机的)④如下图进行数据加权(教程上要求有这步,原因不明,查了一下有人说是因为这些数据不是原始数据,而是频数表数据,所以要进行预处理)⑤依次打开:分析(analyze)--描述统计(descriptive)--交叉表(crosstabs),打开交叉表对话框,按图所示将“组别”“性别”分别添加进“行”“列”中,点击交叉表对话框里的“统计量”(statistics),勾选“卡方”以及“McNemar”,点击交叉表对话框里的“单元格”(cell),勾选“行”。

⑥点击“确定”,出现最后结果。

会出现三张表,主要看第三张表的pearson卡方检验,渐进sig(双侧)值大于0.05,因此认为不同的性别对两组无显著的差别。

最后还得看一下第三张表下面的a中小于5的理论频数不能超过20%,超过了则本次检验不正确,需要(1)增加样本含量,(2)进行合理合并或删除分类。

方法二、貌似方法二只适用于俩个变量的,列如比较若干组的人数差异性 如下图所示设置两个变量(组别、人数)再给“组别”变量添加值输入数据(我是随机的)④加权处理不知道需不需要,教程上并没有,不过方法一中的解释如果正确,那么次方法也是需要预处理的。

⑤找到非参数检验->旧对话框->卡方检验,将其单击单击打开,将“人数”添加到“检验变量列表”中,点击“选项”,勾选“描述性”⑥点击“确定”,出现最后结果。

会出现三张表,主要看第三张表的渐进显著性值小于0.05,因此认为人数对组别有显著的差别。

最后还得看一下第三张表下面的a中小于5的理论频数不能超过20%,超过了则本次检验不正确,需要(1)增加样本含量,(2)进行合理合并或删除分类。

卫生统计学卡方检验课件

卫生统计学卡方检验课件

2/19/2021
卫生统计学卡方检验
7
若H0成立,则理论上:
奥美拉唑组愈合人数:
115
T11
85 57.84 169
奥美拉唑组未愈合人数:
T12
8554 27.16 169
雷尼替丁组愈合人数:
T21
8411557.16 2/19/2012619
T nRnC n
雷尼替丁组未愈合人数:
T22
8454 26.84 169
2/19/2021
卫生统计学卡方检验
3
表1 两药治疗消化道溃疡4周后疗效
两组的愈合率不同有两种可能:
1. 两药的总体愈合率无差别,两样本率的差别仅由抽 样误差所致。
2. 两种药物的总体愈合率确有不同。
2/19/2021
卫生统计学卡方检验
4
一、卡方检验的基本思想
表1中,64、21、51、33 是整个表的基本数据,其余
卫生统计学卡方检验
8
TRC
nR nC n
n R 为相应行的合计
n C 为相应列的合计
n 为总例数。
2/19/2021
卫生统计学卡方检验
9
表1 两药治疗消化道溃疡4周后疗效
2/19/2021
卫生统计学卡方检验
10
2 检验的基本公式:
2 (AT)2
T
2/19/2021
从基本公式可以看出, 2 统计量值反映了实际频数和理 论频数的吻合程度。如果假设检验H0 (π1=π2)成立,则 实际频数和理论频数之差一 般不会相差太大, 2值相 应也不会太大; 反之,实际频数和理论频数之差相差 很大卫,生则统计 学2 值卡相方检应验也会很大,11 相应的P值也就越小,

卡方检验的SPSS操作

卡方检验的SPSS操作
a Continuity Correction 11.836
df
b. 0 cells (.0%) have expected count less than 5. The minimum expected count 16. c. Binomial distribution used.
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
又如模拟值和实际值之间的检验
两种治疗方法的疗效比较
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
首先建立数据文件,如下。
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
四格表卡方检验
注意:由于上表给出的不是原始数据,而是频数表数据,应 该进行预处理。
沈毅 沈毅
卡方检验基础-卡方分布
当n比较大时, χ2 统计量近似服从k -1个自由度的χ2分布。 在自由度固定时,每个χ 2 值与一个概率值( P 值)相对 应,此概率值即为在H0 成立的前提下,出现这样一个样本 或偏离假设总体更远的样本的概率。如果 P 值小于或等于 显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不 一致。如果 P 值大于显著性水准,则不拒绝H0 ,认为观察 频数与期望频数无显著性差异。 P 值越小,说明H0 假设正 确的可能性越小; P 值越大,说明H0 假设正确的可能性越 大。 浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室 沈毅 沈毅
浙江大学医学院流行病与卫生统计学教研室 浙江大学医学院流行病与卫生统计学教研室
沈毅 沈毅
一致性检验

卫生统计学卡方检验

卫生统计学卡方检验

卫生统计学卡方检验
26/94
(一) 多个样本率比较
例3 某研究者欲比较A、B、C 三种方案治疗轻、中度 高血压疗效,将年纪在50~70岁240例轻、中度高血压患 者随机等分为3组,分别采取三种方案治疗。一个疗程 后观察疗效,结果见表11.4。问三种方案治疗轻、中度 高血压有效率有没有差异?
卫生统计学卡方检验
卫生统计学卡方检验
29/94
④ 确定P值
υ=(3-1)(2-1)=2,查 2 界值表得P<0.01。
⑤ 下结论
因为P<0.01,按α=0.05水准,拒绝H0,接收 H1,差异有统计学意义。即可认为三种方案治疗轻 、
中度高血压有效率不等或不全等
卫生统计学卡方检验
30/94
例 某市重污染区、普通污染区和农村出生婴儿致畸情 况以下表,问三个地域出生婴儿致畸率有没有差异?
① 建立假设 H0:π1=π2 H1:π1≠π2
② 确定检验水准
α=0.05
③ 计算统计量 2 值
2(2 62-73 6-7 1/2 )27 12 .7 5 3 33 86 29
④ 确定P值
υ=(2-1) (2-1)=1,查 2界值表得P>0.05。
卫生统计学卡方检验
24/94
⑤ 下结论 因为P>0.05,按α=0.05水准,不拒绝H0,差 异无统计学意义。尚不能认为甲、乙两疗法对小 儿单纯性消化不良治愈率不等。
9/94
TRC
nR nC n
n R 为对应行累计
n C 为对应列累计
n 为总例数。
卫生统计学卡方检验
10/94
表1 两药治疗消化道溃疡4周后疗效
卫生统计学卡方检验
11/94

卡方检验SPSS操作

卡方检验SPSS操作

卡方检验SPSS操作卡方检验是一种统计方法,用于比较观察频数与期望频数之间的差异是否显著。

它适用于比较两个或多个分类变量之间的关系,并确定这些变量是否相互独立。

在SPSS中,可以使用交叉表和卡方检验命令来执行卡方检验。

首先,打开SPSS软件并导入待分析的数据文件。

然后,选择“数据”菜单中的“交叉表”选项。

在弹出的交叉表对话框中,将要分析的变量拖拽到“行”和“列”的方框中。

假设我们要比较性别和喜好电影类型之间的关系,那么将性别拖拽到“行”,将电影类型拖拽到“列”。

接下来,在交叉表对话框中,点击“统计”按钮。

在弹出的统计对话框中,选择“卡方”选项,并点击“继续”按钮。

然后,点击“确定”按钮生成交叉表。

SPSS将显示交叉表的结果,包括观察频数、期望频数、卡方值和p值等。

在卡方检验中,我们通过观察频数和期望频数之间的差异来判断两个变量是否相关。

如果差异较大,卡方值较大,p值较小,则说明两个变量之间存在显著关系。

不管是使用交叉表还是描述统计方法进行卡方检验,都需要注意以下几点:1.样本数据应该是随机抽取的,并且足够大。

2.对于交叉表中的每个单元格,期望频数应当大于等于5,以确保卡方检验的可靠性。

3.卡方检验只能检验两个或多个分类变量之间的关系,不能用于比较连续变量。

4.如果卡方检验结果显著,表明两个变量之间存在关联,但不能确定关联的性质或因果关系。

卡方检验在数据分析中有着广泛的应用,可以用于医学研究、市场调查、社会科学等领域。

通过SPSS软件的操作,可以便捷地进行卡方检验,并获取检验结果。

spss卡方检验

spss卡方检验

Likelihood Ratio
73.739
9
.000
Linear-by -Linear
A s sociation
63.389
1
.000
N of Valid Cases
278
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5.42.
例6 某医院观察了三年间四个季节中四种甲状腺疾病检出情 况,整理资料如表6,问四种甲状腺疾病检出情况是否与 季节有关联?
表6 某院季节与甲状腺疾病检出情况关联性分析
甲状腺疾病分类
季节
合计




甲亢
411
451
294
284
1440
亚甲炎
249
329
331
204
1113
甲低
60
61
59
52
232
甲状腺肿瘤
Estimate ln(Estimate) Std. Error of ln(Estimate)
2.791 1.026
.177
Asymp. Sig. (2-sided)
Asymp. 95% ConfidencCeommon Odds
Interval
Ratio
Lower Bound Upper Bound
*
卫生统计学教研组
SPSS卡方检验
河北医科大学公共卫生学院 卫生统计学教研组
内容
1
完全随机设计两样本率比较的假设检验
2
配对设计四格表资料的假设检验
3

医学统计学之卡方检验SPSS操作

医学统计学之卡方检验SPSS操作

Likelihood Ratio
3.159
3
.368
L i ne a r-b y-L i ne a r
Asso ci a tio n
2.358
1
.125
N of Valid Cases
280
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 6.43.
Descriptive Statistics
crosstabs…
25
步骤: 5、定义:行 (row=group)和列(Column= effect)
26
用Statistics 选择要输出的统计量, 选择Chi-square 。
27
检验结果
Co un t g rou p T o ta l
group * effect Crosstabulation
检验水准:a’=0.05/3=0.0167 40
X2=24.894,p=0.000,按a=0.0167水准, 拒绝H0,接受H1,差异有统计学意义, 可认为乙、丙两种疗法对尿路感染治疗效 果有差别,丙疗法优于乙疗法。
41
补充 P100 行×列表资料的x2检验 两组构成比的比较
步骤:1、定义变量并输入数据
Asso ci a ti on
20.217
1
.000
N of Valid Cases
44
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 8. 59.

第8章卡方检验 SPSS卫生统计学

第8章卡方检验 SPSS卫生统计学

结果
五、配对设计 (二)R×R列联表
例8-6
六、四格表的确切概率法(例8-7)
总例数小于40,且有1个格子的理论频数小 于5,读取fisher‘s exact test结果p=0.214
练习
课本169-171页 练习题1、3、5、6
课外延伸内容
Kappa一致性检验
用于检验两种方法结果的一致程度。 crosstabs→statictics:选Kappa exact:选exact
其他两两比较时
设定A组与C组比较 If:组别~=2 或者:If:组别=1∣组别=3
如果想对其中的两个率进行相 互比较时,最好能够采用更加复 杂的分类数据模型,如对数线性 模型或者logistic回归模型进行分 析。 采用列联表分割等方法只能得 到近似的结果。
五、配对设计 (一)配对设计四格表(2×2列联表)
3、anylyze→descriptive statistics→crosstabs
第一个表显示数据处理概况:有效数据 例数、无效数据例数、总例数
第二个表显示列联表的资料,一个期望频数小于5(4.8)
结论:有1个格子的期望频数大于1,小于5,最小 期望频数为4.80 连续校正卡方值(continuity correction) x2=2.624, p=0.105>0.05,差别没有统计学意义。
Kappa检验会利用列联表中的全部信息,而 McNemar检验只关心两者不一致的情况。 对于一致性较好,即绝大多数数据都在主对 角线上的大样本列联表, McNemar检验 可能会失去使用价值。 如对1万个案例进行一致性评价,9995个都 是完全一致的,显然,一致性相当的好, 但McNemar检验只考虑不一致的数据, 反而可能得出有差异的结论。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

皮尔逊卡方值x2(pearson chi-square)=4.130 连续校正x2(continuity correction):仅在2×2表计算.(n≥40, 有
1≤T<5) 似然比值(likelylihood ratio):处理多维表时有更大优势。 费歇尔精确检验(fisher‘s exact test) (n<40或有T<1,四格表
非整数加权
单元格累计权重进行四舍五入 加权前,对个案权重进行四舍五入
加权后,对单元格的累计权重 截去小数点
加权前,对个案权重进行舍位
如果数据文件当前的加权是将函数值作为加 权变量,那么单元格计数就有可能是非整 数加权,此处5个选项,用于处理非整数情 况。
即进行处理后再计算检验统计量。
Exact 对话框
将频数f放入frequency variable栏中
3、anylyze→descriptive statistics→crosstabs
Statistics对话框
Cells对话框
第一个表:显示数据处理概况:有效数据 例数、无效数据例数、ts
第8章卡方检验 SPSS卫生统计学
第八章 χ2 检 验
χ2检验(chi square test)是以χ2 分布为 理论基础的检验方法。
主要用于: 1、分类资料的假设检验。 2、频数分布的拟合优度检验。
2 (A T )2, (行 数 - 1 )(列 数 1 ) T
TRC

皮尔逊卡方值x2=4.130,p=0.042<0.05, 差别有统计学意义。
三、四格表校正卡方检验
1、定义变量,输入数据(例8-2) 设三个变量:
四格表校正卡方检验
例题8-2
2、data→weight cases--激活weight cases对话框。
将频数f放入frequency variable栏中
首先是处理记录缺失情况报告,可见24例 均为有效值。
二、独立样本2×2列联表 卡方检验
例题:例8-1
步 骤:
1、定义变量,输入数据 设三个变量:
处理(r):即行号 状况(c):即列号 频数(f)
加权数据——data-weight cases
2、data→weight cases…激活weight cases对话框。
Crosstabs(列联表)过程构成 两维或多维的各水平的列联表。并 为两维表提供多种检验与相关的计 算。
如果研究者想知道性别和病情分级的交叉频 数分布,以及各种百分比的情况,怎么做? (数据:病人基本资料)
操作步骤: analyze→descriptive statistics→crosstabs Rows框:sex columns框:x0 cells:
4.156
1
.041
Fis her's Exact Tes t
.049
.031
Linear-by-Linear As sociation
4.106
1
.043
N of Valid Cas es
169
puted only for a 2x2 table
b.0 cell s (.0% ) have expected count les s than 5. The m i ni m um expec 84.
如果掌握的是原始资料,可不必转 换成列联表,直接录入即可
程序操作
1、Analyze-Descriptives statistics-Crosstabs
Statistics对话框:选择chi-square
四、R×c列联表的卡方检验
多用于多个率、构成比的比较 例题8-3,步骤 1、定义变量,设三个变量,输入数据 2、weight cases 3、crosstabs
Value Pears on Chi-Square4.130b
Conti nuity Correaction3.487
As ym p. Si g. Exact Sig. Exact Sig.
df
(2-s ided) (2-s ided) (1-s ided)
1
.042
1
.062
Likeli hood Rati o
nR nC n
A:实际频数(actual frequency)
T:理论频数(theoretical frequency)
TRC :第R 行C 列的理论频数 nR :相应的行合计,nC :相应的列合计
一、分类变量的统计描述
1、使用frequencies过程输出频数表 如病例基本资料:
如果研究者希望了解共有多少个患者, 男性和女性各为多少,不同病情等级的人 数有多少?(数据:病人基本资料)
应用frequencies:选入性别(sex)、 病情等级(x0)
首先给出的是统计量列表,因没有选择输出任何统 计量,所以只给出有效统计量。可见共有24名患者的数 据,且这些数据都是完整的,没有缺失值。
接着给出的是性别的频数表
接着给出的是病情分析的频数表
2、使用crosstabs过程输出频数表
percentages:选择row、column、total →continue→ok
Cells 按钮
Residuals:残差 Unstandardized:单元格观
察频数与理论频数之差A-T Standardized: 对(A-T)进行标准化变换 Adjusted Standardized:
调整后的标准化残差,单 元格残差除以标准误
3、anylyze→descriptive statistics→crosstabs
第一个表显示数据处理概况:有效数据 例数、无效数据例数、总例数
第二个表显示列联表的资料,一个期望频数小于5(4.8)
结论:有1个格子的期望频数大于1,小于5,最小 期望频数为4.80
连续校正卡方值(continuity correction) x2=2.624, p=0.105>0.05,差别没有统计学意义。
资料自动给出确切概率法结果)。
线性相关(linear-by-linear association):行、列变量有无线性关 系,列联表分类变量中少用,多用于连续变量。
有效例数(N of valid cases)
结论:有0个格子的期望频数小于5,最 小期望频数为26.84,符合pearson x2 检验的要求。
相关文档
最新文档