卡方检验习题教学文案

合集下载

研究生 卡方检验(上机)

研究生 卡方检验(上机)

小儿上消化道出血的有效率是否有差别?
表11.1甲、乙两药治疗小儿上消化道出血的效果
组别 甲药 乙药 合计
有效 27 40 67
无效 18 5 23
合计 45 45 90
有效率(%) 60.00 88.89 74.44
四格表 值的校正
2
T 5且n
40时, 不须校正;
1 T<5, 而n 40时, 需计算校正值, 或改用 四格表确切概率计算法; T<1或n<40时, 需用确切概率计算法。
( A T)2 2 T
A 为实际频数 (actual frequency) T 为理论频数(theoretical frequency)
四格表基本格式
处理 有效 无效 合计 A组 B组 合计 a c a+c b d b+d a+b c+d n
假定两药有效率相等,都为P,则A组有效人数应为(a+b)×p;
Data → Weight Cases… Weight Cases by: Frequency Variable框:f Analyze → Descriptive Statistics → crosstabs… Row(s)框: Column(s)框: Statistics: Chi-square(McNemar ) Continue Cells:Counts Observed Percentages Row Continue OK
作业评讲
综合分析题第2题 3 x 3 析因设计
析因设计与随机区组设计的区别
综合分析第4题
①资料运用的是两样本 t 检验
②会增大 犯Ⅰ型错误的概率,因此不
正确。

《医学统计学》医统-第九章卡方检验

《医学统计学》医统-第九章卡方检验

卡方值
当自由度ν确定后,χ2分布曲线下右侧尾部的面积 为α时,编辑课横件 轴上相应的χ2值记作χ2α,ν
查χ2界值表,得χ20.05,1=3.84,按α=0.05 水 准, 拒绝H0 , 接受H1 , P<0.05,可 以认为两组治疗原发性高血压的总体有 效率不同,即可认为吲达帕胺片治疗原 发性高血压是有效的。
医学统计学
第九章 2检验
公共卫生系 流行病与卫生统计学教研室
祝晓明
一、率
率(rate):率表示在一定空间或时间范围内 某现象的发生数与可能发生的总数之比,说明 某现象出现的强度或频度,通常以百分率 (%)、千分率(‰)、万分率(/万)、或 十万分率(/10万)等来表示。
你们班级的及格率,挂科率怎么算?
❖自由度ν愈大,χ2 值也会愈大;所以 只有考虑了自由度ν的影响,χ2 值才
能正确地反映实际频数A和理论频数T 的吻合程度。
检验的自由度取决于可以自由取值的格子数目,
而不是样本含量n。四格表资料只有两行两 列,ν=1,即在周边合计数固定的情况下,4个基
本数据当中只有一个可以自由取值。
编辑课件
检验步骤: 1.建立检验假设并确定检验水准 H0:π1=π2 即试验组与对照组的总体有效率相等 H1:π1≠π2 即试验组与对照组的总体有效率不等
2
(20 25.77)2
(24 18.23)2
(21 15.23)2
(5 10.77)2
8.40
25.77
18.23
15.23
10.77
(2 1)(2 1) 1
编辑课件
纵高
3.确定P 值,作出推断结论
0.5
0.4
0.3
自由度=1

第八章 卡方分析教学版

第八章 卡方分析教学版
9
2=
i 1
fi -ei
ei
2
3.905, 在计算理论次数的过程中共用到平均数,
标准差和总数三个统计量,故本题的自由度为df 9-3=6,
2 查卡方分布表, 0.05 (6) 12.6, 2 2 0.05 , p 0.05, 故差异不显著,即552名中学生的身高分布
2 (三) 2×2 列联表 检验
因素X 因 素 Y
分类1
分类1 a
分类2
b a+b
分类2
c
a+c
d
b+d
c+d
n
nad bc ~ 2 1 a bc d a cb d
2 2
三、独立性检验
2 (三) 2×2 列联表 检验
观察频数a对应的理论频数为:
二、总体分布的拟合检验
(二)统计假设及相关计算
• H0: f0 = fe H1:
f0 ≠ fe
运用基本公式计算出卡方值 查表,比较其与临界卡方值的大小,如果„„ 注意:卡方值分布全部为正值,但f 0 -f e 可能是负值,因此, 卡方检验是双侧检验,0.05和0.01是指双侧概率而言。 拟合度检验需要先计算理论次数,这是计算卡方值的关键性 步骤。(一般根据某种理论或经验)
符合正态分布。
三、独立性检验
(一)适用材料
主要用于两个或两个以上因素多项分类的计 数资料分析。如果要研究的两个自变量之间是否 具有独立性或有无关联或有无“交互作用”的存 在,就要应用卡方独立性检验。 如果两个子变量是独立的,无关联的,就意 味着对其中一个自变量来说,另一个自变量的多 项分类次数上的变化是在取样误差的范围之内。 假如两个因素是非独立,则称两变量有交互作用。

第五讲卡方检验

第五讲卡方检验

3/19/2015
16
a
b d
2.成组四格表的专用公式
2
c
ad bc n 2 a bb d c d a c
该公式从x2基本公式推导而来,计算较为简单,结果相同。
3/19/2015
17
3.成组四格表χ2检验计算公式的适用条件
(1) 当实验对象总个数 n>40,且所有格子的理论频数 E≥5时, 可用χ2检验基本公式或专用公式计算χ2值。 (2) 当 n>40 ,但有任一格子的理论频数 E 仅满足 1<E<5 时, 需用校正公式:

3/19/2015 12
x2检验的原理:
E χ2检验假设两组率相同,(O-E)2/E 应该很小。

2
O E
2
如果实际频数和理论频数相差的很大, χ2 值也越大。 当 χ2 值比规定的界值还大时,被认为是小概率事件, 就拒绝H0,认为两组率不相同。 因为 χ2 值是对每个格子的 (O-E)2/E 求和,所以格子
自由度:=(2-1) x (2-1)=1 第四步:确定P值 第五步:判断结果
3/19/2015 31
2 (三)行x列表 x 检验
四格表是指只有2行2列,当行数或列数超过2时,统
称为行x列表。
行x列表 x2 检验是对多个样本率(或构成比)的检
验。
基本公式:x2 =(O-E)2/E
O2 n 1 专用公式: n n R C
a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 20. 00.

卡方检验-研究生

卡方检验-研究生
T
44.09
50.91
39.91
46.09
(二)、四格表的专用公式
当n≥40,T≥5时,用 χ2 =
(ad-bc)2 n
(a+b)(c+d)(a+c)(b+d)
a、b、c、d 为四格表的实际频数 (a+b), (c+d), (a+c), (b+d)是四格表周边的合计数 n=a+b+c+d, 为总的样本含量 对例10-7的计算 χ2 = =3.11
(二)样本构成比的比较
(二)样本构成比的比较 例7-7 某医师在研究血管紧张素转化酶(ACE)基因I/D多态与2型糖尿病肾病(DN)的关系时,将249例Ⅱ型糖尿病患肾病分为两组,资料见表7~9。问两组Ⅱ型糖尿病患者的ACE基因型总体分布有无差别? 表7-9 DN组与无DN组Ⅱ型糖尿病患者ACE基因型分布
配对设计包括:
观察的结果只有阳性、阴性两种可能,清点成对资料时只有四种情况: 甲+乙+ 甲+乙- 甲-乙+ 甲-乙-
A
列成下面四格表
B
适用于配对设计的计数资料 配对资料的结果有 甲 乙 结果 + + a + - b - + c - - d
例7~3 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗体进行测定,结果见表7~3。问两种方法的检验结果有无差别? 表7~3 两种方法的检测结果
免疫荧光法
乳胶凝集法
合计
+ —
+ — 合计
χ2 =∑(︱A-T︱-0.5)2
T
χ2 =
(︱ad-bc︱-n/2)2 n
(a+b)(c+d)(a+c)(b+d)
例7-2某医师用两种疗法治疗心绞痛,结果如表10-10,问两种疗法的疗效有无差别? 表10-10 两种疗法治疗心绞痛的效果率

卡方检验

卡方检验
25
总体分布的拟合性检验(2)
• 例:某校314名学生在一次考试中的成绩分 布如下:A等22人,B等94人,C等113人,D 等69人,E等16人。问这一成绩是否服从正 态分布?
26
总体分布的拟合性检验(2)
• 首先,建立假设: • H0:实际成绩的等级人数分布与正态分布所 期待的理论次数分布无显著差异。 • H1:实际成绩的等级人数分布与正态分布所 期待的理论次数分布有显著差异。
2 2 2 2
9
χ2检验的基本公式
• 究竟χ2值大到什么程度才能说样本分布与理 论分布不一致呢?这要看样本的χ2值在其抽 样分布上出现的概率如何而定。 • 我们就用上面的例子说明χ2的抽样分布。如 果将上述所抽取的50个学生还回总体之中,再 从中随机抽取50个学生,又可以计算出一个样 本χ2值。这样反复抽下去,就会有一切可能 个样本χ2值。这一切可能个样本χ2值的分布, 就形成一个实验性的χ2抽样分布。
表 300次掷一颗六面体实验观测结果
点数
频数
I
O
1
43
2
49
3
56
4
45
5
66
6
41
13
总体分布的拟合性检验(1)
• 上例中的数据录入有两种方式,数据编号da ta10-01 和 data10-01a。data10-01是一种 直接录入原始数据的方式,只有一个变量, 在应用中可直接使用,但数据录入量较大。
对话框2
1选择行变量
7单击OK按钮
2单击按钮 3选择列变量 4单击按钮
5单击统计按钮, 进行设置
6单击单元格按钮, 进行设置
47
统计设臵
1选中χ2
2单击按钮

医用统计学-卡方检验2

医用统计学-卡方检验2

220(c+d) 400(a+b+c+d)
2
a
ad bc 2 n b c d a c b
d
χ2=21.65 P<0.05
1
14
2×2表χ2值的连续性校正:
➢ 当n≥40,且T≥5时,不需进行连续性校正(使用基本 公式或专用公式);
➢ 当n≥40,但1≤T<5时,需进行连续性校正;
2
合计 138
正常体重 48(43.3) 42(37.8) 21(18.9)
111
合计
78(31.3) 78(31.3) 93(37.4)
249
24
1.建立检验假设,确定检验水准 H0:两组人群的体育运动习惯的总体构成比相同 H1:两组人群的体育运动习惯的总体构成比不相同 α=0.05 2.选择公式,计算检验统计量
0.5 0.4
f (x2 ) 0.3
v 1
0.2
v6
0.1
0.05 v 10
0 024
3.84
6 8 10 12 14 16
x2
χ2分布规律: 自由度一定时,χ2值越大, P值越小。 当P值一定时,自由度越大,χ2越大。
=1时, χ2 =3.84, P=0.05 χ2 =6.63, P=0.01
根据 =1查2界值表,得P<0.05,按=0.05 的检验水准,拒绝H0,接受H1,提示两种药 物治愈率有差别。
专用公式法:
表8-1 两组流感患者不同疗法治愈率的比较
组别 治愈人数 未治愈人数
合计
中药 144(a)
36(b)
180(a+b)
西药 128(c) 合计 272(a+c)

卡方检验具体操作讲课文档

卡方检验具体操作讲课文档
体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差别对样本所代
表的总体间是否存在着差别做出判断。
现在四页,总共三十七页。
定性资料的假设检验:行×列表卡方检验
基本思想:检验实际频数和理论频数的差别是否由抽样误差 引起,也就是由样本率或样本构成比来推断总体率或总体构 成比。
行×列表的简单形式是:四格表;当行和或列大于2时,统称行 ×列表,或R×C表。
实例:某研究者调查了一批高血压患者的 血压控制情况和肥胖度,结果如下表,请 问两者有无关系。
良好
血压控制情况
尚可
不良
合计
不肥胖
15
24
12
51
肥 轻度肥胖
4
2
7
13


度 中/重度肥胖
20
13
11
44
合计
39
39
30
现在十五页,总共三十七页。
108
二、确切概率法:数据输入
现在十六页,总共三十七页。
卡方检验具体操作
现在一页,总共三十七页。
卡方检验具体操作
现在二页,总共三十七页。
定性资料的统计分析
主要内容
一、四格表卡方检验
二、确切概率的计算 三、配对卡方检验 四、分层卡方检验
现在三页,总共三十七页。
定性资料的统计分析
统计推断:用样本信息推论总体特征的过程。
包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指标量,对总
15
0
47
1
54
12
67
0
7
45
52
33
76
57
166
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

资料收集于网络,如有侵权请联系网站删除
word可编辑
2

检验

练 习 题
一、最佳选择题
1.四格表的周边合计不变时,如果实际频数有变化,则理论频数( )。
A.增大 B.减小 C.不变

D.不确定 E.随a格子实际频数增减而增减
2.有97份血液标本,将每份标本一分为二,分别用血凝试验法和ELISA法对轮状病毒
进行诊断,诊断符合情况见下表,欲比较何种诊断方法的诊断符合率较高,用( )统计
方法?
两种诊断方法的诊断结果

血凝试验法 ELISA法 合计
符合 不符合

符 合 74 8 82
不符合 14 1 15
合 计 88 9 97

A.连续性校正2检验 B.非连续性校正2检验
C.确切概率法 D.配对2检验(McNemar检验)
E.拟合优度2检验

3.做5个样本率的2检验,每组样本量均为50,其自由度为( )。
A 249 B 246 C 1 D 4 E 9

4.对四格表资料做2检验时,如果将四格表的行与列对调,则对调前后的( )。
A.校正2值不等 B.非校正2值不等
C.确切概率检验的P值不等 D.非校正2值相等
E.非校正2值可能相等,也可能不等

二、问答题
资料收集于网络,如有侵权请联系网站删除
word可编辑
1. 简述2检验的基本思想。
2. 四格表2检验有哪两种类型?各自在运用上有何注意事项?
3. 什么情况下使用Fisher确切概率检验两个率的差别?
4. 在回顾性研究和前瞻性研究的四格表中,各自如何定义优势比?

三、计算题
1.前列腺癌患者121名中,82名接受电切术治疗,术后有合并症者11人;39名接受
开放手术治疗,术后有合并症者1人。试分析两种手术的合并症发生率有无差异?

2.苏格兰西南部两个地区献血人员的血型记录见下表,问两地的血型分布是否相同?

两地献血人员的血型分布

地区
血型

合计
A B O
AB

Eskdale 33 6
56
5 100
Annandale 54 14 52 5 125
合计 87 20 108 10 225

3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组
100例,分别给予不同的镇痛处理,观察的镇痛效果见下表,问4种镇痛方法的效果有无差
异?

4种镇痛方法的效果比较
镇痛方法 例数 有效率(%)
颈麻 100 41
注药 100 94
置栓 100 89
对照 100 27
资料收集于网络,如有侵权请联系网站删除
word可编辑
资料收集于网络,如有侵权请联系网站删除

word可编辑
练习题答案
一、最佳选择题解答
1. C 2. D 3. D 4. D

二、问答题解答
1. 答:在2检验的理论公式22ATT中,A为实际频数,T为理论频数。
根据检验假设H0:π1=π2,若H0 成立,则四个格子的实际频数A与理论频数T相差不应
很大,即2统计量不应很大。若2值很大,即相对应的P值很小,比如P≤a,则反过来
推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,
接受其对立假设H1,即π1≠π2。
2. 答:四格表2检验分为两独立样本率检验和两相关样本率检验。两独立样本率检
验应当首先区分其属于非连续性校正2检验,或是连续性校正2检验。非连续性校正
2

检验的理论计算公式为:22ATT,专用计算公式为:


2

2
adbcnabacbdcd



。连续性校正2检验的理论计算公式为:


2
2
0.5ATT



,专用计算公式为222adbcnnabacbdcd;两相关样

本率检验的理论计算公式为:22bcbc,当样本数据b+c<40时,需做连续性校正,
其公式为221cbcbc。
3. 答:当样本量n和理论频数T太小时,如n<40而且T<5,或T<1,或n<20,
应该用确切概率检验,即Fisher检验。
4. 答:暴露组的优势与非暴露组的优势之比就称为优势比,也称为比数比,简记为
OR。前瞻性研究暴露组相对于非暴露组关于非暴露组关于“发病”的优势比,即:
资料收集于网络,如有侵权请联系网站删除
word可编辑


OddacadOROddbdbc暴露

非暴露
;如果资料来自回顾性病例对照研究,则根据“暴露”

相对于“非暴露”的优势计算病例组相对于对照组关于“暴露因素”的优势比,即:


OddabadOROddcdbc病例

对照

三、计算题解答
1.解:
H0:π1=π2,两种治疗方法总体合并症发生率无显著差异
H1:π1≠π2;两种治疗方法总体合并症发生率有明显差异
05.0




2

2
71111381213.48382391210921211






查附表8,因为220.052,13.843.483,故05.0P,按05.0水准,不拒绝
H0 ,即两种治疗方法合并症发生率无显著差异。
2.解:

0
H
:两地的总体血型分布相同

1
H
:两地的总体血型分布不同

05.0


2222
2

2222

336565
225100871002010010810010541452515.71012587125201251081251041213










查附表8,因为220.052,37.815.710,故05.0P,按05.0水准,不拒绝
0
H
,即两地的总体血型分布无显著差异。

3.解:
H0:π1=π2=π3=π4 ,四种镇痛方法总体有效率相同
资料收集于网络,如有侵权请联系网站删除
word可编辑
H1:四种镇痛方法总体有效率不同或不全相同
05.0


2222
2

2222

41948927
40010025110025110025110025159611731146.17510014910014910014910014941213










查附表8,因为220.005/2,312.84146.175,故005.0P,按05.0水准,
拒绝H0 ,接受H1,即四种镇痛方法总体有效率有显著差异,有效率由高到低依次为注药、
置栓、颈麻和对照。

相关文档
最新文档