第七章 X2检验
第七章 列联表资料的X2检验

• 3、观察结果: 四种形式 ⑴、甲+乙+ a ; ⑵、甲+乙- b; ⑶、甲-乙+ c ; ⑷、甲-乙- d。 • 4、配对资料的专用四格表 • 5、计算公式:McNemar test ⑴、专用公式:b+c>40 P107,式(7-7) ⑵、校正公式:b+c<40 P107,式(7-8) 6、注意事项:⑴、要求资料为配对的计数资 料;⑵要注意配对资料的四格表X2检验的适用 条件
对理论频数太小有以下三种处理办法: A、最好增加样本含量,以增加理论频数。 B、删去上述理论频数太小的行或列。 C、 将太小理论频数所在的行或列与性质相近 的邻行或邻列的实际频数合并。 (2)、当进行多个样本率(或构成比)比较 的X2检验,结论为拒绝检验假设H0时,只能 认为各总体率(或构成比)之间总的来说 有差异,但不能说它们彼此间有差异或某 两个间有差别,还需进一步进行两两比较。 (3)对于有序的R*C表资料不宜用X2检验
(五)、交叉分类2*2表的关联分析
1、 X2检验 2、列联系数r
(六)、2*2配对资料的关联性分析
1r检验)不一样,是四格表 资料X2检验基本的公式 2、列联系数r
(七)、R*C表资料的关联性检验
1、 X2检验 2、列联系数r
(八) 多个样本率比较的X2分割法
(四)、行×列表资料的X2检验
国开作业实用卫生统计学-第七章 行列表 自测练习07参考(含答案)

题目:三个率比较的卡方检验,若P0.05,则结论是?()
选项A:至少有两个总体率有差别
选项B:总体率之间两两有差别
选项C:三个样本率各不相同
选项D:两两样本率之间各不相同
答案:至少有两个总体率有差别
题目:三行四列表作χ2检验,当有4个格子的理论频数1T5时,以下哪项可取?()
选项A:增加样本例数
选项B:仍做χ2检验
选项C:作校正的χ2检验
选项D:应进行适当的合并
答案:增加样本例数
题目:五个样本率比较的χ2检验,若结论拒绝无效假设,如果要推断它们彼此之间不同,或某两者之间有差别,可用什么方法?()
选项A:方差分析
选项B:χ2分割法
选项C:秩和检验
选项D:LSD法
答案:χ2分割法
题目:作多个样本率的假设检验,其检验假设是?()
选项A:π1=π2=……=πn
选项B:X1=X2= (X)
选项C:P1=P2 =……=Pn
选项D:m1= m2=……=mn
答案:π1=π2=……=πn
题目:四行四列表作χ2检验,当有2个格子的理论频数T1时,以下哪项可取?()选项A:仍做χ2检验
选项B:增加样本例数
选项C:应进行适当的合并
选项D:作校正的χ2检验
答案:增加样本例数
题目:行列表资料的χ2检验的目的之一是?()
选项A:推断其总体效应是否不同
选项B:推断其样本效应是否不同
选项C:推断其样本率或构成比是否不同
选项D:推断其总体率或构成比是否不同
答案:推断其总体率或构成比是否不同。
第7章 x2检验

例7-3:某实验室采用两种方法对58名可疑 红斑狼疮患者的血清抗体进行测定,问:两 方法测定结果阳性检出率是否有差别?
表7-3 两种方法的检测结果 免疫荧光法 + - 乳胶凝集法
合计
+ 11(a) 2(c) 13
- 12(b) 33(d) 45
合计 23 35
58
检测结果一致: (a)免+乳+ ,(d) 免-乳检测结果不一致:(b) 免+乳- , (c)免-乳+ 比较两种检测方法有无差异时,只需比较不一致的 结果 。
感染率 18.18 45.45 27.27
一、基本思想
1.各组合概率Pi的计算 周边合计不变的条件下,表内4个实际频数 变动的组合数共有“周边合计中最小数+1”
表7-4 两组新生儿HBV感染率的比较 组别 阳性 阴性 合计 感染率(%) 预防注射组 4 18 22 18.18 非预防组 5 6 11 45.45 合计 9 24 33 27.27
公式:
b c 40
2 ( b c ) 2 x , bc b c 40
v 1
(7 7)
(| b c | 1) x , bc
2 2
v 1
(7 8)
1.建立检验的假设,确定检验水准 H0:b=c ;H1:b c =0.05 2.计算 χ2 统计量
b+c=2+12=14<40
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
(a b)! (c d )! (a c)! (b d )! pi a!b!c!d!n!
(7 9)
2.累计概率P的计算 1)单侧检验:现有样本四格表及其以左的所 有四格表组合的累积概率为左侧概率(PL); 现有样本四格表及其以右的所有四格表组合的 累积概率为右侧概率(PR)。 H1为π1>π2,则P单侧 =PR; 若H1为π1<π2,则P单侧=PL 2.双侧检验: 计算满足Pi ≤P*条件下的各种组合之四格表 的累计概率。
第七章 卡方检验

第七章1下列不能用X2检验的是。
A. 成组设计的两样本频率的比较B. 配对设计的两样本频率的比较C. 多个样本频率的比较D. 频率发布的比较E. 等级资料实验效应的比较2.通常分析四格表在情况下需用Fisher精确概率计算法。
A.T<5B.T<1或n<40C.T<1且n<40D.1≤T<5且n<40E.T<5或n<403.三个样本频率比较,X2>X2,可以认为。
0.01(2)A.各总体频率不等或不全相等 B.各总体频率均不相等 C.各样本频率均不相等 D.各样本频率不等或不全相等 E.各总体频率相等4.当四格表的周边合计数不变时,如果某格的实际数有变化,则其理论频数。
A.增大 B.减小 C.不变 D.不确定 E.随该格实际频数的增减而增减5.对于总合计数 n为500的5个样本率的资料做X2检验,其自由度为。
A.499 B.496 C.1 D.4 E.9 6.从甲、乙两篇论文中,查到同类研究的两个率比较的四格表资料以及χ2检验结果,甲论文χ2>χ20.01(1),乙论文χ2>χ20.05(1)。
若甲、乙两论文的样本量相同,则可认为。
A.两论文结果有矛盾 B.两论文结果基本一致 C.甲论文结果更可信D.甲论文结果不可信 E.甲论文说明两总体的差别大7.用两种方法检查已确诊的乳腺癌患者120名,甲法检出率为60%,乙法检出率为50%,甲乙两法的一致检出率为35%,则整理成四格表后表中的d(即两法均未检出者)为。
A.30 B.18 C.24 D.48 E.428.用甲乙两种方法检查已确诊的鼻咽癌患者100名,甲法阳性者80名,乙法阳性者60名,两法均为阳性者50名,欲检验两法结果有无差别,宜选用。
A .普通四格表χ2检验B .配对四格表χ2检验C . u 检验D .t 检验E .秩和检验9. 两组二分类资料发生率比较,样本总例数100,则2χ检验自由度为 。
A. 1B. 4C. 95D. 99E. 10010.设两定性因素为A 和B ,每因素的两水平用+和-表示,则配对四格表的因素和水平搭配为:A .A+,A -,B+,B - B .A+A -,A -A+,B+B -,B -B+C .A+A+,A -A -,B+B+,B -B -D .A+B+,A+B -,A -B+,A -B -E .以上都不是11.三行四列表作2χ检验当有4个格子的1<T<5时, 。
医学统计学总复习(刘桂芬主编-研究生使用) (1)

b. t 检验 c. 用 r 检验来代替。 ④ 作结论:如 P≤0.05, 说明方程成立,列出回归方程;如 P>0.05, 说明方程不成立,不列回归方程。 5. 直线相关的概念 6. 直线相关的主要用途:用于分析两变量是否有相关关系及其方 向
观察人数
期内死亡人数
- 14 -
x~
nx
Dx
0~
25
10
1~
22
20
2~
10
9
3~
11
7
4~
10
1
5~
8
4
6~
4
0
7~
4
1
8~
3
0
9~
3
0
10~
2
0
11~
1
0
第三部分 期末成绩评定
一、成绩评定方法 总评(100%)=平时作业 10%+基础理论知识考试(笔试)60%+操作 技能考试(上机)30% 二、考试题型 (一)基础理论知识考试(笔试)(考试时间:100 分钟) 1、最佳选择题(单选)(30%,30 小题,每题 1 分) 2、辨析题(30%,10 小题,每题 3 分) 3、简答题(10%,2 小题,每题 5 分) 4、分析应用题(30%,5-6 题)
第十六章 生存分析
1.生存资料的特点 2.生存分析的几个基本概念(生存时间、死亡概率与生存概率、生存 率、中位生存期) 3.生存分析的用途 4.生存率计算方法:(1)K-M 法:例数少,且为未分组;(2)寿命表 法:例数多,且为频数表资料(注意:生存概率与生存率的结果) 5.生存率曲线比较:(1)log-rank test:两组或多组;(2)Gehan Score test:两组 6.Cox 模型(不要求) 第二十二章 医学论文统计结果报告
第七章次数资料分析——2检验

表7-3 x 2 计算表
实际观察次 数(A)
理论次数(T)
192
202.5
78
67.5
72
67.5
18
22.5
360
360
A-T
-10.5 +10.5 +4.5
-4.5
0
( A T )2 T
0.5444 1.6333
0.3 0.9
3.377
第二节 适合性检验
▲(五)查临界 x 2 值,作出统计推断 (P346)
★ χ2的连续性矫正
● 当df=1时,计算χ2 值必须进行矫正,计算公式为:
2 c
( A T 0.5)2 T
原因: χ2分布属于连续型随机变量的概率分布,在对 次数资料进行χ2检验时,计算所得的χ2值偏大,概率 偏低,因此需要矫正。
●当df>1时,可不作连续性矫正,但要求各组内的理 论次数不小于5。若某组的理论次数小于5,则应把它 与其相邻的一组或几组合并,直到理论次数大于5为 止。
▲(一)建立假设
H0:实际观察次数之比符合9:3:3:1的理论比例 HA:实际观察次数之比不符合9:3:3:1的理论比例
第二节 适合性检验
▲(二)计算公式
●本例的属性类别分类数k=4, 因此自由度df=k-1=4-1=3,可采用一般公式
x 2 ( A T )2
T
第二节 适合性检验
▲(三)计算理论数
x2检验的显著性三个判断标准
1、x2<x20.05 P>0.05
差异不显著;
2、x20.05≤x2<x20.01 0.01<P≤0.05
差异显著;*
3、x2≥x20.01 P≤0.01
差异极显著;**
第7章 χ2检验

89.02
70.27 80.13
2、计算卡方值 a=73 b=9 c=52 d=22 n=156 2 ( ad bc ) n 2 =8.59 (a b)(a c)(b d )(c d )
(四)四格表资料卡方检验的校正
1、校正条件: n≥40,且 1<T<5(一个及以上格子) 2、基本公式
那么A药组82人中理论上讲有效人数为65.7人
(82*80.13%=65.7),即第一行第一列的理论频
数为82*80.13%=65.7
n n R C 用计算,即 也可以 T RC n
T11=125*82/156=65.7)。
表7-1 两药治疗脑血管栓塞有效率比较
药物 A B 合计 有效 73 (65.7) 52 (59.3) 125 无效 9 (16.3) 22 (14.7) 31 合计 82 74 156 有效率(%) 89.02 70.27 80.13
a c
b d
73 52
9 3
四格表资料的基本形式
处理组 A药 B药 合 计 发生数 未发生数 合计 a+b c+d n
a c a+c
b d b+d
请判断下列a、b、c谁属四格表:两组大白鼠 在不同致癌剂作用下的发癌率如下表,问两组发 癌率有无差别?
表 处理 甲组 乙组 合计 不同致癌剂作用下大白鼠发癌率比较 例数 71 42 113 发癌数 52 39 91 未发癌数 19 3 22 发癌率% 73.24 92.86 80.33
T 怎么求 ?
n n R C T:理论频数(theoretical frequency) TRC n T 第R 行C 列的理论频数
次数资料分析——2检验

这是一个2×4列联表独立性检验的问题。 检验步骤如下: 1. 提出无效假设与备择假设 H0:水牛体型构成比与地区无关,即两地 水牛体型构成比相同。 HA:水牛体型构成比与地区有关,即两地 水牛体型构成比不同。
2. 计算各个理论次数,并填在各观察次数后的括号中 计算方法与2×2表类似,即根据两地水牛体型构
第二节 适合性检验
★判断实际观察的属性类别分配是否符合已知属 性类别分配理论或学说的假设检验称为适合性 检验。
●遗传学上:
一对性状杂种后代的分离现象,3:1; 二对性状杂种后代的分离现象是否符合9:3:3:1; 动物性别比 1:1。
适合性检验方法
(一) 建立假设 (二) 计算实际x2值 (三) 查x2值表,作统计判断
表7—12 2×c 联列表一般形式
表7—12 2×c联列表一般形式
其中Aij(i=1,2;j=1,2,…,c)为实际观察次数。
上一张 下一张 主 页 退 出
第三节 独立性检验
★【例7.8】在甲、乙两地进行水牛体型调查,将 体型按优、良、中、劣四个等级分类,结果见表 7-13。问两地水牛体型构成比是否相同?
●当自由度df=3时,查得
x
2 00( 5 3)
7.。81
x ●由于 2 < x 020(5 3),故P>0.05,不能否定H0,表明
实际观察次数与理论次数差异不显著。因此,可以认为毛
色与角的有无两对性状杂交二代的分离现象符合孟德尔遗
传规律中9:3:3:1的理论比例。
第七章 χ2检验
第三节 独立性检验 ★独立性检验的意义
▲(一)建立假设
H0:实际观察次数之比符合9:3:3:1的理论比例 HA:实际观察次数之比不符合9:3:3:1的理论比例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H 0 : 1 2 (分别为样本率P 、P2、P的总体率) 1
0.05
n 近似地代替 ,理论上应有:
n1 n1 T11 n1 n
T21 n2 n2 n1 n
T12
n1 n2 n1 (1 ) n
n2 n2 n
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第四节 配对设计四格表资料的χ2检验
两种培养基白喉杆菌生长情况
甲 培养基 + + - 合 计
H0: B=C H1: BC 连续性校正:
乙 培养基 - 18(b) 14(d) 32
合计
22 (a) 2 (c) 24
=0.05。
Z1 , Z 2 ,..., Z 互相独立,均服从 N ( 0,1) , 2 2 Z2 ... Z2 的分布称自由度为 的 2 分布, 则 Z1 2 2 ( ) 记为 (2 或 , 或简记为 . )
2 ( )
当自由度〉2 时,随着 得增加,曲线逐渐趋于对称, 当自由度 很大时, 近似地服从正态分布.有 (2 ) Z , (2 的正态分布 ) 服从均数为 ,方差为2 2
AB 型 18(16.22) 8(9.78) 26 184 111 295
合计
H0: 急 性 白 血 病 患 者 与 慢 性 患 者 的 血 型 分 布 构 成 比 相 同
=0.05
2 2 2 2 2 2 58 49 59 18 43 27 2 295 184 101 184 76 184 92 184 26 111 101 111 76 1.839
2
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
四格表专用公式
( A T )2 2 基本公式: T (a b)(a c) 2 (a b)(b d ) 2 (c d )(b d ) 2 a b d abcd abcd abcd (a b)(a c) (a b)(b d ) (c d )(b d ) abcd abcd abcd (ad bc) 2 n 1 ; (四格表专用公式) (a b)(c d )(a c)(b d )
0.2 0.1 0.0 0 3 6 9 12 ¿ ¨· ½ Ö µ
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
15
18
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第二节 四格表资料的χ2检验
表 两种疗法的心血管病病死率比较
(a b)!(c d )!(a c)!(b d )! a!b!c!d!n!
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
2 c 2 ( 2 9 5 26 42 2) 42 28 14 7 35 3.62 , 1
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第三节 行×列(R×C) 2 表资料的χ 检验
行×列表的x2检验是对多个样本率(或构成
=(2- 1)(4- 1)=3, P>0.5。 按 =0.05 水 准 , 不 拒 绝 H0。
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
行×列表x2资料检验的注意事项
表中不宜有1/5以上格子的理论频
数小于5,或有一个格子的理论频 数小于1。 增加样本含量以增大理论数 根据专业知识删减或合并 计算确切概率
药物
有效
无效
合 计 45 35
有效率 (% ) 91.1 68.6
兰芩口服液 41(36.56) 4(8.44) 银黄口服液 24(28.44) 11(6.56)
合
2013-1-15
计
65
15
80
81.3
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
表
反应变量按二项分类的两个独立样本资料 反应结果 阳性 阴性 观察 总频数 阳性 频率
第一节 2 χ 分布和拟合优度检验
一、 χ2分布 二、拟合优度检验
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
2013-1-15
一、
(1) 自由度为 1的
2
2 χ 分布
分布
2 2 若 Z ~ N ( 0,1), 则 Z 的分布称为自由度为1的 分布 . 2 2 (chi-square distribution),记为 (1) 或 (1) .
分析急性白血病与慢性白血病患者的血型分布构成比有无差别?
表 急 性 白 血 病 患 者 与 慢性 白 血 病 患 者 的 血 型 分 布
分组 急性组 慢性组 合计
A 型 58(63.0) 43(38.0) 101 H1: 不 相 同 ,
B 型 49(47.40) 27(34.62) 76
O 型 59(57.38) 33(34.62) 92
比)的检验。 基本公式:x2 = (A-T)2/T 专用公式:x2 =n ×(A2 /n R× n C -1 ) 自由度:=(R-1)×(C-1) 适用条件:表中不宜有1/5以上格子的理 论频数小于5,或有一个格子的理论频数小 于1 。
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
第七章
2 χ 检验
χ2检验(Chi-square test)也称卡方检验, 常用于分类变量资料的统计推断,以χ2分布为 理论基础,是现代统计学的创始人之一,英国 人K . Pearson(1857-1936)于1900年提出的 一种具有广泛用途的统计方法,可用于两个或 多个率间的比较,计数资料的关联度分析,拟 合优度检验等等。
校正公式 :
c2
( A T 0.5) 2 T
,(也适合其它行 列表资料)
c2
2013-1-15
( ad bc n / 2) 2 n (a b)(c d )( a c)(b d )
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
2013-1-15
本章内容
第一节 第二节 第三节 第四节 第五节
χ2分布和拟合优度检验 四格表资料的χ2检验 行×列(R×C)表资料的χ2检验 配对设计四格表资料的χ2检验
四格表资料的确切概率法
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
40 16 56
2
(b c) , bc
2
1
(| b c | 1) 2 , bc
2
1
当 b+c40 时 可 不 校 正 , 而 b+c<40 时 则 一 定 要 校 正 。 本 例 b+c=18+2=20<40, 需 作 连 续 性 校 正 ,
2 ( 18 2 1 ) 2 11.25 , 10 31
实例
表 两零售点猪肉表层沙门氏菌带菌情况检查结果 沙门氏菌 零售点 合计 带菌率(%) 阳性 阴性 甲 2(4.17) 26 (23.33) 28 7.14 乙 5(2.33) 9 (11.67) 14 35.71 合计 7 35 42 16.67
2 42 ( 2 9 5 26 ) 5.49 , 1 2 28 14 7 35
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
卡方检验的基本原理
若检验假设H0:π1=π2成立,四个格子 的实际频数A与理论频数T相差不应该很 2 2 大,即统计量 不应该很大。如果 值很大,即相对应的P值很小,若 , P 则反过来推断 A与T相差太大,超出了抽 样误差允许的范围,从而怀疑H0的正确 性,继而拒绝H0,接受其对立假设H1, 即π1≠π2。
样本 1 样本 2 合计
A11
A21
A12
A22 n 2
n1 ( 给 定 )
P 1 A 11 n1 P2 A21 n2
n 1
n2 ( 给 定 ) n (给 定 )
P n1 n
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
(1)检验 H1 : 1 2 (2)用 P
上述基本公式由Pearson提出,因此软件 上常称这种检验为Pearson卡方检验
2013-1-15
青岛大学医学院公共卫生系流行病 与卫生统计学教研室 周晓彬制作
连续性校正公式
χ2 分布是一连续型分布,而行×列表资料属离散型
分布,对其进行校正称为连续性校正 (correction for continuity),又称Yates校正(Yates' correction)。 ⑴当n ≥40,而1≤T<5时,用连续性校正公式 ⑵当n <40或T<1时,用Fisher精确检验(Fisher exact test )
( AT ) , (行数-1)(列数 1) T
2 ( A T ) 2 T 2 2 2 2 (41 36.56) (4 8.44) (24 28.44) (11 6.56) 6.565 36.56 8.44 28.44 6.56
2013-1-15
6
合计
甲城 市