χ2检验.
医学统计学之卡方x2检验

举例
买彩票
奖项 中奖概率
T
A
一等 1% 10 0
0
二等 5% 50 0
0
三等 10% 100 20
2%
四等 20% 200 180
18%
五等 64% 640 800
80%
二、基本原理
基本思想是检验实际频数和理论频数的差别是否 由抽样误差所引起的,由样本率来推断总体率。
x2反映了实际频数于理论频数的吻合程度,x2值
α=0.05。
T11 =44(41/70)=25.8 T12=44(29/70)=18.2 T21=26(41/70)=15.2 T22 = 26(29/70)=10.8
(2)求检验统计量值
2 (20 25.8)2 (24 18.2)2 (21 15.2)2 (5 10.8)2 8.40
作χ2检验后所得概率P接近检验水准α,需要
计数资料的统计推断
卡方检验是χ2检验(Chi-square test) 是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的 一种具有广泛用途的统计方法,是分类 计数资料的假设检验方法,可用于两个 或多个率间或构成比之间的比较,计数 资料的关联度分析,拟合优度检验等等。
2 检验的应用
①检验两个样本率之间差别的显著性; ②检验多个样本率或构成比之间差别的
显著性; ③配对计数资料的比较; ④检验两个双向无序分类变量是否存在
关联。
某医生想观察一种新药对流感的预防效 果,进行了如下的研究,问此药是否有 效?
组别 实验组 对照组 合计
发病人数 14 30 44
未 发 病人数 86 90 176
观察例数 100 120 220
第五章 χ2检验

χ2的连续性矫正
由上式计算的 χ2 只是近似地服从连续型随机变 量 χ2 分布。在对次数资料迚行χ2 检验利用连续型随 机变量χ2分布计算概率时,常常偏高,特别是当自 由度为1时,偏差较大。
矫正后的χ2值记为χc2
当自由度大于1时, χ2分布与连续型随机变量
χ2分布相近似,这时,可不作连续性矫正,但要
总和
r1 r2
总和
R1= O11 + O12 R2= O21 + O22
C1= O11 + O21
C2= O12 + O22
T
给药方式与给药效果的2×2列联表 给药方式
口服 注射
有效
58 64
无效
40 31
总数
98(R1) 95(R2)
有效率
59.2% 67.4%
总数
122(C1)
71(C2)
193(T)
1.H0 :给药方式与给药效果相互独立。
HA :给药方式与给药效果有关联。
2.给出显著水平α=0.05
3.计算各个理论数 Eij=Ri×Cj/T=行总数×列总数/总数
E11= R1 × C1/T=61.95 E21= R2 × C1/T=60.05 E12= R1 × C2/T=36.05 E22= R2 × C2/T=34.95
本章内容
一、离散型数据 x2 统计量和 x2分布 二、拟合优度检验 三、独立性检验
拟合优度检验 (吻合度检验)
理论数可以通过一定的理论分布或某种学说 推算出。用实际观察数与理论数直接比较,从而得
出两者之间是否吻合,这一类检验称为吻合度检验。
独立性检验
分析两类因子是相互独立还是彼此相关。理论 值的推算没有什么理论或学说作依据,这时可假设 观察的各属性之间没有关联,然后证明这种无关联 的假设是否成立。这种检验称为独立性检验。
医学统计学9 χ2检验

卡方检验的基本原理
反映实际频数与理论频数的吻合程度可用统计量
A
T T
2
来表示
案例分析
某医院采用甲乙两种方法测定60例结核杆菌阳性率, 如下图。试问这两种检测方法阳性率是否相同。
测定方法 阳性数 阴性数 合计
阳性率
甲法
42
18
60
70.0%
乙法
23
37
60
38.3%
合计
65
55
120
54.2%
错误的方法
根据2*2四格表卡方检验方法进行 可求得 2 =12.62, p<0.001;
2
(ad bc)2n
(a b)(a c)(bd )(c d )
c2
(
29 26 5 2 42
2 5 )( 26 9 )( 2 26 )( 5
9
)
5.49
x2,1 3.84
P 0.05
结论与之相反。
配对四格表资料的 χ2 检验
与计量资料推断两总体均数是否有差别有成组设 计和配对设计一样,计数资料推断两个总体率(构 成比)是否有差别也有成组设计和配对设计,即四 格表资料和配对四格表资料。
若检验假设H0:π1=π2成立,四个格子的实际频 数A与理论频数T 相差不应该很大,即统计量不
应该很大。如果上述统计量值很大,从而怀疑H0 的正确性,继而拒绝H0,接受其对立假设H1,即 π1≠π2 。
这个统计量就称为卡方统计量。
医学统计学定性资料的统计分析-χ2检验

29 41
48.28 39.02
H0:1=2; H1:12; =0.05。 本例a格的理论频数最小,T11=1216/41=4.68<5, n>40,故考虑用校正公式计算2 值。
2 C
( 2 15 1014 41/ 2) 12 2916 25
2
41
2 2.36 0.05,1 3.84
(二)2检验的基本思想
例4-6-1 据临床研究,一般的胃溃疡病患者有25%会出现胃出 血症状。某医院观察了300例65岁的胃溃疡病患者,其中有99例 发生胃出血,占33.0%,问老年患者是否较一般患者易出血? 表中基本数据是a,b,c,d,其余数 据都是从这四个基本数据推算出 表4-6-1 131例胃癌患者治疗后5年存活率的比较 来的,这种资料称为四格表资料。 存活率(%) 存活数 死亡数 合计治疗数
(即多个率或构成比的比较)
上述两个样本率比较的资料,其基本数据只 有2行2列,称为2 ×2表或四格表资料。当基 本数据超过2行或2列的资料,就称为行×列 表或 R × C表资料。行×列表资料的2检验 主要用于多个样本率或多个构成比之间的比 较。
2 值的计算可按前述基本公式( 2 =∑(A-
2
计算统计量Z :
z
0.33 0.25
0.25 (1 0.25) / 300
3.20
. 确定P 值和判断结果:
Z0.01=2.326,得P<0.01,按=0.05水 准拒绝H0,接受H1。 认为老年胃溃疡病患者的胃出血率大于 20%,即老年患者较一般患者易出血.
(二)两样本率的比较
3.确定P 和判断结果:=(2-1)×(2-1)= 1;查2界 值表,20.05=3.84, 所以P>0.05,按=0.05水准不拒绝H0,差别无统计 学意义。故尚不能认为单纯手术疗法与联合疗法对胃 癌患者治疗效果有差别。
χ2检验

检验(chi-square test)检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。
可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。
一、四格表资料的检验例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较组别有效无效合计有效率(%)化疗组19244344.2化疗加放疗组34104477.3合计53348760.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。
这里可通过检验来区别其差异有无统计学意义,检验的基本公式为:式中A为实际数,以上四格表的四个数据就是实际数。
T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。
这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。
兹以表20-11资料为例检验如下。
检验步骤:1.建立检验假设:H0:π1=π2H1:π1≠π2α=0.052.计算理论数(TRC),计算公式为:公式(20.13)式中TRC是表示第R行C列格子的理论数,n R为理论数同行的合计数,n C为与理论数同列的合计数,n为总例数。
第1行1列:43×53/87=26.2第1行2列:43×34/87=16.8第2行1列:44×53/87=26.8第2行2列:4×34/87=17.2以推算结果,可与原四项实际数并列成表20-12:表20-12 两种疗法治疗卵巢癌的疗效比较组别有效无效合计化疗组19(26.2)24(16.8)43化疗加放疗组34(26.8)10(17.2)44合计533487因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:T1.1=26.2T1.2=43-26.2=16.8T2.1=53-26.2=26.8T2.2=44-26.2=17.23.计算值按公式20.12代入4.查值表求P值在查表之前应知本题自由度。
第六章 χ2检验

二、计算检验统计量:
2 1 4 1 3
2
2 2 2 2 2 2 2 2 30 38 32 12 19 30 19 9 189 1 0 . 69 112 49 112 68 112 51 112 21 77 49 77 68 77 51 77 21
统计:按照α=0.05的检验水准,拒绝H0,接受H1,差异有统计学意义。 专业:结合本例,可以认为三种方法治疗慢性支气管炎的效果不同或 不全相同。
2.两组或多组样本构成比的比较
例6-4:欲了解儿童白血病患者的血型分布是否与成 年患者有所不同,资料见表6-4。试分析儿童白血病 患者与成年患者的血型分布构成比有无差别?
第六章 χ2检验
《医学统计学》余松林主编
本章内容
第三节 独立性检验 第四节 趋势检验 第五节 多个四格表的联合分析 第六节 四格表的费歇尔精确概率检验
第三节 独立性检验
本节介绍应用χ2检验推断两个或两个以 上总体率(或构成比)之间有无差别及 两分类变量间有无相关关系。
一、四格表资料的χ2检验 (两个样本率的比较)
表6-4 儿童急性白血病患者与成人急性白血病患者的血型分布
分组
儿童 成人 合计
A型 30
19 49
B型 38
30 68
O型 32
19 51
AB型 12
9 21
合计 112
77 189
解:
一、建立假设,确定检验水准:
H0:儿童白血病患者与成人患者的血型分布构成比相同 H1:儿童白血病患者与成人患者的血型分布构成比不相同 检验水准α=0.05。
二、计算检验统计量:
应用统计学(第六章 次数资料的χ2检验)
次有极为密切的关系。
若需进一步比较r×c列联表内组间的差异,可将r×c列联表做 成多个2×c列联表进行检验。
例4:碘治疗甲状腺肿效果与年龄关系3×4列联表
年龄(岁) 治愈
显效
好转 无效 合计
11~30 67(45.29) 9(17.87) 10(22.02) 5(5.82) 91
31~50 32(39.32) 23(15.51) 20(19.12) 4(5.05) 79
49.00
59.04
df=2, χ20.05 =5.992;χ2> χ20.05 ,P<0.05
推断:否定H0 ,接受HA。三种农药对烟蚜的毒杀效果 存在显著差异。
例3:肺门密度与矽肺期次的3×3列联表
矽肺期次
Ⅰ Ⅱ Ⅲ 合计
+ 43(249) 1(17.2) 6( 7.9)
50
肺门密度 ++
188(149.9) 96(103.4) 17( 47.7)
例5:为研究53BP2对肿瘤发生易感性的影响,建立了该基因的 基因敲除小鼠,其等位基因杂合型(-/+)和野生型(+/+)小鼠 在接受γ射线照射之后的肿瘤发生情况记录如下表。问该基 因是否影响小鼠对肿瘤的易感性?
肿瘤
无瘤
合计
野生型
3
16
19
杂合型
9
10
19
合计
12
26
38
解:组合概率计算
i
a
b
c
d
ij
T
(i=1,2,…
j=1,2,…)
3.理论数和χ2值的计算
理论数
r
c
Eij Oij Oij
【统计分析】x2检验
表 10-6
三种药物治疗老年 2 型糖尿病的疗效
有效
无效
合计
35
21
56
17
13
30
29
1
30
81
35
116
有效率(%) 62.5 56.7 96.7 69.8
单向有序R×C表
有两种形式
一种是R×C表中的分组变量(如年龄组)是有序的, 而指标变量(如传染病的类型)是无序的。其研究目 的通常是分析不同年龄组各种传染病的构成情况,此 种单向有序R×C表可用行×列表资料 χ2 检验进行分 析。
α=0.05
2. 计算检验统计
2 b c 12 2 11 12 4.92
bc
2 11
3. P<0.05 差异有统计学意义。
配对四格表资料的关联性检验
公式与普通四格表检验公式相同
1. 建立假设 H0:两法的结果无相关 H1:两法的结果相关
α=0.05 2. 计算检验统计
2
a
ad bc2 n ca bc d b
观察组和对照组疗效比较
组别 显效 有效 无效
观察组 58
44
18
对照组 56
43
35
合计
114
87
53
双向无序R×C表
若研究目的为多个样本率(构成比)的比较, 可用行×列表资料 χ2 检验; 若研究目的为分析两个分类变量直接有无关联 性,可用行×列表资料 χ2 检验及列联系数进 行分析。
组别 降糖 1 号 玉泉丸 格列本脲 合计
x2检验基本思想
组别
+
-
合计
A
a
B
c
合计
m1
χ2检验的公式
χ2检验的公式χ2检验是一种常用的统计方法,用于检验两个分类变量之间是否存在相关性。
它的全称是卡方检验,是由卡方分布衍生而来的统计检验方法。
χ2检验的公式如下:χ2 = Σ ( (Oij - Eij)^2 / Eij )其中,χ2表示卡方值,Oij表示观察到的频数,Eij表示期望的频数。
在χ2检验中,我们需要先确定一个原假设和备择假设,然后根据实际观察到的频数和期望频数,计算出卡方值。
最后,根据卡方值和自由度的关系,确定拒绝域,从而判断原假设的可信程度。
χ2检验可以用于比较两个分类变量的分布情况,例如比较两组样本在不同类别上的分布是否存在差异。
这种差异可能源于不同类别之间的关联性,也可能是由于其他因素导致的。
χ2检验的目的就是通过计算卡方值,判断这种差异是否显著。
在进行χ2检验时,需要注意以下几点:1. 样本容量要足够大。
当样本容量较小时,χ2检验的结果可能不准确。
2. 数据应该是独立的。
χ2检验要求样本观测值之间是相互独立的,否则会导致结果的偏差。
3. 期望频数要大于5。
当期望频数小于5时,χ2检验的结果可能不可靠。
4. 自由度的确定。
在计算卡方值时,需要根据分类变量的类别数和样本容量来确定自由度的取值。
χ2检验的步骤如下:1. 建立假设。
根据研究问题,确定原假设和备择假设。
2. 收集数据。
根据研究问题,收集相应的数据样本。
3. 计算期望频数。
根据总体分布的假设,计算出每个类别的期望频数。
4. 计算卡方值。
根据观察频数和期望频数,使用χ2检验公式计算出卡方值。
5. 确定拒绝域。
根据显著性水平和自由度的关系,确定拒绝域的边界。
6. 做出判断。
比较计算得到的卡方值和拒绝域的边界,判断原假设的接受或拒绝。
χ2检验的应用非常广泛,特别是在医学、社会科学和市场研究等领域。
例如,医学研究可以使用χ2检验来比较不同治疗组的治愈率是否存在差异;社会科学研究可以使用χ2检验来分析不同人群之间的社会行为是否存在关联;市场研究可以使用χ2检验来分析不同产品的偏好是否存在差异。
第7章 χ2检验
89.02
70.27 80.13
2、计算卡方值 a=73 b=9 c=52 d=22 n=156 2 ( ad bc ) n 2 =8.59 (a b)(a c)(b d )(c d )
(四)四格表资料卡方检验的校正
1、校正条件: n≥40,且 1<T<5(一个及以上格子) 2、基本公式
那么A药组82人中理论上讲有效人数为65.7人
(82*80.13%=65.7),即第一行第一列的理论频
数为82*80.13%=65.7
n n R C 用计算,即 也可以 T RC n
T11=125*82/156=65.7)。
表7-1 两药治疗脑血管栓塞有效率比较
药物 A B 合计 有效 73 (65.7) 52 (59.3) 125 无效 9 (16.3) 22 (14.7) 31 合计 82 74 156 有效率(%) 89.02 70.27 80.13
a c
b d
73 52
9 3
四格表资料的基本形式
处理组 A药 B药 合 计 发生数 未发生数 合计 a+b c+d n
a c a+c
b d b+d
请判断下列a、b、c谁属四格表:两组大白鼠 在不同致癌剂作用下的发癌率如下表,问两组发 癌率有无差别?
表 处理 甲组 乙组 合计 不同致癌剂作用下大白鼠发癌率比较 例数 71 42 113 发癌数 52 39 91 未发癌数 19 3 22 发癌率% 73.24 92.86 80.33
T 怎么求 ?
n n R C T:理论频数(theoretical frequency) TRC n T 第R 行C 列的理论频数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
甲组 乙组 合计
a c a+c
四格表的专用公式及校正公式
χ2=
(ad - bc) n (a b)(c d)(a c)(b d)
2
χ2=
( ad bc n/2) n (a b)(c d)(a c)(b d)
2
配对计数资料的卡方检验
2 ( b c ) 2 , 1 , (b c) 40 bc 2 ( b c 1 ) c2 , 1 , (b c) 40 bc
实习 计数资料的统计推断
明确率的抽样误差的意义 学会率的标准误的计算方法,并能正确 用于计数资料的分析 2 学会率的u检验、 检验的计算方法,并 正确动用假设检验对计数资料进行分析 评价。
四格表资料的χ2检验
主要用于两个样本率(或构成比)的假 设检验。
表11-1 四格表数据格式
阳性 阴性 b d b+d 合计 a+b=n1 c+d=n2 a+b+c+d= n 率pi a/n1 c/n2 (a+c)/n
27 18
45
22 12
34
行×列(R×C)表资料的χ2检验
χ2= n(
A2 1 n n ) R C
n为总例数 , A为每个格子的实际频数 , nR和 nC分别为与A同行和同列的合计数。
υ =(R-1)(C-1)
22.为比较槟榔煎剂和阿的平驱绦虫的 效果,对45名绦虫患者进行治疗,其结 果如下,问两药疗效是否相同?
槟榔煎剂和阿的平驱绦虫治疗的结果
药物
槟榔煎剂 阿 的 平 合 计
治疗人数
27 18 45
有效人数
22 12 34
槟榔煎剂和阿的平驱绦虫治疗的结果
药物 有效人数 无效人数 合 计
槟榔煎剂 22 阿 的 平
5
27
12 34
6(4.4) 11
18 45
合
计
x 0.607
2Leabharlann p217-23:为了研究两种方法细菌培养效果是否相同,分别 用两种方法对110份乳品作细菌培养,结果如下,请作统计
分析
两种方法对110份乳品细菌培养的结果
常规培养
乳胶凝集
+ + 27 8 1 74
合计
28 82
合计
35
75
110
x 4
2
P217-24 在某小学采用随机抽样的方法对二、四、 六这三个年级的部分学生进行了视力检查,资料
如下表。问3个年级学生的近视率有无差别?
某小学三个年级的部分学生视力检查结果
年级 近视人数 非近视人 数 合计 近视率(%)
二年级 四年级 六年级
会 计
13 21 38
72
107 119 107
333
120 140 145
405
10.83 15.00 26.21
17.78
x 11.75
2
p217-25某年某地爆发松毛虫病,对调查的333例 患者,以14岁为界分为儿童组和成人组,资料如 下表。问儿童和成人各型松毛虫病的构成比是否 相同?
某地儿童和成人松毛虫病患者的型别构成比
皮炎型 50 105
155 骨关节 炎型 软组织 炎型
年龄分 组
混合型 72 23
95
合计 188 145
333
儿童组 成人组
合计
48 10
58
18 7
25
x 70.14
2
槟榔煎剂和阿的平驱绦虫治疗的结果
药物 治疗人数 有效人数
槟榔煎剂 阿 的 平
合 计