第八章 卡方检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2(d)0.85 14(固定值) 5 (固定值) 82 (固定值)
假设检验的过程
1.建立假设: H0 : π 1 = π 2 H1 : π 1 ≠ π 2 2.确定显著性水平, α取0.05。 3.确定比当前表格更极端表格的组合数,并计算 概率值P。 4.做出结论
在边缘合计数不变的条件下,比当前四 格表更极端的组合情况可根据最小的理 论频数所在的格子来寻找。本例中为d。 实际频数为2,理论频数为0.8536。差值 为1.15。所以d取值为2,3,4,5,这4 种组合就是满足条件的四格表。计算它 们的概率之和为0.20。 因为P > 0.05;不拒绝H0,差异无 统计学意义,还不能认为两组患者的 病死率存在差异。
四、四格表的确切概率法
何分布。此方法不属于 χ 2 检验范畴,但可 作为四格表 χ 2 检验应用上的补充。 适用条件(有其一即可): ♦ N<40 ♦ 有理论频数<1 2 ♦ χ 检验后所得到的概率接近检验水准α。
♦ 该法由R.A.Fisher提出,其理论依据是超几
确切概率法的基本思想: 在四格表周边合计不变的条件下, 利用公式8-7直接计算出表内四个格子 数据的各种组合的概率。然后计算单 侧或双侧累计概率,并与检验水准α 比较,作出是否拒绝H0的结论。
χ
2
检验的基本公式
ν = (R −1)(C −1)
( A−T)2 1 2 2 χ =∑ = ( A −T ) ∑ T T
上述基本公式由Pearson提出,因此软 上述基本公式由 基本公式 件上常称这种检验为Peareson χ 2检验,下 面将要介绍的其他 χ 2 检验公式都是在此 基础上发展起来的。它不仅适用于四格表 资料,也适用于其它的“行×列表”。
2
(8-5)
i =1
χ =
2
( ad −bc − n/ 2) n
2
(8-6)
(a + b) + d)(a + c)(b + d) (c
♦ 例题8.2 某医学院抽样调查大学四年级和五
年级学生近视眼患病情况,四年级学生的近 视率为7.14%,五年级学生的近视率为 35.71%,调查结果见8-2,试问该大学四年 级与五年级学生的近视眼患病率是否一样? 表8-2 两个年级大学生的近视眼患病率比较 患病情况 年级 四年级 五年级 合计 近视 2(4.67) 5(2.33) 7 非近视 合计
42 2 ( 2 × 9 − 26 × 5 − ) × 42 2 2 χ = 28 × 14 × 7 × 35 = 3.62
V=(2-1)( ( )(2-1)=1 )( )
=3.62 < 3.84, P > 0.05;不拒绝H0, 差异无统计学意义,还不能认为两个年级学生 的近视眼患病率有差异。
χ
2
将实际数和理论数代入统计量 χ 值 2 的基本公式即可计算出检验统计量 χ 值。
2
χ 值的大小反映了实际数与理论数的
2
相差情况,若无效假设H0成立,则理论 数和实际数相差不因该太大,从H0假设 2 成立的总体中抽出当前较大的 χ 值或 2 比他还大的 χ 的概率较小,因此就有 理由推翻无效假设H0。
15
18
(1)建立检验假设,确定检验水准
H0:π1=π2 H1:π1≠π2
α取0.05。 (2)计算检验统计量:H0成立时,两 组有效率相同,均近似等于合计的有效 率,由此得到四格表中每一格的理论频 数,分别记在表8-1各格子的括号内。
♦ 表8-1 两组疗法治疗高血压的疗效
疗效 组别 对照组 试验组 合计 有效 无效 合计 有效率% 44 26 70 45.45 80.77 58.57
χ =
2
(ad −bc) n
2
(a + b) + d)(a + c)(b + d) (c
(8-4)
式中a、b、c、d分别为四格表中的实际频数, n为总例数。
♦ 表8-1 两组疗法治疗高血压的疗效
疗效 组别 对照组 试验组 合计 有效 20(a) 21(c) 41(a+c) 无效 24(b) 5(d) 29(b+d) 合计 44(a+b) 26(c+d) 70(a+b+c+d)
χ 值的大小与格子数的多少也有关, 格子数越多,则自由度越大, χ 2 值也
2
越大。
若 χ 值大于 χ 界值(根据自由度ν和 ν 2 χ 检验水准α 查附表7 界值表得出), 则可按α =0.05的检验水准拒绝H0成立 的无效假设,最后作出统计结论。
2 2
χ2分布(chi-square distribution) 分布( )
χ2
χ 2 检验的基本公式中A为实际频数 在
(Actual frequency);T为理论频数 (Theoretical frequency),是根据无效假设 推算出来的。理论频数的计算公式为:
T RC n R nC = n
式中TRC为第R行第C列格子的理论数, nR为R行的合计数,nC为第C列的合计数,n 为总例数。
20(25.8) 24(18.2) 21(15.2) 5(10.8) 41 29
χ2 值和自由度 (2)计算
χ
2
= Σ
(A
−T T
)2
= 8 . 40
自由度为υ =k-1-(计算T时利用样本资料估计的参数个数)
υ =(R-1)( )= )(C-1)= )=1 ( )(
实际计算时,求得一个格子的理论频数后,其他各格的理 论频数均可根据行或列的合计数求得。因此,可以自由 取值的格子数为1。
♦ 例题1:某医院研究中药治疗急性心肌梗死
的疗效,临床观察结果见表8-14,其中给68 例患者注射该中药,24小时死亡率为4.41%, 而对14例患者未用该中药,死亡率为14.29%, 试问接受两种不同疗法患者的病死率是否一 样?
表1 两种药治疗急性心肌梗死的疗效
治疗效果 疗法 中药组 非中药组 合计 存活 65(a) 12(c) 77 (固定值) 死亡 3(b) 合计 68(固定值)
第八章 χ 检验
2
χ 检验(Chi-square test)是现
2
代统计学的创始人之一,英国人 K . Pearson(1857-1936)于1899 年提出的一种具有广泛用途的统 计方法。
χ 2分布和拟合优 χ 检验以
2
度检验为理论依据,用途非常广 泛。
χ 2 检验的适用资料类型
•单个频数分布的拟合优度检验 •完全随机设计下两组频数分布 2 的 χ 检验 2 •多组频数分布的 χ 检验 •配对设计下两组频数分布的
(a + b)!(c + d)!(a + c)!(b + d)! P= a!b c!d!n ! !
♦ 例题8.3:有17名腰椎间盘脱出症患者,其
中有9人志愿接受一种新的疗法,治愈率为 77.78%,其他8人接受保守疗法,治愈率为 25.00%,如表8-3所示,试问两种疗法的疗 效差别是否有统计学意义? 表8-3 两种疗法对腰椎间盘脱出症的疗效 治疗效果 疗法 新疗法 保守疗法 合计 治愈 7(a) 2(c) 9 (固定值) 未治愈 2(b) 合计 9(固定值)
0.5 0.4 0.3 0.2 0.1 0.0 0 3
3.84
χ 1 f (χ ) = 2Γ(ν / 2) 2
2
2Biblioteka Baidu

(ν / 2−1)
e
−χ 2 / 2
纵 高
自由度=1 自由度=2 自由度=3 自由度=6
0.05的临界值 P=0.05的临界值
6
7.81
9 12 卡方值
12.59
2 2 2
例题8.1中,也可以用四格表的专用公 式计算,统计量相同,结论一致。
(20 × 5 − 24 × 21) × 70 χ = 44 × 26 × 41× 29 = 8.40
2 2
三、四格表校正 χ 公式
2
适用条件:N≥40且有格子的理论频数 1≤T< 5
χ
2
=

k
(A
i
− T i − 0 .5 ) Ti
26(23.33) 28 (固定值) 9(11.69) 14 (固定值) 35 42
假设检验的过程
1.建立假设: H0 : π 1 = π 2 H1 : π 1 ≠ π 2 2.确定显著性水平, α取0.05。 3.计算统计量 χ 2 4.求概率值P: 5.做出推论:
因为N≥40且有格子的理论频数1≤T< 5
20(25.8) 24(18.2) 21(15.2) 5(10.8) 41 29
表8-1中是两组样本的频数分布。我们的问题是 这两个频数分布的总体分布是否相等?或者这 两份样本是否来自同一个总体? 因为这里是二分类变量,问两个总体分布是否 相等就相当于问两组样本的总体有效率是否相 等。 四个格子的数据20、24、21、5是基本数据,其 余的数据44、25、41、29、70都是从这四个数 据计算得来的,因此,该表称为四格表 (fourfold table ),又称为2 × 2列联表。 在此四格表中, 20、24、21、5是实际频数A, 在这四个数字旁边括号内的数字是理论频数T, 通过实际频数和理论频数的差异的大小可以确 定 χ2 检验中检验统计量的大小。
(3)确定概率P值的范围 因为8.40>3.84,P<0.05; (4)下结论 因为P<0.05;拒绝H0,接受H1,可以认 为两组治疗原发性高血压的总体有效率 不等,试验组高于对照组,即可以认为 该中药治疗原发性高血压有效。
第二节 完全随机设计下四 格表的卡方检验
根据N和理论频数的情况,选择 2 ♦ χ 检验基本公式; 2 ♦ χ 检验基本公式的校正公式; ♦ 四格表 χ 2 检验专用公式; ♦ 四格表 χ 2 检验校正公式; ♦ 四格表的精确概率法;
一、χ 检验基本公式
2
♦ 适用条件:N≥40且所有的理论频数都≥ 5
表8-1 两组疗法治疗高血压的疗效
疗效 无效 24(18.2) 5(10.8) 29
组别 对照组 试验组 合计
有效 20(25.8) 21(15.2) 41
合计 44 26 70
二、四格表专用 χ 公式
2
适用条件:N≥40且所有的理论频数都≥ 5 四格表资料进行 χ 2 检验还可以选用专用公式, 省去计算理论频数的过程,使计算简化。其 计算公式为:
6(d)3.76 8(固定值) 8 (固定值) 17 (固定值)
假设检验的过程
1.建立假设: H0 : π 1 = π 2 H1 : π 1 ≠ π 2 2.确定显著性水平, α取0.05。 3.确定比当前表格更极端表格的组合数,并计算 概率值P。 4.做出结论
在边缘合计数不变的条件下,比当前四 格表更极端的组合情况可根据最小的理 论频数所在的格子来寻找。本例中为d。 实际频数为6,理论频数为3.76。差值为 2.24。所以d取值为0,1,6,7,8,这 5种组合就是满足条件的四格表。计算它 们的概率之和为0.057。 因为P > 0.05;不拒绝H0,差异无 统计学意义,还不能认为两种疗法的疗效 存在差异。
四格表专用公式的推导
为了不计算理论频数T, 可由基本公式推导出, 基本公式推导出 为了不计算理论频数 可由基本公式推导出,直接由各 格子的实际频数(a、b、c、d)计算卡方值的公式: 格子的实际频数( 、 、 、 )计算卡方值的公式:
(A−T)2 基本公式: χ 2 = ∑ T (a + b)(a + c) (a + b)(b + d) (c + d)(b + d) a − a + b + c + d b − a + b + c + d d − a + b + c + d + +L+ = (a + b)(a + c) (a + b)(b + d) (c + d)(b + d) a +b + c + d a +b + c + d a +b + c + d (ad −bc)2 ⋅ n = ν =1 ; (四格表专用公式) (a + b)(c + d)(a + c)(b + d)
χ 检验
2
一、χ 检验的基本思想
2
例8.1见 P67。 为了解某中药治疗 原发性高血压的疗效,将70名高血 压患者随机分为两组,试验组用该 药加辅助治疗,对照组用安慰剂加 辅助治疗,观察结果见表8-1,问该 药治疗原发性高血压是否有效?
♦ 表8-1 两组疗法治疗高血压的疗效
疗效 组别 对照组 试验组 合计 有效 无效 合计 有效率% 44 26 70 45.45 80.77 58.57
♦ 例题2:某医师跟踪观察24例不同手术方式
相关文档
最新文档