第06章 卡方检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时,一般不作校正。
例 6-3
某医生欲研究不同分娩方式与重症肝炎孕产妇的 重症肝炎孕产妇不同分娩方式的结局 存活 41 18 59 H1: 12 死亡 3 6 9 合计 44 24 68
结 局 的 关 系 ,资 料 见 表 6-4。问 两 种 分 娩 方 式 的 结 局 有 无 差 别 ? 表 6-4 分娩方式 剖宫产 阴道分娩 合计 H0: 1=2
0.05。
2
3.03 ,
=1
2<3.84=2
按 =0.05 水 准 , 不 拒 绝 H0, …
二、行×列表资料的 检验
2
① 多个样本率比较时,有R行2列,称为R ×2表;
P2 A21 n2
P n1 n

反应变量按二项分类的两个独立样本资料 反应结果 阳性 阴性 观察 总频数 阳性 频率
样本 1 样本 2 合计
A11
A21
A12
A22
n1 (给定)
P 1 A 11 n1
n2 (给定)
n
(给定)
P2 A21 n2
n1
n 2
P n1 n
一、四格表(2×2表)卡方检验
二、行×列表卡方检验 三、配对四格表卡方检验
一 、 四 格 表 (fourfold table)资 料 的 2 检 验 (两 个 样 本 率 的 比 较 )
表 6-2 处理 螺赛克 雷米替叮 合计 表
两种药物治疗消化道溃疡 4 周后疗效 愈合 未愈合 合计 85 84 169 愈 合 率 (%) 75.29 60.71 68.05
四格表资料 检验公式选择条件:
2
n 40, T 5,专用公式或基本公式
,校正公式; Fisher 确切 n 40, 1 T 5 概率 n 40 ,或T 1 , 直接计算概率 (Fisher确切概率)。 或 P 时,
2 连续性校正仅用于 1 的四格表资料,当 2
医 学 生 , 测 定 空 腹 血 糖 值 (mmol/L), 其 频 数 分 布 如 表 6-1 中 第 (1)栏 和 第 (2)栏 所 示 , 试 用 2 检 验 判 断 该 资料是否符合正态分布。
H0: 空 腹 血 糖 的 实 际 频 数 与 正 态 分 布 的 理 论 频 数 符 合
H1 : … 不 符 合
( AT ) , (行数-1)(列数 1) T
式中,A为实际频数(actual frequency) T为理论频数(theoretical frequency)
nR nC TRC n
例6-2的计算结果
A11 T11 2 T11
2
( A12 T12 )2 ( A21 T21 ) 2 ( A22 T22 ) 2 T12 T21 T22
2 0.1,7
故 按 = 0 . 1 0 水 准 拒 绝 H0 , 可 认 为 实 际 频 数 与 正态分布的理论频数不符合,拟合优度不好。 在 自 由 度 =7 的 卡 方 分 布 中 , = 15.0509 时
2
P=“ =CHIDIST(15.0509,7)” =0.03535
第三节 独立性检验
(64 57.84)2 (21 27.16)2 (51 57.16)2 (33 26.84)2 4.13, 57.84 27.16 57.16 26.84
(行数-1)(列数 1) (2 1)(2 1) 1 因 2 4.13 3.84, 所以P 0.05,拒绝H 0
f1 F1
自由度
2
F1 k 1 (计算理论分布时利用
样本资料估计的参数个数)
( f k Fk ) 2 ( f 2 F2 ) 2 ... F2 Fk
(3) 确定概率 P 并作出统计推论。
注意:理论频数F不宜过小,如不小于5,否则需要合并
例 6-1
某 医 学 院 校 医 生 随 机 抽 取 100 名 一 年 级
=0.05
首先考查最小行合计和最小列合计所对应的理论数,即最 小 理 论 数 。 本 例 的 最 小 理 论 数 为 T22=3.18, 且 1T225, 而 n=6840, 按 式 (6-12)计 算 校 正 2 值 如 下 :
( 41 6 3 18 68 / 2) 2 68 44 24 9 59
Z
(4) 0.0322 0.0793 0.1685 0.3050 0.4721 0.6480 0.7939 0.8980 0.9564
(5) 0.0322 0.0471 0.0882 0.1365 0.1671 0.1759 0.1459 0.1041 0.0584 0.0436 1.0000

(6)= n(5) 3.22 4.71 8.82 13.65 16.71 17.59 14.59 10.41 5.84 4.36 100.00
F1 F2
பைடு நூலகம்1 2

f1 f2


Fk
k
fk
问题:试判断这份样本,是否来自该理论分布?
(1) H 0:样本的总体与该理论分布无区别 H1 :样本与该理论分布有区别 0.05或 0.1 2 (2) Pearson 统计量 2 k (实际频数-理论频数) 2 P 理论频数 i 1
2
1
2

( / 21)
e
2 / 2
ß ×· Ý
× Ô Ó É ¶ È £ ½ 1
0.2 0.1 0.0 0 3
3.84
× Ô Ó É ¶ È £ ½ 2 × Ô Ó É ¶ È £ ½ 3 × Ô Ó É ¶ È £ ½ 6
P=0.05的临界值
7.81 12.59
6
9 12 ¿ ¨· ½ Ö µ
2
2
2
表 6-3 处理 洛赛克 雷米替叮
两种药物治疗消化道溃疡效果 愈合 64(a) 51(c) 未愈合 21(b) 33(d) 合计 85 84 愈 合 率 (%) 75.29 60.71
54 169(n) 合 计 115 用 表 6-3 资 料 , 代 入 式 (6-10), 求 2 值 如 下 :
15
18
性质:若 (1 ), ( 2 ) 互相独立,
2 2

(1 ) ( 2 ) 服从 分布, 自由度 1 2
2 2 2
( 1 ) ( 2 ) 服从 分布, 自由度 1 2
2 2 2
第二节 拟合优度检验
类别或组段 观察频数 理论频数
2 ( 64 33 21 51 ) 169 2 4.13, 85 84 115 54
与前面计算的结果一致。
4.四格表资料检验的连续性校正公式

2 c
2
( A T 0.5) T
n 2 2
2
(| ad - bc | - ) n c = (a+b)(c+d )(a+c)(b+d )
0.10 。
本 资 料 的 均 数 X 4 . 1 9 6 6 , S 0.6737 。 本例因为正态分布有 及 两个参数,所以其 自 由 度 为 : =k— 1— 2=10−3=7
表 6-1
X
正 态 分 布 拟 合 优 度 的 2检 验
(Z )
Z=(2.95-4.1966)/0.6737
0.3
0.2
0.1
0.0
0
2
4
6
8
10
2 2 0.05(1) 3.84 (1.96)2 Z 0.05/ 2 2 2 0.01(1) 6.63 (2.5758)2 Z 0.01/ 2
(2) Z1 , Z 2 ,..., Z 互相独立,均服从 N ( 0,1) , 2 2 2 2 则 Z1 Z 2 ... Z 的分布称自由度为 的 分布, 2 2 2 记为 ( ) 或 ( ) ,或简记为 .
第六章
检验
2
χ 2检验(Chi-square test)是现代统计学的创 始人之一,英国人K . Pearson(1857-1936) 于1900年提出的一种具有广泛用途的统计方 法,可用于拟合优度检验、两个或多个率或 构成比间的比较等等。
第一节
分布
2
(1) 自由度为 1 的 2 分布 若 Z ~ N ( 0,1), 则 Z 2 的分布称为自由度为 1 的 2 分布. 2 (1) . (chi-square distribution),记为 (2 或 1) 图形:从纵轴某个点开始单调下降,先凸后凹.
F n
( f F )2 F
(7)
0.9839 0.0121 2.6182 2.0969 1.3276 1.7765 6.0691 0.0161 0.1208 0.0297 15.0509
界 值 表 得 = 1 5 . 0 5 > 12.02 , P < 0 . 1 ,
2 2
2 0.05,1
2.卡方检验的基本原理
若检验假设H0:π1=π2成立,四个格子的实际频 数A与理论频数T相差不应该很大,即统计量 该很大。如果
2
不应
2值很大,即相对应的 P 值很小,
若 P ,则反过来推断A与T相差太大,超出了抽样
误差允许的范围,从而怀疑 H0的正确性,继而拒绝
H0,接受其对立假设H1,即π1≠π2。
3. 四格表资料检验的专用公式
2
(ad bc) n (a b)(a c)(b d )(c d )
发生数 未发生数 合计 a+b c+d n
2
样本 1 样本 2 合 计
a c a+c
b d b+d
2 ( A T ) 基本公式: 2 T
(a b)( a c) (a b)(b d ) (c d )(b d ) a b d abcd abcd abcd (a b)( a c) (a b)(b d ) (c d )(b d ) abcd abcd abcd (ad bc) 2 n 1 ; (四格表专用公式) (a b)(c d )( a c)(b d )
(1)检验 H : 1 1 2 (2)用 P
n1
H 0 : 1 2 (分别为样本率P 、P 的总体率) 1 2、P
0.05
n1 n2 n
n 近似地代替 ,理论上应有:
T11 n1
T21 n2
n1 n1 n
n2 n1 n
T12 n1 (1 )
T22 n2 (1 )
n2 n2 n
一般地,
nR nC (行合计)(列合计) 理论频数 = 总计 n
1. 基本公式
A11 T11 2 T11
2
( A12 T12 ) 2 ( A21 T21 ) 2 ( A22 T22 ) 2 T12 T21 T22 2
* 图形:单峰,正偏峰; 自由度 很大时, 近似地服从正态分布.有 2 ( ) 2 Z , ( )服从均数为,方差为2的正态分布 2
2 ( )
χ2分布(chi-square distribution)
0.5 0.4 0.3
f ( ) 2( / 2) 2
64(57.84) 21(27.16) 51(57.16) 33(26.84) 115 54
反应变量按二项分类的两个独立样本资料 反应结果 阳性 阴性 观察 总频数 阳性 频率
样本 1 样本 2 合计
A11
A21
A12
A22 n 2
n1 ( 给 定 )
P 1 A 11 n1
n1
n2 ( 给 定 ) n (给 定 )
f
(1) 2.65 | 2.95 | 3.25 | 3.55 | 3.85 | 4.15 | 4.45 | 4.75 | 5.05 | 5.35 | 5.65
(2) 5 5 4 19 12 12 24 10 5 4 100
(3) -1.85 -1.41 -0.96 -0.51 -0.07 0.38 0.82 1.27 1.71
相关文档
最新文档