第九章卡方检验2

合集下载

卫生统计学-第九章 卡方检验

卫生统计学-第九章 卡方检验

11
2检验的基本思想
• 如果H0成立,则男女生感染率的差异仅是抽样误
差引起的,相差不会太大,由此而计算出来的T与 A也不会相差很大,即2值不会相差很大
• 如果两样本率相差过大,即T与A相差较大,2值
也会相差较大,相应的P值也就越小。
• 因此,由实际样本资料求得一个较小的P,而且
P≤,就有理由怀疑H0的真实性,因而拒绝H0,
18.55
66.45
(3)确定自由度和P值
四格表的自由度=1,卡方界值为3.84 卡方值>卡方界值,所以 P<0.05
(4)作出推断性的结论
按α =0.05水准,拒绝H0,接受H1,可认为该小学男女生 蛔虫感染率不同,男生的感染率高于女生.
18
四格表除了可用基本公式外,更多用四格表专用公 式计算卡方值.
假设四格的数字分别为a,b,c,d,如图,
则用下式来计算卡方值:
2
(ad bc)2 n
(a b)(c d )(a c)(b d )
23 57 a 13 72
此式不必计算理论数,比较方便,结果也更为准确.
19
某小学男女生蛔虫感染率的比较
• 实际工作常用于检验两个或多个样本率及构成比
之间差别有无统计学意义,两种属性或特征之间 是否有关系以及拟合优度检验等。
5资料的2检验 • RC表的2检验 • 配对四格表的2检验 • 精确概率法
6
§1 2检验的基本思想
例:某小学男女生蛔虫的感染率如下表,试判断男女 蛔虫感染率是否有差别?
从而作出接受H1的统计推断;如果P>,则没有
理由拒绝H0。
12
性别 男 女 合计
虫卵阳性人数 阴性人数 合计 感染率(%)

医学统计课件人卫6版 第九章 卡方检验ppt课件

医学统计课件人卫6版 第九章 卡方检验ppt课件
R行与C列中,行合计数中的最小值与列合计
数中的最小值所对应格子的理论频数最小。
➢ 两样本率比较的资料,既可用Z检验也可用 检2
验来推断两总体率是否有差别,且在不校正的 条件下两种检验方法是等价的,对同一份资料

Z2 2
讨论:计算与分析1.2.
.
11
补充:
两大样本率的假设检验
1)样本率与总体率比较: Z p0 0(10)/n
➢ 基本公式:
2
(AT)2
T
.
3
➢ T值是在假设H0 成立的条件下,求得的理论频数
TR C
nR .nC n
➢ TRC 表示R行C列的理论频数
➢ nR 为相应行的合计,nC 为相应列的合计
➢ n 为总例数
.
4
求得χ2 值,按ν =(R - 1)(C - 1)
➢ 查附表7,得P值。 同一自由度下,χ2值越大, ➢ 相应的概率P值越小。
• 此类设计可作两方面的统计分析:
.
13
1.两法检验结果有无差别: (阳性检出率是否不同)
2 (b c)2
bc
ν=1
若观察频数b+c < 40,需对χ2值进行校正
2(b | c|1)2
bc
.
14
2.两法检验结果有无关系(联)(了解) H0 :两法结果无关联 H1 :两法结果有关联
α = 0.05
.
18
行×列表资料检验的专用公式:
2 n(
A2 1)
nRnC
(行数-1)(列数-1)
例9-5;9-6
.
19
行×列表资料 检2 验的注意事项
1.一般认为,行×列表中的理论频数不应小于1, 或 的1格T子5 数不宜超过格子总数的1/5。若 出现上述情况,可通过以下方法解决:①最好 是增加样本含量,使理论频数增大;②根据专 业知识,考虑能否删去理论频数太小的行或列, 能否将理论频数太小的行或列与性质相近的邻 行或邻列合并;③改用双向无序 R×C列表的 Fisher确切概率法。

课程九章卡方检验2ppt课件

课程九章卡方检验2ppt课件
一、配对2×2列联表资料的2检验
例9-6 设有132份食品标本,把每份标 本一分为二,分别以甲、乙两种方法做 沙门菌检验。结果见9-8表,问两种方 法的阳性结果有无差别?
表9-8 两种检验方法检验结果比较




合计

80(a) 10(b)
90

31 (c) 11(d)
42
合计
111
21
132
分析
治疗效果
有效
无效
7
5
3(4. 8)
8
10
13
合计
12 11 23
有效率 (%)
58.3 27.3 43.5
本例n<40,不应用四格表卡方检验, 应用确切概率计算法。
H0:两种类型阳性率相等,即π1=π2 H1:两种类型阳性率不等,即π1≠π2
α=0.05
从原四格表组合得知:
按条件要求列出
周边合计不动时,大于等于1.8的所有组合数。
三、确切概率计算法的设计基本思想
四格表周边合计不变,只变a、b、c、 d四个实际数,这样的组合有几个,就用公 式计算几个p值,求全部p值之和 与所定 α比较,若∑p> α则无统计学意义,否则相 反。
周边合计不变,共有“周边合计最小数+1” 种组合。
条件: 1. 周边合计不变
2. 只求
所有p值和即可。

R×C列联表资料χ2 检验注意问题
关于R×C列联表资料2检验的条件
使用2检验在任何情况下都要注意理论频数 T
不能太小。一般要求各格的理论频数均应大于1, 且T<5的格子数不宜多于格子总数R×C的1/5 (1) 增加样本含量 (2)合理合并行列 (3) 改用确切概率计算法

医学统计学 -第09章 卡方检验

医学统计学  -第09章  卡方检验

0.4 f(x)
v=1
0.3
2分布
0.2
v=4
v=6 v=9
0.1
0.0
0
3
6
9
12
15 x
(2)计算检验统计量
2 (A T )2
T
(41 36.5625)2 (4 8.4375)2 (24 28.4375)2 (11 6.5625)2
36.5625
8.4375
28.4375
6.5625
理论基础:超几何分布,不属于卡方检验
谢谢
表 慢性咽炎两种药物疗效资料
分组
兰芩口服液 银黄口服液
合计
有效
41 24 65
无效
4 11 15
有效率 (%) 91.11
68.57 81.25
合计
45 35 80
问题: 两个总体有效率是否相等?
(1)建立检验假设 H0:π1=2 两药的总体有效率相同 H1:π1≠π2 两药的总体有效率不同 检验水准=0.05
bc
= 1
若b+c<40,采用以下校正公式
2 (| b c | 1)2
= 1
bc
第三节 行×列表资料的2检验
(一)R×C表 最常见的形式是
2×C列联表(一般为2个构成比的比较) R ×2列联表(一般为多个样本率的比较)
R×C列联表2检验的原理与2×2列联表2 检验的原理完全一样
统计量计算公式
合计 40 30 32 102
有效率(%) 87.50 66.67 21.88 60.78
(1)建立检验假设,确定检验水准
H0 :1 2 3
H1
:
1
,

第九章 卡方检验

第九章 卡方检验

2
T
离散用连续近似
2 ( ad bc n / 2)2 n
(a b)(c d )(a c)(b d )
注:(1)这种校正称为连续性校正。 (2)如检验所得P值近于检验水准α时, 最 好改用四格表确切概率法。
例 9-3 将病情相似的淋巴系肿瘤患 者随机分布两组,分别做单纯化疗与复 合化疗,两组的缓解率见表9-4,问两疗 法的总体缓解率是否不同?
2分布
如果Z服从标准正态分布,那么Z2服从自 由度为1的 2 分布,其分布图见156。
如果Z1,Z2,…,Zv是v个独立的标准正
态分布随机变量,
z12

Z
2 2



Zv2
的分布
服从自由度为v的 2 分布。
1.962=3.84
例9-2 具体步骤
建立检验假设
H0:1=2 假设两药的愈合率相同 H1:12 假设两药的愈合率不同
第二节 独立样本2×2 列联
表资料的2检验
提出问题
研究目的:比较洛赛克与雷尼替丁疗效有无差 别?
能否说明洛赛克比雷尼替丁效果好?
已知
≠ P1=75.29%
P2=60.71%
推断
π1
?
π2
2 检验的基本思想
假设: 洛赛克与雷尼替丁治疗消化道溃疡的效果相同。
1 2
计算两组合计的愈合率为68.05%(即115/169) 作为 总体率的估计
3 确定P值,做出结论
查附表,
2 0.1(1)

2.71
2.64 2.71, P 0.1
按 0.05 的水准下,不能拒绝H0,即差别无 统计学意义。还不能认为两种方案的总体缓概率

09卡方检验(医学统计学)

09卡方检验(医学统计学)

1.建立检验假设并确定检验水准
H

0
1
2
,即两组新生白兔HBV的总体感染率相等
H1:1 2 ,即两组新生白兔HBV的总体感染率不相等
0.05
2.计算概率 根据公式计算各种组合的四格表概率,结果见表
9-4。例如实际观察到的四格表资料的概率为
P* 9!8!8!9! 0.041464 7!2!2!6!17!
构成比之间有无差别。
Karl Pearson
第一节 四格表资料的 2检验
例9-1 吲达帕胺片治疗原发性高血压疗效,将患者随 机分为两组,试验组用吲达帕胺片加辅助治疗,对 照组用安慰剂加辅助治疗。试分析有效性。
2 检验的基本思想可通过其基本公式来解释:
2 观察值 理论值 2 A T 2
死亡 3 6 9
合计 44 24 68
四、四格表资料的Fisher确切概率法
当四格表资料中出现n<40 或T <1,需改用四格表 资料的Fisher确切概率法。该法是一种直接计算概 率的假设检验方法,其理论依据是超几何分布( hypergeometric distribution)。四格表的确切概率 法不属于检验的范畴,但常作为四格表资料假设 检验的补充。
=0.05
2.计算检验统计量
2 259(2 3212 3692 ...... 4442 1) 297.38
9871080 5181080
9 3 3 9 5 5
(3 1)(4 1) 6
3.确定P值,作出推断结论 查 2 界值表得P<0.05,认为三个不同地区的人群血型分布 总体构成比有差别。
C 各样本率均不相等
D 各样本率不等或不全相等
E 各总体率相差很大 3.四格表资料 2 检验中,出现下列哪种情况需进行校正

最新【基础医学】第九章 卡方检验幻灯片课件

最新【基础医学】第九章 卡方检验幻灯片课件
/611696569
表9-8 不同文化程度患者首选疼痛量表的类型
文 化 程 度
高 中 以 下 高 中
高 中 以 上 合 计
V AS 3(3.5) 0(1.6) 4(1.8)
7
首 选 测 痛 量 表
V DS
NRS
16(18.7) 10(8.6)
18(19.7) 9(9.0)
11(9.7)
12(10.2)
37
39
FPS 44(39.0) 18(17.8) 15(20.2)
时,一般不作校正。
例9-2 将116例癫痫患者随机分
为两组,一组70例接受常规加高压氧 治疗(高压氧组),另一组46例接受 常规治疗(常规组),治疗结果见表 7-4。问两种疗法的有效率有无差别?
表9-3 两种疗法治疗癫痫的效果
治 疗 方 法
治 疗 结 果
有 效
无 效
高 压 氧 组 66( 62.8)
四格表资料检验的专用公式
2
(adbc)2n
(ab)(ac)(bd)(cd)
2(331041039)218634.10
7243143114
(四)四格表资料检验的校正公式
c2
( AT 0.5)2 T
(|ad-bc|-n)2n
c2
=
2
(a+b)(c+d)(a+c)(b+d)
2 分布是一连续型分布,而四格
合 计
乙 剂 量
死 亡 (+ )
生 存 (- )
6( a) 3( c)
12( b) 18( d)
9
30
合 计
18 21 39
上述配对设计实验中,就每个对子而 言,两种处理的结果不外乎有四种可能:

第九章 卡方检验

第九章   卡方检验
为客观起见,建议将两种结论同时报 告出来,以便他人判断。当然,如果 两种结论一致,如均为或,则只报道 非连续性检验的结果即可。
2020年3月4日
2020年3月4日
二、两相关样本率检验(McNemar)
1.资料类型
两个相关样本率资料又称配对计数资料,顾名 思义,是采用配对设计,且结果以频数方式表 达的资料,见例9-3。
3.合并理论频数太小的格子所相邻的行或
列。这样做同样会损失信息及损害样本的
随机性,但损失的信息比第②种方法小一
些。不过,应注意合并得是否合理,如不
同年龄组是可以合并的,但不同血型就不
能合并。
2020年3月4日
第三节、Fisher确切概率检验*
确切概率检验是由Fisher 1934年提出的一种用 于两个独立样本率比较的方法,故又称Fisher 确切概率法。有人认为,当样本量n和理论频数 T太小时,如n<40而且T<5,或T<1,或n< 20,应该用确切概率检验。这一观点所基于的 理论是,当样本量太小时,二项分布的正态逼 近性较差,因而不宜用基于正态分布的检验。 提出上述条件的另外一种考虑是确切概率法的 计算量偏大,但随着计算工具的大大改进,确 切概率法的应用不一定限于上述条件。
2020年3月4日
P
2020年3月4日
2020年3月4日
2020年3月4日
理论频数太小的三种处理方法
1. 增大样本量。以达到增大理论频数的目 的,属首选方法,只是有些研究无法增大 样本量,如同一批号试剂已用完等。
2. 删去理论频数太小的格子所对应的行或 列。这样做会损失信息及损害样本的随机 性。
2020年3月4日
2020年3月4日
2020年3月4日
2020年3月4日
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Chi-square test Statistics Statistic Statistician Population rate Sample rate Pooled rate Sample size Sampling error Hypothesis testing 卡方检验 统计学 统计量 统计学家 总体率 样本率 合并率 样本含量 抽样误差 假设检验
chi-square test for 2×2 table
If , then reject H0。There is statistically significant difference between 2 sample rates. Or the difference between 2 sample rates is statistically significant. Otherwise, no reason to reject H0。 There is no statistically significant difference between 2 sample rates.
chi-square test for paired 2×2 table
For example 9-3,
(160 48 32 9) 2 249 2 91.95 192 57169 80
1
P 0.005
The outcomes of 2 methods are not independent of one another.Or there is association between the outcomes of 2 methods.
192 80 192 80 T ( A B ) np ( A B ) 249 249 249 249
chi-square test for paired 2×2 table
Chi-square statistic and degree of freedom are both same as those of section 1. However, the design and purpose of study as well as the explanation of results are still different.
chi-square test for paired 2×2 table
关联的方向:
ad-bc > 0: 正相关 ad-bc < 0: 负相关
关联的程度:
Pearson列联系数:
Cp 91.95 0.5193 249 91.95
Cramer列联系数(修正)
Cc 91.95 0.6077 249
4. Analysis of data
H0 :
1 2
H1 :
1 2
0.05
chi-square test for 2×2 table
To apply chi-square test, the sample size should be large enough. Experience: n≥40 and all T≥5 nR nC ( A T )2 2 TRC T n
Vocabulary of chapter 9
Association Independence Categorical variable Distribution Goodness of fit test General formula Specific formula Continuity correction Completely randomized design Paired design 关联 独立 分类变量 分布 拟合优度检验 基本公式 专用公式 连续性校正 完全随机设计 配对设计
chi-square test for paired 2×2 table
4. Analysis of data Purpose 1: testing for the difference between 2 methods. Which is better for high positive rate? Note: The 2 samples are not independent. The above chi-square test does not work.
chi-square test for 2×2 table
2. Collection of data 3. Sorting data: 2×2 table Success Failure Sample 1 a b Sample 2 c d Total a+c b+d
Total a+b c+d n
chi-square test for 2×2 table
练习题: 用两种方法检查已确诊的乳腺癌患者120 名,甲法检出率为60%,乙法检出率为 50%,甲乙两法一致的检出率为35%,问 两种方法检出率有无差别?两种方法有无 关联?
chi-square test for R×C table
R×C table: R numbers of rows C numbers of columns
0.05
Question: if H0 is true, how much is the expected frequency of each cell?
chi-square test for paired 2×2 table
概率乘法定理:互相独立事件同时出现的概率等 于各事件单独出现时概率的乘积。
Vocabulary of chapter 9
Null hypothesis Alternative hypothesis Significance level Table of critical value P value Fourfold table Actual (observed) frequency Theoretical (expected) frequency Row total Column total 无效假设(零假设) 备择假设 检验水准 界值表 P值 四格表 实际(观察)频数 理论(期望)频数 行合计 列合计
2 2 0.05,
chi-square test for 2×2 table
n≥40 but any 1≤T<5 Yates correction (continuity correction)

2
( A T 0.5) 2 T
n 2 ( ad bc ) n 2 2 (a b)( c d )( a c)( b d )
( R 1)(C 1)
(ad bc) n (a b)(c d )(a c)(b d )
2 2
chi-square test for 2×2 table
If H0 is true, A and T should be close each other and chi-square statistic will tend to be small. If H0 is not true, chi-square statistic will tend to be large.
chi-square test for paired 2×2 table
1. Design Paired design. Each food sample has to be detected by method A and method B. 2. Collection of data
chi-square test for paired 2×2 table
2 2
For example 9-3, b+c=32+9=41>40,
b c
2
2
1
bc
32 9
32 9
2
12.90
P 0.005
chi-square test for paired 2×2 table
Conclusion: reject H0. There is statistically significant difference in positive rates of 2 methods. Since pA (77.11%) > pB (67.87%), method A is better. This test is called McNemar’s test.
卫生统计学Health Statistics
第九章
检验(II)
2
chi-square test(II)
余红梅
Department of Health Statistics
School of Public Health, Shanxi Medical University
Vocabulary of chapter 9
3. Sorting data: paired 2×2 table
Outcomes of method A and method B Method A Method B Total + - + 160 (a) 32 (b) 192 (a+b) - 9 (c) 48 (d) 57 (c+d) Total 169 (a+c) 80 (b+d) 249 (n)
2 2
chi-square test for paired 2×2 table
If b+c<40, chi-square needs correction.
bc bc 0.5 0.5 b c 2 2 2 b c 1 2 bc bc bfor paired 2×2 table
相关文档
最新文档