四格表的确切概率法教学材料

合集下载

医学统计学案例分析

医学统计学案例分析

案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。

经检验,得连续性校正χ2=,P>,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。

表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率(%)14中药12();2()西药6()7()1327合计18%9【问题1-5】(1)这是什么资料(2)该资料属于何种设计方案(3)该医师统计方法是否正确为什么【分析】(1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。

(2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。

、(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。

当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析-卡方检验(一)【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。

该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t =,P=,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=,P=,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】(1)这是什么资料(2)该资料属于何种设计方案(3)该医师统计方法是否正确为什么(4)该资料应该用何种统计方法【分析】 (1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。

(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。

(3) 该医师统计方法不正确。

因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。

医学统计学案例分析2

医学统计学案例分析2

案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。

经检验,得连续性校正χ22=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。

表1-4两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7西药6(8.67)7(4.33)1346.2合计1892766.7【问题1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】(1)该资料是按中西药的治疗结果(有效、无效)分类的计数资料。

该资料是按中西药的治疗结果(有效、无效)分类的计数资料完全随机设计方案。

(2)27例患者随机分配到中药组和西药组,属于例患者随机分配到中药组和西药组,属于完全随机设计方案(3)患者总例数n=27<40,该医师用χ2检验是不正确的。

当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in2×2table)直接计算概率案例分析-卡方检验(一)【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。

该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1)该资料是按中西药疗效(有效、无效)分类的该资料是按中西药疗效(有效、无效)分类的二分类资料,即计二分类资料,即计数资料。

(2)随机抽取140例胃炎患者分成西药组和中药组,属于属于完全随机设完全随机设计方案。

15-2配对四格表资料差别检验的精确概率方法_刘玉秀

15-2配对四格表资料差别检验的精确概率方法_刘玉秀

南京大学学报(自然科学)第34卷 第5期 JOU RN AL OF NAN JING U NIV ERSIT Y Vol.34,No.5 1998年9月 (N ATU RAL SCIENCES ) Sept .,1998配对四格表资料差别检验的精确概率方法刘玉秀 刘 钧(南京大学医学院临床学院南京军区南京总医院 医务部,210002,南京)摘 要 探讨用于配对四格表资料差别检验的精确概率方法。

方法:在配对四格表资料两组率差为0的无效假设下,根据两项分布的原理,可导出假设检验用的精确概率计算公式,借此公式经逐一计算,给出b ≤20和c ≤10不同组合时的单、双侧检验精确概率值。

提供了配对四格表资料差别检验的精确概率计算公式,并构造出b ≤20和c ≤10的精确概率速查表。

结论:M cN emar 卡方检验方法仅适于b +c >20情形,当b +c ≤20时宜用本文介绍的精确概率方法:或通过公式计算或直接查表。

关键词 配对四格表,假设检验,精确概率分类法 R311a0 引 言医学研究中经常会遇到配对形式的四格表资料,该类资料数据处理的目的一般为推断两因素(处理)间有无关联或两处理的结果间有无差异(此种情况更为多见),前者可采用通常四格表资料处理的卡方检验法或Fisher 精确概率法,后者常规应用的方法为M cNem ar 卡方检验法,但此方法需满足一定的条件,当配对四格表中(b+c)较小(<20)时不宜使用,应考虑选用配对四格表资料差别检验的精确概率计算方法。

表1 A 、B 两种检验方法对血中某抗体的检出情况T able 1 T he o utcome o f two test matho dsA B +-合 计+461460-43640合计50501001 举 例欲比较两种检验方法对血样中某抗体的检出率,将100份血样同时用两种方法进行检测,结果为阳性或阴性。

根据检测的结果,应以血样本为基本单位,整理成数据对子数为100的配对形式的四格表资料(表1)进行两方法间检出率a收稿日期:1997-07-14;修回日期:1998-03-03第一作者简介:刘玉秀,男,1966年2月生,主治医师,现从事科研管理,曾发表“生物检定数据效价比值的广义线性模型估计”等论文差异的检验时,应进行专用于配对四格表资料的检验方法。

递进法讲解四格表fisher确切概率法

递进法讲解四格表fisher确切概率法
Ⅳ,f。即 : J) I l .二 ) :
CN

第一步 : 以假设检验的过程为 出发点 。 首先帮助学生复习假设检验 的过程 , 重强调假设检验 都 着 是在 H 成 立的条件 下 , 0 根据研究 的 目的 、 究设 计 的类 型和资 研 料 的特点等选择合适 的统计量 ,比如 t 统计量 统计 量等 , 然 后通过 统计 量与相应 的界值做 比较 , 出 P值 的范 围 , 得 最后 与 检验水准 做比较 , 得出统计学结论和专业 结论。 在这里 , 我们 强调 P值范 围是基于某一统计量 的分布来 确定的。
本” 出现概率还要小 的所有情况出现的概率之和 。
第 三步 : 举一个经典 的例子说 明超 几何分布 的含义及其概 率 的计算方法1 2 1 。
在数理统计学教学中常用的经典例子 : —批产品共 J件 , 7 其 v
本思想 , 进行对 P值含 义 的充 分理解 , 然后 基于超几 何分布 的 思想 , 解析 “ 四格 表周边合计 不变 ” 的本 质 , 出所有 可能 的组 得 合, 进而求解 当前组合发生 的概率和“ 不利于 风” 的更极 端组 合
并进一步体会假设检验的基本过程和 P值 的含 义。结果证 明, 应用该 法基本 可达到教 学要 求 , 可供 同行借鉴。
关键词 : 卫生统计学 ; 四格表 fh r i e 确切概率法 ; s 递进 法 ; 教学
中 图分 类号 : 4 4 G 2 文 献 标识 码 : B 文 章 编 号 :6 1 14 (0 9)0 0 6 - 2 17 — 2 6 2 0 2 -0 5- - 0
3 4 写 的 方 面 .
地择取 。 我们 中等卫生职业学校 自编的语 文教材就专门设计 了

四格表资料的Fisher确切概率法资料讲解

四格表资料的Fisher确切概率法资料讲解
H0成立时, 304例老年胃溃疡患者中胃出血发生人数的分布
9
二、两样本率比较
目的:推断两个样本各自代表的两总体率是否相等 应用条件:当两个样本率均满足正态近似条件时,
可用u检验。
up1p2 sp1p2
p1p2
pc(1pc)(n11
1) n2
pc
x1 n1
x2 n2
10
两样本率比较
例5 为研究高血压病的遗传度, 某医师进行了高血 压子代患病率调查。其中父母双亲有一方患高血压 者调查了205人,其中高血压患者101人;父母双亲 均患高血压者调查了153人,其中高血压患者112人。 问双亲中只有一方患高血压与双亲均患高血压的子 代中,高血压患病率是否相同? 本例 p1=101/205=0.49268
H0(=0=50) 成立时,1小时内该装置发出的质点数的概率分布 19
样本阳性数与总体平均数的比较----直接计算概率法
例10 某省肺癌死亡率为35.2/10万,在该省某 地抽查10万人,进行三年死亡回顾调查,得肺 癌死亡数为82人。已知该地人口年龄别构成与 全省基本相同。问该地肺癌死亡率与全省有无 差别?
本例π0=0.80,1-π0=0.20,n=10, 根据题意需求最少治愈9人的概率。
5
样本率与总体率的比较----直接计算概率法
例2 据以往经验,新生儿染色体异常率一般为1%, 某医生观察了当地400名新生儿,发现有1例染色体 异常,问该地新生儿染色体异常率是否低于一般?
H0成立时, 400名新生儿中染色体异常例数的概率分布
p1=70/100=0.70 p2=60/120=0.50 pc =(70+60)/(100+120)=0.5909
12

四格表资料的确切概率法

四格表资料的确切概率法
合计
愈合
未愈合
64(57.84) 21(27.16)
51(57.16) 33(26.84)
115
54
合计 85 84
169
愈 合 率 (%) 75.29 60.71 68.05
表 反应变量按二项分类的两个独立样本资料
反应结果
阳性
阴性
观察 总频数
阳性 频率
样本 1
A11
A12
n1 ( 给 定 ) P1 A11 n1
理论频数
f1 F1 2 ( f2 F2 )2 ... ( fk Fk )2
F1
F2
Fk
k 1 (计算理论分布时利用
自由度 样本资料估计的参数个数)
(3) 确定概率 P 并作出统计推论。
注意:理论频数F不宜过小,如不小于5,否则需要合并
例 6-1 某 医 学 院 校 医 生 随 机 抽 取 100 名 一 年 级
0
f
( 2)
1
2( / 2)
2
2
( / 21) e 2 / 2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18卡方值Fra bibliotek性质:若 2 (1 ), 2 (2 )互相独立,

2 (1 ) 2 (2 ) 服从 2分布, 自由度 1 2 2 (1 ) 2 (2 )服从 2分布, 自由度 1 2
第二节 拟合优度检验
类别或组段 观察频数
理论频数
1
f1
F1
2
f2
F2



k
fk
Fk

四格表资料的Fisher确切概率法资料讲解

四格表资料的Fisher确切概率法资料讲解
H0(=3)成立时, 每毫升水中大肠杆菌数的概率分布
17
样本阳性数与总体平均数的比较
2. 正态近似法
近似
x ~ N(0,0)
u X 0
当μ0≥20时,
0
,可利用Poisson分
布的正态近似原理做检验。
18
样本阳性数与总体平均数的比较----直接计算概率法
例9 质量控制标准规定某装置平均每小时发出质点 数不超过50个。今抽查一次,在1小时内测得该装置 发出的质点数为58个,问该装置是否符合要求?
87.00
39
卡方检验基本思想
2
2
2 (AT)2
T
(行 数 1)列 ( 数 1)
TRC
nR.nC n
应用检:验用的于检两验个统或计多量个为样本率,度检验。
40
3. P 值的确定
卡方检验基本思想
2
2
2
2 ,
P
检2验 时2,,要根P据自由度ν 查附表9 界值表。
表 6-1 两组降低颅内压有效率的比较
组别
有效
无效
合计 有效率(%)
试验组 99(90.48) a 5(13.52) b 104 (a b) 对照组 75(83.52) c 21(12.48) d 96 (c d)
95.20 78.13
合计 174 (a c) 26 (b d) 200 (n)
例11 某省肿瘤研究所分别在甲、乙两县随机抽 查10万育龄妇女,进行追踪观察。三年中甲县 死于宫颈癌的有28人,乙县死于宫颈癌者47人。 问甲乙两县宫颈癌死亡率有无差别?
23
两样本阳性数的比较
例12 某车间在改革生产工艺前,随机测量三次 车间空气中的粉尘浓度,每次取1升空气,分别测 得有38、29、36颗粉尘;改革生产工艺后又测量3 次,每次取1升空气,分别测得有25、18、21颗粉 尘。问工艺改革前后粉尘浓度是否有变化?

Fisher确切概率法

Fisher确切概率法

第三节四格表资料的Fisher确切概率法前面提及,当四格表资料中出现,或,或用公式(8-1)与公式(8-4)计算出值后所得的概率时,需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。

该法是由,其理论依据是超几何分布(hypergeometric distribution),并非检验的范畴。

但由于在实际应用中常用它作为四格表资料假设检验的补充,故把此法列入本章。

下面以例8-1介绍其基本思想与检验步骤。

例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表8-3。

问两组新生儿的HBV总体感染率有无差别?表8-3两组新生儿HBV感染率的比较组别阳性阴性合计感染率(%)预防注射组 4 18 22 18.18非预防组 5 6 11 45.45合计9 24 33 27.27一、基本思想在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准做出推断。

1.各组合概率的计算在四格表周边合计数不变的条件下,表内4个实际频数, ,,变动的组合数共有“周边合计中最小数+1”个。

如例7-4,表内4个实际频数变动的组合数共有个,依次为:(1) (2) (3) (4) (5)0 22 1 21 2 20 3 19 4 189 2 8 3 7 4 6 5 5 6ad-bc= -198ad-bc= -165ad-bc= -132ad-bc =-99ad-bc= -66(6) (7) (8) (9) (10)5 176 167 158 149 134 7 3 8 2 9 1 10 0 11ad-bc= -33ad-bc=0ad-bc=33ad-bc=66ad-bc= 99各组合的概率服从超几何分布,其和为1。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k i1 ni mi 2Aii
(7-14)
其中k为类别数,ni和 m分i 别为第i行合计和第i列合计。 H 0成立时(7-14)式中统计量服从自由度为k-1的
2分布。
当k=2时,(7-14)式便回到(7-12)式,这说明
本节的方法McNema是r检验的推广。
例7-7,
Tk1 k (ni mi)2
• 2.当多个样本率(或构成比)比较的检验,结论 为拒绝检验假设,只能认为各总体率(或总体构 成比)之间不全相等,但不能认为彼此间都不相 等。若要比较彼此间的差别,可用行×列表的分 割法。
• 3.对于行×列表单向等级资料(单向有序资料) 组间的比较,宜用第八章秩和检验,如作卡方检 验法只说明各处理组的效应在构成比上有无差异, 而不能说明组间整体效应的差异。
甲培养基
阳性 阴性 合计
阳性
22 (a) 2 (c) 24
乙培养基 阴性 18 (b) 14 (d) 32
合计
40 16 56(固定值)
配对设计
对子号

1
阳性
2
阳性


56
阴性
乙 阳性 阴性
… 阴性
两种培养+) 阴性(-)
阳性(+) 22(a) 18(b) 40 阴性(-) 2(c) 14(d) 16
| P1- P2 | 0.5000 0.3167 0.1333 0.0500 0.2333 0.4167 0.6000
end
P(i) 0.0124 0.1061
0.0405 0.0028
❖余仿此,P(0)=0.0124, P(5)=0.0405, P(6)=0.0028, 因此所求概率为:
P =P(0)+P(1)+P(5)+P(6)=0.0124+0.1061 +0.0405+0.0028=0.1618
❖ 推断结论 按=0.05的水准,不拒绝H0,差异无
统计学意义。还不能认为两批食品卫生状况有差 别。
end
这类问题的原始数据可以表示为表7-11所示的四格 表形式。表7-11和表7-3的区别仅在设计上,前面是 两个独立样本,行合计是事先固定的;而这里的“两 份样本”互不独立,样本量都是n,固定的,而行合计 与列合计却是事先不确定的。
变量1
阳性 阴性 合计
表7-11 两个变量阳性率比较的一般形式和符号
阳性
P (a b)(!cd)(!a c)(!bd)! a !b !c !d !n !
end
例7-14 抽查两批食品的卫生状况,作大肠杆菌检 查,检查结果见表6-10。问两批食品的卫生状况有 无差别?
• 表7-14 甲乙两批食品大肠杆菌检查结果
组 别 阳性数 阴性数 合计
阳性率 (%)
甲批 26(28.8) 7(4.2)
b18与 c2作 2检 验
H 0 : 两种培养基上白喉杆菌生长的阳性概率相等 H 1 : 两种培养基上白喉杆菌生长的阳性概率不相等
检验水准 0.05
若 H 成0 立, 白喉杆菌生长状况不一致的两个格 子理论频数都应该是 (bc)/ 2
由检验 基2 本公式(7-1)有
2
b
bc2 2
c
b
2
c2
检验水准 0.05
变量1
1 2 … R 合计
表7-13 配对设计下多分类资料的R×R列联表
变量2
1
2

R
合计
A11
A12

A1c
n1(固定值)
A21
A22

A2c
n2(固定值)





AR1
AR2

ARR
nR(固定值)
m1
m2

mR
n(固定值)
配对设计下多分类资料一般可表示为表7-13的形 式。表7-13是表7-11的推广,这里的定性变量1和 变量2都有R个可能的“取值”,R〉2。
33
41.67
乙批 36(33.2) 2(4.8)
38
合计
62
9
71
10.00 27.27
end
计算 P 值
• 表7-14中甲批食品阳性率P1=0.4167,乙批食品阳性 率P2=0.1000,两者之差| p1-p2 |=0.3167。在周边
合计数不变的条件下,可能还有其它组合的四格表, 其阳性率之差≥0.3167,所有这些比当前四格表更
变量2 阴性
a
b
c
d
m1
m2
合计
n1 n2 n(固定值)
由表7-11不难看出,
变量1的阳性率 n1 a b nn
变量2的阳性率 m1 a c nn
变量1的阳性率—变量2的阳性率abacbc
nn n
可见,两个变量阳性率的比较只和b、c有关,而与a d无关。
回到表7-10,两种培养基白喉杆菌生长状况一致
2 0 .0 5 (1 ) 3 .8 4 ,1 1 .2 5 3 .8 4 ,P 0 .0 5 ,
按 0水.05准拒绝 ,H 0 差别有统计学意义, 可以认为,两种培养基上白喉杆菌生长的阳性概
率不相等。鉴于甲培养基阳性频率为 40/56==71.4%,乙培养基为24/56=42.9%,可 以认为,甲培养基阳性概率高于乙培养基。
k i1 ni mi 2Aii
3 1 ( 6 5 - 6 8 ) 2 (5 1 5 4 )2
(3 4 2 8 )2
3 6 5 + 6 8 - 2 6 0 5 1 5 4 2 4 2 3 4 2 8 2 1 7
=1.60
2 0 .0 5 ,2 5 .9 9 ,1 .6 0 5 .9 9 ,P 0 .0 5 ,
故尚不能认为甲法测定结果的概率分布与乙法测 定结果的概率分布不同。
将上述方法用于多等位基因传递不平衡检验
搜集n对同胞,每一对中必须有一位是某疾病的患 者,另一位未患该疾病;变量1为该病患者在某位点 的等位基因类别,变量2为未患者在该点的等位基因 类别。要检验的是:同胞对中患病者与未患病者在 该位点上等位基因的概率分布是否相同。如果两个 概率分布不同,则该基因位点可能与该疾病有关。
假设检验基础
一、二分类情形--2×2列联表
2 (bc)2 v1
bc
一、二分类情形--2×2列联表
k1 k
T
(ni mi)2
k i1 ni mi 2Aii
第六节* 四格表的确切概率法
• 前已述及,四格表若有理论频数T小于1,或n<40时,
尤其是用其他检验方法所得概率接近检验水准时, 宜用四格表的确切概率法(exact probabilities in 2×2 table),即四格表概率的直接计算法。 • 本法的基本思想是:在四格表周边合计不变的情况 下,获得某个四格表的概率为 :
序号( i) 0 1 2 3 4 5 6
阳性
6 0 5 1 4 2 3 3 2 4 1 5 0 6
阴性
6 10
7 9 8 8 9 7 10 6 11 5 12 4
P1 P2 0.5000 0.0000 0.4167 0.1000 0.3333 0.2000 0.2500 0.3000 0.1667 0.4000 0.0833 0.5000 0.0000 0.6000
第五节 检验要注意的问题
• 1. 理论数不宜太小,一般不宜有1/5以上格子的 理论频数小于5,或有一个理论频数小于1。对理 论数太小有三种处理方法:
• ①最好增加样本含量以增大理论频数;根本的方 法。
• ②删去理论频数太小的行和列;此法不好。 • ③将理论频数较小的行或列与邻行或邻列合并以
增大理论频数。但后两法可能会损失信息,
极端的情况都应考虑进去,因为这些极端情况在H0
条件下都有可能发生。
end
❖ 表7-11中| p1-p2 |≥0.3167的四格表为序
号(0)、(1)、(5)、(6)的情形,按公式 求得序号(1)的概率为
12!10!6!16!
P(1)
0.1061
5!7!1!9!22!
end
表7-11 确切概率计算表(四格表周边合计数不变)
合计
24
32
56
本例是以每份标本一分为二,分别同时接种于两种 培养基上,属于配对设计;两份样本实质上是一样的, 不是互相独立的,观察白喉杆菌生长与否,指标为二 分类的定性变量;目的是通过样本资料来推断两方法 的阳性概率有无差别。
观察结果甲培养基的阳性率等于40/56,乙培养基 的阳性率等于24/56,比较总体阳性概率不能用前面 第二节的办法,原因是前面的办法针对的是“两组独 立样本”,而现在我们遇到的实质上是一组样本,即 使分成了两份,也是“两份互不独立的样本”需要另 想方法。
以上检验称为 McNemar 检验。
我们将两个变量不一致的总例数(b+c)视为 固定值,在此条件下进行推断无需考虑两变 量一致的总例数a和d的大小。这类方法在统 计学中称为条件推断方法。当然,也有文献 报道对此类问题进行非条件推断的方法,这 时a和d的信息都能用上,但十分复杂,超出 了本书的范围。
异常
2 9 17 28
合计
65 51 34 150(固定值)
类似于例7-6,这里是配对设计,只是定性变量有
3种可能的“取值”;甲方法的测定结果 65,51,34
是一组频数分布;乙方法的测定结果 68,54是,28另 一组
频数分布。
需要检验的是
H 0 : 两种测定方法的检查结果的概率分布相同 H 1 : 两种测定方法的检查结果的概率分布不相同
bc
bc
2
2
化简后不难得到, 2统计量的计算公式为
相关文档
最新文档