样本含量的估计(流行病学应用)

合集下载

样本量计算(Epiinfo2002流行病学分析软件的应用讲座补充资料)

样本量计算(Epiinfo2002流行病学分析软件的应用讲座补充资料)

应用Epi info2002流行病学分析软件进行样本量的计算(“Epi info2002流行病学分析软件应用讲座”补充资料,主讲人:李海闽) (一)关于Epi info2002计算样本量涉及的几个概念1、把握度又称检验效能(power of test),是用数量描述的事物现象之间如果确定有一个真正的差别存在,能被显著性检验所检出的概率。

数理统计学用β表示II型错误的概率,1-β称为把握度。

做研究设计时,如果要求检出差别显著性的把握度越大,则要求样本含量也越多。

2、置信水平置信水平(confidence level)是置信度的互补概率。

例如95%置信度,其置信水平为0.05;99%置信度,其置信水平为0.01。

一般情况α取0.05,则置信度为95%(1-α=0.95)。

3假设检验的两类错误由于假设检验是根据有限的样本信息对总体作推断,不论做出哪一种推断结论,都有可能发生错误。

这就是假设检验的两类错误。

如果实际情况与H0不一致,检验结论为拒绝H0,接受H1, ;或者实际情况与H0一致,检验结论为接受H0;这两种推断结论都是正确的。

如果实际情况与H0一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的H0,导致推断结论错误。

这样的错误称为第I类错误。

如果实际情况与H0不一致,也仅仅是抽样的原因使得统计量的观察值落到接受域,不能拒绝原本错误的H0,则导致了另一种推断错误。

这样的错误称为第II类错误。

表6-3 归纳了假设检验中两种实际情况和不同检验结论的关系。

犯第 I 类错误的概率用α来控制,其大小与检验水准相同。

根据研究者的需要。

常取为0.05 或0.01 等。

当α取为0.05 时,其意义是:如果原假设H0 成立,按照同样的方法在原假设H0 规定的总体中重复抽样,那么在每100 次检验结论中平均可以有5 次拒绝H0 (犯第I类错误)。

犯第II类错误的概率用β来控制。

因为H0 不成立时检验统计量的精确分布往往难以确定,所以在多数情况下准确估计β的数值比较困难。

常用流行病学研究方法

常用流行病学研究方法

医学
哲学
流行病学 研究方法
数学
预防医学第5版
20世纪中期开始,为适应多病因论的需求,在统计学的 帮助下,流行病学群体研究方法又有了突飞猛进的发展。 混杂因子、效应修饰因子的处理技术不断完善,解决了 在多个病因存在的条件下生物现象的或然性问题及巧合 现象,因果判断的能力进一步加强。 如今,流行病学的群体研究方法已被医学各领域广泛应 用,成为医学各学科不可或缺的研究方法。
预防医学第5版
二、现况研究
(一)现况研究的概念:
现况研究是在某一人群中,应用普查或抽样 调查的方法收集特定时间内、特定人群中疾 病、健康状况及有关因素的资料,并对资料 的分布状况、疾病与因素的关系研究所获得的资料是在某一时间横断面上收集的,故又称横 断面研究(cross sectional study)。
预防医学第5版
二、现况研究
(三)现况研究的种类:
1.普查:
普查(census)就是对总体中所有个体均进行 调查。现况研究中普查的含义为:在特定时间
对特定范围内人群中的每一成员进行的调查。
普查分为以了解人群中某病的患病率、健康状况等为目的的普查和以 早期发现病人为目的的筛检(screening)。 工作目的是早发现早诊断病人,使其得到及时治疗时,必须采用普查。
预防医学第5版
一、概述
(二)描述性资料的来源: 现况研究
专门设计的调查研究 生态学研究 个案调查 爆发调查
死亡报告 出生登记 常规记录资料 出生缺陷监测 药物不良反应监测 疾病监测等资料
预防医学第5版
一、概述
(三)描述流行病学的用途: 描述流行病学可以回答所描述的事件存在于什么时间、什么
地点和哪些人群中,数量是多少。对这些问题的回答可以: 为病因研究提供线索。 掌握疾病和病因的分布状况,为疾病防制工作提供依据。 用来评价防制策略和措施的效果。

流行病学方法—筛查试验

流行病学方法—筛查试验


由金标准证实未患研究疾病的非病例组:代表未患研究疾病的全体,与
病例组有好的可比性。
(三)确定样本含量:
公式如下:
=
2 ×(1−)

2
式中:α为一类错误的概率;
μ α为α对应的u值;
δ为容许误差;
P为灵敏度或特异度的估计值。
(四)确定截断值:

即确定试验阳性与阴性的界值

确定方法

ҧ ± 2s
N
灵敏度:筛检试验阳性者占受检
病人总数的百分比,是指将实际
有病的人正确地判断为患者的能
力。
假阴性率:又称漏诊率,是指实
际有病者而被判定为非病者的百
分比。
特异度:是指将实际无病的人正
确地判断为非患者的能力。
假阳性率:又称误诊率,是指实
际无病者而被判定为有病的百分
比。
约登指数:又称正确指数,是灵敏度和特异度之和减去1。约登

百分位数法

基于防治实际确定
(一)评价指标

真实性(validity):有效性,准确性(accuracy)。是指筛检试验测量值与
实际情况的符合程度,是正确地判定有病与无病的能力。
表11-8 评价资料整理表
金标准
试验
患者
非患者
合计
阳性
a真阳性
b假阳性
a+b
阴性
c假阴性
d真阴性
c+d
合计
a+c
b+d
度均高
便于判断筛检
效果
有早期可识别
的症状体征
有确诊条件和
治疗方法
疾病自然史
考虑经费

临床研究中样本量的估计方法

临床研究中样本量的估计方法
! 1 # 徐勇勇 + 医学统计学 ! 3 # + 北京 0 高等教育出版社 * "--10 & 2 1!""# $%&$ ’ ()*% +# *$ ’ $,&- . / !!!" #$%&’(" &)* ! " # 雷鸣 * 刘鸿里 * 丛雪峰 * 等 + 手术时机对高血压脑出血康复疗效的影响 ! , # + 中 国临床康复 * "--"* ’ . ) / 0 11&’ ! $ # 赵清波 * 徐勇勇 + 如何确定抽样研究所需要的样本量 ! , # + 中华预防医学杂 志 * "--1* $& . $ / 0 "-$ 2 % ! % # 李良寿 * 孙长生 * 李远贵 + 临床医学研究原理与方法 ! 3 # + 西安 0 陕西科学技 术出版社 * 144&0 "") 2 4 ! & # 陈倩予 + 胃癌术后肠内外早期营养支持对比观察 ! , # + 中国临床康复 * "--"* ’ . ) / 0 11’1 ! ’ # 王红 * 王永岗 * 危淑梅 * 等 + 肺癌术前呼吸锻炼的临床意义 ! , # + 中国临床康 复 * "--"5 ’ . ) / 0 11)) ! ( # 王芳 * 韩丽莎 * 闫秀英ቤተ መጻሕፍቲ ባይዱ* 等 + 旋磁场对糖尿病大鼠血糖及组织细胞学影响的观 察 ! , # + 中国临床康复 * "--"* ’ . $ / 0 $(’ ! ) # 鲁燕莉 + 肩周炎的康复治疗 ! , # + 中国临床康复 * "--"* ’ . ) / 0 11(’ 临床研究中样本量的估计方法

(完整版)第18章样本含量的估计

(完整版)第18章样本含量的估计

无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。

抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。

这就是样本含量估计(estimation of sample size)。

本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。

第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。

因此,尽量减小抽样误差是提高统计推断精度的必然要求。

在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。

同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。

但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。

比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。

由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。

同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。

(完整版)第18章样本含量的估计

(完整版)第18章样本含量的估计

第十八章样本含量估计无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。

抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。

这就是样本含量估计(estimation of sample size)。

本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。

第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。

因此,尽量减小抽样误差是提高统计推断精度的必然要求。

在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。

同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。

但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。

比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。

由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。

同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。

样本含量估计及等效性检验

样本含量估计及等效性检验

取α=0.05,β=0.1,将各组的 i的估计值: 2.79、4.01、3.84,及 i :0.26、0.27、1.11代 入公式,计算 i / k = (2.79+4.01+3.84) /3 = 3.55,查表α=0.05,β=0.1,ν1= 3 - 1 = 2,ν2= ∞,查表得 = 2.52 ,代入公式:
2 2 n i / k / i /( k 1) i 1 i 1
2 k k
将有关数据代入公式:
(0.26 0.27 1.11 ) 3 2.52 [ ] 2 2 2 ((2.79 3.55) (4.01 3.55) (3.84 3.55) ) / 2) 7
n
2 12.65 (2 sin
1
0.548 2 sin
1
0.149)
2
33
注:本公式采用三角函数的弧度计算
完全随机设计 多个率样本比较样本含量的估计 公式(二)
n 1641.6 (sin
1
max
1 2 sin min )
注意本公式采用三角函数的角度计算
将数据代入公式(二)
2.等效检验条件: (1).必须Λ>δ(δ为两样本率差 值); (2).应先作一般u检验,当P>α 时,再进行等效检验。
三、计数资料两样本率比较:
两样本率比较的等效性检验 可用u检验。
计数资料的等效性检验(公式):
u=(Λ-|P1-P2|)/Sp
SP = uc=(Λ-|P1-P2|-(1/n1-1/n2)/2)/Sp (此式为校正公式)

式中Λ为等效差值, P1、 P2 为两样本率,Sp为两 样本率合并标准误。

样本含量的计算

样本含量的计算
• 一般取0.8、0.9、0.95 • 即组间确有差别,则在100次试验中能发现 • 此差别的平均概率 • 检验效能不宜低于0.75 • β一般取单侧Z值
15
计算机模拟举例1
• 假设: • -试验组死亡率为20% • -对照组死亡率为50% • -试验组和对照组的样本量均为n=50 • -显著性水平为双侧0.05 • -检验方法=卡方检验
7
按试验类型
• 估计总体 • 样本与总体比较 • 配对资料 • 两样本比较 • 多样本比较
主要变量的性质
• 分类变量 • 数值变量
• 一般情况下,分类变量所需要的样本量多于数值变 量
9
按结局指标
•计数 定性 指标 死亡与存活, 阳性与阴性, 正常与异常
•计量 定量 指标 血压、血糖、血清酶
•结局指标有多个时,估计样本含量时需要选择其中 最重要的结局指标,或按照所需样本量最多的指标,
当k=1时两组样本含量相等,
24
• 例4:某一项研究吲达帕胺治疗原发性高血压的治疗, 经预试验得治疗前后舒压差值 mmHg 资料如下 与安慰 剂比较,两药治疗前后差异均有统计学差异 ,当 α=0.05,β=0.10时需要治疗多少例可以认为吲达帕胺 有效
z z n
211/k
2
2
s s 2(2k2 )/1 ( 1/k)
p(p1p22p)/2
本设计至少需要观察235例
30
2.2.4 两样本率比较
• 例8:某医师研究某药对产后宫缩痛、外阴创伤痛 效果,预试验旧药镇痛率为55%,新药镇痛率为75%, 当α=0.05,β=0.1时需要观察多少例能说明新药镇 痛效果优于旧药
N zz2 p1e 1p/ ck2p(1p)p
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本含量的估计
流行病学与卫生统计学教研室 戴江红
中药治疗子宫肌瘤的疗效研究
• 确诊为子宫肌瘤的患者60例,随机分为2组 • 中药组(消瘤散剂)30例 • 西药组(米非司酮)30例 • 分别治疗6个月 –中药组有效率60% –西药组有效率50% –P>0.05
以率的变化作为终点指标计算样本量
α水平相 应的标准 正态差
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05,β水平为0.05 ( 1-β=0.95) • Zα/2=1.96,Zβ=1.64 • p1=50%,p2=60% [1.96(2×0.55×0.45)1/2+1.64(0.5×0.5+0.6×0.4)1/2]2 N= =639例 (0.5 - 0.6) 2
计量资料 对照组血清胆固醇水平为215mg/dl,合理膳食可以使干 预组较对照组降低15mg/dl,已知从其他资料获得胆固醇标 准差为25mg/dl,规定=0.05(双侧),=0.05,计算各组 样本数?
N
2( Z a Z ) 2 2 d2
σ=25, d=15, Zα=1.96,Zβ=1.64 N=72 每组需要72例
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05,β水平为0.1 • Zα/2=1.96,Zβ=1.28 • p1=50%,p2=80% [1.96(2×0.65×0.35)1/2+1.28(0.5×0.5+0.8×0.2)1/2]2 N= (0.5 - 0.8) 2 =50例
(p1+p2)/2
对照组 发生率
N
[ Z 2 p (1 p ) Z
p1 (1 p1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
为1-β水平相应 的标准正态差
试验组发生率
N:为计算所得一个组的样本大小
样本含量的确定与以下因素有关:
• 设计的类型 • 主要变量的性质 • 临床上认为有意义的差值 • 显著性水平α • 把握度1-β
病例分析(3)
• 实验室检查 – 尿: 潜血+ 白细胞胆红素葡萄糖++++ 酮体+ • 实验室检查 – 血液: 葡萄糖+++ 尿素氮++ 碳酸氢盐正常
病例分析(4)
• 女孩可能:І型糖尿病 • 她的父母向护理专家进行咨询 糖尿病的知识 胰岛素的自我给药 饮食控制 葡萄糖监测
N
[ Z 2 p (1 p ) Z
p1 (1 p1 ) p 2 (1 p 2 ) ]2
( p1 p 2 ) 2
• Zα/2=2.58,Zβ=1.64 p1=50%,p2=80% N =111例 如果随访过程可能10~20%的脱失 则最少每组应保证:111/0.90=124人 111/0.80=139人
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05,β水平为0.1 ( 1-β=0.9 ) • Zα/2=1.96,Zβ=1.28 • p1=50%,p2=70%
[1.96(2×0.6×0.4)1/2+1.28(0.5×0.5+0.7×0.3)1/2]2 N= =124例 (0.5 - 0.7) 2
样本含量的确定与以下因素有关:
• 设计的类型(流行病学) • 观察性研究 • 实验性研究
样本含量的确定与以下因素有关:
• 主要变量的性质 • 分类变量 • 数值变量 • 计数资料所需的样本含量要大些 • 计量资料所需的样本含量可少些
样本含量的确定与以下因素有关:
• 临床上认为有意义的差值 • 对照组的发生率 • 实验组的发生率
练习: 用旧药治疗慢性肾炎的有效率为30%,现试验新药 疗效,新药的有效率必须达到50%才认为有推广价 值,问每组各需要多少例患者? 设α=0.05,β=0.10
查表:Zα/2=1.96,Zβ=1.28
计算:N=?
N
[ Z 2 p(1 p) Z p1 (1 p1 ) p2 (1 p2 ) ]2 ( p1 p2 )
病例分析(1)
• 一名活泼的13岁中学生向她的父母抱怨说: – 一周来总是口渴、尿频和疲劳
• 一家人去拜见他们的家庭儿科医生
– 女孩每天要喝3升以上的水 – 24小时排尿8次,至少有一次夜尿 – 学习成绩有所下降
病例分析(2)
• 临床查体 无发热 脉搏80次/分(有些偏高) 血压正常 呼吸次数正常 女孩体重比3个月前减轻了1kg 其他未发现异常
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05,β水平为0.1( 1-β=0.9 ) • Zα/2=1.96,Zβ=1.28 • p1=50%,p2=60% [1.96(2×0.55×0.45)1/2+1.28(0.5×0.5+0.6×0.4)1/2]2 N= (0.5 - 0.6) 2 =518例
*双侧检验时Zβ与单侧检验时相同
流行病学研究中的第Ⅰ类和第Ⅱ类错误
人群 样本 有差别 有差别 1﹣β 把握度 β(第Ⅱ类错误) 假阴性 无差别 α(第Ⅰ类错误) 假阳性 1-α
无差别
中药治疗子宫肌瘤的疗效研究
• 确诊为子宫肌瘤的患者60例,随机分为2组 • 中药组(消瘤散剂)30例 • 西药组(米非司酮)30例 • 分别治疗6个月 –中药组有效率60% –西药组有效率50% –P>0.05
2
练习: 用旧药治疗慢性肾炎的有效率为30%,现试验新药 疗效,新药的有效率必须达到50%才认为有推广价 值,问每组各需要多少例患者? 设α=0.05,β=0.10
查表:Zα/2=1.96,Zβ=1.28
计算:N=124
中药治疗子宫肌瘤的疗效研究
• 确诊为子宫肌瘤的患者60例,随机分为2 组 • 中药组(消瘤散剂)30例 • 西药组(米非司酮)30例
• 比较瘤体缩小
以定量指标的变化作为终点指标计算样本量
为1-β水平相应 的标准正态差
估计的标 准差
N
2( Z a Z ) 2 2 d2
两组连续变 量均值之差
α水平相应的 标准正态差
公式适用于N≥30时
n1 n
2
( z 2
/ 2
z


)
2
【例】为研究某地正常成年男、女末稍血液的红细胞的 差别,据文献报道,男性红细胞均数为465万/mm3 ,女 性红细胞均数为422万/mm3,标准差为52万/mm3,取双 侧α=0.05,把握度(1-β)=0.9,问要抽查多少人才能 发现男女间红细胞的差别?
样本含量(sample size)
• 为了保证研究结论的可靠性,确定的实验研究 或调查研究所需要的最低观察对象的数量。 • 样本含量少,指标不稳定,精密度和准确度 差;检验功效低。研究结论不可靠。 • 样本含量过多,造成人财物的不必要浪费。混 杂因素多,影响数据质量。
N
[Z

2 p (1 p ) Z
N
[Z

2 p (1 p ) Z
Hale Waihona Puke p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.01,β水平为0.05 ( 1-β=0.95) • Zα/2=2.58,Zβ=1.64 • p1=50%,p2=60% [2.58(2×0.55×0.45)1/2+1.64(0.5×0.5+0.6×0.4)1/2]2 N= =878例 (0.5 - 0.6) 2
N
[Z

2 p (1 p ) Z

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• Zα/2=2.58,Zβ=1.64 p1=50%,p2=80% [2.58(2×0.65×0.35)1/2+1.64(0.5×0.5+0.8×0.2)1/2]2 N= (0.5 - 0.8) 2 =111例 估计随访过程可能10~20%的脱失,则最少每组应 保证多少人?
结局+ 实验组 (干预措施)
随 机 分 组
结局- 随访观察 结局+ 对照组 (对照措施) 结局-
病人群体
样本
临床试验原理示意图
可能比较的结局指标
• 生存率 • 生存质量 • 不良反应 • 并发症:如由于糖尿病所致的血管问题的危险 • 测量糖化血红蛋白,一种监测长期血糖水平的指示剂 • 在特定时间点上的血糖水平

p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.01,β水平为0.05 • Zα/2=2.58,Zβ=1.64 • p1=50%,p2=80% [2.58(2×0.65×0.35)1/2+1.64(0.5×0.5+0.8×0.2)1/2]2 N= =111例 (0.5 - 0.8) 2
以率的变化作为终点指标计算样本量
α水平相 应的标准 正态差
(p1+p2)/2
相关文档
最新文档