样本含量估计及等效性检验教学内容
样本含量估计ppt课件

26
确定样本量的方法---查表法
σ=1.5 δ=0.2 σ/δ =1.5/0.2=7.5
公式计算法:uα/2=1.96 n=(1.96)2(1.5)2/(0.2)2=216.1≈217
δ
检
检
总总
容
验
验
体体
许
水
效
标率
误
准
能
准
差
差7检验水准(Fra bibliotek值)即假设检验第一类错误出现的概率,也称假阳性率,,即检验水 准或显著性。α越小,所需的样本量越大,反之就要越小。α水平由 研究者根据具体情况决定,通常α取0.05或0.01。 ❖ 另外还应明确是单侧或双侧检验。
用统计学检验时,当研究结果高于和低于效应指标的界限均有 意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于 或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量 就小。当进行双侧检验或单侧检验时,其α或β的U界值通过查标准 正态分布的分位数表可得。
地区性研究:平均样本人数500-1000人; 全国性研究:1500-2500人 描述性研究:样本最少占总体的10%,如果总体较小,则最
少占总体20% 相关性研究:受试者至少30人以上
6
确定样本量的方法---计算法和查表法
❖ 样本含量估计常用的两种方法。
❖ 需要提前确定以下参数:
TEXT
α
1-β
σ和π
u u 211/ k 2
n
2
试验组样本量为n,对照组样本含量为kn, 当两组样本含量相等时,k=1。
第19章 样本含量估计

for the Reporting of
QUality Of
Meta分析QUOROM和MOOSE指南(the
Reporting Of Meta-analyses of randomized controlled Trials & Meta-analysis Of Observational Studies in Epidemiology)
总体均数的估计 总体率的估计
引例
拟采用单纯随机抽样的方法调查某地区男性成年人 群血红蛋白含量 (g/L) 的平均水平。根据文献,中 国男性成人血红蛋白含量为 (140±30)g/L,要求所 获得允许误差不超过5g/L,取=0.05,问需要调查 多少位该地区成年男性?
设血红蛋白服从正态分布 从X~N(140, 302)总体中进行抽样 样本均数在135~145g/L之间的概率为1-0.05
抽样研究的目的
统计推断:在于利用实际观测得到的样本信息推断 未知的总体特征
参数估计:利用样本统计量估计总体参数
• •
X p
假设检验:利用样本信息完成总体间比较,并发现其差
异,从而说明研究因素与所研究事物间的联系
• 利用 X 完成总体均数 之间的比较 • 利用 p 完成总体均数 之间的比较 • 利用回归系数b(或相关系数r)完成 (或)与0的比较
57.3 Z /2 n arcsin( (1 ))
2
例18.2
研究某地菜农钩虫感染率,要求允许误差不 超过2%,取=0.05 ,需调查多少人?
根据题意, =2%=0.02 ; =0.05 , Z0.05/2=1.96 ,
12_第十二讲_样本含量估计

8. 交叉设计样本含量估计 9. 相关分析的样本含量的估算 10. 病例对照研究的样本含量估算(非配对) 11. 病例对照研究(配对/成组) 12. 方差分析的样本含量
14. 卡方检验的样本含量 15. 多元线性回归 16. Logistic 回归 17. Logrank 检验 18. 生存率比较样本含量的计算 19. 两样本比较秩和检验的样本含量
经验估算是否可行?
一、样本含量估计的四基本要素
I型错误概率:即检验水准,越小, 所需样本含量越多, 一般取0.05; II型错误率或检验效能(1-,一般取 0.90,0.95,0.80等); 临床上最小有意义的差值 ; 总体标准差S或总体率。 其它:变量类型,单双侧检验等
失访率5%-10%,校正样本含量 每组n= 1150 5%校正n=1213 10%校正n=1280
5、若有多个重要结局指标,需要重复估算, 取量最大者;
6、组间例数不等时,样本含量需校正
在总例数一定时,组间例数相等时的检验效 能最大 (多组同样)。 若样本例数不等,则样本含量需加以校正。
其中 d为同一对象两阶段差值的标准差, 为临床上认为有意义的均数差值。
6、两样本生存率比较的样本含量
Pe、Pc分别为试验组和对照组的生存率; Qe+Qc=1
实例分析:无截尾值
两种疗法治疗某种癌症,新法的5年生存率为 72.5%,旧法5年生存率为52.5%, 计算样本含量。 两组的研究对象例数相同,各需要170例。
3、约定很关键:在计算样本含量之前, 一定要明确欲检测有临床意义的差值及 其表达方式。
可为可信区间的宽度、检验出有临床意义 的差值。 常用绝对值的形式表示,有时为了更好理 解,也可用相对数形式 不能确定△时,需做敏感性分析,即借助 于Power与样本含量曲线;
样本含量估计

2024/4/18
试验组-对照组= δ
最终所需样本量
1 =0 =113例
总样本量N=226例
15
三、常见研究设计类型的样本含量的估计
两组平行设计、定量、非劣效
某研究者欲评价试验药物A缓解癌症患者癌因性疲乏症状的有效性。以药物B为阳性
药物,设计了一项随机、双盲双模拟、平行对照、多中心临床试验。
-δ
0
-δ
0
δ
非劣效性试验:确定非劣效界值-δ !
H0:T-C ≤ - δ ;H1:T-C> - δ ;α=0.025(单侧)
由临床专家与统计学专家商量,最终由临床研究者确定。
2024/4/18
7
二、估计样本含量需要考虑的因素——研究设计
目的
假设检验
设计类型:
平行设计
交叉设计
实验设计
-14d
N1=13例;N2=13例
✓ I类错误:α=0.05
✓ II类错误:β=0.20
N1=17例;N2=17例
✓ 脱失率:20%
✓ 统计分布: 正态分布
✓ 效应量: 文献发现,服用标准药的受试者平均心率为μ1=93 次/分,标准差为σ= 9 次/分,同
2024/4/18
17
一个受试者相邻两次测量值之间相关系数均为ρ=0.7。两组受试者服药后平均心率
病例数
常见ADR概率(%) 一般ADR概率(%)罕见ADR概率(%)
假定总发生率为5%
假定总发生率为1% 假定总发生率为0.1%
100
99.41
63.40
9.52
100+300
>99.99
用样本估计总体教学设计

用样本估计总体 教学设计一、课程名称:(适用大部分课程教案)二、授课对象高中二年级学生,具备基础的统计学知识和一定的数据分析能力。
三、授课时间2课时,每课时45分钟。
四、授课教师张XX,高中数学教师,具备多年统计学教学经验。
五、教学目标1、知识与技能目标(1)掌握用样本估计总体的基本原理和方法;(2)能够运用不同的估计方法对总体参数进行估计;(3)学会分析估计结果的可靠性和准确性。
2、过程与方法目标(1)通过实例分析,培养学生运用统计学方法解决实际问题的能力;(2)培养学生合作探究、交流讨论的学习习惯;(3)提高学生运用计算工具进行数据分析的能力。
3、情感态度价值观目标(1)培养学生对统计学的好奇心和兴趣,激发学生学习积极性;(2)使学生认识到统计学在现实生活中的重要作用,增强学生的应用意识;(3)培养学生严谨、客观的科学态度,提高学生的数据分析素养。
六、教学重占和难点1、教学重点(1)用样本估计总体的基本方法;(2)估计结果的可靠性和准确性的分析;(3)实际问题的解决方法。
2、教学难点(1)样本估计总体原理的理解;(2)不同估计方法的适用条件和优缺点;(3)估计结果的分析和评价。
七、教学过程1、导入新课(5分钟)授课开始时,通过向学生展示一个与日常生活密切相关的统计数据问题,例如:“根据班级学生的身高数据,估计全年级学生的平均身高”,引发学生对用样本估计总体问题的思考。
通过这个实例,引导学生回顾已学的统计学知识,为新课的学习做好铺垫。
2、新知讲授(20分钟)(1)介绍用样本估计总体的基本概念和原理,如:样本均值、样本方差、置信区间等;(2)讲解不同估计方法,如:点估计、区间估计,并分析各自的优缺点;(3)通过具体例题,展示如何运用这些方法进行总体参数的估计;(4)强调估计结果的可靠性和准确性的判断标准,以及如何在实际问题中进行应用。
3、合作探究(15分钟)将学生分成小组,每组针对一个实际问题进行探究,如:“根据某地区部分家庭的年收入数据,估计该地区所有家庭的平均年收入”。
(完整版)第18章样本含量的估计

无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。
抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。
这就是样本含量估计(estimation of sample size)。
本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。
第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。
因此,尽量减小抽样误差是提高统计推断精度的必然要求。
在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。
同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。
但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。
比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。
由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。
同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。
必修三2.2.用样本估计总体(教案)

必修三2.2.用样本估计总体(教案)必修三2.2.用样本估计总体(教案)导语:本文为必修三2.2.用样本估计总体(教案)的教学指南,旨在引导学生了解和应用样本估计总体的方法。
通过学习本课,学生将能够理解抽样和样本的基本概念,并能够运用点估计和区间估计的方法进行总体参数的估计。
为了达到良好的教学效果,本教案采用了多样的教学方法,例如引导讨论、示例演示和小组合作等。
一、教学目标:1. 理解样本与总体的概念和关系;2. 掌握点估计的方法;3. 了解区间估计的原理和应用;4. 能够进行样本估计总体的实际问题分析。
二、教学过程:1. 导入(5分钟)引导学生思考以下问题:什么是样本?什么是总体?样本和总体之间有什么关系?为什么需要用样本来估计总体?2. 点估计的方法(15分钟)a. 讲解点估计的基本原理,即通过样本数据来估计总体参数的值。
b. 示例演示:设计一个问题,如某班级数学考试成绩的平均分。
用班级中的五位同学的成绩作为样本,通过计算样本的平均分来估计全班的平均分。
c. 引导学生讨论点估计的优点和缺点。
3. 区间估计的方法(15分钟)a. 讲解区间估计的概念和原理,即通过样本数据构造一个置信区间来估计总体参数的范围。
b. 示例演示:使用同样的例子,构造一个置信水平为95%的置信区间,来估计全班的平均分。
c. 引导学生讨论区间估计的优点和缺点。
4. 实际问题分析(25分钟)a. 设计一个实际问题,例如某个城市的人均收入。
要求学生提出估计该城市人均收入的方法和步骤,并结合点估计和区间估计的方法进行分析。
b. 小组合作:分组讨论,每个小组根据实际问题设计一个解决方案,并准备向全班汇报。
c. 汇报与讨论:每个小组轮流汇报他们的解决方案,并进行讨论。
5. 总结与延伸(10分钟)a. 概括本课内容,强调样本估计总体的方法和应用。
b. 提出延伸问题,鼓励学生进一步探索样本估计总体的其他应用领域。
三、教学反思:本节课通过引导讨论、示例演示和小组合作等多种教学方法,促使学生自主思考和应用样本估计总体的方法。
样本含量估计

34.3
35
Copyright 2008 Parenteral Drug Association, Inc.
Page 30
定性资料的样本含量估计 单样本设计的率比较样本含量估计
n
Z /2
Z
2
(1 )
Copyright 2008 Parenteral Drug Association, Inc.
用样本信息(XS、p)估计总体特征(、)
影响因素分析或预测
用样本信息完成总体间的比较 相关(或回归)分析
Copyright 2008 Parenteral Drug Association, Inc.
Page 4
总体参数估计中样本含量的 估计
Copyright 2008 Parenteral Drug Association, Inc.
1.282)
15
2
10
23.6
24
Copyright 2008 Parenteral Drug Association, Inc.
Page 21
独立样本比较的样本含量估计 独立样本均数差的分布
X1 ~ N (1, 2 )
X2 ~ N(2, 2)
X1
X2
~
N (1
2 ,
多少病例?若A药组样本含量占整个样本含量 的60%,每组各需多少病例?
Copyright 2008 Parenteral Drug Association, Inc.
Page 25
1.8 1012 / L =(2 1) 1012/L=11012 /L
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床流行病学应用研究室
样本含量估计
样本含量的估计原则 是指在研究结论具有一定 可靠性(检验效能)的基 础上确定最少的样本例数。
估计样本含量,目的 是在保证一定精确度的前 提下,确定最少的观察单 位数。
随着试验设计的类型不同其样本 含量估计的方法也不同
一、计数资料样本含量估计
完全随机设计 多个率样本比较样本含量的估计
公式(二)
n16.6 41
(s 1 inma s x i 1 n
)2
min
注意本公式采用三角函数的角度计算
将数据代入公式(二)
1.6 25
n16.641
3
(s 1 in 0 .54 s8 i 1n0 .14 )2 9
PEMS3.1统计软件包演示
结果
指标,临床前该中药可使病人血 沉平均下降3.3mm/h ,标准差为 1.94 mm/h,西药可使病人血沉 平均下降4.9 mm/h,标准差为 2.97 mm/h,为了进一步观察该 中药的疗效,拟申请一项课题, 问估计需观察多少病例数?
取α=0.05,β=0.1 检验效能power = 1 - 0.1 = 0.90, 双侧检验,uα= u0.05=1.96, uβ= 1.282,δ= 4.9 - 3.3 = 1.6,取 较大的标准差σ=2.97 ,代入公式:
总体标准差(或估计值) = 2.97
两总体均数之差(估计值)= 1.6
果A法有效率54.8%,B法 28.46%,C法14.9%,问正式 试验需要观察多少例病人?
本研究最大样本率Pmax=0.548,最小样本 率Pmin=0.149, =0.05,=0.1,=k-1=3-1, 查表=12.56
n
21.6 25
3
(2si1n0.542 8si1n0.14 )29
注:本公式采用三角函数的弧度计算
n 1n216.6 4 si 1 1n1 0 ..9 1 6 5 1 s.2i 1n 80.4 2 5 246
计算得每组观察病例数为46 例,估计15%的失访率,每 组需观察病例数53例,两组 共需观察106例。
两样本率比较所需的样本含量
检 验 水 α = 0.05(双侧)
检 验 效 能 1-β = 0.9000
2、确定检验效能(1—β) β为犯第二类错误的概率,要
求检验效能越大,所需样本含量 也越大,一般取β=0.10,检验效 能1—β=1-0.10=0.90,在临床研 究设计时,检验效能不宜低于 0.75,,若低于0.75,有可能研究 结果不能反映出总体的真实差异, 可能出现非真实的阴性结果。
3、确定容许误差δ(即处理组 间的差别)
单组样本率的检验 两样本率的检验 多样本率的检验
二、计量资料样本含量估计
单组样本均数的检验 两样本均数的检验 多样本均数的检验
确定样本含量的前提条件
1、确定检验水平α
确定犯第一类错误的概率,
即显著性水平,一般取α=0.05, 同时还应明确是单侧检验或是双 侧检验,这里α越小,估计样本含 量越大。
uα、uβ是根据所选择的α、β 值查表得到,uα有单双侧之分, uβ只取单侧,例如常用α=0.05, β=0.1,此时对于双侧检验,查 表得u0.05=1.96,u0.1=1.282 (只取单侧),σ为两总体标准差 的估计值,一般取两者中大的一 个。
例3、某项研究,观察某中药 治疗某病患者,以血沉作为疗效
n1 = n2 = 2((1.96 + 1.282)2 2.972)/1.6 2 = 72 每组所需观察病例数72,两组共144,若 估计失访率为15%,两组共需观察166例。
利用PEMS3.1统计软件包计算
结果
两样本均数比较所需的样本含量
检 验 水 准 α = 0.05(双侧)
检 验 效 能 1-β = 0.9000
多个样本率比较所需的样本含量 样本个数 =3 检 验 水 准 α = 0.05 检 验 效 能 1-β = 0.9000 最小总体率(估计值)πmin = 0.149 最大总体率(估计值)πmax = 0.548 每组所需样本例数为 n = 33
成组设计 两样本均数比较的样本含量估计:
n 2 ( u u )22/2
第一总体率(估计值)π1 = 0.15 第二总体率(估计值)π2 = 0.45 每组所需样本例数 n = 47
两组所需总例数
N = 94
按15%的失访率估计 N = 108
完全随机设计 多个率样本比较样本含量的估计
(公式一)
n
2
(2si1 npmax2si1 npmi)n2
例2、某医院观察三种治疗方法 治疗某病的效果,初步观察结
5、样本含量估计的其他依据
GCP的规定
例1、某医生采用中药治 疗慢性盆腔炎患者,观察复 发率为15% ,根据文献检索 用西药治疗的复发率为45% , 拟进行一项临床试验,问需 要多少病例数?
两样本率比较样本含量的估计 公式(一)
nuu 21(11)2(12)
其中, 12
取α=0.05,β=0.1,双侧检验, P1 、P2分别 为治疗组与对照组的样本率的估计值
将数据代入公式:
n 1 .9 6 1 .2 8 20 .2 1(1 5 0 .1) 5 0 .4(1 5 0 .4)5 44
0 .3
两样本率比较样本含量的估计 公式(二)
同样,取α=0.05,β=0.1,双侧检验, P1 、P2 分别为治疗组与对照组的样本率的估计值
取α=0.05,β=0.1,采用双侧检验,将试验 组估计样本复发率P1=15%及西药对照组 估计样本复发率为P2 =45% ,代入公式:
比较两总体均数或率的差异时, 应当了解总体参数间差值δ的信息。 如两总体均数间的差值δ=μ1-μ2的信 息,两总体率间的差值δ=π1-π2的信 息。
4、实验单位的标准差
关于δ和的估计其他原则
有时研究者很难得到总体参数的信息,可
根据研究的目的人为给出,或用临床专业上认 为有意义的差值来代替,也有人主张用0.25倍 或0.50倍的标准差估计总体均数间的差值,或 规定试验的新药有效率必须超过标准(或对照 药)药物有效率的30%才有推广意义。这些信 息可以通过查阅文献资料,借鉴前人的经验或 预试验寻找参考值。