样本例数的统计学要求.
新药临床研究的例数估算问题

新药临床研究的例数估算问题孙瑞元王雪融李玉红国家药品监督管理局最近对新药临床研究所需病例数做了规定。
按统计学中样本例数的估算方法,并不能适应新药临床研究的需要,因为临床研究的目的不仅要分析新药疗效,而且要了解新药的不良反应,所以必须有一定的基本例数,才能满足科研中重复原则的要求。
1 新药临床研究的基本例数要求国家药品监督管理局规定临床研究的完成例数,见表1。
表1 新药临床研究所需的病例数同时规定:① 新药临床研究应完成符合统计学要求的临床病例数;② 应在临床药理基地中选择负责和承担单位,并经核准,如需增加承担单位或在基地以外的医疗机构进行临床研究,须另行申请并经批准;③ 临床研究可进行多中心临床试验,每个中心的病例数不得少于20例;④ 第一类新药(化学药)中的避孕药,Ⅱ期临床试验应完成不少于100对6个月经周期的随机对照试验,Ⅲ期临床试验完成不少于1 000对12个月经周期的开放试验, Ⅳ期临床试验应充分考虑该类药品的可变因素,完成足够样本量的研究工作。
我国现将临床试验分为4期,即将原来的Ⅱ期分为Ⅱ、Ⅲ期。
Ⅱ期采用随机盲法对照临床试验,着重于新药有效性的判断,并对安全性作初步评价,推荐临床给药剂量。
Ⅲ期临床试验采用扩大的多中心临床试验,在进一步评价有效性的同时,着重于安全性的评价,因此对临床研究所需的病例数也做了相应的规定。
首先,新药临床研究不得少于以上规定的最低例数。
从有效性方面看,若新药的有效率远大于对照药,统计学上进行例数估算,不需按新药临床研究规定的最低例数即可得到P<0.05的结论,但进行例数估算时,代入公式计算的新药有效率是一估计值;另外,计算出的病例数只有理论意义,再加上病情、病种、病程、医院等诸多因素的影响,若按理论估算的病例数进行临床研究,未必得出预期的有效率和P<0.05的结论。
从不良反应方面看,Ⅲ期临床试验中若新药的主要不良反应发生率为1%,则理论上100例患者中有1例发生,实际试验中有可能观察不到,如按规定的最低例数做300例,则临床试验中有80%的把握度能观察到此不良反应。
医学研究关于样本例数选择

医学研究的样本例数读者须知在医学研究中样本例数的确定是一个难点,医学统计学家认为样本含量的确定有两种方法:公式法和查表法,公式法和查表法本质一样,查表法是统计学家由公式做出的,而公式法需要研究者自己做,因为医学研究中尚有不少问题还搜索不到相应的计算公式来确定样本例数,本书搜集到的公式也十分有限,那么通过搜索文献来估计样本例数也是读者需要学习的一种方法。
须知,不存在无限定条件的样本例数。
现行统计教材中的样本例数没有特别强调这一点,以导致使用时,常提出如下问题:“了解吸烟是否是肺癌的危险因素,需要调查多少人?”,类似这样的问题是没人能回答出的。
医学研究中样本例数都是建立在一组限定条件之下的样本例数,若这一组限定条件改变,那么样本例数的值随之改变。
简言之,样本例数是这一组限定条件的函数。
这种函数关系具体由计算样本例数的公式表述。
那么,确定公式等号右端的各参数就变成了计算样本例数的前提。
根据此思路我们设计了一个确定样本例数的流程图(见下页),同时,这个流程图也是我们撰写本书具体内容和阅读本书的思路。
这个小册子中的例题均来自各种卫生统计学的教材和相关著作,其本质没有变化,但读起来却更加符合人们的认知习惯,你会感觉到更容易读懂了。
本书由一附院医学统计咨询室集体讨论,具体由孙奇执笔撰写和排版,几经修订,历时超过百天。
尽管如此,鉴于我们知识的局限性,也只能做到抛砖引玉,而且书中错误肯定难免。
欢迎读者不吝指正,我们将深表谢意!样本例数估计流程图目录1.两样本率比较的样本例数 (4)2.多个样本率比较的样本例数 (6)3.两样本均数比较的样本例数 (8)4.多个样本均数比较的样本例数 (10)5.诊断试验的样本例数 (12)6.现况研究的样本例数 (1313)7.病例对照研究的样本例数 (1515)8.队列研究的样本例数 (1717)9.多元统计的样本例数 (1919)10.其他 (20)11.附表 (21)1 两样本率比较的样本例数1.1提出专业问题某课题的研究目的是比较两种药物治疗乙型肝炎后表面抗原HBsAg 的改善情况,问两组各需要乙肝患者多少名? 1.2转化为统计问题上述研究所对应的统计问题为:两样本率比较的样本例数 1.3选择相应的公式两样本率比较的样本例数公式(1.3)[1]139221222211112112/)(]/)1(/)1())(1(2[p p Q p p Q p p Z Q Q p p Z N a --+-++-=--β1.4确定公式等号右端各参数1.公式(1.3)中a Z 、βZ 、P 、1P 、2P 、1Q 、2Q 的确定方法如下: (1)a Z 的确定:统计学家建议05.0=a ,则96.12/05.0=Z 。
析因设计

以下来自姚辰各种临床设计幻灯样本例数的统计学估计:n=c(s/Δ)2n=每组样本例数s=合并的标准差Δ=事先规定的临床认可的有意义差值c=当α(第Ⅰ类错误)和1-β(检验把握度)为指定的常数时,组间例数的比例系数不同研究目的的实验有不同的样本例数计公式,可咨询统计专业人员析因设计:是一种多因素的交叉分组设计。
它不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用,表示各因素不是各自独立的,而是一个因素的水平有改变时,另一个或几个因素的效应也相应有所改变;反之,如不存在交互作用,表示各因素具有独立性,一个因素的水平有所改变时不影响其他因素的效应。
正确应用析因设计:析因设计各处理组间在均衡性方面的要求与完全随机设计一致,各处理组样本含量应尽可能相同;析因设计对各因素不同水平的全部组合进行试验,故具有全面性和均衡性;析因设计可以提供三方面的重要信息:各因素不同水平的效应大小各因素间的交互作用通过比较最佳组合,找出最佳组合析因设计比一次只考虑一个因素的实验效率高,比如,2×2析因设计是一次考虑一个因素实验的1.5倍。
从得到的信息来看,它节省了组数和例数;当考虑的因素较多,处理组数会很大(比如,4个因素3个水平的处理数为34=81种),这时采用析因设计不是最佳选择,可选用正交设计。
析因设计的优点之一是可以考虑交互作用,但有时高阶交互作用是很难解释的,实际工作中常只考虑一、二阶交互作用。
以下来自胡良平主编《现代统计学与SAS应用》军事医学科学出版社2000年8月第1版2002年4月第2次印刷:多重比较中“各处理组均数都分别与对照组均数比较的DUNNETT t检验法”试验所涉及的处理因素的个数≥2,当各因素在试验中所处的地位基本平等,而且因素之间存在一级(即2因素之间)、二级(即3个因素之间)乃至更复杂的交互作用时,需选用析因设计。
试验设计:假定要考察的试验因素有3个,它们分别有2、3、4个水平,则它们的所有水平组合数为2×3×4=24(种),即有24种不同的试验条件,每种试验条件下至少独立重复做2次以上的试验,即此设计所需的总样本含量=K×2×3×4(这里,K为重复试验次数)。
样本例数的统计学要求

84 189 21 47 63 141 16 35 119 268 30 67 93 210 23 53
24
主要疗效指标为定性(分类)指标的样本量估计方案
方案 α 0.05 0.05 0.05 0.05 0.05 0.05 0.05 0.05 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 样本估计参数 β 率 0.1 0.80 0.1 0.80 0.1 0.85 0.1 0.85 0.2 0.80 0.2 0.80 0.2 0.85 0.2 0.85 0.1 0.80 0.1 0.80 0.1 0.85 0.1 0.85 0.2 0.80 0.2 0.80 0.2 0.85 0.2 0.85 率之差 0.15 0.10 0.15 0.10 0.15 0.10 0.15 0.10 0.15 0.10 0.15 0.10 0.15 0.10 0.15 0.10 估计样本数 非劣 等效 122 149 274 336 97 119 218 268 88 112 198 251 70 89 158 200 185 212 417 476 148 169 332 379 143 166 321 374 114 132 256 298 25
般取 =0.05或0.01,其大小必须按第 I类错误 的危害性来决定。 例:在一个新药临床试验中,第 I类错误会将 疗效依旧的一种药不恰当地奉为高明的创新药, 致使无故废弃常规药,没有必要的重新投入市 场。要彻底消灭这类错误使得 =0是做不到的。
17
假设检验与两类错误
在假设检验中, 的数值也是事先选定的。
26
样本例数估计举例
第I类错误 =0.05,u =1.96 第II类错误=0.10,1-=0.90, u =1.282 两组率之差Δ=0.650-0.429=0.221
医学统计学 第二章 计量资料的统计描述

肌红蛋白含量
人数
0~
2
5~
3
10~
7
15~
9
20~
10
25~
22
30~
23
35~
14
40~
9
45~50
2
18
人数
25 20 15 10
5 0
2.5 12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μg / m L)
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
医学统计学 第二章 计量资料的统计 描述
计量资料(定量资料、数值变量资料) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值:
X1,X2,X3,……,Xn
n为样本例数(样本大小、样本含量)
2
统计描述——描述其分布规律 1、用频数分布表(图)
要求:大样本 如 n〉30
2、用统计指标 描述 集中趋势 离散趋势
6
➢制表步骤 了解分布
1. 求极差(range) 极差也称全 距,即最大值和最小值之差,记作R。 本例
R 5 .7 1 2 .3 5 3 .3 6 ( m m o l/L )
7
2.确定组距(i) :
组段数通常取组 10-15组 本例组距
i 3 .3 6 /1 0 0 .3 3 6 0 .3 0
累计频率(%) (4)
0
402
402
35.80
1
330
732
65.18
2
232
964
85.84
3
118
1082
96.35
4
27
《医学统计学》考试试题及答案大全04

《医学统计学》考试试题及答案一.单选题(每题Label分)1.下列关于非参数检验的叙述错误的是()。
A.非参数检验不依赖于总体的分布类型B.非参数检验仅用于等级资料比较C.适合参数检验的资料采用非参数检验会降低检验效能D.非参数检验会损失部分样本信息E.秩和检验是一种非参数检验方法正确答案:B2.两种药物疗效(治愈、显效、好转、无效)比较,宜用()。
A.χ2检验B.方差分析C.秩和检验D.t检验E.SNK-q检验正确答案:C3.用大剂量Vit.E治疗产后缺乳,以安慰剂作对照,Vit.E 组中有效者24例,无效者6例,安慰剂组有效者4例,无效者12例。
欲分析Vit.E是否有效,应用()。
A.χ2检验B.方差分析C.秩和检验D.t检验E.SNK-q检验正确答案:A4.定量资料多组比较,满足参数检验条件,假设检验时宜采用()。
A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:B5.定量资料多组比较,当分布类型不清时,宜用()。
A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:A6.对于多组独立有序多分类变量资料比较,假设检验时宜采用()。
A.秩和检验B.方差分析C.t检验D.χ2检验E.McNemar检验正确答案:A7.非参数统计的应用条件为()。
A.样本数据来自正态总体B.若两组比较,要求两样本方差相等C.总体分布类型未知D.要求样本例数很大E.总体属于某种已知的分布类型正确答案:C8.设配对设计资料的变量为X和X2,则配对设计的符号秩检验,如何编秩()。
A.把X1与X2的差数绝对值从小到大编秩,排好后秩次保持原差数的正负号B.把X1与X2的差数绝对值从小到大编秩,秩次不保存正负号C.把X1和X2综合按绝对值从小到大编秩D.把X1与X2的差数从小到大编秩E.把X1和X2综合从小到大编秩正确答案:A9.用两种方法检查已确诊的乳腺癌患者120名。
甲法的检出率为60%,乙法的检出率为50%,甲、乙两法一致检出率为35%,试问两种方法何者为优,宜用()。
样本例数的统计学要求

导致检验功效低下试验的原因 h过高地估计了试验药物的作用 过高地估计了试验药物的作用 h低估了试验中存在的可能变异 低估了试验中存在的可能变异 h样本例数估计不充分或主要变量 样本例数估计不充分或主要变量 选择不当 h试验质量较低 试验质量较低
29
检验功效低下的试验
当一个规定样本数(n)的试验得出检验 的试验得出检验 当一个规定样本数 功效低下的结论(P>0.05)时,对组间 功效低下的结论 时 确实存在差异的总体而言, 确实存在差异的总体而言,不能认为 此试验可以证实此差异的存在。 此试验可以证实此差异的存在。 检验功效低下的试验提示此试验犯第 II类错误的概率较大。 类错误的概率较大。 类错误的概率较大 检验功效低下的试验缺乏检验灵敏度。 检验功效低下的试验缺乏检验灵敏度。
9
总体和样本
总体: 根据研究目的确定的有代表性的、所 总体 根据研究目的确定的有代表性的、
有研究对象的全体。 有研究对象的全体。(例:高样本:从特定的研究总体中,随机选择一部
分个体。 一个临床试验中150 150例高胆固醇 分个体。(例:一个临床试验中150例高胆固醇 患者) 患者) 统计分析的目的是基于样本资料的信息,推论 一个总体的规律。
26
样本例数估计举例
第I类错误 α=0.05,uα =1.96 第II类错误β=0.10,1-β=0.90, uβ =1.282 两组率之差∆=0.650-0.429=0.221
1.960 × 0.5395 1 − 0.5395) + 1.282 × 0.65 × (1 − 0.65) + 0.429 × (1 − 0.429) ( n= (0.75 − 0.429)2 = 114
样本例数估计举例
食品统计方法中的样本

食品统计方法中的样本食品统计方法中的样本通常是指从食品生产或销售环节中抽取的一部分产品,用来代表整个批次或群体的特征。
在食品统计学中,样本的选择、数量和处理方式对于结果的准确性和可靠性至关重要。
本文将从不同角度探讨食品统计方法中的样本数量和相关要求,以期为相关领域的研究人员和从业者提供参考。
一、样本数量的确定1.1 样本数量与统计推断的置信度在进行食品统计调查时,确定样本的数量需要考虑到统计推断的置信度。
置信度是指通过样本数据对总体特征作出推断的可靠性和准确性程度。
通常来说,当置信度要求越高时,需要的样本数量也相应增加。
1.2 样本数量与总体方差的大小样本数量的确定还需要考虑到总体方差的大小。
总体方差越大,需要的样本数量也就越多,以确保样本的代表性和结果的准确性。
1.3 样本数量与调查对象的多样性在食品统计调查中,如果调查对象非常多样化,那么需要的样本数量也会相应增加。
因为样本数量的大小需要能够充分反映出总体的多样性和变异性。
1.4 样本数量的合理性审核在确定样本数量时,还需要考虑到调查的实施条件、时间和成本等因素,以确保样本数量的合理性和可行性。
二、样本数量的具体要求2.1 样本数量的常见标准根据统计学的常见标准,一般认为当总体容量不大于10000时,样本数量应当为总体容量的10%;当总体容量大于10000时,样本数量则应为总体容量的5%。
2.2 样本数量的代表性在选择食品统计样本时,需要尽量保证样本的代表性,即样本应当能够充分反映出总体的特征和变异性。
为了实现样本的代表性,可以采用随机抽样、分层抽样等方法进行样本选择。
2.3 样本数量的均衡性在进行食品统计调查时,还需要考虑样本数量的均衡性。
即不同类别或区域的样本数量应当相对均衡,以确保调查结果的全面性和比较性。
2.4 样本数量的动态性要注意样本数量的动态性,即在不同时间段或不同场景下,可能需要不同的样本数量和分布方式。
需要根据具体调查的对象和目的,灵活确定样本数量。