样本量计算

临床试验样本量的估算

临床试验样本量的估算 样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。 但是中国的国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(α=0.05,β=0.2)时:

计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=12.365×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=12.365× (S/δ)2 等效性试验(α=0.05,β=0.2)时: 计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=17.127×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=17.127× (S/δ)2 上述公式的说明: 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数; 3) P 是平均有效率,

(完整版)样本量计算(DOC)

1.估计样本量的决定因素 1.1资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。 1.2研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 1.4 1.5 度为 1.6 1.7 1.8双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需 样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量 就小。当进行双侧检验或单侧检验时,其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算 由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。 护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。研究的类型不同,则样本量也有所不同。 2.1描述性研究 例. =0.1, 2.2 2.2.1探索有关变量的影响因素研究 有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。例如,如果研究肺结核患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12个预测影响变量,如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法,在获得相关文献支持下,最好根据公式计算,计量

最新【科研】如何确定临床实验设计中的样本量资料

科研】如何确定临床实验设计中的样本量? 在临床实验研究中,无论是实验组还是对照组都需要有一定数量的受试对象。这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的。仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题。必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来,并且可以对抽样误差做出客观地估计。但重复观测次数越多(即样本含量越大)试验所要消耗的人力、物力、财力和时间越多,可能会使试验研究成为不可能。而且,样本含量过大还会增加控制试验观测条件的难度,有可能引入非随机误差,给观测结果带来偏性(bias) 。所以在实验设计中落实重复原则的一个重要问题就是如何科学合理确定样本量。由于在各对比组例数相等时进行统计推断效能最高,因此多数情况下都是按各组样本含量相等来估计。但在个别情况下,也可能要求各组样本含量按一定比例来估计。 1 与样本含量估计有关的几个统计学参数在估计样本含量之前,首先要对以下几个统计学参数加以确定或作出估计。 1.1规定有专业意义的差值3,即所比较的两总体参数值相差多大以上才有专业意义。3 是根据实验目的人为规定的, 但必须有一定专业依据。习惯上把8称为分辨力或区分度。 8值越小表示对二个总体参数差别的区分度越强,因而所需样本含量也越大。

1.2确定作统计推断时允许犯I类错误(“弃真”的的误率a,即当对比的双方总体参数值没有差到8。但根据抽样观测 结果错误地得出二者有差别的推断结论的可能性,a 确定的 越小,所需样本含量越大。在确定a时还要注意明确是单侧 检验的a,还是双侧检验的a。在同样大小的a条件下;双侧检验要比单侧检验需要更大的样本含量。 1.3提出所期望的检验效能power,用1- B表示。B为允许犯H类错误(“取伪”的错误概率。检验效能就是推断结论不犯H类错误的概率1- B称把握度。即当对比双方总体参数值间差值确实达到8以上时,根据抽样观测结果在规定的a水准上能正确地作出有差别的推断结论的可能性。在科研设计中常把1- B定为0.90或0.80。一般来说1- B不宜低于0.75 , 否则可能出现非真实的阴性推断结论。 1.4给出总体标准差c或总体率n的估计值。它们分别反映计量数据和计数数据的变异程度。一般是根据前人经验或文献报道作出估计。如果没有前人经验或文献报道作为依据, 可通过预实验取得样本的标准差s或样本率P分别作为c和n的估计值。c的估计值越大,n的估计值越接近0.5 ,所需样本含量越大。 在对以上统计学参数作出规定或估计的前提下,就可以根据不同的推断内容选用相应的公式计算出所需样本含量。由于在同样的要求和条件下完全随机设计(成组设计)所需样本含 量最大,故一般都要按完全随机设计作出样本含量的估计。

样本量计算(DOC)

1.估计样本量的决定因素 1.1 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 1.2 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 1.4 显著性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取0.05或0.01。 1.5 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。 1.6 容许的误差(δ) 如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差s代替。 1.8 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义

-临床试验中的随机分组方法

正确使用随机分组是取得比较组间初始可比性、避免选择性偏倚的保证。随机化分组的方法有多种,但真正的随机化应符合下列原则: (1)医生和患者不能事先知道或 决定患者将分配到哪一组接受治疗; (2)医生和患者都不能从一个患者已经进入的组 别推测出下一个患者将分配到哪一组。随机序列的产生可以采用计算机、计算 器、随机数字表和抛硬币的方法来实现。其随机分组方法包括: 简单随机 化( simple rando mizaton)、区组随机化( blockrandomi zation )、分段(或分层) 随机化( stratifiedrandomization)、分层区组随机 化( stratified blockrandomization) 及动态随机化( dy namicrandomization)等。 1. 1 简单随机化分组 简单随机化分组又称为完全随机化分组,是对研究对象直接进行随机分组,常通过 掷硬币或随机数字表,或用计算机产生随机数来进行随机化,在事先或者实施过程中 不作任何限制和干预或调整。简单随机化分组方法对小样本试验操作起来很简单,但是如果研究对象例数较少时,则各组例数会出现不平衡现象。例如,掷硬 币的方法在小样本的试验中由于随机误差难以保证组间病例数的均衡。有研究表明, 当总例数为100时,每组刚好50例的概率仅为8%。因此,采用随机数字表的方法,以及随机数余数分组法可以很好地解决这个问题, 使分组后各组例数相等。 操作步骤: (1)编号: 将N个实验单位从1 到N 编号。动物可按体重大小,患者可按预 计的样本量编号;(2)获取随机数字: 从随机数字表中任意一个数开始,沿同一方向顺序获取每个实验单位一个随机数字; (3)求余数: 随机数除以组数求余数。若整除则余数取组数; (4)分组: 按余数分组; (5)调整: 假如共有n例待调整,需要从中抽取1例,便 续抄一个随机数,除以n后将得到的余数作为所抽实验单位的序号(若整除则余数为n)。例1: 欲将15例病例随机等分到3个组中去。方法:从随机数字表中任意选择起始数, 现将从第5行第5列开始向右的随机数按随机数余数分组的分类结果列于表1中。第一次分组后,甲组6例,乙组5例,丙组4例。由于各组例数不等,须将甲组调整1例到丙组。因此,继续查随机数字表,下一个随机数字为58。58 /3余1,因此继续查随机数字表,下一个随机数字为58。58 /3余1,因此,将第1 例从甲组调整到丙组中去。

抽样调查样本量确定

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

样本量计算

样本量计算 调查研究中样本量的确定 在社会科学研究中,研究者常常会遇到这样得问题:“要掌握总体(population)情况,到底需要多少样本量(sample)?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。本文将根据自己的经验,探讨在调查研究中确定调查所需样本量的一些基本方法,相信这些方法对于其他的社会调查研究也有一定的借鉴意义。 确定样本量的基本公式 在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式: Z2 S2 n = ------------ (1) d2 其中: n代表所需要样本量 Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。 S:总体的标准差; d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。 对于比例型变量,确定样本量的公式为: Z2 ( p ( 1-p)) n = ----------------- (2) d2 其中: n :所需样本量 z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68

p:目标总体的比例期望值 d:置信区间的半宽 关于调查精度 通常我们所说的调查精度可能有两种表述方法:绝对误差数与相对误差数。如对某市的居民进行收入调查,要求调查的人均收入误差上下不超过50元,这是绝对数表示法,这个绝对误差也就是公式(1)中置信区间半宽d。 而相对误差则是绝对误差与样本平均值的比值。例如我们可能要求调查收入与真实情况的误差不超过1%。假定调查城市的真实人均收入为10000元,则相对误差的绝对数是100元。 公式的应用方法 对于公式的应用,一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑95%的置信水平,那么Z=1.96;或者99%,Z=2.68。然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。因此,公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量: 例如:要了解该城市的居民收入,假定我们知道该市居民收入的标准差为1500,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为 n=1.962*15002/1002=8,643,600/10,000=864 即需要调查的样本量为864个。 最大样本量 以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。 首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念: 变异系数V=标准差S/平均值X<= 1 因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度,对公

临床试验样本量的估算

临床试验样本量的估算样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、 计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power 出发,保证有多少把握能做出显著来。 但是中国的国情有多少厂家愿意多做 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100 对有效病例,再考虑到脱落原因,再扩大20%,即120 对,240 例。或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为%和%,则每个治疗组中能接受评价的病人样本数必须达到114 例(总共228 例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250 例。

非劣性试验(α=,β=)时:计数资料: 平均有效率(P) N= 公式:N=×P(1 - P)/ δ2 计量资料: 共同标准差(S) N= 公式:N=× (S/ δ)2 等效性试验(α=,β=)时:计数资料: 平均有效率(P) N= 公式:N=×P(1 - P)/ δ2 计量资料: 共同标准差(S) N= 公式:N=× (S/ δ)2 上述公式的说明:等效标准(δ) 等效标准(δ)等效标准(δ) 等效标准(δ) 1)该公式源于郑青山教授发表的文献。 2)N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数;

样本量计算方法

样本量及其计算依据: 根据现有文献[Gerald Holtmann,Nicholas Talley,Tobias Liebregts,Birgit Adam,Christopher Parow.A placebo-controlled trial of itopride in functional dyspepsia.The New England Journal of MEDICINE 2006;(8):832-840],功能性消化不良患者接受伊托必利50mg组治疗后,其NDI改善值的均数为18.0,本研究期望针刺本经取穴组治疗功能性消化不良的NDI改善值的均数为15.0,本研究共设了6个组别,检验水准α=0.05,检验效能1-β=0.90,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n= j=1 k = Ε( X j- x ) 2/(k-l) j=1 通过公式计算,每组所需样本数n=77例,按15%的脱失率计算,每个组应不少于89例,6组应不少于534例。 样本量及其计算依据: 若分为三组或三组以上,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n=

k = Ε(?X j- x ) 2/(k-l) k为研究所用的组数,?X j, s i各为每组的均数与标准差的估计值,x=Ε?X j/k,ψ为界值,可通过查阅ψ值表得到。

【科研】如何确定临床实验设计中的样本量

【科研】如何确定临床实验设计中的样本量? 在临床实验研究中,无论是实验组还是对照组都需要有一定数量的受试对象。这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的。仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明 不了什么问题。必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来,并且可以对抽样误差做出客观地估计。但重复观测次数越多(即样本含量越大)试验所要消耗的人力、物力、财力和时间越多,可能会使试验研究成为不可能。而且,样本含量过大还会增加控制试验观测条件的难度,有可能引入非随机误差,给观测结果带来偏性(bias)。所以在实验设计中落实重复原则的一个重要问题就是如何 科学合理确定样本量。由于在各对比组例数相等时进行统计推断效能最高,因此多数情况下都是按各组样本含量相等来估计。但在个别情况下,也可能要求各组样本含量按一定比例来估计。 1 与样本含量估计有关的几个统计学参数 在估计样本含量之前,首先要对以下几个统计学参数加以确定或作出估计。 1.1 规定有专业意义的差值δ,即所比较的两总体参数值相差多大以上才有专业意义。δ是根据实验目的人为规定的,

但必须有一定专业依据。习惯上把δ称为分辨力或区分度。δ值越小表示对二个总体参数差别的区分度越强,因而所需样本含量也越大。 1.2 确定作统计推断时允许犯Ⅰ类错误(“弃真”的错误)的概 率α,即当对比的双方总体参数值没有差到δ。但根据抽样观测结果错误地得出二者有差别的推断结论的可能性,α确定的越小,所需样本含量越大。在确定α时还要注意明确是单侧检验的α,还是双侧检验的α。在同样大小的α条件下;双侧检验要比单侧检验需要更大的样本含量。 1.3 提出所期望的检验效能power,用1-β表示。β为允许犯Ⅱ类错误(“取伪”的错误)的概率。检验效能就是推断结论不犯Ⅱ类错误的概率1-β称把握度。即当对比双方总体参数值间差值确实达到δ以上时,根据抽样观测结果在规定的α水准上能正确地作出有差别的推断结论的可能性。在科研设计中常把1-β定为0.90或0.80。一般来说1-β不宜低于0.75,否则可能出现非真实的阴性推断结论。 1.4 给出总体标准差σ或总体率π的估计值。它们分别反映计量数据和计数数据的变异程度。一般是根据前人经验或文献报道作出估计。如果没有前人经验或文献报道作为依据,可通过预实验取得样本的标准差s或样本率P分别作为σ和π的估计值。σ的估计值越大,π的估计值越接近0.5,所需样本含量越大。

临床样本量统计

1、样本量计算公式 根据统计学原理,经预试验的两组结果,对照组率Pc=100%,治疗组率Pi=99%,两组率差=1%。 根据离散响应变量样本量计算公式(等效性/非劣性),每组样本量N=2(Zα+Z2/β)2×(Pc+Pi)/2×{1-(Pc+Pi)/2}/Δ2。取α=0.05,β=0.10,按照临床意义的界值Δ(一般为10%),取对照组有效率的10%,即Δ=10%。 根据以上公式和设定值,每组样本量N=2×(1.96+1.645)2×0.995×0.005/0.12=12.9,即至少需要13例。如果按20%的脱落率计算,即临床样本量为15例。 2、统计分析 1、样本数的确定 本研究欲考察该产品的临床治愈率不差于对照组产品,即设定为非劣效性试验,试验组与对照组按1:1的比例安排病例数,评价指标采用定性指标,根据以往的该类产品的疗效和统计学的一般要求,取α=0.05,β=0.20,等效标准δ=0.15,平均有效率p=0.95,由传统计算公式N=12.365×P(1-P)/ δ2 N:每组的估算例数N1=N2,N1和N2分别为试验组和对照组的例数, P:平均有效率 δ:等效标准 α显著性水平,也是假阳性率,α=0.05,表示将来自同一总体的两样本可能为来自不同总体的概率为5% β:1-β称为检验效能把握度,β=0.20时表示当两总体确有差异时,按α水准有80%的把握能发现他们有所差别。 根据以往的该类产品的疗效和统计学的一般要求,取α=0.05,β=0.20,等效标准δ=0.15, 平均有效率p=0.95,由上述公式计算得到每组需要完成26例,试验设计每组完成30例。 同时为了弥补传统的样本量估计方法的不足,在非劣效性评价的临床试验中,当疗效指标为离散变量时,可以采用相对率可信区间的方法,SAS下编写宏,由SAS.FREQ过程提供的CMH检验和计算相对率的功能解决。随机模拟路线:(1)产生若干符合两项分布的随机数,进行CNH检验,估计相对率的可信区间(可信区间下限不低于0.9),并判断是否符合非劣效的标准;(2)重复N 次,以计算得到非劣效结论的次数,从而计算检验效能;(3 )循环使用上述工具K次,用以寻找符合规定检验效能(0.8)的样本量。模拟结果每组需29例。由此我们每组设计完成30例可以达到80%的效能水平。 2 统计分析计划 2.1 基线评价方法 对于两组定量指标在基线的比较,采用成组设计定量资料所对应的统计分析方法,首先考查资料是否满足正态性及方差齐性的前提条件,若满足,采用成组设计定量资料的t检验,否则,选用成组设计定量资料的wilcoxon秩和检验。

样本量计算(DOC)

1. 估计样本量的决定因素 1.1 资料性质 计量资料如果设计均衡 ,误差控制得好 ,样本可以小于 30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些 ,需要30-100 例。 1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 1.4 显著性水平 即假设检验第一类(a)错误出现的概率。为假阳性错误出现的概率。a越小,所需的样本量越大,反之就要越小。a水平由研究者具情决定,通常a取0.05 或 0.01 。 1.5 检验效能 检验效能又称把握度,为1-B,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的a水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,B越小,检验效能越高,所需的样本量越大,反之就要越小。B水平由研究者具情决定,通常取 B为0.2,0.1或0.05。即1—B =0.8,0.1或0.95,也就是说把握度为80% 90%或95%。 1.6容许的误差(S) 如果调查均数时,则先确定样本的均数()和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1— a )可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差 s 代替。 1.8 双侧检验与单侧检验 采用统计学检验时 ,当研究结果高于和低于效应指标的界限均有意义时 , 应该选择双侧检验 , 所需样本量就大 ; 当研究结果仅高于或低于效应指标的界限有意义

实例教程 手把手教你计算样本量

实例教程:手把手教你计算样本量 作者:张耀文 小玲看了新英格兰医学杂志的一篇文章[1]后,有些地方不明白,于是来找小咖讨论。 小玲:我觉得这个研究做的棒棒哒,但有一点没看明白,就是原文中统计方法部分的样本量计算到底写了个啥: 小咖:你没看明白就对了。这段话确实没有讲明白样本量到底怎么计算来的。你应该去看看这个研究的Protocol和Supplementary Appendix,里面应该会详细写到。因为限于篇幅,有些研究会在正文中省略一些信息。 小玲:那么,哪里能找到这个研究的Protocol和Supplementary Appendix呢? 小咖:来,跟着我操作。首先搜到新英格兰医学杂志的这篇文章,然后点击①PDF下载这篇文章,再点开②Supplementary Material。

下载③Protocol 和④Supplentary Appendix 。 小玲:原来是这样啊,那我赶紧再去读一读这两个文件。 小玲读完后,又来找小咖。 小玲:我找到啦,原来在Protocol 的84-85页有样本量计算的详细介绍。 小咖:很好。你先总结一下大意。 小玲:比较主要结局(体重变化)时,按照P =0.05进行双侧t 检验。对于另一个主要结局(二分类变量)——体重下降5%及以上、10%以上的人数比例,采用双侧卡方检验比较。假设对照组体重下降10%以上的人数比例为10%,利拉鲁肽组的这个比例为14%。当利拉鲁肽组和对照组的样本量分别为2400例、1200例时,可以有超过90%的把握度发现这种差异。 小咖:很好,你get 到了所有的point 。以本研究为例,计算样本量时,需要

6 样本量估计 - 中国临床试验注册中心

广州市社区2型糖尿病人群血清标志物与骨折风险早期 预测的前瞻性队列研究 临床研究负责单位:南方医科大学珠江医院 主要研究者:杨力、张桦、程彦臻、许雯、李婉媚、欧春泉 参加单位及负责人:南方医科大学珠江医院杨力 统计分析单位:南方医科大学生物统计学系 CRO公司:无 方案版本号:1.0 方案定稿日期:2017年4月25日

研究方案摘要

目录 1研究背景与目的 (6) 1.1研究背景 (6) 1.2研究目的 (8) 1.3研究假设 (9) 2试验设计 (9) 3研究对象(队列人群选择) (9) 3.1诊断标准 (9) 3.2入选标准 (10) 3.3排除标准 (10) 4观察指标(变量定义及观测的时间与节点) (11) 4.1一般临床特征指标(含人口学指标) (11) 4.2主要暴露因素/影响预后因素(包括对照选择) (11) 4.3研究终点 (11) 4.4潜在混杂变量 (12) 5样本量估计 (12) 6数据采集与数据管理 (14) 6.1数据来源 (14) 6.2数据采集 (14) 6.3数据库 (15) 6.4数据管理计划与质量控制 (15) 7统计分析 (15) 8伦理考虑 (16) 9质量控制和质量保证 (16) 10组织实施(时间进度) (16) 11参与各方责任及签名 (17) 12参考文献 (17)

1研究背景与目的 1.1研究背景 根据2014 年一项《近十年我国各地区骨质疏松症流行病学状况》报告[1],目前我国约2.1亿人存在低骨量问题,全国 40 岁以上的骨质疏松患者已达到 1.12 亿,随老龄化社会的进展,这一比例还将逐步增加;国际骨质疏松基金会(IOF)报告[2]也指出,在 2010 年,中国 50 岁及以上的人口中发生了大约 230 万例骨折,这一数字预计将在 2050 年上升到 600 万例。骨质疏松骨折是老年人致死、致残最常见的原因[3],《2013 年中国骨质疏松骨折防治蓝皮书》中指出:50岁以上女性椎体骨折的发病率达到15%,髋骨骨折1年内,可导致死亡率增加10~20%[4]。因此骨质疏松骨折成为影响人民身体健康和医疗支出的重大社会卫生问题。 糖尿病是造成骨质疏松的最主要的危险因素之一,随着经济水平飞速发展及生活方式的变化,我国的2型糖尿病发病率急剧升高,上海交通大学医学院附属瑞金医院宁光教授与中国疾病预防控制中心赵文华带领的研究团队的最新研究结果显示[5]:我国18岁及以上成人样本中,根据国际最新临床诊断标准进行诊断的糖尿病估测患病率为11.6%。糖尿病导致骨质量恶化所引发的骨质疏松可使髋部、腕部、脊柱骨折风险增加2~7倍[6],致残、致死率明显升高,严重威胁中国老年人群的健康和生活质量,并造成沉重的家庭、社会和经济负担。 早期防治糖尿病性骨质疏松,提高糖尿病患者对骨量丢失及相关危险因素的知晓率、寻找能早期有效预测骨折风险和生化标志物是预防和尽早治疗的重要前提,将会极大地提高糖尿病病人的生活质量和节省社会资源。而且,构建以社区为基础,建立患者社区档案与综合医院常规诊疗相结合,在社区进行糖尿病骨质疏松高风险人群筛查、教育、治疗的模式是有效防治糖尿病所致骨折的策略。本项目参照国外前瞻性研究的成功经验,开展2型糖尿病骨质疏松骨折风险预测因素的前瞻性研究,以期达到减少并延缓骨折及再次骨折的发病率、降低致残率的目的,为今后建立有效的糖尿病相关性骨质疏松早期筛查、疾病发展监控与干预体系提供理论依据与技术支持。 国内外概况 糖尿病导致骨质损伤涉及高血糖渗透性利尿导致钙磷代谢异常、胰岛素促成骨作用减弱、胰岛素样生长因子(insulinlike growth factor, IGF)缺乏,及AGEs-RAGE 途径[7]等多种因素。在糖尿病人群,常伴有其他的危险因子和糖尿病发生协同作用,使糖尿病相关骨质疏松的风险大大增加。l型糖尿病患者骨质疏松的患病率高达

临床试验样本量的估算

临床试验样本量的估算 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

临床试验样本量的估算 样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显着来。 但是中国的国情有多少厂家愿意多做 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为%和%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显着性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。 假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(α=,β=)时:

计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=× (S/δ)2 等效性试验(α=,β=)时: 计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=× (S/δ)2 上述公式的说明: 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数; 3) P 是平均有效率,

样本量的确定方法.

如对你有帮助,请购买下载打赏,谢谢!样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。

临床试验样本量的估算

临床试验样本量的估算 Document serial number【LGGKGB-LGG98YT-LGGT8CB-LGUT-

临床试验样本量的估算 样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显着来。 但是中国的国情有多少厂家愿意多做 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为%和%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显着性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(α=,β=)时: 计数资料: 平均有效率(P) ? ? ? 等效标准(δ) N=

公式:N=×P(1-P)/δ2 计量资料: 共同标准差(S) ? ? ? ? ? 等效标准(δ) N= 公式:N=× (S/δ)2 等效性试验(α=,β=)时: 计数资料: 平均有效率(P) ? ? ? ? 等效标准(δ) N= 公式:N=×P(1-P)/δ2 计量资料: 共同标准差(S) ? ? ? ? 等效标准(δ) N= 公式:N=× (S/δ)2 上述公式的说明: 1) ? ? 该公式源于郑青山教授发表的文献。 2) ? ? N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数; 3) ? ? P 是平均有效率, 4) ? ? S 是估计的共同标准差, 5) ? ? δ 是等效标准。 6) ? ? 通常都规定α=,β=(把握度80%)

临床试验样本量的估算

临床试验样本量的估算

临床试验样本量的估算 样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。 但是中国的国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(α=0.05,β=0.2)时:

计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=12.365×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=12.365× (S/δ)2 等效性试验(α=0.05,β=0.2)时: 计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=17.127×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=17.127× (S/δ)2 上述公式的说明: 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数; 3) P 是平均有效率,

样本量的确定方法

样本量的确定方法 The pony was revised in January 2021

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城

临床试验样本量的估算

临床试验样本量的估算The final revision was on November 23, 2020

临床试验样本量的估算 样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显着来。 但是中国的国情有多少厂家愿意多做 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为%和%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显着性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(α=,β=)时: 计数资料: 平均有效率(P)等效标准(δ) N=

公式:N=×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=× (S/δ)2 等效性试验(α=,β=)时: 计数资料: 平均有效率(P)等效标准(δ) N= 公式:N=×P(1-P)/δ2 计量资料: 共同标准差(S)等效标准(δ) N= 公式:N=× (S/δ)2 上述公式的说明: 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数; 3) P 是平均有效率, 4) S 是估计的共同标准差, 5) δ是等效标准。 6) 通常都规定α=,β=(把握度80%)

相关文档
最新文档