【科研】如何确定临床实验设计中的样本量

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

科研】如何确定临床实验设计中的样本量？

在临床实验研究中，无论是实验组还是对照组都需要有一定数量的受试对象。这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的。仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题。必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来，并且可以对抽样误差做出客观地估计。但重复观测次数越多(即样本含量越大)试验所要消耗的人力、物力、财力和时间越多，可能会使试验研究成为不可能。而且，样本含量过大还会增加控制试验观测条件的难度，有可能引入非随机误差，给观测结果带来偏性(bias)。所以在实验设计中落实重复原则的一个重要问题就是如何科学合理确定样本量。由于在各对比组例数相等时进行统计推断效能最高，因此多数情况下都是按各组样本含量相等来估计。但在个别情况下，也可能要求各组样本含量按一定比例来估计。

1 与样本含量估计有关的几个统计学参数在估计样本含量之前，首先要对以下几个统计学参数加以确定或作出估计。

1.1规定有专业意义的差值3,即所比较的两总体参数值相

差多大以上才有专业意义。3 是根据实验目的人为规定的，

但必须有一定专业依据。习惯上把8称为分辨力或区分度。

8值越小表示对二个总体参数差别的区分度越强，因而所需样本含量也

越大。

1.2确定作统计推断时允许犯I类错误(“弃真”的错误勺概

率a,即当对比的双方总体参数值没有差到8。但根据抽样

观测结果错误地得出二者有差别的推断结论的可能性，a 确定的越小，所需样本含量越大。在确定a时还要注意明确是

单侧检验的a,还是双侧检验的a。在同样大小的a条件下；双侧检验要比单侧检验需要更大的样本含量。

1.3提出所期望的检验效能power，用1- B表示。B为允许犯H类错误(“取伪”的错误勺概率。检验效能就是推断结论不犯H类错误的概率1- B称把握度。即当对比双方总体参数值间差值确实达到8以上时，根据抽样观测结果在规定的a水准上能正确地作出有差别的推断结论的可能性。在科研设计中常把1- B 定为0.90或0.80。一般来说1- B不宜低于0.75 , 否则可能出现非真实的阴性推断结论。

1.4给出总体标准差c或总体率n的估计值。它们分别反映计量数据和计数数据的变异程度。一般是根据前人经验或文献报道作出估计。如果没有前人经验或文献报道作为依据, 可通过预实验取得样本的标准差s或样本率P分别作为c和n的估计值。c的估计值越大，n的估计值越接近0.5，所需

样本含量越大

在对以上统计学参数作出规定或估计的前提下，就可以根据不同的推断内容选用相应的公式计算出所需样本含量。由于在同样的要求和条件下

完全随机设计(成组设计)所需样本含

量最大，故一般都要按完全随机设计作出样本含量的估计。

2 常用的估计样本含量的方法

2.1 两样本均数比较时样本含量估计方法

(1)两样本例数要求相等时可按下列公式估算每组需观察的例数n 。n = 2*[( a + B ) a / 8 ]A2 ( 1公式

式中8为要求的区分度，a为总体标准差或其估计值S,a、B分别是对应于a和B的U值，可由t界值表，自由度u = a-行查出来，a有单侧、双侧之分，B只取单侧值。

例1 ：某医师研究一种降低高血脂患者胆固醇药物的临床疗效，以安慰剂作对照。事前规定试验组与对照组相比，平均多降低0.5 mmol/L 以上，才有推广应用价值。而且由有关文献中查到高血脂患者胆固醇值的标准差为0.8 mmol/L ，若要求犯I类错误的的概率不超过5%犯H类错误的概率不超过

10%，且要两组例数相等则每组各需观察多少例?

本例8=0.5 mmol/L ，a= 0.8mmol/L, a=0.05 ，B=0.10，1- B =0.90，查t界值表自由度为a—行得单侧t0.05 = 1.645 ,t0.1 =1.282，代入公式(1)

n = 2*[(1.645+1.282) X 0.8/0.5]八2 44=

故要达到上述要求，两组至少各需观察44 例。

(2)两样本例数要求呈一定比例(n2/n1 = c)时，可按下列公式

求出n1，再按比例求出n2 = c*n1。

n1 = [( a +B ) a/ 8 ]A2*(1+C)/C ( 2公式

例2：对例1 资料如一切要求都维持不变，但要求试验组与对照组的例数呈2 ：1比例(即C= 2)，问两组各需观察多少例?

n1 = [(1.645+1.282) X 0.8/0.5]八2 X (1+2=233(例)(对照组所

需例数)

n2= 2X 33=66(例)(试验组所需例数。)

两组共需观察99 例多于两组例数相等时达到同样要求时两组所需观察的总例数2X 44=88。

2.2 配对设计计量资料样本含量(对子数)估计方法配对设计包括异体配对、自身配对、自身前后配对及交叉设计的自身对照，均可按下列公式进行样本含量估计。

n = [( a + B ) a d/ 8 ]A2 (公式

式中8、a、的含义同前,ad为每对差值的总体标准差或其估计值sd。例3：某医院采用自身前后配对设计方案研究某治疗矽肺药物能否有效地增加矽肺患者的尿矽排出量。事前规定服药后尿矽排出量平均增加35.6 mmol/L 以上方能认为有效，根据预试验得到矽肺患者服药后尿矽排出量增加值的标准差sd

=89.0 mmol/L，现在要求推断时犯I类错误的概率控制在

0.05以下（单侧）,犯H类错误的概率控制在0.1以下，问需观

察多少例矽肺病人?

本例8=35.6 mmol/L , sd = 89.0 mmol/L , a=0.05, p=0.10。1- p=0.90,单侧t0.05 = 1.645 , t0.1 = 1.282，代入公式（3）得到。

n = [（1.645+1.282）X 89/35.6]A2 54（例）

故可认为如该药确实能达到平均增加尿矽排出量在35.6 mmol/L 以上，则只需观察54 例病人就能有90%的把握，按照a=0.05的检验水准得出该药有增加矽肺病人尿矽作用的正确结论。

2.3 样本均数与总体均数比较时样本含量估计方法可按下式估算所需样本含量n。

n = [（a + B ）a / 8 ]A2 （ 4公式

例4：已知血吸虫病人血红蛋白平均含量为90g/L ，标准差为25g/L ，现欲观察呋喃丙胺治疗后能否使血红蛋白增加，事先规定血红蛋白增加10g/L 以上才能认为有效，推断结论犯I类错误的概率a（双侧不得超过0.05，犯口类错误的概

率B不得超过0.10，问需观察多少例病人？

本例8=10g/L ，a=25g/L，0.05=1.96（双侧），0.10=1.282

代入公式（4）得：

n=[（1.960+1.282）X 25/10]A2 6=6（例）

故如果呋喃丙胺确实能使血吸虫病人血红蛋白平均含量增加10g/L 以上，则只需观察66 例就可以有90%的把握在a =0.05检验水准上得