第18章样本含量的估计

第18章样本含量的估计
第18章样本含量的估计

第十八章样本含量估计

无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。这就是样本含量估计(estimation of sample size)。本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。

第一节样本含量估计的意义及方法

一、样本含量估计的意义

由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。因此,尽量减小抽样误差是提高统计推断精度的必然要求。在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。

但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。另外,由于所施加干预措施可能存在的不良事件反应尚属未知,让过多的临床病例面临风险,亦有悖医学伦理原则。

因此,恰当的样本含量应该是满足医学科研统计学要求,保证一定推断精度

和检验效能的前提下的最少研究对象数。

二、样本含量估计的方法

样本含量的估计方法目前主要有两种:一是公式法,可根据研究目的、设计类型、已知条件等选择合适的公式进行估算,是目前使用最广泛的方法。二是查表法,统计学家利用公式法获得样本含量后编制成工具表,使用者只需根据已知条件查表即可获得相应的样本含量,省去了繁杂的计算过程,但较为局限。本章将主要介绍公式法样本含量的估计。

第二节 调查设计中样本含量估计

调查研究的目的在于描述健康相关状态、事件在研究当时某特定群体中的分布,并在此基础上通过不同群体分布的比较,探索可能的关联或影响因素。但其主要目的仍在于描述分布,如考察某地菜农钩虫感染率、医学生的吸烟率、某地健康男性居民血红蛋白的含量等。若研究方式为抽样研究,便需要利用已知的样本信息推断总体参数,如总体均数μ、总体率π 的估计等。因此本节将根据所估计的参数不同,介绍样本含量估计的基本条件,及总体均数、总体率估计中的样本含量估计方法。

一、样本含量估计的基本条件

采用公式计算样本含量,必须有一些先决条件和基本信息,下面以例18.1为例简单介绍总体参数估计中样本含量估计的基本条件。

例18.1 拟采用单纯随机抽样的方法调查某地区男性成年人群血红蛋白含量(g/L)的平均水平。根据文献,中国男性成人血红蛋白含量为(140±30)g/L ,要求所获得允许误差不超过5g/L ,取05.0=α,问需要调查多少位该地区成年男性? 此研究为调查研究,目的在于利用抽样获得的样本均数X 估计该地区成年男性血红蛋白含量(g/L)的总体均数μ。假定该地区成年男性血红蛋白含量X 服从正态分布,以文献中中国男性成人的血红蛋白含量信息进行替代(140μ=g/L ,30σ=g/L),则该地区成年男性的血红蛋白含量X ~N (140, 302)。

题意要求允许误差不超过5g/L ,α=0.05,可解释为样本均数X 与总体均数μ之间的差距(X δμ=-)不超过5g/L ,且X 落在135~145g/L 之间的概率为

1-α=0.95。由于总体服从正态分布,样本均数的分布亦服从正态分布,当抽样方

式为单纯随机抽样,且总体为无限总体时,标准误X σ=,X 的分布记为

2~(,)x X N μσ。可用图18.1表示。

图18.1 样本均数的抽样分布示意图

结合图18.1,根据正态分布的原理可得:

2Z α== (18.1) 上式反推即可获得单纯随机抽样研究中总体均数估计中的样本含量公式:

2

/2Z n ασδ??= ??? (18.2) 式中,σ为总体标准差;δ为允许误差;/2Z α为标准正态分布α下双尾Z 值。

如例18.1中 σ=30 g/L ,δ=5 g/L ,/20.05/2 1.96Z Z α==,代入式(18.2)得:

2

1.9630138.35n ???== ???

所以至少需要调查139人才能达到所要求的精度。

由公式(18.2)可知,在总体服从正态分布且为无限总体、抽样方式为单纯随机抽样的前提下,其所需基本信息包括:

1. 置信度1-α 置信度越高,需要的样本含量越大,常取0.05α=。

2. 允许误差(allowable error) 是指研究者要求的样本统计量与其对应的总体参数之间的最大差距,其既可以用绝对误差δ (X δμ=-或p δπ=-),也可以用相对误差ε来表示,其中X εμμ=-或p εππ=-,则绝对误差δεμ=或δεπ=。根据前面章节置信区间的估计,δ即区间长度的一半。允许误差越小,所需样本含量越大。

3. 总体变异度 常用总体标准差σ刻画,总体率估计中的σ=总体的变异程度越高,所需样本含量越大。

二、单纯随机抽样的样本含量估计 (一) 估计总体均数时的样本含量估计

调查研究中利用抽样获得的样本均数X 估计总体均数μ。例18.1即为估计总体均数时的样本含量估计,这里不再赘述。需指出的是,式(18.2)适用于无限总体抽样时的样本含量估计,对个体数为N 的有限总体中进行单纯随机抽样时,需在式(18.2)计算出样本含量n 的基础上利用式(18.3)进行校正:

1c n n n N

=+ (18.3) 若抽样比n N 很小,如小于0.05或0.1,这种校正可省略。

同时,实际工作中总体标准差σ常常未知,可首先通过小规模预调查获得的样本标准差S 估计σ。此时,若继续采用式(18.2)估计样本含量,往往造成样本量的低估,尤其当样本量较小时,实际上难以达到总体均数估计的精度要求。需用式(18.4)进行校正:

2

/2t S n αδ???= ???

(18.4) 式(18.4)中/2t α表示自由度1n ν=-时t 分布界值,在估计出样本含量前其未

知,可先用/2Z α计算出初步的样本含量(1)n ,并以自由度(1)(1)1v n =-获得(1)/2,t αν,代入式(18.3),求出更近似的(2)n ,依次类推,直至样本例数稳定。但在实际应用

中,如果样本估计量较大(如50n ≥),为方便起见可无需校正。

如例18.1中,若根据前期预调查得该地血红蛋白含量标准差s =30g/L ,其余条件不变,问需要调查多少该地区居民?

根据/2Z α计算出的初步样本含量(1)=139n ,0.05/2,138 1.9773t =,带入式(18.4)得: 2

(2) 1.977330140.71415???==≈ ???

n 以(2)=141n ,0.05/2,140 1.9771t =,代入式(18.4)得(3)140.7141n =≈,(2)(3)n n =,可停止计算。故至少需要调查141位成年男性。

(二) 估计总体率时的样本含量估计

调查研究中常需利用抽样获得的样本率p 估计总体率π,由第十章的学习可知,当n 较大,π和1π-均不太小,如n π和(1)n π-均大于5时,样本率p 的分

布亦近似服从正态分布,记为2~(,)p p N πσ,其中p σ=正态分布原理,由式(18.1)反推可得:

2

/2(1)Z n αππδ??=?- ??? (18.5) 式中,π为总体率,其它符号含义同前。总体率未知时,可取50%π=,以使(1)ππ-达到最大,算得样本含量也最大,从而保证总体率推断的精确性。

例18.2 研究某地菜农钩虫感染率,要求允许误差不超过2%,取05.0=α,需调查多少人?

根据题意,05.0=α,/2Z α=0.05/2Z =1.96,

δ=2%=0.02。总体率未知,取0.50π=代入式(18.5)得:

22

/2 1.96(1)0.5(10.5)24010.02Z n αππδ????=?-=??-= ? ?????

式(18.5)同样仅适用于无限总体抽样的样本含量估计,对有限总体进行抽样时,仍需按式(18.3)进行校正。

同时,当总体率π接近0或1时,如π>70%或π<30%,应用式(18.5)会有偏差,此时可对π作以弧度为单位的平方根反正弦变换,再利用正态分布原理获得样本含量的估计公式:

2

n ??= (18.6) 此外,亦可使用基于Poisson 分布的正态近似样本含量估计等,读者可根据上述理论自行推导,或参考其它书籍,这里不再赘述。

三、其它概率抽样方法的样本含量估计

概率抽样方法不同,样本含量估计方法各异。对系统抽样而言,抽样间隔不同,其抽样误差也不同,故系统抽样尚无统一的方法估计样本含量。但如果研究的变量与总体中个体的编号无确定的上升、下降或周期性变化的关系,系统抽样的抽样误差应小于单纯随机抽样,可参照单纯随机抽样所计算的样本含量。这里

简单介绍分层随机抽样和整群抽样中样本含量的估计。

(一) 分层随机抽样样本含量的估计

抽样方式为分层抽样研究中,若总体为无限总体,可在估计各层总体参数2i σ或i π基础上,以各层例数在总体中所占比例i W 为权重进行加权平均,获得总体

方差(22i i W σσ=?∑)或总体率(i i W ππ=?∑),再按式(18.2)或式(18.5)估计调查总例数。

若总体为有限总体,设总体例数为N ,共有L 层,每层例数为N i ,各层总体方差为2i σ(总体率的估计中2(1)i i i σππ=-),则调查总例数的估计公式为:

22222222()i i i i i N w n N Z N ασδσ=+∑∑ (18.7)

式中i w 为各层样本比例(sample fraction),即i i w n n =,余符号同前。若按比例分配,则i i i w N N W ==;若进行最优分配,i i i

i i w N N σσ=∑。得到总的样本例

数n 后,各层样本量为i i n nw =。

(二) 整群随机抽样样本含量的估计

整群抽样中,由于群内个体的相似性和群间个体的异质性,使得整群抽样获得的方差往往大于单纯随机抽样的方差。若定义整群抽样中计算的方差与单纯随机抽样中方差比值为设计效率DEFF (design effect),其估计公式为: 1(1)DEFF m ρ=+-

式中m 为各群平均个体数;ρ为群内相关系数(intra-cluster correlation, ICC),即

群间方差2B σ与总方差22B W

σσ+的比值(222()B B W ρσσσ=+),反映群内个体的相似程度,其未知时,可通过预调查进行估计。

整群随机抽样样本含量C n 的计算,首先按单纯随机抽样计算样本含量n ,再乘以整群抽样的设计效应,则:

C n n DEFF =? (18.8) 所需群数C G n m =。

第三节 实验研究中的样本含量估计

实验研究的目的主要在于通过不同干预措施或实验条件效应指标(均数或率)的比较,说明处理因素的作用,如研究方式为抽样研究,比较的过程即为假设检验。

需要特别指出的是不仅在实验研究中存在比较的过程,在调查设计中为了探索可能的影响因素,以及流行病学中的病例对照研究、队列研究也需要进行比较,即也存在假设检验的问题。因此本节将从假设检验中不同变量类型及设计形式出发,介绍样本含量估计条件和估计方法。

一、样本含量估计的基本条件

假设检验中样本含量的估计公式在不同情况下虽有所不同,但其基本思想大同小异,估计的基本条件也大致相同。这里以例18.3为例介绍估计的基本条件。

例18.3 欲研究海拔对血红蛋白的影响,拟在某高原地区对健康成年男性进行抽样调查,以确定高原地区成年男性的血红蛋白是否高于一般成年男性。已知一般正常成年男子血红蛋白为(140±30)g/L ,根据医学专业知识,当血红蛋白含量

相差至少在10g/L 以上时,可认为二者存在差异。取单侧0.05α=,

10.90β-=,问应对多少名高原地区健康成年男性进行检查?

若血红蛋白服从正态分布,此研究目的在于若高原成年男性血红蛋白总体均数μ与一般成年男性人群总体均数0μ=140g/L 之间的差别δ在10g/L 及以上,且总体标准差30σ=g/L ,则利用抽样研究获得的高原地区成年男性血红蛋白样本信息发现这种差异,并保证发现所存在差异的能力(即检验效能)10.90β-=。

通过前面章节学习不难发现,此时需进行单样本设计均数比较的假设检验: 00:140H μμ==g/L (高原地区成年男性血红蛋白均数与一般正常成年男子相同)

10:150H μμδ=+=g/L (高原地区成年男性血红蛋白均数比一般正常成年男子高10 g/L)

注意:这里的11:H μμ=不同于前面章节建立假设时备择假设的写法10:H μμ≠,后者未给出μ的具体数值。所以前面有关章节介绍过的假设检验,不能估计犯第二类错误的概率β和检验效能1β-。

例18.3中,由于总体服从正态分布,样本均数的分布亦服从正态分布,标

准误X σ=,在0H 规定的总体中20~(,)x X N μσ,在1H 规定的总体中抽样,样本均数20~(,)x X N μδσ+,可用图18.2表示。

图18.2 假设检验中样本均数的分布示意图

从图18.2可见,在0H 成立的正态分布中,在特定的检验水准α下,临界点

c (图18.2中的圆点)的坐标为: 0c Z αμ=+。

进一步考虑控制第二类错误时,假设真正的总体分布位置为图中1H 所对应的0μμδ=+,那么当1H 分布c 点坐标左侧面积为β时,可同时控制此假设检验的效能为1β-,即

0()c Z βμδ=+-

00()Z Z αβμμδσ+=+- (18.9)

推导可得: 2

()Z Z n αβσδ+??=???? (18.10) 这样得到的样本量估计就同时控制了假设检验的第一类错误α和第二类错误

β(即检验效能为1β-)。式18.10中,σ为总体标准差,δ为总体均数间差异,Z α

为指定检验水准α下的单侧Z 值,若为双侧检验应改为2Z α,Z β为指II 型错误β下的单侧Z 值。

需要注意的是,公式18.10中的α根据无效假设有单双侧之分,而β只有单侧。因为确定β必须考虑无效假设0H 不成立时真正的总体分布位置,而此时真正的总体分布位置只会在0μ的左边或右边(0μμ<在左边,0μμ>在右边),两者只能居其一,不可能既在左边又在右边。

例18.3中 σ=30 g/L ,δ=10g/L ,0.05 1.65Z Z α==,0.10 1.28Z Z β==,代入

式(18.10)得:

2

(1.65 1.28)3077.37810n +???==≈???? 所以至少需要调查78人。

由公式(18.10)可知,在假设检验样本含量估计中,所需基本信息包括:

1. I 型错误概率α 即假设检验中的检验水准,α愈小,所需样本含量愈多。对于相同的α,双侧检验比单侧检验所需样本含量多。α通常取0.05。

2. II 型错误概率β或检验效能(1)β- II 型错误的概率愈小,检验效能愈大,所需样本含量愈多。一般要求检验效能≥0.80,β通常取0.20或0.10。

3. 欲比较的两总体参数间的实际差异δ 如两总体均数的差值12δμμ=-,两总体率的差值12δππ=-。δ愈大,所需样本含量愈小。

4. 总体变异度 比较均数时需了解总体标准差σ,比较频率时需了解总体概率1π和2π。总体的变异度愈高,所需样本含量愈多。

二、均数比较中的样本含量估计

(一) 单样本设计均数比较的样本含量估计

例18.3即为单样本设计均数比较的样本含量估计的情形,这里不再赘述。当总体标准差σ未知时,可用样本标准差S 代替。此时,以t 分布中对应的t α和βt 界值代替Z α和βZ ,式(18.10)就转换为:

2()t t S n αβδ+??=????

(18.11) 但n 求出之前,自由度未知,t α和βt 查不出,可首先利用Z α计算出初步的样本含量(1)n ,并以自由度(1)(1)1v n =-获得(1),t αν,代入式(18.11),求出更近似的(2)n ,依次类推,直至样本例数稳定。

(二) 配对设计均数比较的样本含量估计

配对设计假设检验的目的在于通过样本信息考察配对数据差值的总体均数d μ与0之间的差异,与上述单样本设计均数的比较并无本质区别,其样本含量计算公式只要将式(18.10)中σ改为d σ即可,单侧检验时即:

2

()d Z Z n αβσδ+??=???? (18.12) 例18.4 欲研究某药对四氧嘧啶糖尿病模型小鼠的降血糖作用。假设该药使空腹血糖下降2.0mmol/L 及以上有专业意义,若d σ=1.7mmol/L , α取单侧0.05,检验效能1β-取0.90,需要多大的样本含量?

本例的研究目的在于通过某药治疗四氧嘧啶糖尿病模型小鼠前后血糖的动态变化(差值)来说明药物的疗效,治疗前、治疗后血糖值间存在关联,可看成是配对设计,或关联样本。

根据题意d σ=1.70mmol/L ,δ=2.0mmol/L ,α=0.05,0.05Z =1.65;β =0.10,0.10Z =1.28,代入式(18.12)得:

2

2()(1.65 1.28) 1.7 6.22.0d Z Z n αβσδ+??+???===???????? 故需7只四氧嘧啶糖尿病模型小鼠。

(三) 独立两样本设计均数比较的样本含量估计

独立两样本设计指的是相对于配对设计(或关联样本)而言,两样本中的个体测量值彼此独立,没有关联。常见于实验性研究中的完全随机设计样本,及观察性研究中分别独立从两个总体抽样获得的样本。

独立两样本设计均数比较的假设检验中012:H μμ=,112:H μμ≠进一步可改写为012:0H μμ-=,112:0H μμ-≠,即通过样本均数的差值考察两总体均数差值与0之间的差异。此时,若两总体均服从正态分布,且总体方差齐,样本均数差值的分布记为212121211~,()X X N n n μμσ??--+???

?,定义样本比例11/Q n N =,22/Q n N =,不难推导两组总例数N 的计算公式为:

()2

/21112()Z Z N Q Q αβσδ--+??=+????

(18.13) 式中σ、/2Z α、Z β含义同前,12δμμ=-,11n NQ =,22n NQ =。

例18.5 欲采用完全随机设计比较A 药与B 药对改善贫血的效果,据以往

经验,A 药可增加红细胞12110/L ?,B 药可增加红细胞12210/L ?。若121.810/L σ=?,取双侧0.05α=,0.20β=,每组例数相等,问需要多少病例?若A 药组样本含量占整个样本含量的60%,每组各需多少病例?

(1) 已知121.810/L σ=?,1212=(21)10/L=110/L δ-??,/2Z α=0.05/2Z =1.96,

Z β=0.20Z =0.84。代入式(18.13):

2

121112(1.960.84) 1.810(0.50.5)101.6110N --??+??=?+=?????

即两组例数相等时,共需病例102例,每组51例。

(2) 若要求A 药组样本占整个样本含量的60%,即10.6Q =,

2110.4Q Q =-=,则代入式(18.13): 2121112(1.960.84) 1.810(0.60.4)105.8110N --??+??=?+=?????

即两组病例共需106例,其中A 药组111060.664n NQ ==?=例;B 药组221060.442n NQ ==?=例。从上述计算可以看出,在其它条件不变的情况下,若两组样本含量的比例相同,所需的样本含量最少。

当总体标准差σ未知时,可用两样本合并方差的平方根,或两样本标准差中较大的一个进行估计。同时以2t α和βt 界值代替公式(18.13)中的2Z α和βZ 。

三、率比较中的样本含量估计

(一) 单样本设计率比较的样本含量估计

根据二项分布正态近似原理,单样本设计率比较的样本含量估计过程与单样本设计均数的比较基本类似,唯一的区别在于由于标准误p σ的计算与π 有关。

则在0H 规定的总体中000~(,(1))p N n πππ-,在1H 规定的总体中~(,(1))p N n πππ-。单侧检验时,样本含量的公式为:

2

0n =???? (18.14) 例18.6 已知静脉滴注抗生素治疗盆腔炎模型兔的有效率为50%,现欲研究腹腔穿刺灌注法的效果是否优于静脉滴注,预计腹腔穿刺灌注法的有效率为80%。若取单侧α=0.05,检验效能1β-取0.80,问需多少只盆腔炎模型兔?

本例,0π=0.50,π=0.80,0.800.50δ=-=0.30。0.05Z =1.65,0.20Z =0.84,代入式(18.14)得:

2

15.0==????n 故至少需15只盆腔炎模型兔。

(二) 配对设计样本率比较的样本含量估计

表18.1 配对设计四格表

甲 合 计 + – +

/π++ /π-+ 2π –

/π+- /π-- 21π- 合 计 1π 11π- 1

由表18.1可见,配对设计率1π、2π的比较可通过考察配对的甲、乙两种处理措施不一致率/π+-和/π-+的差别实现。若已知甲、乙两种措施阳性率分别为1π、2π,两种方法均阳性率为/π++,则/1/πππ+-++=-,/2/πππ-+++=-,双侧检验时样本含量的估计公式为:

2

12n =????

(18.15) 式中,//12/222ππππππ+--+++++-==,余符号意义同前。 例18.7 欲比较心电图和生化测定法诊断低钾血症阳性率的差别,分别采用两种方法对同一批临床确诊的低钾血症患者进行检查,已知心电图法的阳性率为80%,生化法阳性率为65%,两法均阳性率为50%。若取双侧0.05α=,检验效能10.80β-=,问需检查多少低钾血症患者?

表18.2 例18.7配对设计四格表

生化法

心电图法 合 计 + – +

/0.50π++= /2/0.15πππ-+++=-= 20.65π= –

/1/0.30πππ+-++=-= /0.05π--= 210.35π-= 合 计 10.80π= 110.20π-= 1

根据题意, 0.052 1.96Z =,

0.200.84Z Z β==,0.800.6520.500.2252

π+-?==,代入式(18.15)得:

2

151.5152n =????

=≈ 故至少需检查152名低钾血症患者。

(三) 独立两样本设计率比较的样本含量估计

独立两样本设计率比较的假设检验中,若定义两组样本比例11/Q n N =,22/Q n N =,则012:H ππ=,且设121122c Q Q πππππ===+;112:0H ππ-≠,双侧检验两组总例数N 的计算公式为:

2

12N =???? (18.16) 若两组样本例数相等,则每组的例数为:

2

1212n n ==????

(18.17) 例18.8 欲比较上颌窦窦口扩大术与上颌窦窦口开放术治疗真菌性上颌窦炎模型兔的疗效。根据文献,上颌窦窦口扩大术有效率为83%,上颌窦窦口开放术有效率为33%。若取双侧α=0.05,β=0.20,两组例数相等,问每组需多少只真菌性上颌窦炎模型兔?

根据题意,/2Z α=0.05/2Z =1.96,Z β=0.20Z =0.84。1π=0.83,2π=0.33,1Q =0.50,2Q =0.50,0.830.500.330.500.58π=?+?=c ,代入式(18.17)得:

2

12122

14.0515

n n ==????=????

=≈ 故每组需15只真菌性上颌窦炎模型兔。

四、简单直线相关和回归分析中样本含量估计

抽样研究中,两正态分布定量变量间的关联性可通过假设检验考察总体直线相关系数ρ与0之间的差别来说明。其检验假设为0:0H ρ=,1:0H ρ≠,同时

样本相关系数r 经z 转换(10.5ln()1r z r +=-)后近似地服从均数为)11ln(21ρ

ρ-+,标准差为31

-n 的正态分布,则直线相关分析中的样本含量公式推导为:

2

/2431ln()1Z Z n αβρρ????+=?+??+????-??

(18.18) 式中,ρ为总体相关系数,余符号含义同前。

对于两正态分布定量变量间的直线相关分析和回归分析的假设检验是等价的,因此直线回归分析与相关分析的样本含量估计公式也是一致的。

例18.9 欲探讨男性腰围与腹腔内脂肪面积的关系,根据以往调查结果,两者间的直线相关系数ρ=0.75,取双侧0.05α=,0.10β=,问需测量多少男性?

由题意可知/20.05/2Z Z α==1.96,0.10Z Z β==1.28,ρ=0.75,代入式(18.18)得: 2

1.961.284314.11510.75l n ()10.75n ????+=?+=≈??+??-??

即需要15个观察对象。 第四节 样本含量估计中的注意事项

样本含量估计是抽样研究设计阶段的一个关键问题,是根据分析目的、已知条件(抽样方法、设计方法、总体特征信息等)及推断精度或检验效能的要求,利用样本统计量与其所对应总体参数之间的关系,一般在正态分布基础上,进行数学推导的过程,在具体计算过程中应注意以下一些问题。

(一) 正确理解和应用样本含量估计公式。样本含量估计公式有严格的应用条件,包括研究目的、研究设计类型、抽样方法、总体分布特征以及数据类型等。在使用时应具体分析,选择合适的计算公式。同时,前面对于样本含量估计公式

的介绍只是研究中最基本、最简单的情况,主要在于让大家理解样本含量估计的意义和基本思想。理论上,只要存在样本统计量的抽样误差计算公式,其必然与样本含量n 有关,即可在以一定分布理论基础上,根据分析目的和已知条件,获得样本含量n 的估计公式。

比如在多重线性回归、logistic 回归、Cox 回归分析等,其分析目的在于确定自变量对应变量的影响作用,可通过假设检验考察偏回归系数i β是否等于0实

现,因此亦可采用假设检验中样本含量估计的方法进行样本含量估计,大家可参阅相关文献,但由于其计算过于繁杂,一般均通过软件进行估计。

(二) 样本含量估计的基本参数信息获得方式。抽样研究中,有关总体特征的指标(如总体标准差σ、总体率π、总体相关系数ρ、总体参数间的差异δ等)一般是未知的,其获得常见两种途径:

① 根据既往文献提供的信息进行估计;

② 通过正式研究前进行的小规模预调查或预实验获得的样本信息进行估计,此时需以t 分布中对应的t α(单侧检验时,双侧检验时为2t α)和βt 界值代替公式中的Z α(或2Z α)和βZ 。

(三) 多指标时样本含量的估计。前述的样本含量估计都是基于单指标,当效应指标涉及多个时,其最佳的处理方法是基于指标联合分布的分析方法获得相应的估计公式。如在多个定量变量比较中,其假设检验方法多用Hotelling’s T 2检验或MANOV A 等,相关估计方法可参阅相关文献。此外,也可通过在多指标中确定一个主要指标进行粗略估计,或分别根据各指标进行计算,取样本含量最大者作为保守估计。

(四) 样本含量的调整。应用上述公式估计出的样本含量是满足统计学要求的最小样本含量或有效样本含量。若直接以此作为最终研究对象数,由于各种原因(如调查研究、回顾性研究中缺失值、无效访问等,前瞻性研究中对象的退出、失访、意外死亡、剔除等),造成实际上样本量不足。因此,设计时必须对此情况予以充分考虑,对通过样本含量估计公式获得的样本数n 予以校正。比如在临床试验中,其校正公式为c n =201/(1)n R R --,0R 和1R 分别表示试验组退出试验和对照组接受试验药物的比例。

也有研究者为简便起见,在样本含量公式估计值基础上增加20%,作为研究设计的样本含量。

(五) 样本含量估计的软件。样本含量的估计过程是利用给定条件进行数学运算的过程,其计算公式较为繁杂,不过目前已经有相关的软件完成相应的计算,如专门用于样本含量及检验效能估计的PASS 、G*Power 、PC-Size 、PS 、NQuery Advisor ,以及在SAS 、Stata 中一些相关过程等。

第五节 检验效能的估计

一、检验效能估计的意义

检验效能是指假设检验中0H 实际上不成立,而检验结果亦拒绝0H 、发现其差异的概率,用1β-表示。差异性假设检验中即为总体间差异客观存在时,通过样本信息发现这种差异的能力。由前述样本含量估计可知,为了使假设检验的结果足够可靠,在研究设计时通过事先设定检验效能并据此来估计所需样本量,检验效能越高,所需的样本量就越大。不难推理,除个别假设检验(如正态性检验、方差齐性检验、拟合优度检验等)外,对于任何一个基于抽样的研究,如果检验结果P α>,则需要进一步估计检验效能,以判断样本量是否足够,结论是否为假阴性。

但实际研究中,总体参数未知,检验效能是不可估计的。此时,若根据已知的样本量n 及其它样本信息,在既定的检验水准α下,推算检验效能1β-,是一种假设检验后利用样本信息估计检验效能的方法,即所谓的观察检验效能(observed power),也称为回顾性检验效能(retrospective power),并以此作为理论检验效能的估计值。

一般情况下,要求检验效能应高于80%;当检验效能低于75%时,则认为结果不可靠。

二、检验效能估计的方法

样本含量估计与检验效能估计方法的理论基础其实是一致的,只不过分析目的和已知条件不同。前者是研究设计阶段,在给定了检验效能及其它有关总体特征的信息推导样本例数n ;后者是假设检验后,已知了样本例数n ,并利用获得的样本信息估计总体特征计算检验效能。因此检验效能估计的公式同样可以根据

假设检验的基本思想及正态分布原理推导后获得,更简单的做法是在前述样本含量估计公式基础上反推即可。

在单样本设计的均数比较中,若为双侧检验,样本例数n 的估计公式为2

/2()Z Z n αβσδ+??=????,则Z β即为:

/2Z Z βασ

=- (18.19) 式中各符号的含义同前,δ、σ用样本信息进行估计。若为单侧检验,将2Z α改为Z α即可。

计算出Z β后,若Z β为正值,可以肯定检验效能一定大于0. 50,此时应使用Z β-的值查标准正态分布曲线下的面积(附表2)得到β值,检验效能为(1β-)。若Z β为负值,可以肯定检验效能一定小于0. 50,此时直接使用Z β的值查标准正态分布曲线下的面积得到的概率值即为检验效能。

例18.10 为了解无症状吸烟者肺功能改变情况,对某地25例每天吸烟≥1支且连续吸烟≥1年的无症状吸烟者的用力肺活量(FVC)进行了检测,测得其均数为3.31L ,标准差为1.20L ,已知该地一般人群的FVC 为3.70L 。经单侧t 检验,P =0.058,按0.05α=的检验水准,不拒绝0H ,差别无统计学意义。请判断该研究的检验效能是否足够。

已知n =25,05.0=α,0.05 1.65Z Z α==。δ、σ未知,用样本信息进行估计,则σ=1.21L , 3.31 3.700.39δ=-=L 。代入式(18.19)得:

0.39 1.650.0251.20

Z β=-=- 查标准正态分布曲线下的面积(附表2)得到概率值为0.4900,即检验效能为0.49, 低于0.75,可见该研究的检验效能不足。

其它分析目的下Z β的计算公式见表18.3。

表18.3 不同分析目的中的Z β计算公式

假设检验目的(双侧检验时) Z β计算公式

单样本设计均数比较 /2Z Z βαδσ

=-

配对设计均数比较

/2

d

Z Z βα

=

两独立样本均数比较

/2 Z Z βα

=

单样本设计率比较

Z

β

=

配对设计率比较

Z

β

=

两独立样本率比较

Z

β

=

小结

在医学科研设计中,样本含量估计是一个十分重要的问题。恰当的样本含量指的是在抽样研究中,保证了足够的参数估计精度或检验效能条件下的最小样本量。根据统计推断的目的不同,样本含量的估计主要包括:①参数估计中的样本含量估计,在估计前需明确抽样方法以及置信度1α

-、允许误差δ、有关总体变异度的信息σ或π;②假设检验中样本含量的估计,在估计前需明确设计方法以及I型错误概率α、II型错误概率β、总体参数间的实际差异δ、有关总体变异性的信息σ或π。

检验效能估计是若假设检验结果Pα

>,利用获得的样本信息估计总体特征计算检验效能的过程,以判断样本量是否足够,结论是否为假阴性的过程。若假设检验结果Pα

≤,则不必考虑检验效能不足的问题。

本章需掌握的核心要点和内容

1. 样本含量估计的意义。

2. 样本含量估计应具备的条件。

3. 常用样本含量估计的方法。

(陈卫中殷菲)

(完整版)样本量计算(DOC)

1.估计样本量的决定因素 1.1资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。 1.2研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 1.4 1.5 度为 1.6 1.7 1.8双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需 样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量 就小。当进行双侧检验或单侧检验时,其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算 由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。 护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。研究的类型不同,则样本量也有所不同。 2.1描述性研究 例. =0.1, 2.2 2.2.1探索有关变量的影响因素研究 有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。例如,如果研究肺结核患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12个预测影响变量,如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法,在获得相关文献支持下,最好根据公式计算,计量

抽样调查样本量确定

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

如何确定抽样统计的最小样本量

如何确定抽样统计的最小样本量(附:随机抽样统计的抽样误差Excel计算表格) 在电视节目中经常看到关于选举的报道中经常会后有支持率的数字,例如:调查结果为 ?a方支持率为%; ?b方支持率为%; ?c方支持率为%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况); 最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采 样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为 1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=,置信度为90%时,=,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样为y 相对抽样误差h = E / y C= σ / y 以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 置信度相对抽样误差(假设:C=

样本量计算方法

样本量及其计算依据: 根据现有文献[Gerald Holtmann,Nicholas Talley,Tobias Liebregts,Birgit Adam,Christopher Parow.A placebo-controlled trial of itopride in functional dyspepsia.The New England Journal of MEDICINE 2006;(8):832-840],功能性消化不良患者接受伊托必利50mg组治疗后,其NDI改善值的均数为18.0,本研究期望针刺本经取穴组治疗功能性消化不良的NDI改善值的均数为15.0,本研究共设了6个组别,检验水准α=0.05,检验效能1-β=0.90,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n= j=1 k = Ε( X j- x ) 2/(k-l) j=1 通过公式计算,每组所需样本数n=77例,按15%的脱失率计算,每个组应不少于89例,6组应不少于534例。 样本量及其计算依据: 若分为三组或三组以上,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n=

k = Ε(?X j- x ) 2/(k-l) k为研究所用的组数,?X j, s i各为每组的均数与标准差的估计值,x=Ε?X j/k,ψ为界值,可通过查阅ψ值表得到。

《医学统计学》辅导:样本含量的估计

公卫执业医师《医学统计学》辅导:样本含量的估计 一、估计样本含量的意义及条件 我们在第一节里曾提到重复的原则。所谓重复,是指各处理组(对照在实验研究中也被看作是一种处理,而且是必不可少的)的受试对象都应有一定的数 量,例数不能太少,所以在抽样调查、临床观察或实验研究中,首先总要考虑样本含量(或叫样本大小)问题。样本太小,使应有的差别不能显示出来,难以获得正 确的研究结果,结论也缺乏充分的依据;但样本太大,会增加实际工作中的困难,对实验条件的严格控制也不易做到,并且造成不必要的浪费。所以这里所说的样本 含量估计,系指在保证研究结论具有一定可靠性的条件下,确定最少的观察或实验例数。 但是,样本含量又是个比较复杂的问题。要讲清在各种情况下估计样本含量的方法和原理,那是很繁杂的。而且,不同的参考书上介绍的计算公式和工具表往往不一样,以致同一问题所得的结果也可能有出入。所以,不论按哪种公式或工具表求得的结果,也只能是个近似的估计数。 估计样本含量,必须事先明确一些条件与要求: (一)根据研究目的与资料性质,要先知道一些数据。例如要比较几组计数资料,先要知道百分数或率;要比较几组计量资料,先要知道平均数及标准差。这些数据可从以往的实践,预备试验的结果、兄弟单位的经验或文献资料里得来。 (二)确定容许误差。由于抽样误差的影响,用样本指标估计总体指标常有一定的误差,因而要确定一个样本指标与总体指标相差所容许的限度。此值要求越小,所需例数就越多。 (三)确定把握度(1—β)。β是第二型错误的概率;而1—β的意思是:如果两组确有差别,则在每100次实验中平均能发现出差别来的概率。把握度可用小数(或百分数)表示,一般取0.99、0.95、0.90、0.80、0.50.要求把握度越高,则所需例数直多。 (四)确定显著性水平,即第一型错误的概率(α)。这就是希望在α=0.05的水准上发现差别,还是希望在α=0.01的水准上发现差别。α越少,所需例数越多。 此外,估计样本含量时还应当根据专业知识确定用单侧检验或双侧检验。同一实验,若既可用单侧检验又可用双侧检验,则前者所需例数要少些。 二、用计算法估计样本含量

样本量计算(DOC)

1.估计样本量的决定因素 1.1 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 1.2 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 1.4 显著性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取0.05或0.01。 1.5 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。 1.6 容许的误差(δ) 如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差s代替。 1.8 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义

样本量的确定

样本量的确定 北京广播学院新闻传播学院 调查统计研究所 二零零一年五月 沈浩 本讲主要内容 如何计算简单随机抽样的样本量确定 如何实现分层抽样中各层样本单位数的分配样本容量的确定 样本量=费用+精度 (函数) 确定样本容量,需要处理好预定的精度与现有经费,同时也要考虑资源和时间等限 制条件,最终的样本量确定是在上述因素之间的权衡关系。分层抽样分配样本的标准 总的样本容量事先确定 估计值要求达到的精度预先给定 影响调查样本容量的因素 调查估计值所希望达到的精度 调查估计值所能允许的误差。 估计量的抽样方差较小,估计值是精确的 估计值的精度越高,所需的样本容量就越大 影响精度的因素也同样影响着样本容量的大小 所研究指标在总体中的变异程度 总体的大小

样本设计和所使用的估计量 无回答率 客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少 除了估计值的精度以外,调查实际操作的限制条件也许是影响样本容量的最大因 素。 11>(给定精度水平下样本容量的确定样本容量的大小与调查估计值所要求的精度紧密相关 数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。标准误差 误差界限 变异系数 抽样方差的几种计量方法 抽样调查中样本容量的确定,也经常会使用一种或多种这样的计量方法来对精度进 行说明。 非抽样误差 非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑

样本量计算

样本量计算 调查研究中样本量的确定 在社会科学研究中,研究者常常会遇到这样得问题:“要掌握总体(population)情况,到底需要多少样本量(sample)?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。本文将根据自己的经验,探讨在调查研究中确定调查所需样本量的一些基本方法,相信这些方法对于其他的社会调查研究也有一定的借鉴意义。 确定样本量的基本公式 在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式: Z2 S2 n = ------------ (1) d2 其中: n代表所需要样本量 Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。 S:总体的标准差; d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。 对于比例型变量,确定样本量的公式为: Z2 ( p ( 1-p)) n = ----------------- (2) d2 其中: n :所需样本量 z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68

p:目标总体的比例期望值 d:置信区间的半宽 关于调查精度 通常我们所说的调查精度可能有两种表述方法:绝对误差数与相对误差数。如对某市的居民进行收入调查,要求调查的人均收入误差上下不超过50元,这是绝对数表示法,这个绝对误差也就是公式(1)中置信区间半宽d。 而相对误差则是绝对误差与样本平均值的比值。例如我们可能要求调查收入与真实情况的误差不超过1%。假定调查城市的真实人均收入为10000元,则相对误差的绝对数是100元。 公式的应用方法 对于公式的应用,一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑95%的置信水平,那么Z=1.96;或者99%,Z=2.68。然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。因此,公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量: 例如:要了解该城市的居民收入,假定我们知道该市居民收入的标准差为1500,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为 n=1.962*15002/1002=8,643,600/10,000=864 即需要调查的样本量为864个。 最大样本量 以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。 首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念: 变异系数V=标准差S/平均值X<= 1 因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度,对公

样本量计算

样本量计算 Last revision date: 13 December 2020.

1.估计样本量的决定因素 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显着性,反之就要越大。 显着性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取或。 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为,或。即1-β=,或,也就是说把握度为80%,90%或95%。 容许的误差(δ) 如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 总体标准差(s) 一般因未知而用样本标准差s代替。 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。

(完整版)第18章样本含量的估计

无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物 学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。这就是样本含量估计(estimation of sample size)。本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。 第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。因此,尽量减小抽样误差是提高统计推断精度的必然要求。在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。 但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。另外,由于所施加干预措施可能存在的不良事件反应尚属未知,让过多的临床病例面临风险,亦有悖医学伦理原则。 因此,恰当的样本含量应该是满足医学科研统计学要求,保证一定推断精度 和检验效能的前提下的最少研究对象数。

实例教程 手把手教你计算样本量

实例教程:手把手教你计算样本量 作者:张耀文 小玲看了新英格兰医学杂志的一篇文章[1]后,有些地方不明白,于是来找小咖讨论。 小玲:我觉得这个研究做的棒棒哒,但有一点没看明白,就是原文中统计方法部分的样本量计算到底写了个啥: 小咖:你没看明白就对了。这段话确实没有讲明白样本量到底怎么计算来的。你应该去看看这个研究的Protocol和Supplementary Appendix,里面应该会详细写到。因为限于篇幅,有些研究会在正文中省略一些信息。 小玲:那么,哪里能找到这个研究的Protocol和Supplementary Appendix呢? 小咖:来,跟着我操作。首先搜到新英格兰医学杂志的这篇文章,然后点击①PDF下载这篇文章,再点开②Supplementary Material。

下载③Protocol 和④Supplentary Appendix 。 小玲:原来是这样啊,那我赶紧再去读一读这两个文件。 小玲读完后,又来找小咖。 小玲:我找到啦,原来在Protocol 的84-85页有样本量计算的详细介绍。 小咖:很好。你先总结一下大意。 小玲:比较主要结局(体重变化)时,按照P =0.05进行双侧t 检验。对于另一个主要结局(二分类变量)——体重下降5%及以上、10%以上的人数比例,采用双侧卡方检验比较。假设对照组体重下降10%以上的人数比例为10%,利拉鲁肽组的这个比例为14%。当利拉鲁肽组和对照组的样本量分别为2400例、1200例时,可以有超过90%的把握度发现这种差异。 小咖:很好,你get 到了所有的point 。以本研究为例,计算样本量时,需要

第18章样本含量的估计

第十八章样本含量估计 无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。这就是样本含量估计(estimation of sample size)。本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。 第一节样本含量估计的意义及方法 一、样本含量估计的意义 由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。因此,尽量减小抽样误差是提高统计推断精度的必然要求。在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。 但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。另外,由于所施加干预措施可能存在的不良事件反应尚属未知,让过多的临床病例面临风险,亦有悖医学伦理原则。 因此,恰当的样本含量应该是满足医学科研统计学要求,保证一定推断精度

样本量估计

样本含量估算方法及其软件实现(一) 样本含量(sample size)即观察例数的多少,又称样本大小。在保证研究结论具有一定的可靠性(精度和检验功效)的前提下,常需要在设计阶段就人估计最少的受试对象。在医学科研中,只要是抽样研究,就要考虑样本含量的估计。 样本含量估计充分反映了科研设计中“重复”的基本原则,过小过大都有其弊端。样本含量过小,所得指标不稳定,用于推断总体的精密度和准确度差;检验的功效性低,应有的差别不能显示出来,难以获得正确的研究结果,结论也缺乏充分的证据;样本含量过大,会整加实际工作的困难,浪费人力、物力、财力和时间。由于过分追求数量,可能会引起更多的混杂因素,从而影响数据的质量。 影响假设检验时样本含量估计的因素有四个: 1.第一类错误概率的大小α也称检验水准。α越小所需样本含量越多,对于相同α,双侧检验比单侧检验所需要的样本含量更多。 2.检验功效(1-β)或第二类错误概率的大小β检验功效越大,第二类错误的概率愈小,所需要样本含量愈多。 3.容许误差δ容许误差δ愈大,所需的样本含量愈小。 4.总体标准差σ或总体概率σ愈大,所需样本含量自然愈多。总体概率越接近0.5,则所需样本含量愈多。 样本含量的估算方法有查表法和计算法两种。随着计算机的普遍使用,统计学家也开发了一些专门的样本含量估算软件。其算法都是根据上述影响因素结合统计学原理求得。 我就通过实例的样本含量的计算过程,使大家对样本含量有一个更加直观

的认识。 1 计量资料单组设计基于t检验的差异性检验 举例:已知中国50-70岁男性的平均收缩压为158 mmHg,标准差为18,用药物AAA干预,平均收缩压下降10 mmHg 则认为有临床意义,α=0.05, Power=90%,Power =1-β, 双側检验,需要多少病例数。 启动医学研究样本含量估算系统SASA1.0,在桌面上双击SASA1.0快捷方式或点击开始 \ 所有程序 \ Sample Size Adviser \ Sample Size Adviser,进入SASA1.0主窗口。在Goal栏目中选定Means(计量资料)在Group栏目中选定1,在Analysis Method栏目中选定Test(差异性检验)。

样本量的确定方法

样本量的确定方法 The pony was revised in January 2021

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城

样本量的确定方法

样本量的确定方法(2008-10-14 09:12:34)一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内 样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量 计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的 公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。 1 / 5 1.简单随机抽样确定样本量主要有两种类型: (1)对于平均数类型的变量 对于已知数据为绝对数,我们一般根据下列步骤来计算所需要的样本量。已知期望调查结果的精度(E), 期望调查结果的置信度(L),以及总体的标准差估计值σ的具体数据,总体单位数N。2222/N) σ/(e/Z+σ计算公式为:n=222/e特殊情况下,如果是很大总体,计算公式变为:n= Zσ95%调查结果在例如希望平均收入的误差在正负人民币30元之间,95%的置信范围以内,其。根据估计总体的标准差为150元,总体单位数为1000。的统计量为的置信度要求 Z1.96:n=150*150/(30*30/(1.96*1.96))+150*150/1000)=88 样本量 (2)于百分比类型的变量(E),,一般根据下列步骤计算样本量。已知调查结果的精度值百分比对于已知数据为百分比。,的精度即样本变异程度,总体数为N以及置信度(L),比例估计(P)22+ P(1-P)/N) :n=P(1-P)/(e/Z则计算公式为22公式为:n= ZP(1-P)/e同样,特殊情况下如果不考虑总体, 。取其样本变异程度最大时的值为我们不知道,P的取值,0.5一般情况下的置信95%,其的置信范围以内之间例如:希望平均收入的误差在正负0.05,调查结果在95%。样本量0.5,1.96度要求Z的统计量为,估计P为总体单位数为

临床试验样本量的估算

临床试验样本量的估算 样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。 但是中国的国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA XX规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,贝S每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。 非劣性试验(a =0.05, (3 =0.2)时:

计数资料: 平均有效率(P)等效标准(S) N= 公式:N=12.365X P(1-P)/ 52 计量资料: 共同标准差(S)等效标准(5)N= 公式:N=12.365X (S/ 5 )2 等效性试验(a =0.05, (3 =0.2)时: 计数资料: 平均有效率(P)等效标准(5)N= 公式:N=17.127X P(1-P)/ 5 2 计量资料: 共同标准差(S)等效标准(5)N= 公式:N=17.127X (S/ 5 )2 上述公式的说明: 1)该公式源于郑青山教授发表的文献。

临床试验样本量的估算

临床试验样本量得估算 样本量得估计涉及诸多参数得确定,最难得到得就就是 预期得或者已知得效应大小(计数资料得率差、计量资料得均数差值),方差(计量资料)或合并得率(计数资料各组得合并率),一般需通过预试验或者查阅历史资料与文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不就是想做就能做得。SFDA得规定主要就是从安全性得角度出发,保证能发现多少得不良反应率;统 计得计算主要就是从power出发,保证有多少把握能做出显著来。 但就是中国得国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组与对照组得 有效率分别为65、0%与42、9%,则每个治疗组中能接受评价得病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%得情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人得总样本例数为250例。 非劣性试验(α=0、05,β=0、2)时:

计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=12、365×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=12、365× (S/δ)2 等效性试验(α=0、05,β=0、2)时: 计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=17、127×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=17、127× (S/δ)2 上述公式得说明: 1) 该公式源于郑青山教授发表得文献。 2) N 就是每组得估算例数N1=N2,N1 与N2 分别为试验药与参比药得例数; 3) P 就是平均有效率,

如何确定抽样统计的最小样本量

?a方支持率为45.3%; ?b方支持率为30.2%; ?c方支持率为8.5%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±2.5%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合标准正态分布的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况);

最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :方差,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=1.96,置信度为90%时,=1.645,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样均值为y 相对抽样误差h = E / y 变异系数C= σ / y

以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 相对抽样误差(假设:C=0.4) π为按照经验得出的最后比例,在未知时π可取50%,待算出结果后再重新拟合,比例越悬 从而看出大部分的电话抽样调查:95%置信度的情况下,误差要控制在2%以内取样量一般在2000-5000;为了方便计算抽样调查的误差和估算抽样量,制作了一个Excel表格附后,调整颜色框中的抽样量数字就可以得到相应的误差或根据指定的误差范围估算出抽样量;

抽样调查样本量确定.

抽样调查样本量确定.

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1研究对象的变化程度,即变异程度; (2要求和允许的误差大小,即精度要求; (3要求推断的置信度,一般情况下,置信度取为95%; (4总体的大小; (5抽样的方法。

也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样 本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算 样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根 据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。 1.简单随机抽样确定样本量主要有两种类型: (1对于平均数类型的变量 对于已知数据为绝对数,我们一般根据下列步骤来计算所需要的样本量。已知期望调查 结果的精度(E, 期望调查结果的置信度(L,以及总体的标准差估计值σ的具体数据,总体

样本量计算

样本量计算 文档编制序号:[KK8UY-LL9IO69-TTO6M3-MTOL89-FTT688]

1.估计样本量的决定因素 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显着性,反之就要越大。 显着性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取或。 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为,或。即1-β=,或,也就是说把握度为80%,90%或95%。容许的误差(δ)

如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 总体标准差(s) 一般因未知而用样本标准差s代替。 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。 2.样本量的估算 由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。 护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。研究的类型不同,则样本量也有所不同。 描述性研究

相关文档
最新文档