样本量计算工具(sample size)

合集下载

抽样计算器

抽样计算器


Example - When measuring top box on a 5 point scale for customer satisfaction, the bottom 4 boxes are used to determine the HPD (e.g., a top box result of 55% equals a bottom 4 box result of 45% which would be the historical proportion defective). 例子——用5分制的5分表示顾客满意度的 时候,1-4分就用于确定历史缺陷比率(例
Sample Size Calculator 抽样规模计算方法
Definitions 定义
Population Size 群体规模
Population Size: Is the complete count of an occurance within the group you would like to 318 sample. 群体规模:是你要抽样的群组中一个事件的总数. 群体规模 Historical Proportion Defective (HPD): Is the percent of defects from historical performance. A defect is any incident outside a defined 8.0% performance threshold. 历史缺陷比例( 历史缺陷比例(HPD):是历史绩效中缺陷的百分 比.缺陷是指确定的绩效极限范围之外的所有情况 . Precision: Is the statistical plus/minus band around the sample result. This is also often 1.50% referred to as Confidence Interval. 精确度:是抽样结果的+/-统计范围.也被称为置 精确度 信区间. Degree of Confidence: Is how often a percentage of the sample falls within the 95% confidence interval. 置信度:是抽样的百分比处于置信区间范围内的次 置信度 数. Sample Size: The number of observations required based on the defined criteria to have a 254 statistically valid Sample of the Population. 抽样规模:基于已定义的标准以获得统计上有效的 抽样规模portion Defective 历史缺陷比率

数理统计中的关键公式速查

数理统计中的关键公式速查

数理统计中的关键公式速查统计学作为一门重要的学科,充斥着大量的数学运算和公式。

掌握统计学中的关键公式对于学习和应用统计学都具有重要的意义。

本文将为大家提供数理统计中的关键公式速查,帮助读者快速准确地找到所需公式。

1. 描述统计学公式1.1 样本均值(Sample Mean)样本均值是评估样本集中趋势的常用方式。

公式:$\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_i$1.2 样本方差(Sample Variance)样本方差用于衡量样本数据的离散程度。

公式:$s^2=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})^2$1.3 样本标准差(Sample Standard Deviation)样本标准差是样本方差的平方根。

公式:$s=\sqrt{s^2}$1.4 总体均值(Population Mean)总体均值是指整个总体中的变量的平均值。

公式:$\mu=\frac{1}{N}\sum_{i=1}^{N}x_i$1.5 总体方差(Population Variance)总体方差是指整个总体中的变量的离散程度。

公式:$\sigma^2=\frac{1}{N}\sum_{i=1}^{N}(x_i-\mu)^2$1.6 总体标准差(Population Standard Deviation)总体标准差是总体方差的平方根。

公式:$\sigma=\sqrt{\sigma^2}$2. 概率论公式2.1 条件概率(Conditional Probability)条件概率是指事件 A 在事件 B 已经发生的前提下发生的概率。

公式:$P(A|B)=\frac{P(A\cap B)}{P(B)}$2.2 乘法定理(Multiplication Rule)乘法定理适用于计算多个事件同时发生的概率。

公式:$P(A\cap B)=P(A|B)P(B)$2.3 加法定理(Addition Rule)加法定理适用于计算多个事件至少有一个发生的概率。

样本含量估算方法及其软件实现(SAS软件)

样本含量估算方法及其软件实现(SAS软件)

样本含量估算方法及其软件实现(一)样本含量(sample size)即观察例数的多少,又称样本大小。

在保证研究结论具有一定的可靠性(精度和检验功效)的前提下,常需要在设计阶段就人估计最少的受试对象。

在医学科研中,只要是抽样研究,就要考虑样本含量的估计。

样本含量估计充分反映了科研设计中“重复”的基本原则,过小过大都有其弊端。

样本含量过小,所得指标不稳定,用于推断总体的精密度和准确度差;检验的功效性低,应有的差别不能显示出来,难以获得正确的研究结果,结论也缺乏充分的证据;样本含量过大,会整加实际工作的困难,浪费人力、物力、财力和时间。

由于过分追求数量,可能会引起更多的混杂因素,从而影响数据的质量。

影响假设检验时样本含量估计的因素有四个:1.第一类错误概率的大小α也称检验水准。

α越小所需样本含量越多,对于相同α,双侧检验比单侧检验所需要的样本含量更多。

2.检验功效(1-β)或第二类错误概率的大小β检验功效越大,第二类错误的概率愈小,所需要样本含量愈多。

3.容许误差δ容许误差δ愈大,所需的样本含量愈小。

4.总体标准差ζ或总体概率ζ愈大,所需样本含量自然愈多。

总体概率越接近0.5,则所需样本含量愈多。

样本含量的估算方法有查表法和计算法两种。

随着计算机的普遍使用,统计学家也开发了一些专门的样本含量估算软件。

其算法都是根据上述影响因素结合统计学原理求得。

我就通过实例的样本含量的计算过程,使大家对样本含量有一个更加直观的认识。

1 计量资料单组设计基于t检验的差异性检验举例:已知中国50-70岁男性的平均收缩压为158 mmHg,标准差为18,用药物AAA干预,平均收缩压下降10 mmHg 则认为有临床意义,α=0.05, Power=90%,Power =1-β, 双侧检验,需要多少病例数。

启动医学研究样本含量估算系统SASA1.0,在桌面上双击SASA1.0快捷方式或点击开始\ 所有程序\ Sample Size Adviser \ Sample Size Adviser,进入SASA1.0主窗口。

临床研究样本量计算器-汇通医疗集团有限公司

临床研究样本量计算器-汇通医疗集团有限公司

0.738 0.05 0.2 0 109 0.1839 总体均数: I类错误a: 容许误差: 设计效应deff: 计算得出的样本量 总样本量: 有限总体: 校正后样本量: 0.95 0.05 0.1 1 347 5500 327
版权所有:汇通医疗集团有限公司 版 本 号:V 1.3.1
计算得出的样本量 据P1计算的病人: 据P2计算的常人: 说明: 1.诊断试验没有把握度的概念 2.用灵敏度、特异度分别计算所需病人,常人 3.a 默认为双侧,b 没有单双侧概念 195 95
终点:HR/生存时间 4.生存分析 试验的基本参数 试验组中位生存时间: 对照组中位生存时间: 生存风险HR: 样本量比K,试验/对照 0.8 1
说明:此为单纯随机抽样样本量估算公式
Clinical REsearch Sample Size Calculator 汇通医疗集团有限公司
4. 白色为可改的输入参
临床研究样本量计算器
终点:均数的比较
试验的基本参数 试验组均数μ t: 对照组均数μ c: 界值 D: I类错误a: II类错误b : 样本量比K,试验/对照 脱落率l: 中间参数:Z1-a/2 中间参数:Z1-b 4 2 5 0.1 0.2 1 0 1.64 1.28 试验组标准差SDt: 对照组标准差SDc: 试验组样本量nt: 对照组样本量nc: 6 6 10 10
Clinical REsearch Sam 汇通医疗集团有限公司
1.两组平行对照 操作步骤简要说明:
选择设计类型
临床研究样本量计
1.选择设计类型 2.选择终点类型 3.输入相应参数
终点:率的比较 试验的基本参数 试验组率πt: 对照组率πc: 界值D : I类错误a: II类错误b : 样本量比K,试验/对照 脱落率l: 中间参数: Z1-a 中间参数:Z1-b 中间参数: ������ ̅ 计算得出的样本量 对照组Nc: 试验验Nt: 总样本量: 157 157 314 0.92 0.92 0.1 0.1 0.2 1 0.2 1.64 1.28 0.92

样本量估算系列02--基于PASS两样本率非劣效比较样本量计算

样本量估算系列02--基于PASS两样本率非劣效比较样本量计算

样本量估算系列02--基于PASS两样本率非劣效比较样本量计算题记:今天我们用一个案例介绍基于PASS软件的两样本率非劣效比较的样本量计算方法。

1. 基础知识各位可参考我们上一篇文章 (样本量估算系列 01 -- 基于PASS两样本率比较的样本量计算),此处不再赘述。

2. 案例分析[案例] 一个新的抗肿瘤药物A与标准药物B对照进行III期临床试验。

已知药物B的有效率为30%。

根据临床应用的实际情况,设置非劣效性的限值为10%。

根据预实验,估计新药A有效率为25%。

按照1:1平行非劣效性设计,单侧检验,alpha=0.025,power=90%,每组需要多少样本?总计需要多少样本?分析:按照非劣效设计,A药只要不比B药的有效性低10%则认为A药有用。

这种情况临床很常见,B药作为标准治疗虽然效果很好,但可能存在一些不足,比如价格昂贵、副反应大等。

A药作为一种替代药品具有价格便宜,安全性高等优势,如果疗效上不比B药差,或者仅仅比B药差那么一点,当然也有可能优于B药,我们则认为A药有效。

我们可根据专业知识或者文献回顾设定一个非劣效性的界值,此处设为10%,即A药的有效率只要不低于10%,我们都认为B药与A药疗效一致。

此外,还要已知其他参数:A药的实际有效率(根据文献回顾或预实验获得)25%,1:1平行设计,单侧检验,alpha=0.025,power=90%。

3. PASS计算过程第一步,如图依次点击:图1. 依次选择Proportions--Two IndependentProportions--Non-Inferiority -- Non-Inferiority Test For the Difference BetweenTwo Proportions第二步,如图依次填入参数图2. 如图依次设置参数参数解释:Sample Size表示待计算的试验组样本量,此处为选择项;Higher Proportions Are: Better,此处为选择项,相当于告诉软件后面填入的Proportion越大表示效果越好。

SAS、PASS、Stata三种常用软件样本量计算方法及结果差异的比较

SAS、PASS、Stata三种常用软件样本量计算方法及结果差异的比较

SAS、PASS、Stata三种常用软件样本量计算方法及结果差异的比较作者:林洁孙志明来源:《中国医药导报》2015年第18期[摘要] 目的分析和探讨运用SAS、PASS、Stata 3种软件在两均数(率)比较中进行样本量估计的结果差异,推荐合适的样本量估计软件。

方法通过设定不同的参数情况,分别运用3种软件计算各自样本量,并且与公式计算结果进行比较。

结果在两均数比较时,Stata和PASS的样本量估计结果最准确,不同的参数会影响SAS的结果;在两个率比较时,SAS最准确,PASS的准确性与样本量大小有关系,Stata结果偏大且受不同参数的影响。

结论不同软件计算结果并不一致,综合考虑推荐用SAS软件进行两样本均数(率)比较的样本量估计。

[关键词] 样本量估计;SAS;PASS;Stata[中图分类号] R181 [文献标识码] A [文章编号] 1673-7210(2015)06(c)-0133-05样本量(sample size)是指承受研究实施的样本所包含之观察单位数,或样本例数。

除个别设计方法外,在研究设计中必须确定需要多少实验对象或观察对象。

样本量对研究效果有重要影响,在小样本研究中尤其如此[1]。

一系列规范的的医学研究报告,如加强观察性流行病学研究报告质量的声明和临床试验报告统一标准等均要求在研究报告中描述“如何计算样本含量”[2-6]。

开展一项研究,往往因为各种因素(人力、物力、经费等)限制,只能对总体中的一部分进行研究,即研究样本,然后由样本统计量推断总体参数。

样本过小,结果不稳定,不能真实地反映总体规律;而样本量过大,会增大研究的难度,并造成人力、物力的浪费[7]。

所以合理的样本量,一方面,可以在既定的经费下保证精确度和可靠性;另一方面,可以在既定的精确度和可靠性合理利用资源,保证抽样推断的最大效果。

目前可以用于估计样本含量的软件很多,其中较常用的有SAS、Stata、PASS等。

SAS、PASS、Stata三种常用软件样本量计算方法及结果差异的比较

SAS、PASS、Stata三种常用软件样本量计算方法及结果差异的比较

SAS、PASS、Stata三种常用软件样本量计算方法及结果差异的比较林洁;孙志明【摘要】Objective To analyze the differences between SAS, PASS and Stata for sample size calculation in a test of two means (rates) and recommend the appropriate software for sample size calculation. Methods By setting different pa-rameters, sample sizes were calculated using three kinds of software respectively and compared with the formula results. Results In two sample means test, Stata and PASS had the most accurate results, the results in SAS were affected by different parameters. In two sample rates test, the SAS results were the best of three, the accuracy of PASS was related with the sample size, the results in Stata were larger than others and affected by different parameters. Conclusion The results are not consistent using different software, SAS is recommended for two sample mean (rate) of sample size calcu-lation.%目的:分析和探讨运用SAS、PASS、Stata 3种软件在两均数(率)比较中进行样本量估计的结果差异,推荐合适的样本量估计软件。

实例教程:手把手教你计算样本量

实例教程:手把手教你计算样本量

实例教程:手把手教你计算样本量作者:张耀文小玲看了新英格兰医学杂志的一篇文章[1]后,有些地方不明白,于是来找小咖讨论。

小玲:我觉得这个研究做的棒棒哒,但有一点没看明白,就是原文中统计方法部分的样本量计算到底写了个啥:小咖:你没看明白就对了。

这段话确实没有讲明白样本量到底怎么计算来的。

你应该去看看这个研究的Protocol和Supplementary Appendix,里面应该会详细写到。

因为限于篇幅,有些研究会在正文中省略一些信息。

小玲:那么,哪里能找到这个研究的Protocol和Supplementary Appendix呢?小咖:来,跟着我操作。

首先搜到新英格兰医学杂志的这篇文章,然后点击①PDF下载这篇文章,再点开②Supplementary Material。

下载③Protocol 和④Supplentary Appendix 。

小玲:原来是这样啊,那我赶紧再去读一读这两个文件。

小玲读完后,又来找小咖。

小玲:我找到啦,原来在Protocol 的84-85页有样本量计算的详细介绍。

小咖:很好。

你先总结一下大意。

小玲:比较主要结局(体重变化)时,按照P =0.05进行双侧t 检验。

对于另一个主要结局(二分类变量)——体重下降5%及以上、10%以上的人数比例,采用双侧卡方检验比较。

假设对照组体重下降10%以上的人数比例为10%,利拉鲁肽组的这个比例为14%。

当利拉鲁肽组和对照组的样本量分别为2400例、1200例时,可以有超过90%的把握度发现这种差异。

小咖:很好,你get 到了所有的point。

以本研究为例,计算样本量时,需要知道以下几个重要的参数:1、研究设计类型(随机对照试验);2、结局指标类型(二分类变量——体重下降10%以上的人数比例);3、结局指标的预计值(安慰剂组10%,利拉鲁肽组14%);4、检验水准α(通常取α=0.05);5、把握度1-β(通常为80%或更高,本研究为90%)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档