实例教程 手把手教你计算样本量

实例教程 手把手教你计算样本量
实例教程 手把手教你计算样本量

实例教程:手把手教你计算样本量

作者:张耀文

小玲看了新英格兰医学杂志的一篇文章[1]后,有些地方不明白,于是来找小咖讨论。

小玲:我觉得这个研究做的棒棒哒,但有一点没看明白,就是原文中统计方法部分的样本量计算到底写了个啥:

小咖:你没看明白就对了。这段话确实没有讲明白样本量到底怎么计算来的。你应该去看看这个研究的Protocol和Supplementary Appendix,里面应该会详细写到。因为限于篇幅,有些研究会在正文中省略一些信息。

小玲:那么,哪里能找到这个研究的Protocol和Supplementary Appendix呢?

小咖:来,跟着我操作。首先搜到新英格兰医学杂志的这篇文章,然后点击①PDF下载这篇文章,再点开②Supplementary Material。

下载③Protocol 和④Supplentary Appendix 。

小玲:原来是这样啊,那我赶紧再去读一读这两个文件。

小玲读完后,又来找小咖。

小玲:我找到啦,原来在Protocol 的84-85页有样本量计算的详细介绍。

小咖:很好。你先总结一下大意。

小玲:比较主要结局(体重变化)时,按照P =0.05进行双侧t 检验。对于另一个主要结局(二分类变量)——体重下降5%及以上、10%以上的人数比例,采用双侧卡方检验比较。假设对照组体重下降10%以上的人数比例为10%,利拉鲁肽组的这个比例为14%。当利拉鲁肽组和对照组的样本量分别为2400例、1200例时,可以有超过90%的把握度发现这种差异。

小咖:很好,你get 到了所有的point

。以本研究为例,计算样本量时,需要

知道以下几个重要的参数:1、研究设计类型(随机对照试验);2、结局指标类型(二分类变量——体重下降10%以上的人数比例);3、结局指标的预计值(安慰剂组10%,利拉鲁肽组14%);4、检验水准α(通常取α=0.05);5、把握度1-β(通常为80%或更高,本研究为90%)。

小玲:莫非研究设计和结局指标类型不同,样本量计算的方法也不同?

小咖:是的,上述5个参数(尤其是前3个)不同时,样本量计算的方法也不同,一共好几十种呢。这个研究是平行设计的随机对照试验,结局指标是二分类变量,其样本量计算方法就是最常见的一种。

小玲:呃,这么多啊。那我今天就先学习这一种,以后的慢慢学怎么样?

小咖:好呀。样本量计算推荐使用PASS软件。下面,我用PASS 11来介绍一下怎么计算这个研究的样本量吧。

1、打开PASS 11软件后,在左侧的菜单栏内选择Proportions→Two Independent Proportions→Test (Inequality)→Test for Two Proportions[Proportions]

2、要计算样本量,需要在Find (Solve for)中选择N1。这个研究中,选择的把握度为90%,因此Power (1-Beta)中输入0.9;选择的Significance level(也就是P 值)为5%,因此Alpha (Significance Level)中输入0.05;利拉鲁肽组和安慰剂对照组的样本量比值为2:1,因此N2 (Sample Size Group 2)中选择Use R,R (Sample Allocation Ratio)中选择0.5;P1 (Treatment Group Proportion|H1)为本研究中利拉鲁肽组体重下降10%以上的研究对象比例,输入0.14;P2 (Control Group Proportion)为本研究中安慰剂对照组体重下降10%以上的研究对象比例,输入0.1。其它为默认选项,点击RUN。

3、结果解读

PASS软件给出了样本量计算的结果、参考文献、报告中的名词定义和总结性描述。在样本量计算结果中我们需要重点关注以下两列:

1) Sample Size Grp 1 (N1):干预组样本量。干预组需要2097例研究对象。

2) Sample Size Grp 2 (N2):对照组样本量。对照组需要1049例研究对象。

小玲:这么神奇啊!不过我有点疑惑,为什么计算出来的样本量不是Protocol 中写的2400和1200例呢?

小咖:这是因为上面计算得到的是研究所需的最少样本量。实际研究过程中,研究对象会不依从或失访,因此需要适当地扩大样本量。

小玲:嗯,我明白了。那样本量计算的结果在研究方案或者论文中怎么撰写呢?

小咖:你可以按照以下方式撰写。当然,你要是觉得我的语文学的不好,也可以再修改修改。

本研究为平行设计的随机双盲对照试验。干预组为利拉鲁肽治疗组,对照组为安慰剂治疗组,研究对象体重下降10%以上的人数比例为主要观察的结局指标。根据既往文献报道(或预试验结果),估计对照组体重下降10%以上的人数比例为10%。利拉鲁肽组的这个比例为14%。设α=0.05(双侧),把握度=0.90。利用PASS 11软件计算得到利拉鲁肽组的样本量N1=2097,安慰剂对照组的样本量N2=1049例。假定研究对象的失访率为10%,则需样本量N1=2097÷0.9=2330例,N2=1049÷0.9=1166例。最终利拉鲁肽组纳入研究对象2400例,安慰剂对照组纳入1200例。

小玲:嗯,太好了。对于平行设计的随机对照试验,结局指标是二分类变量的样本量计算方法,我已经掌握了。那其它的样本量计算方法是怎样的呢?

小咖:这个...我妈喊我回家吃饭了,咱们以后再详说吧。

小玲:好的,谢谢小咖。

参考文献

1. Pi-Sunyer X, et al. A Randomized, Controlled Trial of 3.0 mg of Liraglutide in

Weight Management. N Engl J Med. 2015 Jul 2;373(1):11-22.

PMID:26132939

更多临床研究方法学问题,可关注“医咖会”微信公众号。

统计学名词解释

统计学名词解释 第一章绪论 1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。 2.总体:又称母全体、全域,指具有某种特征的一类事物的全体。 3.个体:构成总体的每个基本单元称为个体。 4.样本:从总体中抽取的一部分个体,称为总体的一个样本。 5.次数:指某一事件在某一类别中出现的数目,又称为频数。 6.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。 7.概率:某一事物或某一情在某一总体中出现的比率。 8.观测值:一旦确定了某个值。就称这个值为某一变量的观测值。 9.参数:又称为总体参数,是描述一个总体情况的统计指标。 10.统计量:样本的那些特征值叫做统计量,又称特征值。 第二章统计图表 1.统计表:是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。一般由表号、名称、标目、数字、表注组成。 2.统计图:一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。纵轴表示事物出现的次数或因变量,称为数值轴。一般由图号及图题、图目、图尺、图形、图例、图组成。 3.简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围比较小的时候用。 4.分组次数分布表:数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来,适合数据个数和分布范围比较大的时候用。 5.分组次数分布表的编制步骤: (1)求全距 (2)定组距和组数 (3)列出分组组距 (4)登记次数 (5)计算次数 6.分组次数分布的意义: (1)优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。B.可显示一组数据的集中情况和差异情况等。 (2)缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。 7.相对次数分布表:用频数比率或百分数来表示次数 8.累加次数分布表:把各组的次数由下而上,或由上而下加在一起。最后一组的累加次数等于总次数。 9.双列次数分布表:对有联系的两列变量用同一个表表示其次数分布。

考研心理学统考心理学专业基础综合(心理统计与测量)-试卷6

考研心理学统考心理学专业基础综合(心理统计与测量)-试卷 6 (总分:66.00,做题时间:90分钟) 一、单选题(总题数:25,分数:50.00) 1.单项选择题 __________________________________________________________________________________________ 解析: 2.在抽样时,将要抽取的对象进行编号排序,然后每隔若干个抽取一个,这种方法是 (分数:2.00) A.简单随机抽样 B.系统抽样√ C.分层随机抽样 D.两阶段随机抽样 解析:解析:一般所说的随机抽样,就是简单随机抽样,抽取时,总体中每个个体有独立的、等概率的被抽取的可能。常用的方法有抽签法和随机数字法。系统抽样,也叫机械抽样或等距抽样,首先将个体编号排序,之后每隔若干号抽取一个。分层随机抽样简称分层抽样,具体做法是按照总体已有的某些特征,将总体分成几个不同的部分,再分别在每一部分中随机抽样。两阶段随机抽样适用于总体容量很大的情况,一般而言,首先将总体分成M个部分(如全国有若干个省),在这些部分中选取m个作为第一阶段样本(如选取6个省作为代表),然后在m个样本中抽取个体作为第二阶段的样本(在6个省中抽取样本)。因此本题选B。 3.用统计量估计参数时,当多个样本的统计量与参数的差值的平均数是0时,说明该统计量具有 (分数:2.00) A.无偏性√ B.有效性 C.一致性 D.充分性 解析:解析:用统计量估计总体参数一定会有误差,不可能恰恰相同。因此,好的估计量应该是一个无偏估计量,即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。因此本题选A。 4.当一个统计量是总体参数的无偏估计量时,其方差越小越好,这种估计量的特性是 (分数:2.00) A.无偏性 B.有效性√ C.一致性 D.充分性 解析:解析:当总体参数的无偏估计的参数不止一个时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。因此本题选B。 5.充分性最高的总体平均数的估计量是 (分数:2.00) A.样本平均数√ B.样本众数 C.样本中位数 D.样本平均差 解析:解析:样本统计量的充分性指一个容量为n的样本统计量是否充分地反映了全部n个数据所反映总体的信息。样本平均数的充分性高,因为样本平均数能够反映所有数据所代表的总体信息。因此本题选A。

(完整版)样本量计算(DOC)

1.估计样本量的决定因素 1.1资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。 1.2研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 1.4 1.5 度为 1.6 1.7 1.8双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需 样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量 就小。当进行双侧检验或单侧检验时,其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算 由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。 护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。研究的类型不同,则样本量也有所不同。 2.1描述性研究 例. =0.1, 2.2 2.2.1探索有关变量的影响因素研究 有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。例如,如果研究肺结核患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12个预测影响变量,如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法,在获得相关文献支持下,最好根据公式计算,计量

备考辅导考研心理学大纲心理统计与测量详解

1 真理惟一可靠的标准就是永远自相符合--- 考研心理学大纲心理统计与测量详解 一、心理统计与测量考查目标? 、正确理解心理统计与心理测量的基本概念,掌握心理统计与心理测量的1 基本方法。、掌握有关统计分析的原理和方法,能正确解释统计分析结果。2、掌握各种搞测量理论和各种测量值变得计算方法:能够正确使用各种测3 验,并对结果进行解释。二、心理统计与测量考点解析?(一)心理统计学 心理统计偏向于数学,对于文科的同学来说可能最为头疼,里面还会涉及很多公式,公式最后是要去记忆的。但应注意复习统计学时,由于定义、理论和观点不多,关键是应用公式解决问题,一定要结合课后的练习题勤加练习。什么样的问题对应哪种公式,只有亲自做过才能体会,熟练后也才能得心应手。 作为研究的工具性学科,这门课也要从整体上有个把握,大纲中将心理统计划分为两大部分内容,分别是描述统计和推论统计,其中描述统计又包括了统计图表、差异量数、集中量数、相对量数、相关量数等五小部分。推论统计部分包 2 真理惟一可靠的标准就是永远自相符合--- 括推断统计的数学基础、参数估计、假设检验、方差分析、回归分析、卡方检验和非参数检验七部分。描述统计首先明确描述统计的主要

功用是什么?推断统计主要功用是什么。涉及是数据的基本的、初步的处理,是对数据集中的、相对的、相关性趋势的描述或反映,是必须的基础的部分,而推断统计则是在描述统计结果的基础上,对数据进行深层次的检验和挖掘,在这种更进一步的处理中,发现更深层次的心理现象的规律和其中蕴含的关系以至预测性。具体来讲,不管是描述统计和推断统计,都有一个层层递进的逻辑,复习时一定要逐层推进。虽然需要记忆公式,却不能像生搬硬套一样记忆和运用,而是在统计原理的理解基础上识记,但复杂公式的推导我们没有必要深究,关键是在了解其基本原理后,利用正确的公式处理数据以达到预期的统计目的。可将知识点概括为统计的基础部分、统计检验、参数的估计和回归分析。统统计检验包括参数检验计基础部分包括描述统计整体和推断统计中的数学基础;和非参数检验,而参数检验又分为假设检验和方差分析,非参数检验包括卡方检而统计检验是重点,理解难度不大,验和非参数检验部分。其中统计基础是基础,用于分析样本和总体是否存在显著的差异,应注意区分各种参数检验、非参数检验的应用基础和适用范围,可以进行综参数估计是用一个数值或者一个区间来表示未知总体的参数或者参合整理记忆。数的变化范围。该部分应多通过练习增强辨别能力和熟练度。回归分析也是对结3 真理惟一可靠的标准就是永远自相符合--- 果进行深入整理的方法,不同之处在于回归分析可反映因果关系乃至预测关系,而检验是一种相关关系。考生要多加练习,这四部分的

统计学整理讲解

第1章 什么是统计学? 统计学是研究收集数据,整理数据,分析数据以及由数据分析得出结论的方法,简称为“数据的科学”。 统计滥用 ——不好的样本 ——过小的样本 ——误导性图表 ——局部描述 ——故意曲解 统计应用上的两个极端 ——不用或几乎不用统计 ——简单问题复杂化 随机性和规律性

当我们不能预测一件事情的结果时,这件事就和随机性联系起来了。 通过对看起来随机的现象进行统计分析,统计知识能够帮助我们把随机性归纳于可能的规律性中。统计从我们如何观察事物和事物本身如何真正发生这两个方面帮助我们理解随机性和规律 性的重要性。因此,统计可以看做是一项对随机性中的规律性的研究。 规律也表现出某种随机性。 在这种意义下来说,统计就成了对数据中的偏差问题的研究。根据作为统计基础的数学理论,我们可以确定一项调查中的某一比例有多大的随机性,以及在下一次的重复调查中,这个比例可能有多大的偏差。我们还可以指出,两个比例之间的差异是否大到了随机性本身所不能解释 的地步。 概率 概率是一个0到1之间的数,它告诉我们某一事件发生的机会有多大。 ?概率为统计学的第三个方面——如何从数据中得出结论——奠定了基石。 ?我们可能永远不能确定两个数字的差异是否超出了随机性本身所预期的范围,但是我们可以确定,这种差异发生的概率是大还是小。根据这个基本思想,在很多情况下,我们 可以得出关于我们所处的这个世界的重要结论。 变量(variable) 是指一个可以取两个或更多个可能值的特征、特质或属性。比如,性别是取两个值的变量,因 为一个人只可能是男性或女性。还有其它变量的例子,如人的寿命,体重,以及汽车每升汽油 所能行驶的距离,等等。 变量的值(value) 通常是对某一特定个体的度量,特定个体可能是指一个人,一个家庭,一个地区,或一个国家。表 1.1列出了一些变量、变量的取值及其所测量的个体的例子。从表中可知,性别变量是以人为个体的观测,孩子的数目是以家庭为个体的观测。

样本量计算方法

样本量及其计算依据: 根据现有文献[Gerald Holtmann,Nicholas Talley,Tobias Liebregts,Birgit Adam,Christopher Parow.A placebo-controlled trial of itopride in functional dyspepsia.The New England Journal of MEDICINE 2006;(8):832-840],功能性消化不良患者接受伊托必利50mg组治疗后,其NDI改善值的均数为18.0,本研究期望针刺本经取穴组治疗功能性消化不良的NDI改善值的均数为15.0,本研究共设了6个组别,检验水准α=0.05,检验效能1-β=0.90,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n= j=1 k = Ε( X j- x ) 2/(k-l) j=1 通过公式计算,每组所需样本数n=77例,按15%的脱失率计算,每个组应不少于89例,6组应不少于534例。 样本量及其计算依据: 若分为三组或三组以上,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n=

k = Ε(?X j- x ) 2/(k-l) k为研究所用的组数,?X j, s i各为每组的均数与标准差的估计值,x=Ε?X j/k,ψ为界值,可通过查阅ψ值表得到。

心理统计

心理统计

心理统计概述 心理统计学是研究在心理实验或调查中如何收集、整理、分析数字资料,以及如何根据这些资料所传递的信息作出科学推论的应用统计学分支。19世纪末一些心理学家开始把数理统计方法用于心理学研究。英国F.高 尔顿首先把高斯的误差理论推广到人类行为的测量中,使用了回归直线、相关系数的概念,始创回归原理。他不仅对人类个体测量时搜集的大量数据进行统计分析和处理,并用统计方法分析心理实验结果,使心理学 研究更加科学化。其后,英国心理学家K.皮尔逊和D.斯皮尔曼对心理统计的发展作了许多工作。斯皮尔曼延伸了相关系数的概念,导出等级相关系数的计算方法,并用因素分析方法建立心理科学的数学模型,20世 纪初,统计方法在欧洲各国广为流行,很多心理学研究者,都应用了统计方法。当时,统计学已传入美国,在心理统计上贡献较大的有卡特尔、 桑代克等人,桑代克于1904年著《心理与社会测量导论》,被知名人士 为世界上第一本心理、教育统计学专著。尔后,桑代克的学生凯利等人专门研究心理与教育统计,亦有专著出版。美国的大学先后开设心理统计课程,并出版教材,如心理学家瑟斯顿的《统计学纲要》,实验心理学家盖瑞特的《心理与教育中的统计》等。这些教材的内容大部分属于 描述统计。40年代以后,欧美各国较普遍地应用数理统计方法研究心理问题,心理统计也逐步进入了以推断统计为主要内容的阶段。60年代以 后,由于电子计算机的广泛应用,多因素实验设计和统计方法的普及与应用已成为可能。多元分析方法已成为心理学家处理数据,检验假设,构造模型和分析结果的有效工具。心理统计与心理实验、心理测量有极为密切的关系,心理统计所加工的原始数据来自心理实验和心理测量,而心理实验设计和心理测验的编制必须以统计理论为基础,心理实验与心理测验所获得的数据又必须运用统计方法去进行分析和处理。 心理统计学是心理学研究的有效工具之一。心理学发展的历史证明,科学心理学离不开科学实验或调查,而心理实验或调查又必然要面临处理

样本量计算(DOC)

1.估计样本量的决定因素 1.1 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 1.2 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 1.4 显著性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取0.05或0.01。 1.5 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。 1.6 容许的误差(δ) 如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差s代替。 1.8 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义

心理统计习题

一、是非题 1.平均数不易受极端数据的影响。错 2.中位数是一组数据的中间数值。错 3.对于数据较多的资料,其算术平均数与中位数的值不会相差太大。对 4.根据次数分布表求平均数亦属加权平均的性质。对 5.在教育上常用几何平均数来预测教育现象的发展变化。 6.当一组数据以中位数为其集中量数的代表值时,常以四分差为其差异量数的代表值。对 7.将一组数据中的每个数值都加上10,则所得标准差比原标准差大10。错 8.一组原始数据的标准分数的平均数为零。对 9.可用差异系数比较同一对象在团体中两种单位不同事项相对位置的高低。错 10.一组数据的差异量数越大,其平均数的代表性就越小。对 11.单因素是指在实验中只有一个因素在变化;其余因素尽量不变。对 12.方差分析的基本思想是把实验因素引起的变异和随机因素引起的变异分开,然后比较二者的大小。对 13.方差分析在综合检验多个平均敷间差异的同时也检验了任意两个平均敷间的差异。错 14.方差分析中的均方就是方差。对 15.相关系数达到0.4,即为高度相关。 16.点二列相关是积差相关的特例。 (1)凡适合t检验的资料都适合于Z检验。 (2)当样本容量越大时,t曲线与正态曲线差别越大。 (3)当样本足够大时,样本分布与总体分布相同。 (4)正态分布、t分布、F分布都是对称的分布。 (5)统计假设检验中,a取值越大,拒绝原假设的机会越大。 (6)假如一个样本在总体中出现的机会非常小,那么有理由认为样本与总体间的差异是由偶然因素造成的。 (7)如果资料可靠,统计假设检验中的两类错误完全可以避免。 (8)无论单尾检验还是双尾检验,若在a=0.05情况下拒绝原假设,都说明比较的两个量之间在0.05水平上差异显著。 (9)在相同的a水平下,单尾检验比双尾检验拒绝原假设的机会多。 (10)如果统计推断中犯第一类错误的损失不大,可以适当增大a水平的值。 17.等级变量具有绝对参照点,但不具有相等单位。 18.比率变量既有相对参照点,又有相等单位 二、选择题 1.有8个数据80,90,82,85,91,88,84,92,则它们的中位数是:(C) A.85 B.88 C.86.5 D.91

样本量计算

样本量计算 调查研究中样本量的确定 在社会科学研究中,研究者常常会遇到这样得问题:“要掌握总体(population)情况,到底需要多少样本量(sample)?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。本文将根据自己的经验,探讨在调查研究中确定调查所需样本量的一些基本方法,相信这些方法对于其他的社会调查研究也有一定的借鉴意义。 确定样本量的基本公式 在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式: Z2 S2 n = ------------ (1) d2 其中: n代表所需要样本量 Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。 S:总体的标准差; d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。 对于比例型变量,确定样本量的公式为: Z2 ( p ( 1-p)) n = ----------------- (2) d2 其中: n :所需样本量 z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68

p:目标总体的比例期望值 d:置信区间的半宽 关于调查精度 通常我们所说的调查精度可能有两种表述方法:绝对误差数与相对误差数。如对某市的居民进行收入调查,要求调查的人均收入误差上下不超过50元,这是绝对数表示法,这个绝对误差也就是公式(1)中置信区间半宽d。 而相对误差则是绝对误差与样本平均值的比值。例如我们可能要求调查收入与真实情况的误差不超过1%。假定调查城市的真实人均收入为10000元,则相对误差的绝对数是100元。 公式的应用方法 对于公式的应用,一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑95%的置信水平,那么Z=1.96;或者99%,Z=2.68。然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。因此,公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量: 例如:要了解该城市的居民收入,假定我们知道该市居民收入的标准差为1500,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为 n=1.962*15002/1002=8,643,600/10,000=864 即需要调查的样本量为864个。 最大样本量 以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。 首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念: 变异系数V=标准差S/平均值X<= 1 因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度,对公

10第十章效应量和统计检验力-刘红云版心理统计教材课后习题

练习题 1.什么叫效应值?它在实际研究中有何作用? 2.Cohen d值是如何表达的?在单样本t检验、独立样本t检验和相关样本t检验中,d值的公式是如何变化的? 3.统计量r2描述了什么?它在实际研究中有何作用? 4.从一个均值为40的正态总体中选择一个n=16的样本。对样本施测,处理后,评价处理效应的大小。 a.假设总体的标准差为8,计算Cohen d系数来评价一个样本均值为?x=42的样本的效应大小; b.假设总体的标准差为2,计算Cohen d系数来评价一个样本均值为?x=42的样本的效应大小; c.假设总体的标准差为8,计算Cohen d系数来评价一个样本均值为?x=48的样本的效应大小; d.假设总体的标准差为2,计算Cohen d系数来评价一个样本均值为?x=48的样本的效应大小; 5.五年级学生的阅读成绩测验形成了一个均值为60,标准差为10的正态分布。一个研究者想要评价一个新的阅读项目。他对五年级学生的样本进行这个项目的培训,然后测量他们的阅读成绩。 a.假设研究者使用了一个n=16的样本,得到的测验分数均值为?x=62。使用α=0.05的假设检验来确定项目是否有显著的作用。用Cohen d系数来测量效应大小; b.现在假设研究者使用了一个n=100的样本,得到的测验分数均值为?x=62。再使用假设检验来评价项目效果的显著性,计算Cohen d系数来测量效应大小; c.比较a和b得到的结果,解释样本大小怎样随机影响假设检验和Cohen d系数的。 6.从一个均值为100的总体中得到一个随机样本,对样本施测。处理后,样本均值为?x=104,样本方差为S2=400。 a.假定样本包括n=16名被试,计算Cohen d系数和r2测量处理效应大小; b.假定样本包括n=25名被试,计算Cohen d系数和r2测量处理效应大小; c.比较在a和b部分得到的结果,样本量是如何影响效应大小的? 7.下图是垂直一水平错觉的一个例子。尽管两条线是一样长的,垂直的线看起来更长。为了考察这个错觉,一个研究者准备了一个例子,这个例子中两条线都是10英尺长。给每个被试展示这个例子,告诉他们水平线有10英尺长,然后让他们估计垂直线的长度。一个n=25的样本,估计的平均值为?x=12.2英尺,标准差为S=1.00。 a.使用0.01水平的单侧假设检验证明样本中的个体显著高估了线段的真实长度。(注

常用医学科研中的统计学方法(1)

正确答案错误答案 1.从同一总体抽样,则样本标准差() A随着样本含量增大而增大 B样本含量增大而标准差不变 C随着样本含量减少而减少 D随着样本含量增大而减小 2.用图表示某地区近30年三种疾病的发病率,在各年度的动态发展速度情况,宜绘制() A普通线性图 B.直方图 C.百分条图 D.半对数线图。 3.均数与标准误的关系() A.均数越大,标准误越大 B.均数越大,标准误越小 C标准误越小,用均数推测总体均数的可靠性越大。 E标准误越大,用均数推测总体均数的可靠性越大。 4.多重线性回归分析中,度量一组自变量与应变量线性相关程度的统计量是() A.负相关系数 B.决定系数 C.偏相关系数 D.偏回归系数 5.变异系数cv的数值() A.一定大于1 B.一定小于1 C.可以大于1,也可以小于1 D.一定小于标准差。 6.在样本量为n,自变量个数为3的线性回归方程的假设检验中,回归变异和剩余变异的

自由度分别为() A. 3和n-3 B. 3和n-4 C. 2和n-2 D. 2和n-3 7.比较某地区解放以来三种病的发病率在各个年度的发展速度,应该绘制() A.半对数线图 B.圆图 C.直方图 D.普通线图 8.在同一总体中随机抽取多个样本,用样本均数估计总体均数95%的可信区间,则估计精 密度高的是() A.均数小的样本 B.标准差小的样本 C.标准误大的样本 D.标准误小的样本 9.均数的标准误反映了() A.个体的变异程度 B.集中趋势的位置 C.指标的分布规律 D.样本均数与总体均数的差异 10.由样本均数估计总体均数可靠性大小的指标是() A.标准差 B.标准误 C.方差 D.变异系数 11.表示血清抗体滴度资料平均水平最常用的指标是()

华东师大实验心理学考研含心理统计和心理测量考研真题

华东师大实验心理学考研含心理统计和心理测量考研 真题 一、705心理学专业基础综合考研真题湖南师大

二、郭秀艳《实验心理学》考研真题 一、单项选择题 1首先提出“实验心理学”一词的学者是()。[统考2016年研] A.笛卡儿

B.冯特 C.铁钦纳 D.赫尔姆霍茨 【答案】B ~~ 【解析】实验心理学一词,是1862年由德国著名心理学家、实验心理学的先驱之一冯特(Wilhelm Wundt,1832~1920)在他的《感官知觉理论贡献》论文集的导言里最早提出来的。 2在研究的某一时期内或特定时间点上发生的各种社会事件都可能影响被试的行为,从而混淆实验处理的效果。这种影响研究内部效度的因素属于()。[统考2016年研] A.历史因素 B.成熟因素 C.统计回归效应 D.研究变量与被试特点的交互作用 【答案】A ~~ 【解析】A项,历史因素是指在实验过程中,与实验变量同时发生,并对实验结果产生影响的特定事件。当出现这种情况时,研究者往往无法判断实验结果是由处理(自变量)引起的,还是由特定事件引出的。题干中某一时期社会事件的影响属于历史因素。B项,成熟因素指在实验过程中随着时间的延续,被试身心发生变化,如变得较为成熟,变得疲倦、对实验失去兴趣或饥渴等。C项,统计回归效应指在实验处理前选择了在某一特征方面具有极端分数(高分或低分)的被试,实验处理后,测验分数有回归到平均数的趋向。D项,研究变量与

被试特点的交互作用是指在实验设计中,如果研究者缺乏对变量进行精确控制,诸因素常会产生交互作用的效果。 3既能比较直接地测量每个加工阶段的时间,也能比较明显地看出每个加工阶段特点的实验是()。[统考2016年研] A.库珀(L.Cooper)的心理旋转实验 B.汉密尔顿(W.Hamilton)的字母转换实验 C.克拉克(H.Clark)的句子-图形匹配实验 D.斯腾伯格(S.Sternberg)的短时记忆信息提取实验 【答案】B ~~ 【解析】Hamilton等(1977)、Hockey等人(1981)发展了一种新的实验技术,它被称为“开窗”实验。该实验能直接地测量每个加工阶段的时间,从而能明显地看出这些加工阶段的特点,就好像打开窗子一样,一目了然。“开窗”实验以字母转换实验为例,根据反应时间的数据揭示了完成字母转换作业的3个加工阶段。 4功能性磁共振成像技术的缩写是()。[统考2016年研] A.PET B.fMRI C.MEG D.ERPs 【答案】B ~~ 【解析】A项,正电子发射层析照相术,英文全称为Positron Emission Tomography,缩写为PET。B项,功能性磁共振成像技术,英文为functional

(完整版)统计学的一个试卷

统计学 2、单项选择题【104325】根据某地区关于工人工资的样本资料,估计出的该地区工人平均工资的置信区间为[,],则下列说法最准确的是( A.该地区平均工资有的可能性落入该置信区间 B.该地区只有的可能性落到该置信区间之外 C.该置信区间有的概率包含该地区的平均工资 D.该置信区间的误差不会超过)。 答案: C 答案 3、计算题【145012】根据以往经验,居民家庭人口数服从正态分布,其方差为。现从某地区随机抽取户居民家庭,测得样本的平均家庭人口数为人,试以的可靠程度构造该地区平均居民家庭人口数的置信区间。(结果保留两位小数)(查概率表可知,) 答案:解:已知家庭人口数,(可查正态分布表),则总体均值的置信区间为:即以的可靠程度估计该地区平均居民家庭人口数在人至人之间。答案 4、单项选择题【104332】当置信水平一定时,置信区间的宽度( A.随着样本容量的增大而减小 B.随着样本容量的增大而增大 C.与样本容量的大小无关 D.与样本容量的平方根成正比 答案: A 答案 5、单项选择题【104326】点估计的缺点是()。 A.不能给出总体参数的准确估计 B.不能给出总体参数的有效估计 C.不能给出点估计值与总体参数真实值接近程度的度量D.不能给出总体参数的准确区间 答案: C 答案 6、单项选择题【145018】当正态总体的方差已知时,且为小样本条件下,估计总体均值使用的分布是( A.正态分布 B.分布 C.分布 D.分布)。 答案: A 答案 7、单项选择题【104329】若为抽自的一个样本,总体方差未知,则的的置信区间为( A. B. C. D.)。 答案: D 答案

心理统计学题

心理统计学复习提纲 一.选择题 1. 下面哪个统计量不能用来描述数据的离散程度( c )。 A. 极差 B. 标准差 C. 标准分数 D. 四分差 2.假设学生数学成绩服从正态分布,描述学生性别与数学成绩之间的相关用( d )。 A. 积差相关 B. 肯德尔相关 C. 二列相关 D. 点二列相关 3.某班级一次英语考试成绩服从正态分布,全班平均成绩为70分,标准差为8分,一个学生成绩为80分,他在全班的名次为( b )z=(80-70)/8=1.25,查表0.89 A. 前10% B.前 20% C.后10% D. 后20% 4.有一学生的成绩低于平均成绩一个标准差,请问他在该班的百分位是:a A. 16% B. 36% C.50 % D. 84% 5.计算列联相关系数的适应资料为 b A. 等级数据 B. 计数数据 C.二分变量 D. 等距数据 6.总体方差已知的标准误计算公式为 a A. n σ B. 1-n S n C. n s n 1 - D. 1-n σ 7.变异系数可以描述:d A. 集中趋势 B. 差异显著性 C. 百分位数 D.不同测量的离散程度 8.肯德尔和谐系数一般常用来表示:a A.评分者信度 B.题目一致性 C.题目难度 D.测验效度 9.研究为完全随机取样设计,需检验两组平均数是否存在显著差异,已知其分布为非正态,n >20,请问用哪种统计方法最合适? b A.符号检验(相关) B.秩和检验(独立) C.T检验 D.χ2检验 10.下列那些数据可计算平均数:a A. 同质等距数据 B. 等级数据 C. 出现相同数值多的数据 D. 数值成倍变化的数据 11.两因素析因设计中,计算自由度的公式中,哪一个是求交互作用的?d A. npq-1 B. p-1 C. (p-1)(q-1)n D. (p-1)(q-1) 12.考察年龄(p=3)性别( q=2)在某知觉测验中是否存在交互作用,设计采用:a A. 完全随机化区组设计 B. 析因设计 C. 嵌套设计 D. 拉丁方设计 13.有一考察性别因素和三种教学方式教学效果差异的研究,实验是随机取样,随机分组,各组人数相同。请问 用何统计分析方法处理结果?c A. 区组设计的方差分析 B.裂区设计方差分析 C. 析因设计方差分析 D.判别分析 14.有一研究为完全随机取样设计,需检验两组平均数是否存在显著差异,已知其分布为正态,n >30,请问用 哪种统计方法最合适?c A.符号检验 B. 秩和检验 C.T检验 D.χ2检验 15.两因素完全随机试验设计中,下述计算自由度的公式中,哪一个是求误差项的 b A. npq-1(总自由度) B. n -1 C.(p-1)(q-1)n D. (p-1)(q-1) 16.为了考察三种刺激条件下,被试反应时之间是否存在差异,一研究者分别选取5个年龄段的被试各3个, 来考察三种刺激条件下被试反应时的差异,此种设计为( b ).

样本量计算(DOC)

1. 估计样本量的决定因素 1.1 资料性质 计量资料如果设计均衡 ,误差控制得好 ,样本可以小于 30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些 ,需要30-100 例。 1.2 研究事件的发生率研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 1.4 显著性水平 即假设检验第一类(a)错误出现的概率。为假阳性错误出现的概率。a越小,所需的样本量越大,反之就要越小。a水平由研究者具情决定,通常a取0.05 或 0.01 。 1.5 检验效能 检验效能又称把握度,为1-B,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的a水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,B越小,检验效能越高,所需的样本量越大,反之就要越小。B水平由研究者具情决定,通常取 B为0.2,0.1或0.05。即1—B =0.8,0.1或0.95,也就是说把握度为80% 90%或95%。 1.6容许的误差(S) 如果调查均数时,则先确定样本的均数()和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1— a )可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差 s 代替。 1.8 双侧检验与单侧检验 采用统计学检验时 ,当研究结果高于和低于效应指标的界限均有意义时 , 应该选择双侧检验 , 所需样本量就大 ; 当研究结果仅高于或低于效应指标的界限有意义

心理学统计与测量

心理统计与测量 【考查目标】 1.正确理解心理统计与心理测量的基本概念,掌握心理统计与心理测量的基本方法。 2.掌握有关统计分析的原理和方法,能正确解释统计分析结果。 3.掌握各种测量理论和各种测量指标的计算方法;能够正确使用各种测验,并对其结果进行解释。 一、描述统计 (一)统计图表 1.统计图 2.统计表 (二)集中量数 1.算术平均数 2.中数 3.众数 (三)差异量数 1.离差与平均差 2.方差与标准差 3.变异系数 (四)相对量数 1.百分位数 2.百分等级 3.标准分数 (五)相关量数 1.积差相关

2.等级相关 3.肯德尔等级相关 4.点二列相关与二列相关 5.Φ相关 二、推断统计 (一)推断统计的数学基础 1.概率 2.正态分布 3.二项分布 4.t分布 5.F分布 6. 样本平均数分布 7. 抽样原理与抽样方法 (二)参数估计 1.点估计、区间估计与标准误2.总体平均数的估计 3.标准差与方差的区间估计(三)假设检验 1.假设检验的原理 2.样本与总体平均数差异的检验3.两样本平均数差异的检验4.方差齐性的检验 5.相关系数的显著性检验

(四)方差分析 1.方差分析的原理与基本过程 2.完全随机设计的方差分析 3.随机区组设计的方差分析 4.协方差分析 5.多因素方差分析 6. 事后检验 (五) 统计功效与效果量 (六)一元线性回归分析 1.一元线性回归方程的建立、检验及应用2.可化为一元线性回归的曲线方程(七)卡方检验 1.拟合度检验 2.独立性检验 (八)非参数检验 1.独立样本均值差异的非参数检验 2.相关样本均值差异的非参数检验 (九)多元统计分析初步 1. 多元线性回归分析 2. 主成分分析 3. 因素分析 三、心理测量的基本理论 (一)心理测量的基础

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

样本量的确定方法.

如对你有帮助,请购买下载打赏,谢谢!样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。

样本量计算

样本量计算 Last revision date: 13 December 2020.

1.估计样本量的决定因素 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显着性,反之就要越大。 显着性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取或。 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为,或。即1-β=,或,也就是说把握度为80%,90%或95%。 容许的误差(δ) 如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 总体标准差(s) 一般因未知而用样本标准差s代替。 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。

相关文档
最新文档