抽样调查的样本容量的确定方法

合集下载

大学生调查抽样方案

大学生调查抽样方案

大学生调查抽样方案引言大学生调查是社会科学研究中常见的一种方法,可以通过调查问卷、访谈等手段收集大量的数据,从而了解大学生的观念、态度、价值观等信息。

然而,由于大学生群体庞大且分散,随机抽样成为一种常用的调查方法。

本文将介绍大学生调查中常用的抽样方案,包括简单随机抽样、分层抽样和整群抽样,以及使用Python实现这些抽样方法的代码示例。

简单随机抽样简单随机抽样是最基础的一种抽样方法,它的原理是每个样本有相同的概率被选入样本集。

具体步骤如下:1.定义总体:确定要调查的大学生总体,例如全国大学生总体。

2.确定样本容量:根据需要确定抽取的样本容量,例如1000人。

3.编号抽样框:给大学生总体中的每个个体分配一个编号,例如从1到N。

4.使用随机数生成器:使用随机数生成器生成一个随机数表,表中每个随机数与编号相对应。

5.抽样:按照随机数表抽取样本,直到达到预定的样本容量。

简单随机抽样的优点是简单易行,每个个体有相同的机会被抽中,样本具有代表性。

但由于完全随机抽样,可能会出现抽中一些特殊群体的情况,导致样本的偏差。

分层抽样分层抽样是将总体划分为若干个层次(或称为分层),然后从每个层次中独立抽取样本。

分层抽样的步骤如下:1.定义总体:确定要调查的大学生总体,例如全国大学生总体。

2.划分层次:根据特定的特征,将总体划分为若干个层次,例如按学校、专业、年级等划分。

3.确定每层样本容量:根据每个层次的重要性和特点,确定每个层次抽取的样本容量。

4.抽样框:对于每个层次,构建一个抽样框,列出该层次中的个体编号。

5.独立抽样:按照每个层次的抽样框,独立抽取样本。

分层抽样的优点是可以保证每个层次都有足够的样本表示,提高了样本的代表性。

但需要提前对总体划分层次,且需要对不同层次进行独立抽样,增加了操作和管理的复杂性。

整群抽样整群抽样是将总体划分为若干个群体(或称为簇),然后从每个群体中抽取全部个体作为样本。

整群抽样的步骤如下:1.定义总体:确定要调查的大学生总体,例如全国大学生总体。

抽样技术及样本计算方法

抽样技术及样本计算方法
例如:某地有5000户,今欲抽取1/5家庭作健康调 查,则每5户抽1户,或逢“5”抽,抽到的户即作为 调查单位。
随机抽样—分层随机抽样
分层抽样的特点是先将总体按照某种特征 或指标分成几个排斥的又是穷尽的子总体, 或层,然后在每个层内按照随机的方法抽 取元素。其原则是子总体内元素间差异可 能小,而不同子总体间差异大。
例:你调查了100个人,询问他们是否应该早办奥运会,其中 66%的人说“是”。如果你的调查精确度为3%,这也就 是说,如果你对不同的样本展开同样的调查,最后结果 中选“是”的比例会在63%-69%之间。



抽样误差与样本量关系曲线

样本量
抽样误差随着样本量的增加而减少,但当样本 量增加到一定程度之后,样本量的增加对抽样 误差几乎没有影响了。
ห้องสมุดไป่ตู้点:
完成一项普查需要的时间长,可能影响最终得到数据的可 比性;
可能导致高的非抽样误差;
什么是误差
在CSI中,由于各方面因素的作用,调查 结果总会存在误差。通常,调查误差分为 两种主要类型:
抽样误差 非抽样误差
误差=抽样误差+非抽样误差
总的来说,普查不存在抽样误差,但可能 存在较大的非抽样误差;而抽样调查会产 生抽样误差和非抽样误差。
① 由调研人员引起的 ② 由访问员引起的 ③ 由被访者引起的
非抽样误差与样本量的关系
非 抽 样 误 差
样本量
误 差
样本量
抽样方法
随机抽样
1. 简单随机抽样 2. 等距抽样(系统抽样) 3. 分层随机抽样 4. 整群抽样 5. 多级抽样
非随机抽样
1、方便取样;2、判断取样;3、配额取样
误 差

样本容量的确定

样本容量的确定
抽样结果的点估计在很少的情况下完全准确 因此人们更偏于区间估计 区间估计就是 对变量值如总体平均值的区间或范围进行估计 除了要说明区间大小外 习惯上还要说明实 际总体平均值在区间范围以内的概率 这一概率通常被称为置信系数或者置信度 区间则被 称为置信区间
都在此范围内 而通过简单随机样本对总体做的估计为实际总体平均值 2 倍标准误差范围 内的概率为 95 在实际总体平均值 3 倍标准误 差范围内的概率为 99.7 5.5.3 点估计和区间估计
当利用抽样要对总体平均值进行估计时 有两种估计方法 点估计和区间估计 点估计 是指把样本平均值作为总体平均数的估计值 观察图 5.3 的平均数抽样分布可知某一特定的 抽样结果 其平均数很可能相对更接近总体平均数 但是 样本平均数分布中的任一个值都 可能是这一特定样本的平均值 有一小部分的样本平均值与实际总体平均值有相当的差距 这种差距就叫抽样误差
在任何确定样本容量的问题中 都必须认真考虑所要分析并要据此做统计推断的总体样 本的各个子群的数目的预期容量 例如 从整体上看样本容量为 400 很符合要求 但若要分 别分析男性和女性被调查者 并且要求男性与女性的样本各占一半 那么每个子群的容量仅
1
广州方舟市场研究有限公司
统计学基础知识
为 200 这个数字是否符合要求 能使分析人员对两组的特征做出预期的统计推断呢 再如 要按年龄和性别分析调研结果 问题就变得更复杂了 假设要按以下方式将总体样本划分为 四组
5
广州方舟市场研究有限公司
统计学基础知识
5.5.2 根据单个样本做出推断 在实际操作中 人们往往不愿从总体中抽出所有可能的随机样本 画出像表 5.3 和图 5.4
那样的频率分布表和直方图来 人们希望进行简单的随机抽样 并据此对总体进行统计推断 问题出现了 通过任一简单的随机样本对总体均数进行的估计 其估计值在总体平均值 1 个标准误差内的概率究竟为多大 根据表 5.2 可知概率为 68 因为所有样本平均数有 68

第五章 抽样:样本容量的确定(市场调研-北京大学,胡健颖)

第五章  抽样:样本容量的确定(市场调研-北京大学,胡健颖)

9
第五章 抽样:样本容量的确定
3) 均值或比例的标准误差(standard error) ,或抽 样平均误差,公式为: 均值 比例
x

n
P
P(1 P) n
2014-2-6
北京大学光华管理学院 胡健颖
10
第五章 抽样:样本容量的确定
4) 通常总体标准差 σ 是未知的,在这种情况下,可以通过 下面的公式从样本中估计总体的标准差: 均值 比例
思考题: ① 迪斯尼世界的调查表明,有 60%的老顾客喜欢玩滑行铁道。 若要求误差不超过 2%, 置信度为 90% (Z 值查参考书 552 页) , 求所需的样本容量。 ② 客户要求置信度为 99%,允许抽样误差为 2%,按此计算出 需要样本容量为 500,调查费用是 20,000 美元,但他只有 17,000 美元的预算,问有没有其他方案可供选择? ③ 在具有什么条件下,进行调查前就可以将样本容量确定下 来?
在确定估计比例所需的样本容量时有一个优势:如果缺乏估计 P 的依据,可以对 P 值做最糟糕的假设。给定 Z 值和 E 值,P 值 为多大时要求的样本容量最大呢?当 P=0.05 时, “P(1-P)”有极大 值 0.25 存在。
2014-2-6
北京大学光华管理学院 胡健颖
30
第五章 抽样:样本容量的确定
2014-2-6
北京大学光华管理学院 胡健颖
25
第五章 抽样:样本容量的确定
表 5-1 1000 个样本平均数的概率分析:最近 30 天内吃快餐的平均次数 次数分组 2.6-3.5 3.6-4.5 4.6-5.5 5.6-6.5 6.6-7.5 7.6-8.5 8.6-9.5 9.6-10.5 10.6-11.5

第六讲-2 样本量确定

第六讲-2  样本量确定
11
深圳土壤风沙尘合理采样数目
深圳
Na Mg Al Si K Ca
分布类型 对 对 对 对 正 正
变异系数(%) 2.3 23.7 2.4 0.5 36.3 58.5
=0.05,K=0.1 1 21 1 1 50 131
=0.05,K=0.2 1
5 1 1 13 33
=0.1,K=0.1 1 15 1 1 36 93
(二)约定式方法
认为某一个约定或数量就是正确的样本容量。但约定式确定样本容量的方法
忽略了与所要进行的研究相关的情况,而且采用约定的样本容量进行研究所
需的费用可能比较高。
如大气颗粒物采样
(三)成本基础法
将成本作为确定样本容量的基础。成本将不是确定样本容量的唯一考虑因素, 但在确定样本容量时也应予必要的考虑。
)S
2
假定两样本标准差相同
t均为不同显著性水平的t值
n1、n2- n1=n2时两个样本的大小
Δ—样本平均值*相对误差(%)
14
两个相关样本的情况
n
(t
t
)Sd
2
n
(t
/2
t
)Sd
2
Sd,样本差别的标准差
15
2
为什么要确定样本量?
4. 取样误差与实验室分析误差比较,通常认为取样 误差更大,因此应更加重视取样方法及取样的代 表性,尤其在微量、痕量组分分析中,取样误差 往往比其它误差来源更重要。
5. 当取样偏差是测量偏差的3倍或更多时,测量偏 差就不重要了。所以,当存在显著的取样偏差时, 任凭用多么精密的仪器,对提高分析结果的准确 性都无济于事。可见,分析全过程中,取样工作 是重要的一环.
=0.1,K=0.2 1

抽样方案练习题

抽样方案练习题

抽样方案练习题抽样是统计学中的一项重要方法,用于从总体中选取一部分样本,以了解总体特征或对总体进行推断。

在进行抽样时,需要设计合适的抽样方案,以确保样本能够代表总体,并降低抽样误差的风险。

本文将通过练习题的形式,介绍抽样方案的相关知识与技巧。

练习一:随机抽样某市有1000家餐馆,现希望通过抽样调查了解当地餐馆的经营情况。

请设计一个随机抽样方案,确定需要抽取的样本数量,并说明抽样过程的步骤。

解答:1. 确定样本数量:根据总体大小和置信水平,选择适当的样本容量。

假设置信水平为95%时,选择的样本误差为5%,则样本容量可通过公式 n = Z² * p * q / e²进行计算,其中 Z 表示标准正态分布的分位数,p为总体比例,q = 1 - p,e 为样本误差。

假设总体比例未知,为了确保样本尽可能代表总体,我们可先从初步调查中获得总体比例的估计值。

2. 进行随机抽样:首先,给每家餐馆进行编号,编号应保证每家餐馆都有机会被选中。

然后,使用随机数表或随机数发生器生成一组随机数,代表抽取的餐馆编号。

依据这些编号,从总体中抽取相应数量的样本。

3. 数据收集与分析:对抽取到的样本进行数据收集,可以通过实地调查、问卷调查或访谈等方式获取相关信息。

收集完毕后,对样本数据进行统计分析,得出有关餐馆经营情况的结论。

练习二:分层抽样某公司计划对全国不同地区的消费者进行调查,并希望了解不同地区消费者对其产品的满意度。

请设计一个分层抽样方案,确保样本能够代表各地区的消费者群体,并降低抽样误差的风险。

解答:1. 划分地区层级:根据全国不同地区的分布情况,对地区进行划分,形成若干个地区层级,例如按省份划分或按城市划分。

2. 确定每个地区的样本数量:根据每个地区消费者人数和总体大小,确定每个地区应抽取的样本数量。

一种常用的方法是按照各地区人口比例确定样本数量,以确保样本能够代表各地区总体。

3. 进行分层抽样:在每个地区中,进行简单随机抽样或系统抽样。

报告中的随机抽样与样本容量计算

报告中的随机抽样与样本容量计算

报告中的随机抽样与样本容量计算随机抽样和样本容量计算是科学研究中常用的方法,可以有效地降低研究误差,提高研究结果的可靠性。

本文将从以下六个方面展开详细论述。

一、随机抽样的定义与意义随机抽样是指从总体中按照一定的概率方法选取样本的过程。

随机抽样有助于消除人为主观因素对样本的选择,保证样本的代表性,从而使得样本数据可以更好地反映总体的特征。

随机抽样是科学研究的基础,也是保证研究结果可信度的重要方法。

二、随机抽样的方法与步骤随机抽样有多种方法,常见的包括简单随机抽样、分层抽样、整群抽样等。

在进行随机抽样时,需要明确研究目的、总体特征、样本容量等因素,并按照一定的步骤进行抽样,保证样本的随机性和代表性。

三、样本容量计算的原理与方法样本容量计算是确定研究所需的样本规模的过程。

样本容量的大小直接影响研究结果的可靠性和推广性。

样本容量计算需要考虑到总体的大小、置信水平、可接受的误差水平等因素,常用的计算方法包括经验公式法、查表法和计算机辅助方法等。

四、样本容量计算中的误差评估样本容量计算中有一定的误差,需进行误差评估,以确定样本容量估计的可行性。

误差评估常采用置信区间的方法,计算置信区间的上限和下限,根据误差范围来评估样本容量计算的准确度和可靠性。

五、样本容量的调整与优化方法样本容量计算的结果可能与实际情况存在差异,需进行样本容量的调整与优化。

调整样本容量可以通过增加样本数量、改变抽样方法、加大置信水平等方式进行,以提高研究的精度和效力。

六、事后样本容量评估与修正在进行研究时,有时无法准确估计样本容量,需进行事后样本容量的评估与修正。

通过对已有的样本数据进行分析,评估样本容量的合理性,如果发现样本容量不足,可通过添加新的样本来进行修正,以提高研究结果的可靠性。

通过以上六个方面的论述,可以更全面地了解报告中的随机抽样与样本容量计算的重要性和实施方法。

科学地进行随机抽样和样本容量计算,可以提高研究的可靠性,为科学研究提供坚实的基础。

质量工具讲解 | 抽样调查中样本容量的确定方法

质量工具讲解 | 抽样调查中样本容量的确定方法

(1)如果全部是规模比较小的单位个体户,我们可以根据类别进行适当的分组,将某一类单位比较多的单独分层;将另外类别比较少的,可以几类合并进行抽取具体样本,分层不要多于4层,并保证每层的样本量不小于2个。由于居委会样本量数目已经确定,我们可以直接采取比例分配方法,确定各层样本量。
(2)如果规模比较大的和规模小的并存,可以将规模比较大的单独分层,不用考虑其中的类别;将规模较小的主要是个体户可以根据类别进行分层;其中的难题是如何将样本量在规模大的和规模小的之间分配,因为大规模层内样本变异程度有可能很大,应该抽取较多的样本量,经过测试,如果大规模层总体小于等于5,应该对其进行全面调查;如果大于5个,可以采用以下的公式计算得到:
取规模分配方法,由于人口数与一个地区的个体单位数没有必然的联系,可能导致某些居委会的个体数比较多,却分配了较少的样本量,使得居委会分层变的困难,同时使居委会方差显著增大。而获得较多样本量的居委会,分层的效果和方差提高幅度有限,故采用比例分配的方法可能更加合适一些。对于居委会村委会的抽取,由于本阶可能存在市场内的抽样,分配复杂一些;如果本阶有市场内抽样,可以适当减少居委会村委会的样本量,但应该大于本阶样本量的80%,由于市场内抽样的特殊性,建议将本阶样本量全部分配给居委会村委会,我们所进行的试点就是将样本全部分配给居委会;至于市场内抽样的具体实施,可以根据方案操作完成。对居委会村委会层内,由于使用简单随机抽样完成,采用比例分配平均分配就可。
在实际工作时,由于一个区县包括全部乡镇街道或其中的一个;根据方案,区县抽取办事处的数量应该介于12-4个之间,对应于抽中乡、镇、街道的全部或其中一个,那么其每一个乡镇街道采取比例分配平均分配的样本量应该是11-32个之间;所抽中的居委会、村委会数量应该介于16-48个之间,如果个别乡镇街道抽中的居委会是2个,则其居委会总数相应减少一些;最后,每个居委会、村委会的样本量应该介于3-16个之间,大部分介于5-10之间。以上的讨论没有考虑总体的大小,如果考虑到居委会、村委会的总体有限,则每个居委会村委会的样本量可以减少一些,具体可以采用以下公式得到具体样本量的调整数:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样调查的样本容量的确定方法摘要:确定样本容量是抽样调查中重要的环节,影响到抽样估计的精确度和调查的成本和效益。

单位标志变异程度、抽样极限误差、抽样推断的可靠度、抽样类型和方法等影响到样本容量地确定。

样本容量的确定可以根据由抽样误差、抽样极限误差和概率度推算出来的公式计算,也可以根据建立在过去抽取满足统计方法要求的样本量所累积下来的经验法则来确定。

关键词:样本容量;抽样调查;抽样误差;极限误差抽样调查是根据随机原则,从总体中抽取部分实际数据构成样本,同时运用概率估计方法,依据样本信息推断总体数量特征的一种非全面统计调查。

根据抽选样本的方法,抽样调查可以分为等概率抽样和非概率抽样两类。

等概率抽样又称为随机抽样,是按照概率论和数理统计的原理,从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征做出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。

样本是从总体中抽出的部分单位的集合,样本中所包含的单位数被称为样本容量,一般用n表示。

确定样本容量是制定抽样调查方案中的一个非常重要的环节。

1.确定样本容量的必要性1.1样本容量大小影响抽样估计的精确度抽样估计的精确度是指样本的统计量与其所代表的总体值的接近程度。

调查结果相对于总体真实值的精确度与样本容量直接相关。

样本容量越大,抽样误差相对就会减少,估计精度就会提高;若样本容量太小,抽样误差就会增大,从而影响抽样估计的精确度。

1.2样本容量大小影响抽样调查的成本和效益样本量的设计通常受到研究经费及调查时间的限制。

根据数理统计规律,样本量增加呈直线递增的情况下(样本量增加一倍,成本也增加一倍),而抽样误差只是样本量相对增长速度的平方根递减。

若样本容量过大,调查单位增多,不仅增加人力、财力和物力的耗费,增加调查费用,而且还影响到抽样调查的时效性,从而不能充分发挥抽样调查的优越性。

因此,为节省调查费用,体现出抽样调查的优越性,在确定样本容量时,应在满足抽样调查对估计数据的精确度的前提下,尽量减少调查单位数,确保必要的抽样数目。

2.影响必要样本容量的主要因素影响样本容量的因素是多方面的,在抽样调查总体、调查费用和调查时间既定的情况下,为确定最佳的样本容量,应首先分析影响样本容量的因素。

从理论上说,影响样本容量的因素有以下几个方面:2.1单位标志变异程度或成数方差P(1-P)的大小来表示。

在其他单位标志变异程度一般用方差2条件不变的情况下,为了达到同样的研究目的,总体单位标志的变异程度大,样本容量应越大;反之,总体单位标志的变异程度越小,则样本容量就应越少。

二者成正比关系。

2.2抽样极限误差抽样极限误差又叫允许误差,是指在一定的把握程度下保证样本指标与总体指标之间的抽样误差不超过某一给定的最大可能范围。

在抽样推断中,需要把这个误差控制在一定的范围之内。

抽样平均数极限误差一般用x ∆表示,抽样成数极限误差用P ∆表示。

在其他条件不变的前提下,所允许的抽样极限误差越小,即抽样估计的精确度要求越高,样本容量应越大;所允许的抽样极限误差越大,所需的样本容量就越小。

二者成反比关系。

2.3抽样推断的可靠度抽样推断的可靠度是指总体所有可能样本的指标落在一定区间的概率度,即允许误差范围的概率保证程度。

概率度用2αZ 表示,即置信水平α-1的统计量,一般简写为t 。

在其他条件不变的情况下,抽样估计所要求的可靠程度越高,即概率保证程度越高,要求样本含有的总体信息就越多,只有增加样本容量才能满足高精确度的要求;反之,概率保证程度越低,所需的样本容量就越小。

二者成正比关系。

2.4抽样类型和方法概率抽样的主要类型有简单随机抽样、系统随机抽样、分层随机抽样、整群随机抽样、多阶段随机抽样等。

在简单随机抽样中,根据同一单位是否允许重复抽取方式的不同,抽样方法可分为重复抽样和不重复抽样。

由于在同样的条件下,不同的抽样方式会产生不同的抽样误差,因此,样本容量也应有所不同。

一般来说,分层随机抽样和系统随机抽样的样本容量可定得小些,若用简单随机抽样和整群随机抽样方式,抽样的样本容量就要定得大些。

至于抽样方法,由于不重复抽样的误差小于重复抽样的误差,因此,不重复抽样的样本容量可比重复抽样的样本容量小些。

3.不同抽样方式下的样本容量确定从上述分析中可以看出,影响样本容量的因素是多方面的,但必要样本容量是根据抽样误差、抽样极限误差和概率度推算出来的,在不同抽样方式下,计算公式有所差异。

3.1简单随机抽样的样本容量简单随机抽样是指按照随机原则从总体单位中直接抽取若干单位组成样本。

简单随机抽样中分为重复简单抽样和简单不重复抽样,因此,简单随机抽样的样本容量计算公式包括两种。

3.1.1重复抽样时的样本容量在重复抽样条件下,样本容量的计算公式为:222∆=σt n 或22)1(∆-=P P t n 。

在以上公式中,n 代表样本容量,t 代表概率度2αZ ,∆代表极限误差,2σ代表总体方差,P(1-P)表示成数方差。

3.1.2不重复抽样时的样本容量在不重复抽样条件下,样本容量的计算公式为:22222σσt N t N n +∆=或)1()1(222P P t N P P t N n -+∆-=上式中,N 代表样本总数。

3.2分层随机抽样的样本容量分层随机抽样,也称类型随机抽样,是指首先将调查对象的总体单位按照一定的标准分成各种不同的类别(或组),然后根据各类别(或组)的单位数与总体单位数的比例确定从各类别(或组)中抽取样本的数量,最后按照随机原则从各类(或组)中抽取样本。

对于分层抽样,在总的样本量一定时,一个重要的问题是各层应该分配多少样本量。

实际工作中有不同的分配方法,可以按对各层进行常数分配,也可以按各层单位数占总体单位数的比例分配,还可以采用在总费用一定条件下使估计量方差达到最小的最优分配等,其中等比例分配是较为常用的方法。

分层抽样是对每一组抽样,不存在样本组间误差,抽样平均误差取决于各组内方差的平均水平,即以各组样本单位数为权数,计算各组内方差的平均数。

因此可用组内方差平均数计算出抽样平均误差。

3.2.1重复抽样时的样本容量在重复抽样条件下,样本容量的计算公式为:222∆=σt n 或22)1(∆-=P P t n 在以上公式中,2σ是组内平均方差,)1(P P -代表成数的平均组内方差。

∑=n n i i 22σσ,其中i n 代表各组样本单位数,2i σ代表各组的组内方差,n 代表样本总数。

3.2.2不重复抽样时的样本容量在不重复抽样条件下,样本容量的计算公式为:22222σσt N t N n +∆=或)1()1(222P P t N P P t N n -+∆-=3.2.3各层样本量的确定当样本容量n 确定之后,各层应抽取的样本单位数可采用等比例法进行分配,计算公式为:N nN n i i =上式中,i n 为第i 层应抽取的样本数,n 为样本容量,i N 为第i 层样本数,N 为总体单位数。

3.3整群随机抽样的样本容量整群随机抽样又称聚类抽样,是把总体先分为若干个子群,然后抽取若干群作为样本单位的一种抽样方式。

整群抽样是对选中的群进行全面调查,所以只存在群间抽样误差,不存在群内抽样误差,因此抽样平均误差可根据群间方差推算出来。

由于整群抽样一般是不重复抽样,故应按不重复抽样计算必要的抽样群数。

由整群抽样的极限误差和抽样标准误差公式导出样本容量计算公式为: 22222r r t N t N n σσ+∆=或)1()1(222r r r r P P t N P P t N n -+∆-=上式中r P 代表成数的群间方差,2r σ代表群间方差,r x x i r ∑-=22)(σ,其中i x 是第i 群样本平均数,x 是全样本平均数,r 是抽取的群数。

3.4等距抽样样本容量的确定等距抽样也称为系统抽样、机械抽样,是将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。

根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。

3.4.1无关标志排队的等距抽样若对总体采用按无关标志排队的等距抽样时,可采用简单随机抽样的公式确定等距抽样的样本容量。

由于等距抽样一般都是不重复抽样,应采用在不重复抽样条件下的样本容量的计算公式。

3.4.1有关标志排队的等距抽样若对总体采用按有关标志排队的等距抽样,则样本容量的确定,可采用分层抽样的样本容量公式确定样本容量。

但应注意有序系统抽样的样本容量计算所需的平均组内方差应根据以往的资料作出估计。

4.确定样本容量的相关问题4.1有关总体方差的问题样本容量的确定是在调查之前进行的,这样总体方差(或样本方差)一般是未知的。

在实际工作中往往利用有关资料代替。

如果在本次调查之前,曾搞过同类问题的全面调查,可用全面调查的有关资料代替;在进行正式调查之前,组织两次或两次以上试验性抽样,用试验样本的方差来代替;成数方差在完全缺乏资料的情况下,可用成数方差的极大值0.25(P=0.5)来代替。

4.2一次调查满足多项需要应用公式计算的样本容量是最低的,也是最必要的样本容量。

有时在进行抽样调查时,一次调查要同时满足平均数和成数两个方面需要,这样根据样本容量计算公式得出的必要样本容量可能不相等。

为了同时满足两个推断的要求,一般应选用其中较大的样本单位数作为样本容量。

4.3确定样本容量的经验法则在抽样调查中,除上述利用公式来计算样本容量,还有一种常用的方法,即采用经验法则。

经验法则是建立在过去抽取满足统计方法要求的样本量所累积下来的经验。

使用这个方法时很少需要统计方法知识,但是得出的样本大小很接近统计方法计算出的结果。

在采用经验法则时,有关样本量大小的一项原则是:总体越小,要得到精确样本,即有较高概率得出与总体相同结果的样本,抽样比率就要越大。

较大的总体能够使较小的抽样比得出同样好的样本。

这是因为随着总体人数的增长,样本大小的精确性会随之增加。

对于规模较小的总体(1000人以下),研究者需要比较大的抽样比率(大约30%)为要有较高的精确性,这时需要大约300个样本;对于中等规模的总体(如10000人),要达到同样的精确度,抽样比率为10%或大约1000个样本量就可以了。

就大规模的总体(超过150000)而言,抽样比率为1%或大约1500个样本量就能得出正确的结果。

如果是非常大的总体(超过1000万)。

研究者可以使用0.025%抽样比或者大约2500个样本,就能够得出精确的结果。

当抽样比率非常小时,总体大小的影响力就不那么重要了。

从2亿总体中抽取一个2500左右的样本,与从1000万总体中抽出同样规模的样本,它们的精确程度是完全相同的。

相关文档
最新文档