抽样样本量的确定

合集下载

市场调研中的样本选择与样本量确定方法

市场调研中的样本选择与样本量确定方法

市场调研中的样本选择与样本量确定方法在市场调研过程中,样本选择和样本量确定是非常重要的步骤。

合理的样本选择和样本量确定方法可以确保调研数据具有代表性和可信度。

本文将介绍市场调研中常用的样本选择和样本量确定方法,并对其优缺点进行详细分析。

一、样本选择方法1. 简单随机抽样简单随机抽样是指从总体中按照相同的概率独立地随机选择样本的方法。

这种方法能够确保每个样本的选择机会相等,具有代表性。

但是,在实际应用中,可能会存在抽取样本不完全随机的情况,导致样本选择的偏倚。

2. 系统抽样系统抽样是按照一定的规律从总体中选择样本的方法,例如每隔固定的间隔选择一个样本。

这种方法相对简便,但可能会引入一定的抽样偏倚。

3. 分层抽样分层抽样方法是将总体划分为若干个互不重叠的子总体,然后从每个子总体中进行抽样。

这种方法可以保证每个子总体的代表性,适用于样本选择上具有多个明显特征的总体。

4. 整群抽样整群抽样是指将总体分成若干个互不重叠的群体,然后从中随机选择若干个群体作为样本。

这种方法适用于总体具有自然形成的群体,例如某个地区的消费者群体。

二、样本量确定方法1. 经验法经验法是根据研究者的经验和专业知识来确定样本量。

这种方法操作简单,但容易受主观因素的影响,不够科学准确。

2. 公式法公式法是根据统计学原理和抽样误差要求来确定样本量。

常用的公式包括通过总体标准差来计算样本量的公式和通过总体比例来计算样本量的公式。

这种方法相对科学准确,但需要掌握一定的统计学知识。

3. 置信度和置信水平法置信度和置信水平法是根据置信度和置信水平来确定样本量。

研究者可以根据不同的置信度和置信水平来确定合适的样本量。

这种方法能够更好地控制研究结果的可靠性。

4. 功效分析法功效分析法是通过设定研究效应值和研究检验的显著性水平,来确定样本量。

这种方法可以帮助研究者评估样本量对研究结论的影响,并给出具体的样本量要求。

在确定样本量时,还需要考虑研究的目的、资源限制和可行性。

毕业论文中的样本选择和样本量确定

毕业论文中的样本选择和样本量确定

毕业论文中的样本选择和样本量确定样本选择和样本量确定在毕业论文中是非常重要的步骤。

本文将从样本选择的原则、样本量的确定方法以及在毕业论文中如何合理应用这些方法等方面进行探讨。

1. 样本选择的原则在毕业论文中,样本选择要遵循一定的原则,以保证样本的代表性和可靠性。

以下是几个常用的样本选择原则:(1)随机抽样原则:通过使用随机数表或随机数发生器,从目标总体中等概率地抽取样本,以排除主观因素对样本的影响,从而提高样本的代表性。

(2)分层抽样原则:当总体可以分为若干个互相独立的子总体时,可以先按照某种特征将总体划分为若干个层次,然后在各个层次上进行简单随机抽样,以保证样本在各个层次上的分布与总体相似。

(3)滚动抽样原则:在研究进行过程中,根据实际情况逐步增加或调整样本量,以使样本更具代表性,并能反映研究对象的变化趋势。

2. 样本量的确定方法合理确定样本量是保证研究结果可靠性的重要环节。

以下是几种常用的样本量确定方法:(1)经验公式法:根据经验公式确定样本量,例如当总体容量较大时,可使用经验公式n = Z^2 * P * (1-P) / E^2来估算样本量,其中Z表示显著性水平对应的Z值,P表示总体比例,E表示误差容忍度。

(2)专家判断法:根据经验或领域专家的判断确定样本量,考虑研究内容的特殊性和独特性,综合考虑相关因素。

(3)统计学方法:通过统计学方法进行样本量的计算,根据研究设计、假设检验的力和效应大小等因素进行样本量计算,以保证研究结果的准确性。

3. 在毕业论文中的应用在毕业论文中,样本选择和样本量确定的具体应用取决于研究的目标和方法。

以下是几个常见的情况:(1)问卷调查:在进行问卷调查时,可以根据研究的目标和受众群体的特点,采用随机抽样原则进行样本选择,并根据样本调查结果进行样本量的确定,以便获取可靠的统计数据。

(2)实证研究:在进行实证研究时,可以根据研究的问题和目标,选择适当的样本选择原则,并根据相关的统计学方法确定样本量,以获得可信的实证结果。

统计学中的样本量确定方法

统计学中的样本量确定方法

统计学中的样本量确定方法统计学中,样本量的确定对于研究的可靠性和准确性至关重要。

合理确定样本量可以保证研究结果的有效性,避免结果偏差,并且可以减少资源浪费。

本文将介绍统计学中的样本量确定方法。

一、样本量的重要性在进行统计研究时,我们通常无法对所有感兴趣的个体进行调查或实验。

相反,研究者将从整个群体中选取一部分个体,即样本进行研究。

因此,样本量的大小直接影响到研究结果的可靠性和推广性。

二、简单随机抽样方法简单随机抽样是最常用的样本抽取方法之一,它要求每个个体具有相同的被抽取概率。

在确定样本量时,我们需要考虑一些因素,如总体的大小、总体的方差、误差容忍度和置信水平等。

三、基于假设检验的样本量确定方法在某些情况下,我们需要根据假设检验的需求来确定样本量。

假设检验是统计学中用来检测两个或多个群体差异的方法。

样本量的确定可以通过根据所需的效应大小和显著性水平来选择。

四、基于置信区间的样本量确定方法当我们希望估计总体的某个参数,并且给出一个置信区间时,可以使用基于置信区间的样本量确定方法。

这种方法旨在控制估计的精确性,以便使置信区间的宽度在可接受的范围内。

五、借助统计软件进行样本量计算在实际研究中,我们可以使用各种统计软件来计算样本量。

这些软件提供了各种样本量确定方法的计算工具,使我们能够根据具体情况快速准确地确定样本量。

六、样本量确定的注意事项确定样本量时,还需要注意以下几个方面:1. 确定研究目标和问题,明确需要估计或推断的参数;2. 考虑资源和时间限制,合理平衡研究目的和可行性;3. 在确定样本量时,选择合适的统计方法和分析技术;4. 根据所选方法和技术,选取适当的效应大小、显著性水平和置信水平。

结论样本量的确定是统计学研究中的重要环节。

合理确定样本量可以保证研究结果的可靠性和准确性。

本文介绍了统计学中常用的样本量确定方法,包括简单随机抽样方法、基于假设检验的样本量确定方法、基于置信区间的样本量确定方法以及借助统计软件进行样本量计算等。

抽样样本量的确定_图文

抽样样本量的确定_图文

除了估计值的精度以外,调查实际操作的限制条件 也许是影响样本容量的最大因素。
客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少
1.给定精度水平下样本容量的确定
样本容量的大小与调查估计值所要求的精度紧密相关
数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。
表3: 显示了不同规模的总体在P=0.5时,使用简单随机 抽样,且以误差界限为0.05、置信度为95%的标准估计P 所需的样本容量
总体规模 50 100 500
1,000 5,000 10,000 100,000 1,000,000 10,000,000
所需的样本量 44 80 222 286 370 385 398 400 400
抽样方差的几种计量方法
标准误差 误差界限 变异系数
抽样调查中样本容量的确定,也经常会使 用一种或多种这样的计量方法来对精度进行说 明。
非抽样误差
非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑 为确保调查结果的准确性,应该消除非抽样误差,至少应尽 可能使之最小化
对于小规模总体,通常必须调查较大比 例的样本,以取得所期望的精度。因此,实 际操作中,对小规模总体经常采用普查而不 是抽样调查。
6.样本设计和估计量
计算样本容量时,通常假定采用的抽样方式为简单随 机抽样(SRS)。所以,如果样本容量计算公式假定为简单随 机抽样。
分层抽样得到的估计值通常比相同规模的简单随机抽 样更精确,或者至少 一样精确。 整群抽样得到的估计值,其精度通常低于使用同一估 计量进行估计时的简单随机抽样的估计值的精度

第10章 抽样估计与样本量确定

第10章 抽样估计与样本量确定

19
10.4 参数估计

参数估计就是根据从样本中收集的信息对总体参数进行推 断的过程。根据中心极限定理等推断理论所阐明的抽样分 布与总体分布之间的关系,由样本统计量的具体值(估计 值)估计总体参数。 点估计 区间估计


20

点估计

用样本的估计量直接作为总体参数的估计量。 存在抽样误差。 在点估计的基础上,对总体参数的区间或范围 进行估计(样本统计量加减抽样误差),点估计 值落在该区间范围内的概率为置信度或置信系 数或置信水平。
26
举例P227
已知:n 36,1 95%, 2 0.025,1 2 0.975. 根据样本计算得: x 39.5, s 2 60.37.
2 查 2分布表得知: , 12 2 n 1 20.6120 . 2 n 1 53.1604
课后思考与训练题 P237-238 第4、5、7题

28
10.5 样本量的确定


样本量的确定问题,首先涉及对总体参数估计值的精度要 求,同时也涉及与各种运作限制(如可获得的预算、资源 和时间)之间的平衡问题。 抽样调查估计值的精度是对抽样误差大小的度量。因此确 定样本量是为控制抽样误差,而不是非抽样误差。
该银行信用卡年龄方差 2在95%置信度下的置信区间为 : 53.1604 20.6120 即, 39.75 2 102.51
36 -1 60.37 2 36 -1 60.37
结论是:在95%的置信度下,信用卡用 户年龄标准差为 6.3 ~ 10.1岁.
27
练习题

12
10.3 抽样分布与抽样误差

总体分布:总体各单位的观测值所形成的频数分布。 样本分布:一个样本中各个观测值形成的频数分布。 抽样分布:样本统计量的抽样分布是一种理论分布,是指 在重复抽取容量为n的样本时,由该统计量的所有可能取 值形成的相对频数分布。

抽样数量的确定

抽样数量的确定

抽样数量的确定探索性研究,样本量一般较小,而描述性研究,就需要较大的样本;收集有关许多变量的数据,样本量就要大一些;如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当更大;如果需要特别详细的分析,如做许多分类等,也需要大样本。

针对子样本分析比只限于对总样本分析,所需样本量要大得多;总体指标的差异化越大,需要的样本量就越高;调研的精度越高,样本量越大。

简单随机抽样设计,设计效应等于1;分层抽样设计,设计效应一般小于等于1;整群或多阶抽样设计,设计效应一般大于等于1。

在实际中,在确定样本量时,不考虑时间和费用这两个极为重要的因素是不可思议的。

最终确定的样本量必须与可获得的经费预算和允许的时限保持一致。

最终样本量的确定需要在精度、费用、时限和操作的可行性等相互冲突的限制条件之间进行协调。

有关样本量的经验估计:如果是大型城市、省市一级的地区性研究,样本数在500-1000之间可能比较适合;而对于中小城市,样本量在200-300之间可能比较适合;如果是多省市或者全国性的研究,则样本量可能在1000-3000之间比较适合。

对于分组研究的每组样本量应该不少于50个。

通过试验设计所作的研究,可以采用较小的样本量。

如产品试用(留置)调查,在经费有限的情况下,可以将每组的样本量降低至30个左右,最好每组在50以上,每组超过100个可能是一种资源浪费。

样本量的计算公式:1)对于简单随机抽样,给定均值估计的精度(100%回答)简单随机抽样下,通常使用误差限和估计量的标准差来确定所需的样本量。

其中,为置信区间的值,为估计量的标准差,e为调查误差,N为总体大小。

2) 对于简单随机抽样,给定比例估计的精度(100%回答率)于是公式(1)变为:若在以往调查中可得总体比例的一个较好估计,那么直接将它代入上面的公式就可以得到所需的样本量;否则可以用,因为这时总体的方差最大。

则公式简化成市场调研中常采用该公式来确定最低样本量。

产品质量检测中的抽样与样本量确定

产品质量检测中的抽样与样本量确定产品质量检测是确保产品符合标准要求的关键环节。

而在进行产品质量检测时,抽样与样本量的确定是一个重要的问题。

本文将从抽样的目的、方法以及样本量确定的依据等方面进行探讨。

一、抽样的目的在进行产品质量检测时,完全检测所有产品是不现实的,同时也是不必要的。

抽样的目的是从整体中获取代表性的样本,以此推测整体的质量情况。

通过合适的抽样方法,可以减少成本和时间,同时还能够提高检测的效率。

二、抽样的方法1. 随机抽样随机抽样是指从总体中以完全随机的方式选择样本。

这种抽样方法的好处是能够消除选择偏差,使得样本具有代表性。

随机抽样可以采用抽签、随机数生成器等方式进行,确保每个样本都有平等的机会被选中。

2. 分层抽样分层抽样是基于总体的特征将总体划分为若干层次,然后从各层中抽取样本。

这种抽样方法适用于总体内部具有差异较大的情况。

通过分层抽样,可以保证样本更加具有代表性,减小误差。

3. 整群抽样整群抽样是指将总体划分为若干群体,然后从中抽取群体作为样本。

这种抽样方法适用于总体内部群体特征相似的情况。

整群抽样的优势在于简化了抽样的过程,同时也减少了误差。

三、样本量确定的依据确定合适的样本量对于产品质量检测的准确性至关重要。

样本量的确定主要需要考虑以下几个因素:1. 总体容量总体容量的大小直接影响样本量的确定。

一般来说,总体容量越大,所需样本量越大,以保证结果的准确性。

2. 置信水平置信水平是对结果的可信度的度量。

常见的置信水平有95%和99%。

置信水平越高,所需样本量越大。

3. 容忍误差容忍误差是指在样本检测时允许的误差范围。

一般来说,容忍误差越小,所需样本量越大。

4. 产品属性不同的产品属性对样本量的确定也有影响。

例如,对于质量稳定的产品,所需样本量较小;而对于质量易变的产品,所需样本量则较大。

综上所述,在产品质量检测中,抽样与样本量的确定起着重要的作用。

通过合适的抽样方法,可以提高检测效率和减少成本;而通过对样本量的合理确定,可以保证结果的准确性和可信度。

抽样统计分析的基本知识

抽样统计分析的基本知识引言在统计学中,抽样是一种常用的数据分析方法,通过从总体中选择一部分样本数据进行分析,从而得出关于总体的结论。

抽样统计分析为我们提供了一种有效的方式来推断总体特征,并进行决策或预测。

本文将介绍抽样统计分析的基本知识,包括抽样方法、样本量的确定和抽样误差的控制等内容。

一、抽样方法抽样方法是确定如何从总体中选取样本的方式。

常见的抽样方法有以下几种:1. 简单随机抽样简单随机抽样是指从总体中按照概率相等的方式选择样本,每个样本的选取是相互独立的。

简单随机抽样常用的方式有抽签、随机数表等。

简单随机抽样的优点在于样本的代表性较高,能够减小抽样误差。

然而,简单随机抽样的缺点在于实施起来可能比较复杂,且对总体的特征了解较少的情况下可能效果不佳。

2. 系统抽样系统抽样是从总体中选取样本的方法之一,通过确定一个固定的抽样间距,从总体中选取每隔固定间距的样本。

系统抽样的优点在于实施简单,抽样结果仍具有一定的代表性。

不过,需要注意的是如果总体呈现出周期性或有规律的特点,系统抽样可能引入系统误差,导致样本的代表性出现偏差。

3. 整群抽样整群抽样是将总体划分为若干个互不重叠的群体,然后从这些群体中随机选择部分群体作为样本。

整群抽样的优点在于可以减少抽样的成本,提高调查的效率。

然而,整群抽样可能引入群体间的差异性,因此在分析时需要考虑群体间的相似性程度。

4. 分层抽样分层抽样是将总体划分为互不重叠的若干个层次,然后从每个层次中分别进行抽样。

分层抽样的优点在于可以针对不同层次的特点进行分析,提高样本的代表性。

然而,在进行分层抽样时需要事先对总体的特征有一定了解,并且分层的选择要合理。

5. 整体抽样整体抽样是指直接选取总体中的全部元素作为样本。

整体抽样的优点在于样本的代表性最高,不会引入抽样误差。

然而,整体抽样的缺点在于样本量较大,造成调查成本的增加。

二、样本量的确定样本量的确定是保证抽样结果具有一定代表性的重要因素。

如何确定抽样方法与样本量

如何确定抽样方法与样本量在设计一个抽样调查时,我们通常需要做的工作是:定义总体及抽样单元、确定或构置抽样杠、选择样本量的大小、制定实施细节并实施。

在这本小册子中我们着重介绍一下定量研究的抽样和样本量这两个技术环节。

最基本的定量研究的抽样方法分为两类,一类为非概率抽样,一类为概率抽样。

一.非概率抽样非概率抽样是不能计算抽样误差的,因为它是靠调研者个人的判断来进行的抽样。

它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。

偶遇抽样(方便抽样)常见的未经许可的街头随方或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。

偶遇抽样是所有抽样技术中花费最小的(包括经费和时间)。

抽样单元是可以接近的、容易测量的、并且是合作的。

但尽管有许多优点,这种形式的抽样还是有严重的局限性。

许多可能的选择偏差都会存在,如被调查者的自我选择、抽样的主观性偏差等。

这种抽样不能代表总体的推断总体。

因此,当我们在进行街头访问或邮寄调查时,一定要谨慎对待调查结果。

判断抽样判思抽亲是基于调研者对总体的了解和经验,从总体中抽选“有代表性的”“曲型的”单位作为样本,例如从全体企业作为样本,来考察全体企业的经营状况。

如果判断准,这种方法有呆取得具有较好代表性的样本,但这种方法受主观因素影响较大。

配额抽样配额抽样是根据总体的结构特征来给调查员分派定额,以取得一个与总体结构特征大体相似的样本,例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄的调查人数。

配额保证了在这些特征上样本的组成与总体的组成是一致的。

一旦配额分配好了,选择样本元素的自由度就很大了。

唯一的要求闵是所选取的元素要适合所控制的特性。

这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。

如果与问题相关联的某个特征是十分困难的。

另外,用这种方法进行选择严格控制调查员和调查过度程的条件下,可使配额抽样获得与某些概率抽样非常接近的结果。

抽样方法及样本量的确定

抽样方法及样本量的确定在社会科学研究中,抽样方法及样本量的确定是非常重要的环节。

抽样方法是指从总体中选择一部分样本进行研究,以代表总体特征的一种方法。

而样本量的确定则涉及到研究的可靠性和有效性。

本文将探讨抽样方法的选择以及样本量的确定。

一、抽样方法的选择1. 简单随机抽样简单随机抽样是一种基本的抽样方法,它通过随机选择样本,确保每个个体都有相等的机会被选中。

这种方法适用于总体分布均匀且规模较小的情况。

例如,当我们想要研究某个小城市的居民对某一政策的态度时,可以使用简单随机抽样方法。

2. 分层抽样分层抽样是将总体划分为若干层次,然后从每个层次中随机选择样本。

这种方法适用于总体具有明显的层次结构的情况。

例如,当我们想要研究一个城市的不同社区对某一政策的态度时,可以将城市划分为不同的社区层次,然后从每个社区中随机选择样本。

3. 整群抽样整群抽样是将总体划分为若干个群组,然后随机选择一部分群组作为样本进行研究。

这种方法适用于总体群组之间差异较大的情况。

例如,当我们想要研究某个国家的不同地区对某一政策的态度时,可以将国家划分为不同的地区群组,然后随机选择一部分地区进行研究。

二、样本量的确定确定样本量的大小是保证研究结果准确性和可靠性的关键因素。

样本量过小可能导致结果的不可靠,样本量过大则可能浪费资源。

确定样本量的大小需要考虑以下几个因素:1. 总体大小总体大小是影响样本量确定的一个重要因素。

当总体较大时,样本量可以相对较小;当总体较小时,样本量应相对较大。

2. 置信水平置信水平是指研究结果的可靠程度。

常见的置信水平有95%和99%。

置信水平越高,样本量需要越大。

3. 允许误差允许误差是指研究结果与总体特征之间的差异。

允许误差越小,样本量需要越大。

4. 方差方差是指总体内个体之间的差异程度。

方差越大,样本量需要越大。

综合考虑以上因素,可以使用统计学方法计算出合适的样本量。

常见的计算方法有公式法和抽样方差法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对于P=4%±5%水平左右的调查估计值就不太合适,应 规定更小的误差界限,如小于或等于±0.01、 ±0.02等,这时 候置信区间应该是( 0.05 ± 0.01) 或( 0.05 ±0 .02)。
SSI
a
第1199页
Table 1 样本容量和在P=0.5时运用简单随机抽样估计P值得到的误差界限
样本容量
信水平的标准正态分布的分位点值
该z值可从标准正态分布表中查得,大多
数统计学教材中都附有这样的统计表
SSI
a
第1122页
常用的z值包括
❖ 对于 90% 的置信度,对应的z值为 1.64 ❖ 对于 95% 的置信度,对应的z值为 1.96 ❖ 对于 99% 的置信度,对应的z值为 2.56
SSI
a
第1133页
将各个研究域中所有层的样本容量相加,便得到 了调查所需的总样本容量
SSI
a
第1177页
调查估计值有关的抽样方差有多大
❖ 为达到调查结果要求的精度,最小的调查估计值是什 么?假设我们进行比例估计。其中,一些指标的比例 可能是P=50%或更高,但是其它指标的比例则可能较 低,如P=5% 或者 P=10%
SSI
a
第55页
除了估计值的精度以外,调查实际操作的限制条件 也许是影响样本容量的最大因素。
客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少
SSI
a
第66页
1.给定精度水平下样本容量的确定
样本容量的大小与调查估计值所要求的精度紧密相关
数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。
SSI
a
第1100页
2.误差界限
误差界限是标准误差的倍数 标准误差是估计量抽样方差的平方根 乘数因子取决于在调查估计中所希望
达到的置信水平(或称置信度)
SSI
a
第1111页
对于估计值 t, 在给定其标准误差 t的情况下, 置信区间的公式可以表示为:(t-zt t+zt)
这里 zt是误差界限, z是对应于某一置
a
第33页
分层抽样分配样本的标准
1. 总的样本容量事先确定 2. 估计值要求达到的精度预先给定
SSI
a
第44页
影响调查样本容量的因素
调查估计值所希望达到的精度 调查估计值所能允许的误差。 估计量的抽样方差较小,估计值是精确的 估计值的精度越高,所需的样本容量就越大 影响精度的因素也同样影响着样本容量的大小 所研究指标在总体中的变异程度 总体的大小 样本设计和所使用的估计量 无回答率
SSI
a
第99页
置信区间
由于我们将在某一给定误差界限下,阐述样本容 量确定的过程,所以有必要复习一下置信区间的概念。
对于具有正态分布的估计量来说,95%的置信区 间意味着在同样的条件下,反复抽样100次所得的100 个样本中,有95个样本的估计值所确定的区间包含总 体真值,这个区间以样本的估计值为中心,半径为 1.96倍的标准误差。
SSI
a
第77页
抽样方差的几种计量方法
标准误差 误差界限 变异系数
抽样调查中样本容量的确定,也经常会使 用一种或多种这样的计量方法来对精度进行说 明。
SSI
a
第88页
非抽样误差
非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑 为确保调查结果的准确性,应该消除非抽样误差,至少应尽 可能使之最小化
样本量的确定
a
1
本讲主要内容
如何计算简单随机抽样的样本量确定 如何实现分层抽样中各层样本单位数的分配
SSI
a
第22页
样本容量的确定
样本量=费用+精度 (函数)
确定样本容量,需要处理好预定的精度与现有经 费,同时也要考虑资源和时间等限制条件,最终的样 本量确定是在上述因素之间的权衡关系。
SSI
SSI
a
第1144页
多大抽样方差是可以接受
是否需要对调查的子总体(或称作域)进行估计?
调查结果可能需要包括一些细分的数据 这些数据称为子总体估计值(或域估计值) 为使数据满足调查要求,应该确定合适的精度
与调查估计值有关的抽样方差有多大?
SSI
a
第1155页
对于不同的子总体,对精度的要求可能有所不同
❖ 事实上,P可以是P=0 到 P=1.0之间的任一数值。在确 定调查估计值所需的精度时,应该考虑当某个既定精 度达到时所得的最小估计值。如果最小的估计值是 P=5%,那么误差界限就应该小于5%。
SSI
a
第1188页
例如: 某公司决定,如果公司所在的地区中,至少有P=4%的人
群对某一种产品存在需求,那么该公司就决定生产这种产品。 因此,该公司的市场调研部准备对当地的居民一项调查,以便 估计他们在这种产品上的消费需求。
例如,在一次全国范围的抽样调查中,对国家层次的数据, 调查主办者可能需要±3%的误差界限;但对于省级层次的估计 值,±5%的误差界限可能就可以满足要求;
而对于省级以下层次的估计值,±10%的误差界限可能就 足够了。
SSI
a
第1166页
在这种情况下,通常对每个研究域都进行分层, 并单独计算各层的样本容量
误差界限
Байду номын сангаас
50
0.14
100
0.10
500
0.045
1000
0.032
SSI
a
第2200页
最佳的解决办法
不应为追求最小的误差界限而选择最大可能的样本 可以接受一个较大的误差界限,同时有效地利用现有资源
在此基础上,获得具有相对较高精度的估计结果 采用一个较小的样本而不是大样本而节省下来的费用,
可以用来修正其它影响调查结果精度的因素 例如减少无回答率(如回访拒答者、实施小型的试点调查、
培训访员,等等),这样做可能更有效率
SSI
a
第2211页
4.总体的变异程度
调查总体中,我们所研究的项目或指标,对于不 同的个人、住户或企业,得到的估计结果可能会有很 大的不同。虽然我们不能控制这种变异性,但它的大 小却影响到了给定精度水平下,研究项目所必需的样 本容量。
3.多大的抽样方差是可接受的
调查估计值能容忍多大的不确定性?。 常用的95%的置信度、±5%的误差界限对我们的
调查目标是否适宜 估计值是否需要更高(或更低)精度
如果调查结果将用于进行一项有重大意义或有较大风险的决策, 那么,估计值可能需要较高的精度;
如果我们只是简单地希望取得所研究总体某个特征的感性认识, 那么,稍低一点的精度就可以满足要求了
相关文档
最新文档