抽样原则

抽取样本的原则

抽样检验是根据样本实际检验结果来推断总体特征一种统计检验方法，属于非全面检验的范畴。它是根据统计学原理，从若干个体组成的事物总体中，抽取部分个体并组成样本来进行检验和观察并用样本检验的结果来评估总体所具有的特征。

抽样检验也会遇到误差和偏误问题。通常抽样检验的误差有两种：一种是工作误差（也称登记误差或检验误差），一种是代表性误差（也称抽样误差）。但是，抽样检验可以通过抽样设计，通过计算并采用一系列科学的方法，把代表性误差控制在允许的范围之内；另外，由于检验个体数量少，代表性强，所需检验人员少，工作误差比全面检验要小。

抽样检验之所以能用样本来评估总体，主要是因为抽样检验本身具有其它非全面检验所不具备的特点，主要是：

(1)抽样检验的样本是按随机的原则抽取，在总体中每一个个体被抽取的机会是均等的。因此，能够保证被抽中的个体在总体中的均匀分布，不致出现倾向性误差。

(2)是以抽取的个体所组成的样本来代表总体。而不是用随意挑选的个别个体代表总体。因此，能够保证样本的代表性。

(3)所抽取的检验样本容量，是根据检验误差的需求并经过科学的分析所确定的。

(4)抽样检验的误差，是在检验前就可以根据检验样本数量和总体中各个体之间的差异进行计算，并控制在允许范围以内。因此，检验结果的准确程度较高。

基于以上特点，抽样检验被公认为是非全面检验方法中用来推算和代表总体的最科学的检验方法。1.抽样的一般程序

“确定抽样总体→确定取样范围→确定样本容量→抽取样本→计算样本特征并评估总体”，这是抽样的一般程序。

首先，根据本次评估的目的和任务，明确所要测量属性的范围，确定取样的对象，即抽样总体。

第二，明确总体内抽样的范围并在抽样总体内收集界定全部个体，建立抽样方案。

第三，根据不同抽样方案的差异程度及评估所要求的目的性，确定最经济的样本容量。

第四，采用科学的抽样方法及其组合，从总体中抽取样本并确定测量的对象。

第五，运用统计学原理对抽取的样本特征进行评估。

2.抽样方式

抽样的基本方式分为两大类：随机抽样和非随机抽样。

若总体中每个个体被抽取的机会是均等的，则称为随机抽样，随机抽样必须遵循两个原则，一是总体中的每个个体都有同等的被抽中的机会。二抽取应当是完全客观的，不能依据某个人的主观意志加以选择。抽样的人或单位彼此之间没有牵连，每个人或单位的选择都是独立的。

非随机抽样是根据主客观条件而主观选择样本的方式，又称判断抽样。这种方式虽然有省人、省时、省物、易实施的优点，但科学性较差，不能保证样本的代表性。

什么时候采用随机抽样，什么时候用非随机抽样，应当根据各种条件来决定，例如研究的性质、对误差容忍的程度、抽样误差与非抽样误差的相对大小、总体中的变差、以及统计上的可操作性的考虑等。尽管非随机抽样不能推断总体特征，不能计算抽样误差，但在实际检验中仍常被应用。一方面是操作的考虑，另一方面也是因为所检验内容不需投射总体。如概念测试、包装测试、名称测试以及广告测试等，这类研究中，主要的兴趣集中在样本给出各种不同应答的比例。随机抽样用于需要对总体特征给出很准确的估计的情况。例如要估计市场占有率、整个市场的销售量等都采取随机抽样。

2.1随机抽样

概率抽样包括简单随机抽样，分层抽样，等距抽样，整群抽样等。通常在实地检验中，经常把这几种抽样方法相互结合运用。

2.1.1简单随机抽样

简单随机抽样，也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等，完全随机地抽取检验单位。特点是：每个样本单位被抽中的概率相等，样本的每个单位完全独立，彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。简单随机抽样要求处于总体的个体之间差异程度较小。

2.1.2等距抽样（机械抽样或系统抽样）

机械抽样（等距抽样）。把总体中的所有个体按照一定的标志排列编号，然后以固定的顺序和间隔取样的方法，称为机械抽样。将评估对象总体单位N按照一定的标志进行排队编号，并将N划分成相等的几个单位，使K=N/n，然后随机抽取i，i＋K，i＋2K，……，i+（n-1）K共n个个体组成样本。

机械抽样比单纯随机抽样能够保证抽到的个体在总体中的分布均匀性，抽样的独立性较强。单纯随机抽样比机械抽样更能够保证总体中个体被抽到的机会的均等性，即抽样的随机性较强。单纯随机抽样和机械抽样二者也可以结合使用。机械抽样中样本容量的确定可按单纯随机抽样的公式进行计算。

机械抽样方法一般不适用于大容量的评估总体；当评估总体的个体类别间悬殊时，机械抽样抽取的样本常常缺乏代表性；机械抽样的间隔接近评估总体中个体类别分布的间隔时，常常形成周期性的偏差。这些都是教学评估测量中应用机械抽样需要注意的基本方面。

分层抽样。按与评估内容有关的因素指针等标志先将评估总体加以分组（分层），然后根据样本容量与总体的比率，从各层中进行单纯随机抽样或机械抽样的抽样方法，称为分层抽样。例如，对评估对象为N的总体中，拟取n个个体为样本，可根据一定的标准将N个个体分成优（N1个）、良（N2个）、中（N3个）、差（N4个）四层，然后从各部分（层）中用单纯随机抽样或机械抽样的方法，各抽取n/N,即从优，良，中，差等中分别抽取Ni=n/N（i=1，2，3，4）个个体，组成一个评估测量样本。

运用分层抽样抽取评估的测量样本时，要尽力缩小各层组内的差异，增大层组间的差异；同时层组的划分也不宜过细，以免层组内个体数目过少而无法抽样；再次划分层次的标准必须明确，以免混淆或遗露。

特点是：由于通过划类分层，增大了各类型中单位间的共同性，容易抽出具有代表性的检验样本。该方法适用于总体情况复杂，各单位之间差异较大，单位较多的情况。

2.1.3整群抽样

整群抽样就是从总体中成群成组地抽取检验单位，而不是一个一个地抽取检验样本。分层抽样划组层为类，其作用是尽量缩小总体，使总体的变异减少，而抽取的基本单位仍然是总体中的个体。整群抽样是将评估对象总体的各个个体划分成若干群。然后以群为单位从中随机抽取一些群而组成样本的方法，从中抽取若干个群，对抽中的群内的所有单元都进行检验。即整群抽样划组层为群，群的作用是扩大单位，抽取的单位不再是总体单位而是群。例如要测量某市某年级数学高考成绩，可以以学校为单位进行抽样。

整群抽样的主要缺点是样本分布的匀均性较差，误差也较其它抽样方法大。为了弥补这种缺陷，增强样本对总体的代表性，可以与分层抽样相结合，例如，先按一定的标准把全地区所有学校分成几部分，然后再根据本容量与总体中个体的比率，从各部分中抽取若干学校，组成整群样本。

特点是：检验单位比较集中，检验工作的组织和进行比较方便。但检验单位在总体中的分布不均匀，准确性要差些。因此，在群间差异性不大或者不适宜单个地抽选检验样本的情况下，可采用这种方式。

2.1.4阶段抽样

当评估所要测量的总体很大时，在实践中常采用阶段抽样。首先将评估总体分为A组，每组包含Bi个单位。从A组中随机抽取a组，再分别从抽中的a组的各组中随机抽取ni个单位，构成一个样本，这种抽样方法就是阶段抽样中的两阶段抽样，其中总体单位数N=B1＋B2＋B…+BA，各组的单位数Bi可以相等，也可以不相等；样本单位数n=n1＋n2＋…+na，各组抽取的样本单位数可以相等，也可以不等。多阶段抽样的原理与两阶段抽样的原理相同。在阶段抽样中，由于每一阶段的抽样都会产生误差，所以阶段越多，误差越大，经多阶段抽取的样本的代表性越差。因此运用阶段抽样时，要特别谨慎，尽量提高各阶段抽样的精确度，严格控制整群、分层、机构、单纯随机抽样的误差限度。防止误差传递造成阶段抽样的失败。

2.1.5目的抽样

目的抽样是根据特定的目的，有针对性的随机抽取样本。虽然从广义上说，目的抽样也是随机抽样的一部分，但它与一般的随机抽样却有所不同。它强调抽样的针对性与目的性，而不是泛泛地任意抽取样本。这种抽样方法在实行时，先是要根据一定的抽样目的与需要，挑选出符合抽样目的与需要的对象，然后再在这些已挑选出的对象中进行抽样。如检验一个学校优秀教师的情况，事先要先把那些符合优秀教师条件的人挑选出来，然后再从这些人中抽样。目的抽样由于是在一定的符合抽样目的的范围内进行，所以用目的抽样法抽出来的样本都具有一定的代表性，可以免去其它随机抽样的任意性与偶然性因素，便于集中精力，取得检验的实际效益。因此，目的抽样就成为抽样法搜集教学评估资料信息的一种行之有效的重要办法。

2.2非随机抽样

非概率抽样是不能计算抽样误差的，因为它是靠调研者个人的判断来进行的抽样。它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。

2.2.1偶遇抽样(方便抽样)

常见的未经许可的街头随访或拦截式访问、邮寄式检验、杂志内问卷检验等都属于偶遇抽样的方式。偶遇抽样是所有抽样技术中花费最小的（包括经费和时间）。抽样单元是可以接近的、容易测量的、并且是合作的。但尽管有许多优点，这种形式的抽样还是有严重的局限性。许多可能的选择偏差都会存在，如被检验者的自我选择、抽样的主观性偏差等。这种抽样不能代表总体和推断总体。因此，当我们在进行街头访问或邮寄检验时，一定要谨慎对待检验结果。

2.2.2判断抽样

判断抽样是基于调研者对总体的了解和经验，从总体中抽选"有代表性的""典型的"单位作为样本，例如从全体企业中抽选若干先进的、居中的、落后的企业作为样本，来考察全体企业的经营状况。如果判断准，这种方法有可能取得具有较好代表性的样本，但这种方法受主观因素影响较大。

2.2.3配额抽样

配额抽样是根据总体的结构特征来给检验员分派定额，以取得一个与总体结构特征大体相似的样本，例如根据人口的性别、年龄构成来给检验员规定不同性别、年龄的检验人数。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了，选择样本元素的自由度就很大。唯一的要求就是所选的元素要适合所控制的特性。这种抽样方法的目的是使样本对总体具有更好的代表性，但仍不一定能保证样本就是有代表性的。如果与问题相关联的某个特征未被考虑进配额，配额样本可能就不具有代表性，但在实施中包括太多的控制特征是十分困难的。另外，用这种方法进行选择时，往往存在检验员的选择偏好，因而也难以避免主观因素的影响。如果在严格控制检验员和检验过程的条件下，可使配额抽样获得与某些概率抽样非常接近的结果。在进行配额抽样时，要特别注意配额与检验结果之间的密切联系。

2.2.4雪球抽样

雪球抽样是先选择一组检验对象，通常是随机地选取的。访问这些检验对象之后，再请他们提供另外一些属于所研究的目标总体的检验对象，根据所提供的线索，选择此后的检验对象。这一过程会继续下去，形成一种滚雪球的效果。此抽样的主要目的是估计在总体中十分稀有的人物特征。由于后来被推荐的人可能类似于推荐他们的那些人，因此这种方式的检验也是非概率的

3.随机原则

抽样是统计数据质量的灵魂，样本抽选的好坏，直接关系到最终检验结果是否能反映总体的真实情况。

　在抽样检验中，随机原则是至关重要的。在检验工作中，我们事先并不知道总体的分布具有什么特征，这样在抽选样本的时候，如果不能坚持随机原则，可能会给检验结果带来偏差。

抽样检验的原则和方法抽样检验设计和实施要遵循两个基本原则，抽样必须随机化和样本大小适当。