复习资料 第五章 抽样

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章抽样

第一节抽样的概念与程序

抽样方法是选择研究对象的方法或程序。

一、为什么要抽样

在社会研究中,研究者经常从一个规模很大的研究对象中,选出一部分作为研究对象,这个选取过程就是抽样。进行抽样的原因:考虑研究成本和研究可行性

二、抽样的有关术语

1、总体、样本和元素

每一个具体的调查对象被称为元素;全体研究对象被称为总体;样本则代表一组元素,即部分研究对象,不能独立于总体而存在。总体可以进一步划分为研究总体和目标总体。

研究总体是在理论上明确界定的元素的集合体;目标总体有时也称为调查总体,是实际抽取样本的元素集合体,它是排除了研究总体中一些特例后的总体。

样本中元素个数与总体中元素个数的比率,即样本规模与总体规模的比率称为抽样比率。如在总体为500人中抽取100人进行研究,则抽样比例为100/500=20%。

2、抽样框和抽样单元

研究者在实际抽样(特别是概论抽样)时,经常是先找到一份近似涵盖所有总体元素的名单,然后从中抽取部分元素,这份名单被称为抽样框。如要调查某大学本科毕业生的就业状况,则抽样框就是该大学全体毕业生的花名册。

抽样框中的总体元素又被称为抽样单元。有时抽样单元与分析单位是相同的,但在较大范围的抽样中,可能有多个层次的抽样单元。

3、参数值、统计值和抽样误差

总体的情况或特征是未知的,由参数值来描述,如某个城市中吸烟人口的平均年龄;样本的情况或特征则是已知的,由统计值来描述,如通过样本调查资料统计所得的被调查者的平均年龄。

参数值与统计值之间的差异就是抽样误差。差异越大,抽样误差就越大;差异越小,抽样误差就越小。

抽样误差是衡量样本代表性大小的标准,一般说来,它主要取决于总体的异质性程度和样本规模。

❶如果样本规模相同,总体异质性程度越高,抽样误差越大,样本代表性越低;

❷如果总体异质性程度相同,样本规模越大,抽样误差越小,样本代表性越高。

注意:抽样中因违反抽样规则产生的人为误差,如抄写、资料录入和计算中的人为失误,并不是抽样误差。

三、抽样的步骤

1、设计抽样方案

❶界定总体,对总体的范围和特征加以明确的说明,特别是要明确目标总体的范围和特征;❷介绍抽样框的具体内容,即给目标总体下一个操作化定义;❸确定样本所含个体数目,即样本规模的大小;❹根据不同的目标总体,选择合适的抽样方法。

2、抽取样本

抽取样本是指抽样人员按照抽样方案中选定的抽样方法,从抽样框中实际抽取总体元素,构成样本的过程。

3、评估样本

评估样本是指样本抽出后,对样本的代表性和各类误差情况的检验和评估,目的是为了防止由于样本偏差过大而导致对总体推断的失败。评估样本的方法是先找出一些能够反映总体特征的资料与同类指标的样本统计值进行比较。

第二节非概率抽样

一、方便抽样(又叫偶遇抽样)

方便抽样又称偶遇抽样,是指研究者使用对自己最为便利的方法来选取样本。这种方法很容易产生系统误差,样本代表性很差。因此,在使用时要特别小心,总体的情况越复杂,方便抽样的效果就越差。

举例说明:电视台、电台和报纸记者的“街头拦人”调查,采用的就是方便抽样。为了调查某市的交通情况,研究者到离他们最近的公共汽车站,把当时正在那里等车的人选作调查

对象。其他类似的偶遇抽样还有:在街口拦住过往行人进行调查;在图书馆阅览室对当时正在阅读的读者进行调查;在商店门口、展览大厅、电影院等公众场所向进出往来的顾客、观众进行的调查;报社要求读者剪下报纸刊登的问卷,填写完后寄回去;老师以他所教的班级的学生作为调查样本的调查等等。

二、配额抽样

配额抽样,是根据某些参数值,确定不同总体类别中的样本配额比例,然后按比例在各类别中进行方便抽样。

如研究者想用配额抽样的方法抽取一个40人的样本,首先决定用性别和年龄作为决定样本配额的参数值,通过资料发现,总体中男女各占50%,30岁以下、30—60岁之间和60岁以上的比例为25%、50%和25%。建立样本配额矩阵表格

配额抽样的逻辑是通过样本配额,使样本结构尽可能与总体结构保持一致,对总体进行克隆。有两点不足:

1、为了不偏离总体,配额矩阵中的数字必须十分准确,要做到这一点,就必须掌握总体的最新资料,但这并不容易做到。

举例如下:1936年美国的盖洛普使用配额抽样的方法成功地预测了总统当选人,而同样的方法却也造成了他在1948年的错误预测。就像概率抽样一样,配额抽样所强调的也是样本的代表性,虽说二者所达到目的的方法不一样。

2、尽管配额方法是一种改进,但最后抽样仍由调查员根据方便原则执行,他们从某些特定的矩阵格子中选择样本时,有很大的随意性。在这种情况下,调查员可能为了图方便而去找那些比较好调查的人。

三、判断抽样(又叫立意抽样)

判断抽样,又称立意抽样,是指研究者根据其研究的目的或专家的判断来选取样本。

在这种抽样中,样本能否满足研究目的的要求,是否能反映总体情况,很大程度上依赖于研究者的主观判断,对研究者个人的研究素质有较高的要求。

判断抽样经常被用于以下三种研究场景:

1、研究者用判断抽样来选择特别能提供信息的独特个案;

2、研究者用判断抽样来选取很难以接近的特殊人群;

3、研究者用判断抽样来选取某种特殊个案类型,以便进行深入探究。

四、雪球抽样(又称网络抽样)

雪球抽样又称网络抽样,是一种根据已有研究对象的介绍,不断辨识和找出其他研究对象的累积抽样方法。雪球抽样特别适合用来对成员难以找到的总体进行抽样;也可以用雪球抽样对具有一定网络联系的总体进行抽样。雪球抽样理想的结果是“雪球”滚到了大于所需样本规模的人群,这时可在某个时点中止“雪球”的滚动。

如对吸毒人群进行研究,一般先找到几个吸毒者,然后通过他们的介绍找到新的吸毒者。

第三节概率抽样

概率抽样是实现由样本推断总体的最佳方法,概率抽样是按照随机原则进行的抽样,因此又常被称为随机抽样。它是以随机原则为前提,因此不仅能使研究者在选取要素时避免各种形式的系统误差,还能估计出抽样误差的大小。

一、简单随机抽样(纯随机抽样)

简单随机抽样,也称纯随机抽样,是指研究者严格按照随机原则来抽取样本,排除任何事先设定的模式,每一个对象的抽取都是相互独立的。

随机原则意味着选取对象过程中,一方面要排除任何事先设定的模式使每一个对象被选中的概率都相等;另一方面,对象之间相互独立,任何一个对象是否入选样本,与其他对象无关,每一个对象的抽取都是相互独立的,是一种随机事件。

采用随机抽样的原因:首先,排除了研究者对样本的主观决定,可以避免研究者自觉或不自觉的偏见。其次,随机抽样时以概率理论为基础的,因此,可以计算参数值和抽样误差。概率抽样和等概率抽样不一样:概率抽样指总体中每个元素被抽中的概率可以相等也可以不等;随机抽样是一种等概率抽样。

操作方法:1、直接抽选法:即先建立抽样框,然后再从抽样框中选取元素构成样本。根据

相关文档
最新文档