第四章 抽样
合集下载
第4章__抽样调查

4.1.3抽样误差的确定
❖1)抽样误差的概念
❖2)影响抽样平均误差的因素
1、全及总体标志变异程度 2、样本容量 3、抽样组织方式 4、抽样方法
❖3)降低调查误差的途径
1、提高样本的代表性
2、注重样本量的控制
3、提高抽样设计的效率 4、重视抽样方案的审评
5、努力降低调查员的误差 6、努力调查被调查者的误差
❖ (4)如果这一地区街对面从第一号开始都没有住户,在第一号对面的街区转 一圈,并遵循右手法则。(即按顺时针方向在街区转一圈。)试着沿路线每 隔两户访问一户。
❖ (5)在起始门牌号对面邻近的街区绕过一圈后,如果你没有完成所需的访问, 就按顺时针方向到下一个街区访问。
❖ (6)如果第三个街区的住户数不够完成你的任务,就再做几个街区直到要求 的户数完成为止;这些区要按顺时针方向绕原有的街区来找。
❖5)简单随机抽样方式的优缺点
随机抽样方式的优点
方法简单直观,当总体名单完整时,可直接从中随机抽取样本。由于 抽取概率相同,计算抽样误差及对总体指标加以推断比较方便。
随机抽样方式的缺点
尽管简单随机抽样在理论上是最符合随机原则的,但是在实际应用中 有一定的局限性。第一,采用简单随机抽样,一般需对总体各单位加以 编码,而实际市场调查活动中所需调查总体往往是十分庞大的,单位非 常多,逐一编码几乎是不可能的;第二,对于某些事物无法使用简单随 机抽样,如对连续不断产生的大量产品进行质量检验,就不能对全部产 品进行编号抽样;第三,当总体的标志变异程度较大时,简单随机抽样 的代表性就不如经过分组后再抽样的代表性高;第四,由于抽出样本单 位较为分散,所以调查人力、物力、费用消耗较大。
2)抽样调查的特征
❖(1)抽取样本的客观性 ❖(2)抽样调查可以比较准确地推断总体
第四章 抽样与抽样估计

(一)样本统计量的极限分布 1、如果总体服从正态分布,且均值和方差均为已知,即
Y ~ N (, 2 )
则可以证明不论样本量大小如何,样本均值都围绕总体 均值而服从正态分布,并且其抽样分布的方差等于总体方差 的n分之一,即 y ~ N (, 2 / n)
2、对于非正态总体,若均值μ 和σ 2有限,则根据中心极限 定理,当样本量n充分大时,样本均值仍然围绕着总体均值 而近似地服从正态分布,即
3、缺点: (1)若群内个单元有趋同性,效率将会降低; (2)通常无法预先知道总样本量,因为不知道群内有 多少单元; (3)方差估计比简单随机抽样更为复杂。
(四)分层抽样
1、定义:在抽样之前将总体分为同质的、互不重叠 的若干子总体,也称为层。然后在每一个层独立地随机 抽取样本。 分层抽样示意图:
2、优点:
抽取样本
总体 样本
推断总体
抽样调查中的总体是有限的。在抽样以前,必须根
据实际情况把总体划分成若干个互不重叠并且能组合成 总体的部分,每个部分称为一个抽样单元,不论总体是 否有限,总体中的抽样单元数一定是有限的,而且是已 知的,因此说抽样调查的总体总是有限的。 抽样调查中影响样本代表性的因素有以下几个方面: (1)总体标志值分布的离散程度。 (2)抽样单元数的多少(或称样本量的大小)。 (3)抽样方法。
通常将反映总体数量特征的综合指标称为总体参
数。常见的总体参数主要有:总体总和;总体均值;总
体比率;总体比例。 一般将反映样本数量特征的综合指标称之为统计
量。统计量是n元样本的一个实值函数,是一个随机变
量,统计量的一个具体取值即为统计值。主要的样本统 计量有:样本总和;样本均值;样本比率;样本比例。
第四章 抽样

第四章 抽 样
主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质
主讲人: 张建鹏 要内容
一、抽样的意义与作用 二、概率抽样的原理与程序 三、概率抽样方法 四、非概率抽样方法 五、样本规模与抽样误差
2
一、抽样的意义与作用
1. 相关概念 (1). 总体(population):构成它的所有元素的集合 N 表示。元素则是构成总体的基本的单元。 如:海医学生新闻获得方式调查 某市居民家庭生活状况 (2). 样本(sample):从总体中按一定方式抽取的一部 分元素的集合。用n表示 如:从海医1万名学生中,按一定方式抽取300人进行 调查,这300人构成该总体的一个样本。
28
分层(最佳)抽样法
定义:又称非比例抽样法,根据各层样本标准差 的大小确定各层的样本数目的方法。 计算公式为:
ni = n * ( N i Si / ∑ N i Si )
(1)
式中:ni ----- 各类型应抽选的样本单位数 n ----- 样本单位数 Ni ----- 各类型的调查单位数 Si ----- 各类型调查单位数的样本标准差
14
抽样设计的五个步骤 1)定义目标总体 (如上述案例中正在上学的 年龄在8-17岁的年轻人) 2)制定抽样框 (例如上述案例中的所有县及 县内的城市和城镇) 3)选择一种抽样技术 (如上述案例中的三段 分层概率抽样) 4)实际抽取样本 (样本容量,1000名;执行 抽样过程和对调查员指令) 5)评估样本质量 (如检测样本平均年龄是否 与全国普查数据一致或接近)
33
整群抽样与分层抽样的比较
特征 样本来源 抽样目的 划分原则 整群抽样 一个或几个 不提高成本而提 高抽样效率 分层抽样 所有层 不提高成本而提 高精度
群中的个体异质, 层中个体同质, 群间同质 层间异质
(04)第4章+抽样与抽样分布

4-6
统计学
STATISTICS
例题分析
♦ 假定我们刚刚已取了飞机制造所用的铆钉的25个 假定我们刚刚已取了飞机制造所用的铆钉的25个
一组的样本。检测铆钉的抗剪强度,破坏每个铆 钉所需的力是响应变量。对这组样本,可以求得 各种描述性的测量(均值、方差等)。 ♦ 然而,我们的感兴趣的是总体,并不是样本自身。 被测试的铆钉在测试时已被破坏,不能再用在飞 机的制造上,所以我们肯定不能测试所有的铆钉。 我们必须从这组样本或几组这样的样本来决定总 体的某些特性。 ♦ 因此,我们必须设法推断信息,也即基于样本的 观测结果作出总体的推断
(例题分析) 例题分析)
计算出各样本的均值,如下表。 计算出各样本的均值,如下表。并给出样本均 值的抽样分布
4 - 32
样本均值的抽样分布
统计学
STATISTICS
(例题分析) 例题分析)
【例】设一个总体,含有4个元素(个体) ,即总体单位 设一个总体,含有4个元素(个体) 数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总 个个体分别为x 体的均值、 体的均值、方差及分布如下 总体分布
4 - 17
统计学
STATISTICS
分层抽样
分层抽样
统计学
STATISTICS
(stratified sampling) sampling)
♦ 分层抽样:在抽样之前先将总体的单位按 分层抽样:
某种特征或某种规则划分为若干层(类), 然后从不同的层中独立、随机地抽取一定 数量的单位组成一个样本,也称分类抽样 数量的单位组成一个样本,也称分类抽样 sampling) (stratified sampling) ♦ 在分层或分类时,应使层内各单位的差异 尽可能小,而使层与层之间的差异尽可能 大
[高等教育]现代社会调查 第四章 抽样
![[高等教育]现代社会调查 第四章 抽样](https://img.taocdn.com/s3/m/659306be6bec0975f465e2f8.png)
27
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
第四章 抽样技术

• (五)多阶段抽样
– 含义:multistage sampling-----即先抽大的调 查单元,在大单元中抽小单元,再在小单元 中抽更小的单元。如:我国的城市职工家计 调查,采用三阶段抽样,先城市-基层单位调查户。
第四章 抽样技术
– 应用:在复杂、大规模的市场调查中。
• (六)抽样技术的选用原则
• (四)常用术语
– 1.总体(population)与样本(sample) – 2.总体指标和样本指标
• 总体指标-------反映总体数量特征的指标,有总 体平均数µ,总体比例P, 总体方差 σ 2
第四章 抽样技术
– 样本指标------又称样本估计量或统计量,用 以估计和推断相应总体指标的综合指标,有 样本平均数 x ,样本比例p ,样本方差S2。
第四章 抽样技术
• 成数------分总体成数与样本成数 • 含义------总体中具有某种特征的单位占全部单 位的比例,称总体成数(总体比例) • 如:产品的合格率,市场占有率等。 • 样本成数的抽样分布
– 当从总体中抽出一个容量为n的样本时,样本中具有 某种特征的单位数x服从二项分布,即有x~B(n, π),且 有E(x)=n π V(x)=n π(1- π). – 因而样本比例p=x/n也服从二项分布,且有: – E(p)=E(x/n)= π – V(p)=V(x/n)=1/n π(1- π)
第四章 抽样技术
第四章 抽样技术
第四章 抽样技术
本章要点
• 1.抽样调查的含义、特点与程序; • 2.随机抽样技术的类型及其各自的特点、 方法; • 3.非随机抽样技术的类型及其各自的特 点、方法; • 4.抽样误差的含义及其计算方法 。
第四章 抽样技术
第四篇抽样和分布1(药学)PPT课件

该法要求各层间差异尽可能大,才能得到有较 好代表性的样本,并便于各层间分析比较。
24
4、整群抽样 先将总体分成若干互不重叠部分(称为群),再 从各群中随机抽取某群或几群作为样本。 例:调查某年级学生上网情况
可把每班作为一群,从中随机抽取一班或几班作 为样本。
该法适用于大规模调查,易于组织,节省人 力物力,但误差较大,适于群体差异较小的调 查对象。
8
实例 研究某地区12岁儿童生长发育情 况,总体和个体应为什么? 显然,总体为该地区的全体儿童
个体为每一个儿童。
当然,衡量儿童生长发育情况要通过诸如身高、 体重等数量指标进行,所以对总体的研究实际上 是对该地区的全体儿童的这些指标值概率分布进 行研究。
9
根据研究指标的多少,总体分为 一维总体-研究一项描述指标,常用随机变量X表示; 多维总体-研究多项描述指标,常用随机向量表示,
14
一般地,对有限总体,应采用有放回抽样,对 无限总体(或数量较多),可采用无放回抽样 (近似看作有放回),否则违背独立性。
简单随机抽样具体实施的方法: 抽签法
随机数法
15
三、统计量(Statistic )
样本是对总体的代表和反映,抽样的目的是利用样本值对 总体进行统计推断。
而对总体进行统计推断,常根据需要的不同,利用样本构 造一些包含所需要的多种信息的量,就是关于样本 X1 ,X2 ,…,Xn的一些函数,这些函数统称为统计量。
3
例如,在几何学中要证明“等腰三角形底角相等”, 只须从“等腰”这个前提出发,运用几何公理,一步一 步推出这个结论.这是演绎推理。
而一个习惯于统计思想的人,可能这样推理: 做很多大小形状不一的等腰三角形,实地测量 其底角,看差距如何,根据所得资料看看可否作 出“底角相等”的结论. 这样做就是归纳式的方法.
24
4、整群抽样 先将总体分成若干互不重叠部分(称为群),再 从各群中随机抽取某群或几群作为样本。 例:调查某年级学生上网情况
可把每班作为一群,从中随机抽取一班或几班作 为样本。
该法适用于大规模调查,易于组织,节省人 力物力,但误差较大,适于群体差异较小的调 查对象。
8
实例 研究某地区12岁儿童生长发育情 况,总体和个体应为什么? 显然,总体为该地区的全体儿童
个体为每一个儿童。
当然,衡量儿童生长发育情况要通过诸如身高、 体重等数量指标进行,所以对总体的研究实际上 是对该地区的全体儿童的这些指标值概率分布进 行研究。
9
根据研究指标的多少,总体分为 一维总体-研究一项描述指标,常用随机变量X表示; 多维总体-研究多项描述指标,常用随机向量表示,
14
一般地,对有限总体,应采用有放回抽样,对 无限总体(或数量较多),可采用无放回抽样 (近似看作有放回),否则违背独立性。
简单随机抽样具体实施的方法: 抽签法
随机数法
15
三、统计量(Statistic )
样本是对总体的代表和反映,抽样的目的是利用样本值对 总体进行统计推断。
而对总体进行统计推断,常根据需要的不同,利用样本构 造一些包含所需要的多种信息的量,就是关于样本 X1 ,X2 ,…,Xn的一些函数,这些函数统称为统计量。
3
例如,在几何学中要证明“等腰三角形底角相等”, 只须从“等腰”这个前提出发,运用几何公理,一步一 步推出这个结论.这是演绎推理。
而一个习惯于统计思想的人,可能这样推理: 做很多大小形状不一的等腰三角形,实地测量 其底角,看差距如何,根据所得资料看看可否作 出“底角相等”的结论. 这样做就是归纳式的方法.
第四章 抽样

抽样的类型
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
(1)概率抽样:简单随机抽样、系统抽样、 分层抽样、整群抽样、多段抽样、PPS抽样、 户内抽样 (2)非概率抽样:偶遇抽样、判断抽样、 定额抽样、雪球抽样
二、概率抽样的原理与程序
(一)概率抽样的基本原理 1、总体的同质性与异质性 同质性:如果某个总体中的每一个成员在所有方 面都相同,那么,我们就说这个总体具有完全的 同质性。 否则,就存在不同程度的异质性。 同质性总体不需要抽样。 社会各种总体的异质性决定了严格的概率抽样的 必要性。
(二)系统抽样
3、系统抽样优缺点: <1>优点: ①易于实施,工作量少。 ②样本在总体中分布更为均匀,抽样误差 小于或至多等于简单随机抽样。
(二)系统抽样
<2>系统抽样缺点: ①系统抽样是以总体的随机排列为前提, 如果总体的排列出现有规律分布时,会使 系统抽样产生极大误差。 ②当总体内个体类别之间的数目悬殊过大 时,样本的代表性可能较差。 <3>适用范围:系统抽样最适用于同质性较 高的总体。
人们通常采用下列几组数字
有90%的样本统计值落在u〒1.65SE(样本 平均数的标准差)之间; 有95%的样本统计值落在u〒1.96SE之间; 有98%的样本统计值落在u〒2.33SE之间; 有99%的样本统计值落在u〒2.58SE之间。 其中,百分数表示置信水平,u〒1.65SE等 表示置信区间。
随机数表抽样举例
3、简单随机抽样方法
①当总体元素较少时:常用的办法类似于 抽签,即把总体中每一个单位都编号,将 这些号码写在一张张小纸条上,然后放入 一容器如纸盒、口袋中,搅拌均匀后,从 中任意抽取,直到抽够预定的样本数目。 这样,由抽中的号码所代表的元素组成就 是一个简单随机样本。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 3.设计抽样方案 • 4.制定抽样框
– 制定抽样框就是依据已经明确界定的总体范围,收集总体中全部抽样单位 的名单,并统一编号。
• 5.实际抽取样本 • 6.样本评估
– 样本评估就是对样本的质量和代表性进行检验,其目的是防止因样本的偏 差过大而导致的失误。
– 实际抽取样本就是在上述几个步骤的基础上,严格按照所选定的抽样方法, 从抽样框中抽取一个个的抽样单位,构成样本。
运用:
• 从侨光分校的7000位学生中,抽取100位学 生进行调查查,以研究学生对学校教学条 件的满意度。之前所做的普查表现出的对 学校教学条件的平均满意度为85%,现通 过抽查统计后的满意度为80%。 • 请说出本次抽查中的总体、样本、抽样元 素、抽样单位、抽样框、参数值、统计值、 抽样误差。
二、抽样的作用
• 分类抽样有着突出的优点: 第一,分类抽样能够克服简单随机抽样的缺 点,适用于总体内个体数目较多,结构较复杂, 内部差异较大的情况。 第二,精确度较高。 第三,便于对不同层面的问题进行探索。 第四,便于分工,使工作效率提高。 分类抽样的缺点是,如何分类通常由人们主 观判定,因此要求调查者具备较高的素质与能力, 并且必须事先对总体各单位的情况有较多的了解, 而它们在实际工作中有时难以完全实现,这就会 影响分类的科学性和精确性。
三、抽样的类型
• 概率抽样 • 非概率抽样
– 根据抽取对象的具体方式,人们把抽样分为许多不同 的类型。总的来说,各种抽样都可以归为概率抽样与 非概率抽样两大类。这是两种有着本质区别的抽样类 型。概率抽样是依据概率论的基本原理,按照随机原 则进行的抽样,因而它能够避免抽样过程中的人为误 差,保证样本的代表性;而非概率抽样则主要是依据 研究者的主观意愿、判断或是否方便等因素来抽取对 象,它不考虑抽样中的等概率原则,因而往往产生较 大的误差,难以保证样本的代表性。 概率抽样与非概率抽样又各自包括了许多具体类 型。分别适用于不同调查对象。联系实际认识概率抽 样的不同类型及其适用性是掌握抽样方法的关键。
第四章 抽 样
本章教学目的
• 本章提出了抽样的基本概念和基本术语, 阐释了抽样在社会调查研究中的作用,介 绍了不同种类的抽样方法,特别说明了每 一种方法的适用范围和操作程序,并对它 们做了简要评价。同时,为了更好地应用 抽样方法,还简要介绍了样本规模和抽样 误差问题。其中最重要的就是要联系实际 认识和掌握各种抽样方法。
• 多阶段抽样的不足之处是抽样误差较大。 由于每次抽样都必然产生误差,所以抽样 阶段越多抽样误差就越大。因此,为了降 低抽样误差的程度,必须避免不必要的分 段。
(二)非概率抽样
•
非概率抽样又称为不等概率抽样、非随机抽 样或主观抽样,就是调查者根据自己的方便或主 观判断抽取样本的方法。
– 它不是严格按随机抽样原则来抽取样本,所以失去了 大数定律的存在基础,也就无法确定抽样误差,无法 正确地说明样本的统计值在多大程度上适合于总体。 虽然根据样本调查的结果也可在一定程度上说明总体 的性质、特征,但不能从数量上推断总体。 非随机抽样的具体方法很多,其中常用的有以下 几种:
在社会调查研究中,抽样主要解决的是调查对象的 选取问题,即如何从总体中选出一部分对象作为 总体的代表的问题。关于抽样的作用,有两个相 关的问题需要特别明确: 第一,抽样和抽样调查不能混为一谈。抽样 只是抽样调查的前提和一部分,只解决抽样调查 过程中的选取调查对象这一个问题,抽样调查的 其它所有问题都是靠另外的方法来解决的。 第二,抽样只是抽取样本的方法,而不是调 查方法或者说资料收集方法。
(二)抽样的基本术语
• 1.基本术语 在抽样中,有一些常用的基本术语: (1)总体。它是构成事物的所有元素、也就是最基本 单位的集合。 (2)样本。它是从总体中按照一定方式抽取出的一部 分元素的集合。 (3)抽样元素。它指的是构成总体的每一个最基本单 位,也称 “抽样分子”或“个体”。 (4)抽样单位。它是一次直接的抽样所使用的基本单 位。抽样单位与抽样元素有时是同一的,有时又是不同的。 (5)抽样框。它又称作抽样范围,指的是一次直接抽 样时总体中所有抽样单位的名单。 (6)参数值。它也称为总体值,是关于总体中某一变 量的综合描述,或者总体中所有元素的某种特征的综合数量 表现。在统计中最常见的参数值是某一变量的平均值。 (7)统计值。它也称为样本值,是关于样本中某一变 量的综合描述,或者说是样本中所有元素的某种特征的综合 数量表现。 (8)抽样误差。它是用样本统计值去估计总体参数值 时所出现的误差
• 简单随机抽样没有人为因素的干扰,简单易行, 是概率抽样的理想类型。但是它也有很大局限性。 第一,这种抽样方法,在总体同质性较高时, 用来比较准确有效,但在总体异质性较高时,则 不一定效果好。这是因为当构成总体的个体差异 较大时,用简单随机抽样方法抽出的样本由于在 总体中的分布不一定均匀,所以很可能误差较大, 不能很好地说明总体的性质和特征。 第二,当总体所含个体数目太多时,采用这 种抽样方式不仅费时、费力、费钱,而且很难操 作
1.简单随机抽样
• 简单随机抽样又称纯随机抽样,是指 在特定总体的所有单位中直接抽取n个组成 样本。它是一种等概率抽样和元素抽样方 法,最直观地体现了抽样的基本原理。简 单随机抽样是最基本的概率抽样,其它概 率抽样都以它为基础,可以说是由它派生 而来的。
• 简单随机抽样分为重复抽样和不重复抽样 两类。 • 常用的简单随机抽样方法有直接抽样法、 抽签法和随机数表法。 其中直接抽样法、抽签法适用于总体 规模稍小的抽样;随机数表法是用随机数 表来抽样的方法,适用于总体规模稍大的 抽样。 。
• 同简单随机抽样相比,系统抽样有明显的优点。 第一,当总体规模较大时,系统抽样比简单 随机抽样中的随机数表法易于实施,工作量较少。 它不需要反复使用随机数字表抽取个体,而只需 按照间隔等距抽取即可。 第二,系统抽样的样本不是任意抽取,而是 按照间隔等距抽取,所以在总体中的分布更均匀, 抽样误差一般也要小于简单随机抽样,也就是说 精确度更高,代表性更强。 系统抽样的局限性与简单随机抽样一样,也 是仅适用于同质性较高的总体。当总体内不同类 别个体的数量相差过于悬殊时,采用此法所抽出 的样本代表性可能较差。另外,总体单位的排列 不能呈有规律分布的状态,否则会使系统抽样产 生很大误差,降低样本的代表性。
三、分类抽样
•
所谓分类抽样也叫类型抽样或分层抽样,就 是先将总体的所有单位依照一种或几种特征分为 若干个子总体,每一个子总体即为一类,然后从 每一类中按简单随机抽样或系统随机抽样的办法 抽取一个子样本,称为分类样本,再把它们集合 起来即为总体样本。 按照确定分层样本数量的不同方式,分类抽 样分为比例分类抽样和非比例分类抽样两种。比 例分类抽样是指分类样本在总体样本中所占比例 与该类所有单位在总体中所占比例相同;非比例 分类抽样则比例不同。
五.多阶段抽样
• 多阶段抽样又称多级抽样或分段抽样,就是把 从总体中抽取样本的过程分成两个或多个阶段进 行的抽样方法。它是在总体内个体单位数量较大, 而彼此间的差异不太大时,先将总体各单位按一 定标志分成若干群体,作为抽样的第1阶段单位, 并依照随机原则,从中抽出若干群体作为第1阶段 样本;然后将第1阶段样本又分成若干小群体,作 为抽样的第2阶段单位,从中抽出若干群体作为第 2阶段样本,依此类推,可以有第3阶段、第4阶 段。。。直到满足需要为止。最末阶段抽出的样 本单位的集合,就是最终形成的总体样本。
二、系统抽样
•
系统抽样也称等距抽样或机械抽样,是按一 定的间隔距离抽取样本的方法。其做法是先编制 抽样框,将总体的所有单位都按一定标志排列编 号;再用总体的单位数除以样本的单位数,求得 抽样间距;然后,在第一个抽样间距内随机抽出 第一个样本单位,作为抽样的起点;接着,按照 抽样间距依次抽取样本单位,直到抽足样本的单 位数为止。
四、整群抽样
• 整群抽样又称聚类抽样或集体抽样,是将总体按照某种标 准划分为一些群体,每一个群体为一个抽样单位,再用随 机的方法从这些群体中抽取若干群体,并将所抽出群体中 的所有个体集合为总体的样本。
– 整群抽样分为等规模整群抽样和不等规模整群抽样,前者总体内 所有群体的规模都大致相同,后者总体内各群体规模则不等,在 社会调查研究中以后一种情况居多。这种差异如果较大,就会对 抽样成本预算与精确度测算以及实地调查工作造成不利影响,同 时还容易产生抽样偏差。为了解决这一问题,人们往往采用概率 与元素的规模大小成比例的抽样方法,简称PPS抽样 (Probability Proportionate to Size),就是根据每个群体所 包含的最终抽样单位(如家庭)的规模来决定各自抽取样本的比 例大小,规模大则抽取样本比例相对小,规模小则抽取样本比例 相对大,从而保证每个群体中的最终抽样单位都具有被抽中的同 等机会。
• 整群抽样与分类抽样都是将总体分为一些子群,但它和分 类抽样的区别在于不是按性质和特征而是按集群性划分抽 样对象。而且分类抽样中所有子群均要抽取一个样本,总 体样本是各分类样本的集合,即总体样本在各类中均有分 布。整群抽样则不然,它是抽取若干子群,并将这些子群 的全部个体集合为总体样本,因此,总体样本只分布在部 分子群之中。整群抽样对于个体单位之间界限不清的总体, 能够充分发挥其作用,却并不适用于总体单位界限分明的 情况。对于后者,一般还是以采用分类抽样等方法为宜。 另外,整群抽样对于所含子群总数较少的总体也不大 适用。
四、基本程序
• 1.界定总体
– 界定总体就是在具体抽样前,明确从中抽取样本的总体的范围与界限。
• 2.决定抽样方法
– 各种不同的抽样方法都有自身的特点和适用范围。因此,我们在具体实施 抽样之前,应依据调查研究的目的、界定的总体范围、要求确定样本的规 模和要求量化的精确程度来决定具体采用哪种抽样方法
• 二、抽样的类型
第二节 概率抽样
• 概率抽样又称随机抽样,是指总体中每一个成员都有 同等的进入样本的可能性,即每一个成员的被抽概率相等, 而且任何个体之间彼此被抽取的机会是独立的。概率抽样 以概率理论为依据,通过随机化的机械操作程序取得样本, 所以能避免抽样过程中的人为因素的影响,保证样本的客 观性。虽然随机样本一般不会与总体完全一致,但它所依 据的是大数定律,而且能计算和控制抽样误差,因此可以 正确地说明样本的统计值在多大程度上适合于总体,根据 样本调查的结果可以从数量上推断总体,也可在一定程度 上说明总体的性质、特征。正是因为如此,现实生活中绝 大多数抽样调查都采用概率抽样方法来抽取样本。 概率抽样依照具体抽样方法的不同,分为以下类型: