第七章抽样
第七章 抽样调查技术

13
一、简单随机抽样
(一)具体操作步骤:
第一,对总体的每个单位进行编号,总体单位数 为10,000的总体可编为00 001到期10,000号;
第二,在随机数码表(一般的数理统计书中都有 此表)中从任意一个编号数开始,向上、向下或 跳跃选取编号,在00 001和10,000之间选出200个 (样本单位数);
5
2015/12/22
(二)样本总体
概念: 也称抽样总体(sampled population)或者“子 样”、“样本”,是指从全及总体中抽取出来的 单位集合。 大样本与小样本: 样本总体通常是有限总体,它所包含的的总 体单位数目称为样本容量(通常用英文字母n来表 示)。一般来说,样本单位数达到或者超过30个 称为大样本,而在30个以下的称为小样本。
第二,等距抽样的效率取决于对总体进行 排列时所使用的标志值。在等距抽样中, 调研人员假设总体是有序的。
2015/12/22
23
三、分层抽样
(一)分层抽样的具体步骤 (二)分层抽样的方法 (三)分层指标的选择 (四)分层抽样的优缺点 (五)分层抽样适用的范围
2015/12/22
24
假如我们要进行北京市居民家用电器的拥 有状况调查,采用整群抽样方法,那么, 我们在北京市3,600个居民委员会中随机抽 取20个居委会,这20个居委会中的所有户都 成为我们的调查样本。
2015/12/22
32
(二)采用整群抽样的原因
原因一:当缺少基本单位的名单而难以 直接从总体中抽取所要调查的基本单位。 原因二:即使容易获得个体的抽样框, 但从费用上考虑,直接从个体抽样获得 的样本可能比较分散。 原因三:采用整群抽样是抽样调查本身 目的的需要。 原因四:如果某些总体的各个子总体之 间的差异不大。
统计学课件-第七章抽样调查

分层抽样特点
03
04
05
适用于总体内部差异较 大的情况,能够提高样 本的代表性。
可以根据各层的具体情 分层抽样能够降低抽样 况采用不同的抽样方法, 误差,提高估计的精度。 灵活性强。
分层标准选择与确定
选择分层标准的原则
各层之间具有明显的 区分度,避免出现重 复或遗漏。
与调查目的密切相关, 能够反映总体内部差 异的标志。
3
灵活性高,可以在不同阶段采用不同的抽样方法 和技术。
多阶段抽样优缺点分析
• 节约成本,减少调查人员和资源的需求。
多阶段抽样优缺点分析
抽样误差可能增加
01
由于多阶段抽样的复杂性,可能导致抽样误差的增加。
对抽样设计的要求较高
02
需要仔细设计和规划每个阶段的抽样方法和样本量分配,以确
保抽样的有效性和代表性。
抽样调查作用
抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料, 因而,也可起到全面调查的作用。
抽样方法与类型
抽样方法
简单随机抽样、系统抽样、分层抽样和整群抽样。
抽样类型
概率抽样和非概率抽样。
抽样误差与置信水平
抽样误差
是指由于随机抽样的偶然因素使样本各单位的结构不足以代 表总体各单位的结构,而引起抽样指标和全局指标的绝对离 差。
成本考虑
当总体差异较大时,简单随机抽样的 精度可能受到影响。
对于大规模调查,简单随机抽样可能 需要较高的成本。
实施难度
在某些情况下,获取完整的抽样框可 能较为困难。
03 分层抽样技术及应用
分层抽样原理及特点
01
02
分层抽样原理:将总体 按照某种特征或标志分 成若干层,然后从每一 层中随机抽取一定数量 的样本,最后将这些样 本合并起来构成总体的 样本。
统计学原理第七章 抽样调查

合
计
x A 2 x A ( d ) f ( d )f d σ f f
2
256 72 σ 50 11504 50 53.63 200 200
2
30
第三节 全及指标的推断
一、全及指标的点估计
22
不具有某一标志的单位数用N0表示。 ► 总体成数和标准差与样本成数和标准差的计 算方法相同。只是总体指标用大写字母表示, 样本指标用小写字母表示。例如: ► 具有某一标志的单位数占总体的比重:
N1 P N
总体成数
n1 p n
样本成数
不具有某一标志的单位数占总体的比重:
N0 Q 1 P N
13
► 2.
(二)中心极限定律 ► 1. 独立同分布中心极限定理:证明不论变量 总体服从何种分布,只要它的数学期望和方 差存在,从中抽取容量为n 的样本,则这个 样本的总和或平均数是个随机变量,当n 充 分大时,样本的总和或平均数趋于正态分布.
► 2.
德莫佛-拉普拉斯中心极限定理:证明属性 总体的样本成数和样本方差,在n足够大时, 同样趋于正态分布。
σ N n σ n μx ( ) μx (1 ) n N 1 n N
2 2
总体单位总数
样本单位总数
抽样比例
21
(一)抽样成数的抽样平均误差μp ► 属性总体的标志值是用文字表示的,且标志 只有两个取值,非此即彼,故将属性总体的 标志称为“交替标志”或“是非标志”。 ► 交替标志也可以计算平均数(即成数)和标 准差。为了计算交替标志的平均数和标准差 必须将交替变异的标志过渡到数量标志。 ► 交替标志仍以x表示,设:x =1表示单位具有 某一标志, x = 0表示单位不具有某一标志。 具有某一标志的单位数用N1表示;
第7章 抽样方法

分层抽样
所谓分层抽样,就是先依据某一种或某几种 特征,将总体划分成几个小的部分,每一个 部分称为一层或一类。然后,在每一个层次 中,采取简单抽样或系统抽样的方法抽取一 个子样本,最后,将这几个子样本合起来构 成总体的样本。
例如:某地共有居民20000户,按经济收入高低进 行分类,其中高收入的居民为4000户,占总体的 20%;中收入的居民为12000户,占总体的60%; 低收入的居民为4000户,占总体的20%。要从中抽 选200户进行购买力调查,则各类型应抽取的样本 单位数为: 经济收入高的样本单位数目为:200*20%=40户 经济收入中的样本单位数目为:200*60%=120户 经济收入底的样本单位数目为:200*20%=40户
较适用于同质性较高的总体
同学练习:
某学校有200位学生,采用等距离抽样方法抽 10个学生做样本。假设抽中的第一位学生排 在第三位,请问其他的样本单位的号码为?
整群抽样
整群抽样先要把调查总体划分为若干个群体, 然后用单纯随机抽样法,从中抽取某些群体 进行全面调查。 例如,要调查家庭副业发展情况,不是直接 抽取居民户.而是以村为单位,从中抽取若 干自然村,然后对中选村的全体居民户进行 调查。
• 样本平均数 x=∑xi / n • 样本标准差 S=√∑(xi- x)2 /n • 样本方差 S2=∑(xi - x)2 /n
6.总体与样本的相互关系 总体与样本的相互关系 样本是总体的缩影。 一次抽样时,一个样本单位必然同时又是一 个总体单位。但一个总体单位却不一定是一 个样本单位。 对一定的调查目的而言,总体是唯一的,样 本则不然。
第七章 抽样调查
胡林娜 温州职业技术学院
7.1抽样调查的基本概念
1.抽样调查的含义 抽样调查是按照一定的规则从总体中抽取 一部分个体单位作为样本,通过对样本的调 查研究所获得的信息资料,来推断总体的信 息资料的方法;因而抽样调查也称作抽样推 断。
第七章 抽样调查

数据计算出样本均值(平均耐用时间)
x=1055小时,样本成数(合格率) p=91% 依据样本统计量可以对总体参数进行估 计(估计方法将在第三节介绍)。
六、抽样推断的基本原理
样本指标 1、理论基础: 大数定律 中心极限定理 2、抽样估计的基本要求:
无偏性、有效性、一致性
总体指标
第二节 抽样组织方式
对无限总体不能采用全面调查。
另外,有些产品的质量检查具有破坏性,不可能进行全面调
查,只能采用抽样调查。 从理论上讲,有些现象虽然可以进行全面调查,但实际上没 有必要或很难办到,也要采用抽样调查
抽样调查可以用于工业生产过程的质量控制。
三、抽样推断的内容
(一)参数估计。特点是不知道总体的数量特征,
X
x
2
K
p
P p
K
2
抽样平均数平均误差的计算公式:
采用重复抽样:
x
n
此公式说明,抽样平均误差与总体标准差成正 比,与样本容量成反比。(当总体标准差未知 时,可用样本标准差代替)
例:假定抽样单位数增加 2 倍、0.5倍时, 抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
1 则: x 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍
则:
1 x 0.8165 1.5n 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165 倍。
例:某施工班组5个工人的日工资分别为:34、38、
例:
某厂生产一种新型灯泡共2000只,随机抽出400只作耐 用时间试验,测试结果平均使用寿命为4800小时,样 本标准差为300小时,求抽样推断的平均误差? 已知:
第七章 抽样推断

x x X x x
第七章 抽样推断
p p P p p
合适统计量 的估计值 合理的允 许误差 可接受的 置信度水平
t
概率度
5-40
• 区间估计的三要素 估计区间覆盖 总体参数真值 的概率 F(t)
• 区间估计的特点: • 不指出参数的确定数值,而是在一定的概 率保证程度下指出参数的可能范围。 • 估计的可靠程度可知,即为概率保证程度
X
区间估计的两个基本要求: 置信度 精确度
• 希望置信度尽可能大,精确度尽可能高。 • 但在样本容量n一定时,两者矛盾。
一般在给定的概率保证程度下,尽可能 提高估计的精度(通过降低标准误)。
第七章 抽样推断
抽样极限误差(精度) 与概率保证程度(可靠程度) 99.73%
95.45% 68.27%
3 x 2x x
抽样推断包括三方面的内容:
1、抽样。按照随机原则从总体中抽取部分调查 单位(样本)。
2、 构造统计量 。对样本资料进行加工计算, 获得既能反映样本特征又能用于推断总体的样本数 据。 3、推断。运用概率估计方法,以一定的可靠 性推断总体指标数值。
二、抽样推断的特点 1、按随机原则抽取样本单位 2、用部分推断总体 3、抽样推断的误差可以事先计算并加以控 制 4、运用概率估计方法
实际上就是对估计量可允许取的最高值或最 低值进行了限制
ˆ ˆ Biblioteka 例子• 要估计某乡粮食亩产,从8000亩粮食作物中,用不 重复抽样抽取400亩,求得平均亩产为450公斤。如 果确定抽样极限误差为5公斤,这就要求某乡粮食 亩产为450〒5公斤,即在445公斤到455公斤之间。
x
i 1 n
第7章抽样

随机抽样技术的优缺点
(1) 优点 ①随机抽样是从总体中按照随机原则抽取一部分单位进行的 调查。 ②随机抽样技术能够计算调查结果的可靠程度。 (2) 不足 ① 对所有调查样本都给予平等看待,难以体现重点。 ② 抽样范围比较广,所需时间长,参加调查的人员和费用多。 ③ 需要具有一定专业技术的专业人员进行抽样和资料分析。 一般调查人员难以胜任。 ④抽样框难以构建。 ⑤比其他概率抽样精确度低,标准差较大。 30
24
1.简单随机抽样 • 又称纯随机抽样,即对总体单位不进行任何分组 排列,仅按随机原则直接从总体中抽取样本,以 使总体中的每一个单位均有同等的被抽取的机会。
• 这是最基本,最简单的的机率抽样方法。它易于 理解,样本结果可以推断总体,大多数统计推论 方法都假定数据是由简单随机抽样法法获得的。
25
1.简单随机抽样 • 每个单位被选取的机会是相同的。就好像把各个 单位的名字写在大小相同的纸上,放到一个箱子 中,由我们抽取,每个个案都有被抽到的可能, 而且机会相同。如平日常见的摸彩或摇奖,在数 学上则会利用随机数表来抽取样本。
第七章
抽样
1
本章的学习目标 一、抽样的概念
二、抽样的基本过程
三、概率抽样
四、非概率抽样
五、样本量的确定
六、 PPS抽样简介
七、 KISH表的运用
2
一、抽样的概念
3
(一)什么是抽样?
• 抽样就在我们的日常生活中。抽血化验,尝试水 温,窥一斑而知全豹。
• 抽样,就是从研究总体中抽取一部分的过程。 • 抽样调查,就是从研究总体中抽取一部分代表加 以调查研究,然后用所得结果推论和说明总体的 特性。这也称为推论统计。
2.等距抽样
• 又称系统抽样或机械抽样。 • 具体做法: • 1)将总体的所有单位按一定顺序排列起来; • 2)计算抽样间隔R=N/n;
经济统计学第7章抽样调查

参数的假设检验是根据样本,对总体参数某种假设的正确性作出判断。 可以分别提出两种假设: 前一种不能轻易拒绝的假设为原假 设,后一种为备选假设。假设检验就是根据样本,检验 是否成立, 不成立就接受备选假设 。
一、基本思想: 小概率原则:认为在一次实验中 小概率事件几乎是不可能发生的,小概率事件的概率为显著性水平 。
一个总体的检验
Z 检验 (单尾和双尾)
t 检验 (单尾和双尾)
Z 检验 (单尾和双尾)
2检验 (单尾和双尾)
均值
一个总体
比例
方差
总体方差已知时的均值检验 (双尾 Z 检验)
均值的双尾 Z 检验 (2 已知)
假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 原假设为:H0: =0;备择假设为:H1: 0
单侧检验 (原假设与备择假设的确定) 例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上
除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为
H0: 1000 H1: < 1000
第二节
一个正态总体参数的假设检验
-10
100
20
25
-5
25
30
30
0
0
离差
40
35
5
25
50
40
10
100
10
25
-5
25
20
30
0
0
30
35
5
25
40
40
10
100
50
45
15
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章抽样一、抽样与抽样调查抽样:是一种选择调查对象的程序和方法。
抽样调查:就是从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特征。
优点:社会学中第一次采用抽样方法的调查是A.L.Bowleg于第一次世界大战前在英格兰和威尔士所做的五城镇调查。
二战后,随着计算机技术的发展抽样调查法得到迅速推广,目前已成为社会调查的主流。
与整体调查(普查)比,抽样调查具有下列优越性。
第一、调查费用低。
抽样调查由于调查的仅仅是整体的一部分,因此,所需费用较整体调查低。
例如,我国第三次人口普查,动用普查人员710万,正式调查期间还动员了1000万干部群众参加,耗资约4亿元。
第二、速度快。
时间往往是最重要的,特别是某些社会现象需要及时了解,随时掌握。
第三、范围广。
由于上述两个特点,抽样调查可广泛用于各个领域,各种课题。
第四、可获得内容丰富的资料。
普查通常只了解少量项目,无法进行深入分析。
例如人口普查,我国1953年的第一次人口普查,只有姓名与户主的关系、性别、年龄、民族、住址六个项目,1982年的第三次人口普查,调查项目也只增加到19个。
第五、准确性高。
整体调查往往需要大批访问员,而这些访问员,有许多是缺乏经验和专业训练的,这往往会降低调查质量。
4、注意事项:抽样调查的成功首先要求所选取的样本能够代表总体,所谓代表性就是说,所选取的样本从调查要研究的总体特征看,能再现总体的结构。
在社会研究中,任何个体之间都存在着差异,任何部分都无法完全代表总体,因此,无论采用什么样的选取部分的方法,无论做得多么仔细,没有也不可能抽出毫无偏差的代表总体的所有特点和关系的样本。
这也就是说,在用样本来概括总体时,总要有误差,它的大小可以反映出样本代表性的高低。
对于研究人员来说,重要的不是没有误差,而是能知道误差的大小和控制它的大小。
有两个因素可以减少抽样误差。
首先,大样本比小样本产生的误差小。
其次,从同质的总体中抽取样本比从异质总体中抽取样本所产生的抽样误差要小。
二、非概率抽样抽样方法一般分为两大类:非概率抽样,是根据研究任务的要求和对调查对象的分析,主观地、有意识地在研究对象的总体中进行选择。
概率抽样,是依据概率理论,按照随机的原则选择样本,完全不带调查者的主观色彩。
非概率抽样由于每个个体进入样本的概率是未知的,而且由于排除不了调查者的主观影响,因而无法说明样本是否重现了总体的结构,用这样的样本推论总体是极不可靠的。
1、偶遇抽样(方便抽样)指研究者在一定时间、一定环境里所能遇见到或接触到的人均选入样本的方法。
“街头拦人”法即为一例,电视台、电台和报社的记者常借这种方法迅速了解公众对某些刚刚发生的重大事件的反映。
偶遇抽样的优点是方便省力,但样本的代表性差,有很大的偶然性。
偶遇抽样非常容易产生系统误差,可能会产生无效的、非常不具代表性的样本,甚至比完全没有样本更糟。
这种样本可能颇具娱乐价值,但它可能得到扭曲的观点,并成为总体一个严重的错误代表。
2、主观抽样(判断抽样、立意抽样)主观抽样的“主观”有两种含义,一是主观判断的意思,即研究者依据主观判断抽取可以代表总体的个体作为样本。
这种样本的代表性取决于研究者对总体的了解程度和判断能力。
二是“有目的”地选择样本的意思。
如在问卷设计阶段,为检验问题设计是否得当,常有意地选择一些观点差异悬殊的人作为调查对象。
这种方法常用在探索性研究或实地研究中。
主观抽样常用在下列三种情况:第一,研究者使用它来选择特别能提供信息的独特个案。
例如要研究杂志的内容,以发掘文化主题,可选择某本流行的女性杂志做研究,因为该本杂志领导潮流。
第二,研究者使用它来选取很难接近、特殊总体中的成员。
例如,要研究娼妓,若要列出所有娼妓名单,使用随机抽样是不可能的,相反,使用主观信息比较可行,像娼妓招揽客人的地方、娼妓结合的社会团体,在红灯区工作的警察、其他娼妓等等。
第三,当研究者想要确认特殊个案类型,以便进行深入探究时可使用此方法。
3、滚雪球抽样是先从几个合适的调查对象开始,然后通过他们得到更多的调查对象,这样一步步扩大样本范围。
例如研究城市保姆问题。
4、空间抽样是针对一个变动的总体,如游行队伍、集会等进行抽样的方法,这种总体虽然总是变动的,但在空间上是有限的。
空间抽样最重要的是在同一时间对整个总体进行抽样。
5、配额抽样(定额抽样)是按照调查对象的某种属性和特征将总体中所有个体分成若干类或层,然后在各层中抽样。
样本中各类所占的比例与他们在总体中所占比例一样。
定额抽样是以代表总体为目的的,因此它必须对总体的性质有充分的了解,如不同性别、年龄、教育水平的人在总体中各占多大比例等。
然后按比例分配应抽定额。
不过一旦定额抽样者固定了要抽取的类别和每一个类别要抽取的个案数目后,便使用随意抽样了,因而这种抽样还是有很大的局限性。
例题:假设某高校有2000名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%、二年级、三年级、四年级学生各占30%,20%,10%。
现要用定额抽样方法依上述三个变数抽取一个规模为100人的样本。
依总体的构成和样本规模,我们可得到下列定额表表5—1 100人的定额样本分布表男生(60人)女生(40人)文科(30)理科(30)文科(20)文科(20)年级一二三四一二三四一二三四一二三四人数12 9 6 312 9 6 312 9 6 312 9 6 3三、概率抽样(一)有关概率抽样:1、概率抽样是按照随机原则选择样本,完全不带调查者的主观意志,使总体中每一个体都具有一个已知不为零的被选机会进入样本。
2、基本原则:如果总体中的每一个体被抽取为样本的概率相同,那么从这个总体抽取的样本,就具有对该总体的代表性。
3、优点:第一,更具代表性。
代表性是指当选出的样本的各种集合特征大体接近于总体的集合特征时,样本就具有代表性。
第二,概率理论使我们能够估计样本的精确度和代表性。
(二)抽样设计的类型:1、简单随机抽样(simple random sampling)是最基本的概率抽样,最直观地体现了抽样的基本原理,是其他抽样方法的基础。
简单随机抽样分为重复抽样和不重复抽样两类:在重复抽样中,已被选中的个体仍放回总体,因此,在同一样本中,某一个体就有可能不止一次地出现。
在不重复抽样中,被选样本的个体不再放回总体,因此,在同一样本中,每一个体只能出现一次。
社会调查中的简单随即抽样通常是使用随机数表进行。
随机数表一般是由范围在00001~99999内的5位数的随机数,按行和列排序构成的。
下面举一例说明如何使用随机数表进行抽样。
假设要从一个900人的总体中,用简单随机抽样方法抽取一个100人的样本。
ⅰ、将总体中的所有人编号:在本例中,每个人按001~900的顺序编号。
ⅱ、确定选出的随机数的位数。
本例中,由于总体人数为900,所以需要有3位数的随机数才能保证所有人都有被选中的机会。
ⅲ、决定从5位数组中选择哪几位数字。
要从5位数中产生3位数可以选择最左边的3位数、中间的3位数、最右边的3位数,任何方法都行,关键在于要先建立一个原则,然后从头到尾都依这个原则去做。
ⅳ、确定在表中选择数字的顺序。
我们可以随意确定在表格中选去数字的顺序:依纵列的方向往下选取或往上选取;也可以顺着每一行从左到右或从右到左;还可以顺着对角线方向。
同样,选择什么样的方法并不重要,重要的是选定一个方法之后,必须从头到尾都使用这种方法。
ⅴ、确定开始选择的5位数组的起点。
只需闭上眼睛,用铅笔随意在随机数表上戳一下以决定开始的第一个数字,或者可以在纸上随意写下某一行与某一列,然后从这个位置的数字开始。
ⅵ、处理大于总体规模或重复的随机数。
当选取随机数时碰到超过范围的数字,在本例中如918,跳过这个数字然后继续选下一个即可。
在选择过程中,如果碰巧选中了两个相同的随机数,如两次选中了288,则应跳过第2次选中的288。
ⅶ、用所选的随机数抽样,抽样框中编号与选出的随机数相同的那些人将组成样本。
简单随机抽样是概率抽样的理想类型,没有偏见,简单易行。
但当总体所含个体数目太多时,采用这种抽样方式不仅费时、费力,而且费用很高,而在总体异质性很高时,误差较大。
2、系统抽样(systematic sampling)(1)是简单随机抽样的一个变种。
是系统化地选择完整名单中每第K个要素组成样本。
如果名册包含10,000个要素,而你们需要1000个样本时,你们选择每第十个要素作为样本。
为了避免使用本方法时造成的人为偏差,必须以随机的方式选择第一个要素。
(2)系统抽样法中有两个常用术语:抽样间距和抽样比率。
抽样间距是指两个被选择要素间的标准距离,抽样比率则是被选择要素与所有总体要素的比率。
抽样间距= 总体大小( 样本大小抽样比率=样本大小(总体大小(3)在系统抽样中,等间距抽取是最常用的规则,故系统抽样经常被称为等距抽样。
常用的等距抽样方法包括直线等距抽样和循环等距抽样,二者的区别在于总体规模是否为样本规模的总数倍。
ⅰ)整数抽样间距:当总体N是样本数n的整数倍,即抽样间距k=N /n是整数,可使用直线等距抽样。
即在算出抽样间距后,先在1~k范围内抽取一个随机数r作为起点,然后每隔k个单位抽出一个单位,直到抽出n个单位。
抽中的号码分别为:r ,r+k,…,r+(n—1)kⅱ)非整数抽样间距当N不是n的整数倍,即抽样间距k不是整数时,可以采用以下两种方法进行抽样。
一是循环等距抽样方法,即先将N个总体单位首尾相接排成一个封闭圈,抽样间距k取最接近N /n的整数,再从1~N中随机抽取一个随机起点作为起始单位,然后每隔k抽取一个单位,直到抽满n个单位为止。
另一种方法是调整直线等距抽样,先将非整数的抽样间距k的小数点后移,使其成为整数[k],然后在10~[k]之间选定一个整数的随机起点[r];接下来再将[r]的小数点移回来,成为非整数的随机起点r。
由r开始每隔k个单位抽出一个单位,直到抽出n个单位。
抽中的号码分别为r ,r+k,…,r+(n—1)k,接下来再将这些号码的小数部分略去,便相应地得到入样单位的号码。
例如,N=2580,n=300,则k=8.6。
利用调整直线等距抽样,在10~86之间选定整数的随机起点[r]=27,将小数点移回,得到非整数的随机起点r=2.7,由此得到号码:2.7,11.3,19.9,28.5,…,将小数点后面的部分略去,就是选中的号码:2,11,19,28,…。
可以证明,调整后所有单位都具有相同的中选概率。
(4)使用系统抽样要注意一个问题:如果总体的排列出现有规律的分布时,就会使系统抽样产生很大误差,降低样本的代表性。
在一个有关二战士兵的经典研究中,研究人员从名册中每隔十个士兵抽出一个来进行研究。