系统抽样
系统抽样

一、知识概述1、系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.2、系统抽样的步骤:①采用随机的方式将总体中的个体编号.为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等.②为将整个的编号分段(即分成几个部分),要确定分段的间隔k.当(N为总体中的个体的个数,n为样本容量)是整数时,k=;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数能被n整除,这时k=.③在第一段用简单随机抽样确定起始的个体编号.④按照事先确定的规则抽取样本(通常是将加上间隔k,得到第2个编号+k,第3个编号+2k,这样继续下去,直到获取整个样本).说明:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的;③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3、系统抽样与简单随机抽样的区别与联系系统抽样与简单随机抽样相比,有如下区别:(1)系统抽样比简单随机抽样更容易实施,可节约成本.(2)系统抽样所得到的样本的代表性和个体的编号有关;而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.如,如果学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取样本就可能会是全部为男生或全部为女生.(3)系统抽样比简单随机抽样的应用范围更广.联系是:(1)系统抽样适用于总体中的个体较多的情况,因为这时应用简单随机抽样就显得很不方便;(2)系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段进行抽样时,采用的是简单随机抽样;(3)与简单随机抽样一样,系统抽样也属于等概率抽样.二、例题讲解例1、在10000个有机会中奖的号码(编号为0000~9999)中,有关部门按照随机抽样的方式确定后两位是68的号码为中奖号码,这是运用哪种抽样方式来确定号码的()A.抽签法B.系统抽样C.随机数表法D.其他抽样方法解:由题意可知抽出的号码分别为0068,0168,0268,……,9968,显然这是将10000个中奖号码平均分成100组,从第一组抽取了0068号,其余号码在此基础上加上100的倍数得到的,可见这是采用系统抽样法.答案:B例2、一个总体中有100个个体,随机编号0,1,2,……,99.依编号顺序平均分成10个小组,组号依次为1,2,3,……,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为t,则在第k组中抽取的号码个位数字与t +k的个位数字相同,若t=7,则在第8组中抽取的号码应是________.答案:75例3、为了了解参加某种知识竞赛的1000名学生的成绩,应采用什么抽样方法恰当?简述抽样过程.解:假设抽取50名学生.适宜选用系统抽样,抽样过程如下:(1)随机地将这1000名学生编号为1,2,3, (1000)(2)将总体按编号顺序均分成50部分,每部分包括20个个体.(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码,比如是18.(4)以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998.例4、为了了解参加某种知识竞赛的1003名学生的成绩,请用系统抽样抽取一个容量为50的样本.解:(1)随机地将这1003个个体编号为1,2,3,…,1003.利用简单随机抽样,先从总体中剔除3个个体.(2)再按系统抽样的方法抽取.例5、某制罐厂每小时生产易拉罐10000个,每天生产时间为12小时,为了保证产品的合格率,每隔一段时间要抽取一个易拉罐送检,工厂规定每天共抽取1200个进行检测,请你设计一个抽样方案.若工厂规定每天共抽取980个进行检测呢?解:每天共生产易拉罐120000个,共抽取1200个,所以分1200组,每组100个,然后采用简单随机抽样法从001~100中随机选出1个,再每隔100个,拿出1个送检,或者根据每小时生产10000个,每隔×3600=36秒拿出1个易拉罐送检.若共要抽取980个进行检测,则要分980组,但980不能整除120000,则先计算出120000除以980的整数部分是122,所以先要剔除120000-980×122=440个,剩下119560个平均分为980组,每组122个,然后采用简单随机抽样法从001~122中随机选出1个编号,例如选出的是108号,可以从第108个易拉罐开始,每隔122个,拿出1个送检,或者根据每小时生产10000个,每隔×3600=43.92秒拿出一个易拉罐送检.例6、下面给出某村委会调查本村各户收入情况所作的抽样,阅读并回答问题:本村人口:1200人,户数300,每户平均人口数4人;应抽户数:30户;抽样间隔:;确定随机数字,取一张人民币,编码的后两位数为12;确定第一样本户:编码的后两位数为12的户为第一样本户;确定第二样本户:12+40=52,52号为第二样本户;……(1)该村委会采用了何种抽样方法?(2)抽样过程中存在哪些问题,并修改.(3)何处是用简单随机抽样.解:(1)系统抽样.(2)本题是对某村各户进行抽样,而不是对某村人口抽样,抽样间隔为:,其他步骤相应改为确定随机数字;取一张人民币,编码的后两位数为12,确定第一样本户:编号为12的户为第一样本户;确定第二样本户:12+10=22,22号为第二样本户.(3)确定随机数字用的是简单随机抽样.取一张人民币,编码的后两位数为12.。
抽样调查-第7章 系统抽样

三、总体单元的排序
系统抽样时N个总体单元的排序情况 大致有以下三种:
(1)按无关标志排队 (2)按有关标志排队
(3)介于上述两者之间
返回
四、系统抽样的优缺点
系统抽样的优点: 1.简便易行,容易确定样本单元
2.样本单元在总体中分布比较均匀
系统抽样的缺点: 1.如果单元的排列存在周期性的变化,而抽样 者对此缺乏了解或缺乏处理经验,抽取的样本 的代表性就可能很差。
3,8,13。 7 8 9 10 11 12 6 5 4 3 2
1
13
循环等距抽样
返回
3. 不等概系统抽样法
不等概系统抽样中每个单元的入样概率不相等.最常用 也是最简单的不等概系统抽样是PS 抽样.即入样概率 i 与单元大小 M 成比例的系统抽样.令
i
Mi 表示总体所有单元大小的总和,则 i n M0
Y( n1) k r
yr
Y
yk
nk
返回
令 Yrj
Y( j 1) k r (r 1,2,, k ; j 1,2,, n) 得下表:
1 2
Y12
1 2
Y11 Y21
Y22
r
Yr1
Yr 2
k
层平均
Yk1
Yk 2
j Y Y
M0 Mi
i 1
N
实施不等概系统抽样最简单的方法是代码法: 下面以例7.1来说明 【例7.1】设总体由10个行政村组成,N=10,每个行政村 的人数 M i 见下表.利用PS 系统抽样抽取n=3个行政村.
返回
用PS系统抽样抽选行政村
2.1.2系统抽样

系统抽样
一、系统抽样的概念 将总体分成 均衡的 几部分,然后按 照预先定出的规则,从每一部分抽取 一个 个体,得到所需样本的抽样方
法叫做系统抽样.
由于抽样的距离相等,因此系统抽 样也被称作等距抽样.
二、系统抽样的步骤
一般地,假设要从容量为 N的总体中抽取容量
为n的样本,可以按下列步骤进行系统抽样:
要从某校3002名学生中抽取100名学生
进行健康检查,请设计合理的抽样方法.
[解析] S2
S1 先将该校学生编号,号码为 1~3002.
Hale Waihona Puke 用随机数表法从 0001~3002 的号码中随机抽取 2
3002 个号码(3002-[ ]×100=2)剔除. 100 S3 S4 S5 将剩余的 3000 个学生重新编号为 1~3000. 将总体分成 100 个部分, 每个部分含有 30 个个体. 用简单随机抽样方法从 1~30 的号码中,抽取一
4.从已编号为 1~50 的 50 枚最新研制的某种型号的 导弹中随机抽取 5 枚来进行发射实验,若采用每部 分选取的号码间隔一样的系统抽样方法, 则所选取 5 枚导弹的编号可能是( B ) A.5,10,15,20,25 B、3,13,23,33,43 C.1,2,3,4,5 D、2,4,6,16,32
吗?为什么?
某批产品共有1564件,产品按出厂顺序 编号,号码为从1到1564.检测员要从中抽取
15件产品作检测,请你给出一个系统抽样方
案.
[解析] 将其剔除.
(1)先从 1564 件产品中, 随机抽取 4 件产品,
(2)将余下的 1560 件产品编号:1,2,3,…,1560. 1560 (3)取 k= =104,将总体均匀分为 15 组,每组 15 含 104 个个体. (4)从第一段把 1 号到 104 号中随机抽取一个号 s. (5)按编号把 s,104+s,208+s,…,1456+s 共 15 个 号选出.这 15 个号所对应的产品组成样本.
系统抽样

例5:采用系统抽样从个体数为83的总体中 抽取一个样本容量为10的样本,那么每个个体
10 人样的可能性为 _________. 83
例6:从2004名学生中选取50名组成参观 团,若采用下面的方法选取:先用简单随机抽 样从2004人中剔除4人,剩下的2000个再按系 统抽样的方法进行,则每人入选的机会( C) A.不全相等 C.都相等 B.均不相等 D.无法确定
二、从容量为N的总体中抽取容量为n的样本,用系统抽 样的一般步骤为: (1)将总体中的N个个体编号.有时可直接利用个体自 身所带的号码,如学号、准考证号、门牌号等; (2)将整体按编号进行分段,确定分段间隔k(k∈N). (3)在第一段用简单随机抽样确定起始个体的编号L (L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L 加上间隔k得到第2个个体编号L+K,再加上K得到第3个 个体编号L+2K,这样继续下去,直到获取整个样本.
5、什么叫随机数表法?
利用随机数表、随机数骰子或 计算机产生的随机数进行抽样,叫 随机数法;课本P56页给出的方法 叫随机数表法。
温故知新 1.为了了解一批零件的长度,抽测了其中200个零件的 长度,在这个问题中,200个零件的长度是( A.总体 C.总体的一个样本
[答案] C
)
B.个体 D.样本容量
A.①②③ C.①③④
[答案] D
B.①②④ D.①②③④
3.福利彩票的中奖号码是从1~36个号码中,选出7个 号码来按规则确定中奖情况,这种从36个号码中选7个号的 抽样方法是________.
[答案] 抽签法
4.下面的抽样方法是否是简单随机抽样? (1)某班45名同学,指定个子最高的5名同学参加学校组 织的某项活动; (2)从20个零件中一次性抽出3个进行质量检验; (3)一儿童从玩具箱的20件玩具中随意拿出一件来玩,玩 后放回,再拿一件,连续拿了5件.
系统抽样法

系统抽样法系统抽样法,在统计学中是一种常用的抽样方法。
它是指根据一定的规则,从总体中随机选择具有代表性的样本,以便对总体进行统计推断。
系统抽样法不仅能保证样本的随机性,还能提高调查的效率和准确性。
下面将介绍系统抽样法的基本原理、应用场景以及优缺点。
系统抽样法的原理是通过预先设定的规则来选择样本。
首先,需要确定样本容量,即要从总体中选取多少个样本点。
然后,确定一个起始点,这个起始点是通过随机抽取总体中的一个个体来确定的。
接下来,按照一定的间隔(这个间隔可以是固定的数字,也可以是总体的大小除以样本容量得到的比例),在总体中选取样本。
直到选取到规定的样本容量为止。
这样,样本就具有代表性,能够对总体进行推断。
系统抽样法常见的应用场景是社会调查、市场研究、医学实验等。
在社会调查中,比如对某个城市的居民进行调查,我们可以先确定样本容量,然后选取一个起始点,按照一定的间隔,从不同区域或人口群体中选取样本。
这样,我们可以通过这些样本来了解整个城市的人口特征、生活习惯等信息。
在市场研究中,通过对一部分消费者进行调查,可以推断出整个市场的需求、偏好等情况。
在医学实验中,可以通过对一部分病人进行治疗或观察,来推断出某种治疗方法的有效性或某种药物的副作用。
系统抽样法具有一定的优点和缺点。
其优点之一是样本选择随机性好,能够较好地代表总体。
其次,系统抽样法也较为简单,实施起来相对容易。
此外,它还能提高调查的效率,通过合理的样本容量和间隔选择,能够最大程度地获取有用的信息。
然而,系统抽样法也存在一些缺点。
首先,它对总体的要求较高,需要清楚地了解总体的特点和组成,才能选择合适的起始点和间隔。
其次,如果选择的起始点过于倾斜,可能会导致样本选择的偏差,影响结果的准确性。
此外,系统抽样法也对调查过程的随机性和外界干扰较为敏感,需要注意控制环境和调查过程中的误差。
总之,系统抽样法是一种常用的抽样方法,通过预先设定的规则,从总体中随机选择具有代表性的样本。
系统抽样法

系统抽样法系统抽样法是一种常用的抽样方法,可以帮助研究者从一个大的总体中抽取一部分样本,以便进行研究和分析。
在很多实际问题中,我们不可能对整个总体进行研究,而是通过对样本的研究,得出对总体的结论。
系统抽样法能够保证样本具有代表性,且能够有效减少抽样误差。
系统抽样法的基本原理是按照一定的顺序从总体中选取样本。
首先,需要确定总体中的个体数目N,然后确定所需样本的大小n。
接下来,计算抽样间隔k,即总体中每隔k个个体选择一个样本单位。
然后,随机确定一个起始个体,从起始个体开始,每隔k个个体选择一个样本单位,直到累计选择n个样本单位为止。
使用系统抽样法进行抽样有以下几个优点:1. 方便快捷:系统抽样法不需要列出总体的名单或分层,仅需要确定总体的大小和样本的大小,便可进行抽样。
这大大减少了工作量和时间。
2. 代表性:由于采用了间隔抽样原则,系统抽样法可以有效地保证样本具有代表性,从而可以得出对总体的准确推断。
3. 统计效果好:与简单随机抽样相比,系统抽样法具有更好的统计效果。
通过合理地选择起始个体,可以避免产生类似于序列效应和群体集中效应等系统偏差。
4. 可估抽样误差:在使用系统抽样法时,我们可以通过计算抽样误差来进行精确的估计。
这样在数据分析和结论得出时,会更加可靠和准确。
然而,系统抽样法也存在一些限制和注意事项:1. 依赖性问题:由于抽样间隔k是事先设定的,因此如果总体中存在某种周期性或重复性,可能会导致样本选择的不够随机,造成样本的偏倚。
2. 初始选择问题:抽样过程需要从一个起始个体开始,如果起始个体不具有代表性,可能会影响最终的样本结果。
因此,在选择起始个体时需要特别注意。
3. 总体规模影响:对于总体规模较小的情况,系统抽样法可能造成样本选择的不充分,影响样本的代表性。
此时,建议使用其他抽样方法。
4. 返回抽样问题:系统抽样法在一轮抽样中,可能会重复选择到之前已经被选入样本的个体。
这会导致样本的重复性,影响结果的可靠性。
系统抽样法

系统抽样法系统抽样法是一种常用的统计抽样方法,可以有效的代表总体,用于对总体进行推断和估计。
系统抽样法是在总体中按照一定规则选择一部分样本作为代表,从而得到可靠的总体估计。
系统抽样法的步骤如下:1. 确定总体:首先需要明确研究对象或感兴趣的总体,例如某产品的用户群体。
2. 确定样本量:根据所设定的误差容限和置信水平,计算得到所需的样本量。
3. 确定抽样间隔:抽样间隔是指从总体中选择样本的规则,比如每隔5个元素选择一个样本。
4. 确定起始点:从总体中任意选择一个起始点作为第一个样本。
5. 依次选择样本:按照设定的抽样间隔,从起始点开始,依次选择样本,直到达到所需的样本量为止。
6. 数据收集和分析:对所选择的样本进行数据收集和分析,可以获得关于总体的一些统计特征。
7. 总体估计:基于对样本数据的分析,对总体的特征进行估计,如总体均值、总体比例等。
系统抽样法的优点包括:1. 相对于随机抽样,系统抽样具有较高的效率,能够达到相同的估计效果,样本量较少时,所需的抽样量较少。
2. 系统抽样相对于方便抽样和判断抽样,具有较高的代表性,能够更好地反映总体的特征。
3. 系统抽样法适用范围广,可以应用于各种类型的总体,如人群、产品、地域等。
然而,系统抽样法也存在一些局限性:1. 当总体的分布不规律时,系统抽样可能导致样本选择出现一定的偏差,因此在使用系统抽样方法之前,需要确保总体具有较好的规律性。
总之,系统抽样法是一种常用的统计抽样方法,可以帮助研究者从总体中选择出具有代表性的样本,从而对总体进行推断和估计。
在实际应用中,研究者需要根据具体情况选择合适的抽样方法,并确保抽样过程的准确性和可靠性。
系统抽样

下面我们先探究:
系统抽样
系统抽样的定义
思考1:某中学高一年级有10个班,每
班50人,打算从年级500名学生中抽取
50名进行问卷调查,那么年级每个同学
被抽到的概率是多少?
P=1/10
随机抽样(二)
系统抽样
复习回顾
1.简单随机抽样的概念
一般地,设一个总体的个体数为N,如果通过 逐个不放回抽取的方法从中抽取n个个体作为样本, 且每个体被抽到的概率相等,就称这样的抽样方 法为简单随机抽样。
2.简单随机抽样有什么特点?
(1)总体的个体数不是很多,有限; (2)逐个进行抽取; (3)不放回抽样; (4)是等概率抽样。简单随机抽样的每个个体入样的可 能性(概率)均为n/N.
思考7:系统抽样适合在哪种情况下使用? 系统抽样公平吗?
[注意]:①系统抽样适合于总体的个体数 较多的情形.
②系统抽样也是等概率抽样,即每个 个体被抽到的概率是相等的,其概率仍 为P=n/N,从而保证了抽样的公平性.
例1 某中学有高一学生322名,为 了了解学生的身体状况,要抽取一个容 量为40的样本,用系统抽样法如何抽样?
系统抽样:
1.定义:
当总体的个体数较多时,采用简单随机 抽样太麻烦,这时将总体分成均衡的几个部 分,然后按照预先定出的规则,从每个部分 中抽取一个个体,得到所需的样本,这样的 抽样方法称为系统抽样(等距抽样)。
系统抽样的步骤:
(1)先将总体的N个个体编号。
(2)确定分段间隔k,对编号进行分段,当N/n (n是样本容量)是整数时,取k= N/n;
先从总体中随机剔除5个个体,再均衡 分成进行 系统抽样?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三)根据各单元原有的自然 位置进行排序
例如:学生按学号抽样,入户调查根据 街道门牌号按一定间隔抽取等。 这种自然状态的排列有时与调查标志有 一定的联系,但又不完完一致,这主要 是为了抽样方便。
四、系统抽样的特点
优点: 1.简便易行,容易确定样本单元
等距抽样简单明了,快速经济,操作灵活方便,使用面广, 是单阶段抽样中变化最多的一种抽样技术。 在某些场合下甚至可以不用抽样框。例如若要对公路旁的树 木进行病虫害调查,确定每 20 棵数检查一棵,只要在初始被 检树确定后,每隔 20 棵检查一棵即行,根本不需要在事先对 公路旁的所有树木进行编号,或者不需要知道抽样框即所有 树木的棵数。 在我国,等距抽样已成了最主要、最基本的抽样方式,一些 大规模的抽样调查,如农产量抽样调查、城乡住户调查、人 口抽样调查、产品质量抽样检查中都普遍采用了等距抽样。
三、排序标志
等距抽样需要有作为排序依据的辅助标志。 排序标志各式各样,可自由选择,但归纳起 来,可分为两类,即无关标志和有关标志, 它们对等距抽样的作用和相应的估计精度各 有不同的影响。
(一)按无关标志排队 (无序系统抽样)
即各单元的排列顺序与所研究的内容无关. 如研究人口的收入状况时,按身份证号码、按 门牌号码排序非常方便,一般说来,这些号码 与调查项目没有关系,因此可以认为总体单元 的次序排列是随机的 无关标志排序的等距抽样也称无序等距抽样。
k 1 2 2 V ( ysy ) E ( ysy Y ) ( yr Y ) k r 1
性质2 用样本(群)内方差 S 2 表示系统抽 wsy 样估计量的方差: ( N 1) 2 k (n 1) 2 V ( ysy ) S S wsy N N
式中:
1 S ( yrj Y ) N 1 r 1 j 1
评价: 在无关标志排序的条件下,各单元的位次排定, 并不等于各单元的调查标志值也按同一次序排 定,虽然是等距抽样,它与随机抽样在性质上 并无不同. 故无关标志排序的等距抽样,实质上相同于简 单随机抽样,二者只是抽样形式不同而已,完 全无损于随机原则,它们在估计精度上也是一 致的。
(二)按有关标志排序
k
k
n
三、估计量方差的不同表示形式
如前所述,如果总体单元是按无关标志 排列的,则其方差可按简单随机抽样去 做。 若总体单元是按有关标志排列的,则此 时的等距抽样可以看作是整群抽样或分 层抽样的特例,因此,等距抽样估计量 的方差可以比照整群抽样或分层抽样的 方法构造,有几种表示方法。
为方便起见,假定 N= nk,因此系统样本的平 均数 ysy 是总体均值的无偏估计,它的方差按 定义为:
系统抽样中最简单的是等间隔抽取,这 种系统抽样又称为等距抽样。 等距抽样的随机性是有限制的,因此也 被称为伪随机抽样,但要注意:等距抽 样并未真正丧失随机性原则。 例:工业产品质量检查,每隔2小时抽选 一个或若干样品进行检验。
二、系统抽样的实施方法
(一)直线等距抽样
假设:总体N个单元按直线排列,样本容量为n, 且有 N/n=k,k为整数,称为抽样间距(sampling interval)。 实施方法:
(二)循环等距抽样
为克服直线等距抽样的上述缺陷,拉希里(Lahiri)提出一种替 代方法,称为循环(或圆形)等距抽样。 实施方法:
1.将总体排成首尾相连的圆形。 2.在1~N范围内随机抽取整数r作为起始单元编号。 3.每隔间距k(k为最接近N/n的整数)抽取样本单元。直到抽足n个单 元为止。
评价:对于循环等距抽样,即使对于N/n不为整数的情况, 不仅样本量不会随起始值而变化,且是严格等概率的。 例:见P143
注意:以下为了处理方便,我们假定N总 是n的整数倍。在实际工作中,若n充分 大,则由于N/n非整数而带来的影响就充 分小,可以忽略不计。
(三)不等概系统抽样法 常用的不等概率系统抽样是πPS系统抽样 令: M 0
r 1 j 1
样本(群)内相关系数: wsy
E ( yrj Y )( yru Y ) E ( yrj Y ) 2
2
层内方差:
S wst
2
n k 1 ( yrj y. j ) n(k 1) j 1 r 1
同一系统样本内对层均值离差的相关系数:
wst
一、符号说明
第r行第j列的单元指标值:Yrj Yrj=Y(j-1)k+r ,r=1,2,…k; j=1,2,…,n 总体单元数:N 样本单元数: n n 1 系统样本平均数: y yrj r n j 1
系统样本均值估计量:
ysy
层均值: y j , j=1,2…,n 总体方差: S 2 2 k n 1 2 系统样本(群)内方差: Swsy k (n 1) ( yrj yr )
E ( yrj y. j )( yru y.u ) E ( yrj y. j )
2
二、估计量
设起始值为r,则相应系统样本的平均数为:
1 1 yr yrj Yrj n j 1 n j 1
总体均值 Y 的估计量为:
n
n
ysy
1 n yr yrj n j 1
比较等距抽样方差和简单随机抽样方差:
n 1 2 V ( ysrs ) V ( ysy ) ( S wsy S 2 ) n
可见:
当S wsy 2 S 2 , 即等距样本内方差大于 总体方差时, 机抽样; 系统抽样法优于简单随 2 2 当 S S , 即等距样本内方差小于 总体方差时, wsy 抽样法; 简单随机抽样优于系统 当S wsy 2 S 2时,即等距样本内方差 等于总体方差时, 抽样法抽样效果相同 系统抽样法与简单随机
877 961 1034 1239 1407 1553 1870
723
1346
解:
M 0 M i 1870 , n 3,
i 1
N
M0 k 623 n
在 [1,623]中随机抽取整数r,设r=100,则 r+k=723, r+2k=1346,则对应的行政村为 1,4,8.
注: 对于特别大的单元一般直接作为样本,然 后对剩余的单元组成的总体实施抽样.
【例7.1】设总体由10个行政村组成,N=10,每个行政村的人 数 Mi见下表,利用πPS 系统抽样抽取 n = 3 个行政村 行政村编号 1 2 3 人数(Mi) 103 432 96 累计人数 103 535 631 抽中代码 100
4 5 6 7 8 9 10
246 84 73 205 168 146 317
M i表示总体所有单元大小的总和,
i 1
N
M i 则有入样概率为: i n M0
在实际中,实施不等概率抽样最简单的方法是代码法。
实施方法:
1.先将单元 Mi值累加,取最接近M0/n 的整数 k为抽样间距。 2.从 [1,k]中随机抽取一个整数作为起始单 元编号。 3.每间隔k抽取样本单元,则代码 r, r+k, … ,r+(n-1)k 所对应的单元即样本单元.
2.样本单元在总体中分布比较均匀,有 利于提
高估计精度.
将总体各单元按一定的顺序排列后再抽样,使得样 本单元的分布更加均匀,因而样本也就更具代表性, 比简单随机抽样更精确 。
缺点: 1.如果单元 的排列存在周期性的变化,而抽样 者对此缺乏了解或缺乏处理的经验,抽取出样本 的代表性就可能很差可能很高。这时要慎重地 选择K。
即各单元的排列顺序与所研究的内容是有关的, 用来对总体单元规定排列次序的辅助标志,与 调查标志具有共同性质或密切关系。 这种排序标志,在我国抽样调查实践中有广泛 应用,如农产量调查,以本年平均亩产为调查 变量,以往年已知平均亩产作为排序标志。 利用这些辅助标志排序,有利于提高等距抽样 的抽样效果。
1.将总体分为n段,每段k个单元 2.在第一段的k个单元中随机抽取一个单元r 3.每隔k个单元抽出一个单元,共抽取n个单元,则被抽中的单元 编号分别为: r, r+k, r+2k, … r+(n-1)k
例见课本P142
方法评价:
当N/n=k为整数时,总体中每个单元的入样概率 都相等(都等于1/k),从而是一种严格的等概率抽 样。 当N/n=k不是整数时,实际抽取到的样本单元数 可能是[N/k],也可能是[N/k]+1,也即与原来设 定的样本量可能相差1。每个单元的入样概率也是 不相等的。这时等距抽样有可能产生偏倚。
系统抽样的总体单元 1 1 2
…
2 Yk+1 Yk+2
…
…
j
…
n
平均
Y1 Y2
…
… Y(j-1)k+1 … Y(n-1)k+1 … Y(j-1)k+2 … Y(n-1)k+2
… …
y1
y2
…
r
…
Yr
…
Yk+r
…
… Y(j-1)k+r … Y(n-1)k+r
… …
yr
…
k
Yk
Y2k
…
Yjk
…
Ynk
yk
性质1 当 N=nk 时,有 k 个可能样本:
1 1 E ( ysy ) yr yrj Y k r 1 nk r 1 j 1