抽样调查整群抽样与系统抽样

合集下载

学术研究的样本选择与抽样方法如何选择合适的样本和抽样方法

学术研究的样本选择与抽样方法如何选择合适的样本和抽样方法

学术研究的样本选择与抽样方法如何选择合适的样本和抽样方法在学术研究中,样本选择和抽样方法是非常重要的步骤,因为样本的质量和抽样方法的合理性直接影响到研究结果的准确性和推广性。

本文将探讨如何选择合适的样本和抽样方法,以及如何避免与样本相关的偏倚(bias)和错误(error)。

一、样本选择的原则和方法1. 代表性:样本应尽可能代表研究对象的整体特征,这样才能保证研究结果的推广性。

代表性可以通过随机抽样来实现,即按照一定的概率分布随机选取样本。

2. 样本大小:样本大小应根据研究问题的复杂程度和样本之间的差异来确定。

虽然没有固定的准则,但通常样本大小应足够大以确保结果的可靠性。

3. 可得性:样本的可得性指的是样本是否容易获取。

在实际研究中,有时可能会受到时间、经费和地理等因素的限制,因此需要在可得性和代表性之间进行权衡。

二、常见的抽样方法1. 简单随机抽样:是最常用的抽样方法之一,每个样本都有相等的机会被选中。

简单随机抽样通常通过随机数表或者随机数生成器来实现。

2. 系统抽样:在样本框中按照一定间隔选取样本。

例如,如果总体规模为N,样本量为n,那么每隔N/n个单位选取一个样本。

3. 分层抽样:将总体划分为若干子总体,根据研究需要在每个子总体中进行独立抽样。

分层抽样可以保证各个子总体的代表性,并提高样本的效率。

4. 整群抽样:将总体划分为若干群体或者簇,然后随机选取其中的部分群体作为样本。

整群抽样可以简化调查过程,并减少调查成本,但需要确保群体内的异质性不太大。

5. 分级抽样:将总体划分为若干级别,然后在每个级别中进行独立抽样。

例如,在调查学生时可以根据年级和班级进行分级抽样。

三、样本选择和抽样方法的优化1. 声明限制条件:在学术研究报告中,应明确样本选择和抽样方法的限制条件,并解释这些限制条件对结果的影响。

这有助于读者了解研究的局限性。

2. 多样本比较:在某些情况下,研究者可能需要比较不同样本的差异。

(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。

如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。

群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样壹样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。

系统抽样

系统抽样

(三)根据各单元原有的自然 位置进行排序


例如:学生按学号抽样,入户调查根据 街道门牌号按一定间隔抽取等。 这种自然状态的排列有时与调查标志有 一定的联系,但又不完完一致,这主要 是为了抽样方便。
四、系统抽样的特点


优点: 1.简便易行,容易确定样本单元


等距抽样简单明了,快速经济,操作灵活方便,使用面广, 是单阶段抽样中变化最多的一种抽样技术。 在某些场合下甚至可以不用抽样框。例如若要对公路旁的树 木进行病虫害调查,确定每 20 棵数检查一棵,只要在初始被 检树确定后,每隔 20 棵检查一棵即行,根本不需要在事先对 公路旁的所有树木进行编号,或者不需要知道抽样框即所有 树木的棵数。 在我国,等距抽样已成了最主要、最基本的抽样方式,一些 大规模的抽样调查,如农产量抽样调查、城乡住户调查、人 口抽样调查、产品质量抽样检查中都普遍采用了等距抽样。
三、排序标志

等距抽样需要有作为排序依据的辅助标志。 排序标志各式各样,可自由选择,但归纳起 来,可分为两类,即无关标志和有关标志, 它们对等距抽样的作用和相应的估计精度各 有不同的影响。
(一)按无关标志排队 (无序系统抽样)


即各单元的排列顺序与所研究的内容无关. 如研究人口的收入状况时,按身份证号码、按 门牌号码排序非常方便,一般说来,这些号码 与调查项目没有关系,因此可以认为总体单元 的次序排列是随机的 无关标志排序的等距抽样也称无序等距抽样。
k 1 2 2 V ( ysy ) E ( ysy Y ) ( yr Y ) k r 1
性质2 用样本(群)内方差 S 2 表示系统抽 wsy 样估计量的方差: ( N 1) 2 k (n 1) 2 V ( ysy ) S S wsy N N

抽样方案的步骤包括哪些

抽样方案的步骤包括哪些

抽样方案的步骤包括哪些抽样方案的步骤包括哪些摘要:抽样是研究中常用的一种数据收集方法,它是通过从总体中选择一部分样本进行调查,以推断总体的特征。

本文将详细介绍抽样方案的步骤及其包括的内容,包括确定调查目的、定义总体、选择抽样方法、确定样本量、制定抽样框架和实施抽样调查等。

关键词:抽样方案、调查目的、总体、抽样方法、样本量、抽样框架、抽样调查一、确定调查目的抽样方案的第一步是确定调查目的。

调查目的直接决定了研究的方向和内容,需要明确研究想要获取的信息和结果。

在这一步中,策划师需要与研究团队和相关利益方进行充分的沟通和讨论,确保调查目的的准确性和一致性。

二、定义总体定义总体是抽样方案的第二步。

总体是指研究所要推断或得出结论的全部对象或现象的集合。

在定义总体时,需要明确总体的界限、特征和属性,以便进行后续的抽样和调查工作。

此外,还需要考虑总体的大小和分布情况等因素。

三、选择抽样方法选择合适的抽样方法是抽样方案的核心步骤之一。

常用的抽样方法包括随机抽样、系统抽样、分层抽样和整群抽样等。

不同的抽样方法适用于不同的研究对象和目的,策划师需要根据研究需求和实际情况选择最合适的抽样方法。

四、确定样本量确定样本量是抽样方案的重要一环。

样本量的大小直接影响到研究结果的精确性和可靠性。

在确定样本量时,需要考虑到抽样误差、置信水平和效应大小等因素。

此外,还需要根据实际情况进行样本量的调整和修正。

五、制定抽样框架制定抽样框架是抽样方案的关键步骤之一。

抽样框架是指从总体中选择样本的具体方法和程序。

在制定抽样框架时,需要根据抽样方法和实际情况确定样本来源、抽样单元和抽样方式等。

此外,还需要考虑到调查的时空范围和周期等因素。

六、实施抽样调查实施抽样调查是抽样方案的最后一步。

在实施抽样调查时,需要根据抽样方案的要求进行具体操作,包括抽取样本、收集数据、分析数据和得出结论等。

在整个过程中,需要严格控制抽样误差、提高数据质量和保障调查的可信度和有效性。

(抽样检验)第七章整群抽样

(抽样检验)第七章整群抽样

第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样一样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。

因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。

随 机 抽 样

随 机 抽 样

二、 分层抽样
分层抽样(stratified sampling)又称类型抽样,它是先将总 体中的所有单位按某种特征或标志(如性别、年龄、职业或地域等) 划分成若干类型或层次,然后再在各个类型或层次中采用简单随机 抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起 来构成总体的样本。例如,在某地区高科技企业中抽取样本时,可 以先把总体中的各高科技企业按年销售额分为高、中、低三大类; 然后采用简单随机抽样或系统抽样的方法,分别从这三大类的企业 中抽取子样本;最后将这三个子样本合起来构成全体高科技企业的 样本。
(3)确定在表中选择数字的顺序。选择数字时遵循的顺序可以随 意确定,如可以顺着每一列自上而下或自下而上;也可以顺着每一 行从左到右或从右到左;还可以顺着对角线方向。例如,本例选择 顺着每一列自上而下的选取方式,一列选完后,从右边的一列继续 自上而下选取;一页选完后,从下一页的第一个列继续自上而下选 取,直到选够随机数为止。
在实际运用分层抽样的方法时,需要考虑以下2个方面的问题:
1. 分层的标准
同一个总体可以按照不同的标准进行分层。在 实际抽样中,通常采用的标准有以下3条:
(1)以所要分析和研究的主要变量或相关的变量 作为分层的标准。比如,要研究居民的消费状况和 消费趋向,可以以居民家庭人均收入作为分层标准; 又如,要了解不同职业的人员对社会经济改革的看 法,就可以以人们的职业作为分层的标准。
从理论上来说,简单随机抽样符合抽样调查的随机原则, 有关抽样调查的基本原则和方法,都是在简单随机抽样的基 础上建立的,它是抽样调查的基本形式。但在实际应用中却 有一定的局限性。例如,当全及总体的编号量N极大时,就 要事先对每个单位一一加以编号,这是几乎不可能完成的。 特别是对于正在连续大量生产的工业产品进行质量抽查时, 就无法对全部产品进行编号抽样。基于以上原因,一般在全 及总体单位数并不太大,而且总体单位之间差异较小的情况 下,简单随机抽样方式才变得简便易行。

抽样的四种基本方法

抽样的四种基本方法

抽样的四种基本方法抽样是研究中常用的一种方法,用于从全体个体中选择一部分进行调查或研究,以获取全体的代表性信息。

抽样方法可以分为四种基本类型:随机抽样、系统抽样、分层抽样和整群抽样。

1.随机抽样:随机抽样是一种完全随机的抽样方法,个体被选入样本的概率是相等的。

这种方法可以确保样本的代表性,一般只要样本容量足够大,就能够准确地反映总体特征。

在随机抽样中,可以使用简单随机抽样或系统抽样的方式进行,其中简单随机抽样是最常用的方法。

例如,通过随机数表或随机数生成器进行随机选取。

2.系统抽样:系统抽样是按照一定顺序和规律抽取样本的一种方法。

它首先从总体中的其中一位置开始选取一个个体作为起始点,然后每隔一定数量的个体选取一个个体,直到满足样本容量为止。

系统抽样的优点是方法简单,易于操作。

例如,在人口普查中,可以按照城市排名或者住房特征顺序抽取样本。

3.分层抽样:分层抽样是按照总体的特征对总体划分为若干层,然后从每一层中随机抽取样本。

这种方法可以保证每一层的代表性,并减小总体差异对样本结果的影响。

在分层抽样中,需要根据实际情况将总体划分为不同的层次,然后确定每层的样本容量。

例如,在一个学生群体中,可以按照年级划分层次,然后从每个年级中抽取相应比例的样本。

4.整群抽样:整群抽样是将总体划分为若干群,然后从每一群中抽取全部个体作为样本。

这种方法常用于研究群体特征,可以减少样本选择的复杂性。

整群抽样的关键是选择合适的群体代表性,以确保样本结果能够准确反映群体整体特征。

例如,在一个学校中,可以将每个年级作为一个群体,然后从每个年级中抽取全部学生作为样本。

以上是抽样的四种基本方法:随机抽样、系统抽样、分层抽样和整群抽样。

每种方法都有其适用的场景和优缺点,研究者需要根据具体问题的需要和总体特征选择合适的抽样方法,以确保样本的代表性和研究结果的可靠性。

[高等教育]现代社会调查 第四章 抽样

[高等教育]现代社会调查  第四章 抽样
27
3.分层抽样
——又称类型抽样,它是先将总体中的所有单位按某种特征或标 志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后 再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取 一个子样本,最后,将这些子样本合起来构成总体的样本。 操作方法:
将总体中的所有单位按某种特征或标志(如性别、年龄、职业或地
特点 简单随机抽样 一阶段抽样 系统抽样
分层抽样
整群抽样 多阶段抽样 多段抽样 PPS抽样
样本一次直接从 总体中抽出
样本分多阶段从 总体中抽出
17
1.简单随机抽样
——是概率抽样的最基本形式,它是按等概率原则直 接从含有N个元素的总体中随机抽取n个元素组成样本 (N>n)。
常用方法:直接抽样法、抽签法、随机数表法
25
当抽样间距(K=N/n)不是整数时:
循环等距抽样法 A+K A A+2K
A+3K
A+4K
A+(n-1)K
调整直线等距抽样 如:N=2580, n=300, 则K=8.6
……
调整:在1-86之间选择整数的随机起点,如27;将小数 点调回,得到非整数的随机起点2.7,由此得到号码:2.7, 11.3, 19.9, 28.5,……。将小数点后面的部分略去,就是迁 中单位的号码:2, 11, 19, 28, …… 26
抽5个区
抽4个区 抽3个区
抽12所学校
抽10所学校 抽10所学校
每所学校抽20名教师
每所学校抽30名教师 每所学校抽40名教师
方案8
方案9
根据抽取对象的具体方式的不同,把抽样分为概率抽 样和非概率抽样。
6
抽样的类型
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
此时系统抽样估值的精度与K的选取有很大关系, 应避免K=t 对周期资料选择合适K进行系统抽样,可得到比较 理想的精度 实际呈现精确周期排列的资料是没有的,而具有 一定周期性的资料很多,例如季节资料、月度资 料、星期资料等
个体的次序随机排列
对总体的某种排列次序,系统抽样精度可能优于 简单随机抽样也可能劣于简单随机抽样,但对N个个 体的所有N!种排列而言,系统抽样的平均精度与简单 随机抽样相等
V(YˆS
K
Y)SK
N0
(
N0
Yij
Yj)2
i1 j1
j1
N 0
K
K(Y ji Y i)22 K K N 0N 0(Y ji Y i)Y (jl Y l)
i 1j 1
j 1i l
K N0N0
(Yji
Yi)
(Yjl
Yl)0,系统



于样分
j1 il
系统抽样的效率
例 假设总体有表中的30个单元,欲取5个构成系统样 本,与简单随机抽样和分层抽样同样本量的结果进行 比较(两种排列方式).
个体指标与其次序有线性关系 个体指标与其次序有某种周期关系 个体的次序随机排列
个体指标与其次序有线性关系
Y ii,i 1 ,2 , ,N 设 U i(Y i)/i
则 U N 2 1 ,S 2N 1 1iN 1(U i U )2 (N 1 1 )N 2
系统抽样
U ˆSYSN1 2N(NK) V(UˆSY)SN2(1K221)
然后对号码1,2,…,K作随机抽样,若i入样,则 K+i,2K+i,…,皆入样,组成一个系统样本
若将同一列个体看做一个群,系统抽样可视为整群抽样
一般假定N=KN0,并且只从1~K中抽选一个样本单元
系统抽样的优点是抽样非常方便
系统抽样的估值法
将系统抽样看作整群抽样抽取一个一级单元,有
(1)YˆSYSKN0 Yj是Y的无偏估计量
§6.1 整群抽样 §6.2 群内相关系数 §6.3 系统抽样
§6.4 个体指标具有特殊结构时的 系统抽样
§6.5 系统抽样估计量方差的估计
整群抽样的提法 目标量的估计
整群抽样的提法
整群抽样的提法与特点
在多阶抽样中,当某一单元被抽中,对该单元 包含的下一级抽样单元不再抽样,而是进行普查 抽样框要求简单
S2 S内 2时,简单随机抽样 系优 统于 抽样 S2 S内 2时,系统抽样优于 随简 机单 抽样 S2 S内2时,两者精度相同
系统抽样的效率
与分层抽样的比较
将总体N 分 0个 为层,每层简取 单一 随个 机样 抽本
Yˆst
N N0
N0
Yii
i1
V(Yˆst)KN0
K
(YjiYi)2
i1 j1
DefV fV (Y(ˆC Yˆ)S)E1(N01)C
C较大N,0较大时,整群抽差样得精多度
对第一级为简单 样随 的机 二抽 阶抽样有
Deff1C(n0 1)
整群抽样的设计效应
实 际 当 各 群, 容常 量 K 1用 i不 K 1Ni 等 N0来 时估 计
设计效应
群 内 相 关 系 数 的 另 一 表 达 式 为 C = 1 N N 1 S S 内 2 2 1 S S 内 2 2
V(YˆCS)E K k21K kK11iK 1jN i1YijK Y2
(3)V(YˆCS)E的一个无偏估计量为
v(YˆCS)EKk21K kk11i k1N j1i Yij YˆC KSE 2
目标量的估计
定理6.2 对有放回PPS整群抽样,总体总数Y的估计有
(1)Y的无偏 Y ˆC估 P PS k 1计 i k1p1为 i N j 1 i Yij
i1
j1
若群内各单元指等标,均 则 C相 达最大1值
群内相关系数是衡量群内单元同质性的一个指标
整群抽样的设计效应
N i N 0 (i 1 ,2 , ,K )时
V(Y ˆCS ) EK k2 1K k K 1 1iK 1 N j 0 1Y ijK Y 2
V(Y ˆ)K k2 1K k K 1 1iK 1N j 0 1YijY2(K,N 较大 )
社会态度
税务信息
住宅 城市居民 离开的旅客
学生 成年村民
土地所有者
街区 住宅区 航班
班级

分类台帐页
目标量的估计
将整群抽样看作二阶抽样的特例
定理6.1 对简单随机抽样的整群抽样,总体总数Y的估 计有
(1)Y的无偏Yˆ估 CS E计 K ki k1为 N j 1 i Yij
(2)YˆCS的 E 均方偏差为
一般 S 内 2S2 , 有所 C 介 以 0 , 1 于 之间
群内相关系数方便计算的另一表达式
K Ni
2
K
(Yij Y )
Ni
(Yij Y )2
i1 j1
C
K
i1 j1
Ni
(Ni 1) (Yij Y )2
ห้องสมุดไป่ตู้
i 1
j 1
目标量的估计
例3 某县有33个乡,共726个村,某一年度农作物总 种植面积为30525亩。先采用等概抽样随机抽出10个 乡进行该种作物的产量调查,要求利用无偏估计量和 比率估计量(以群规模为辅助变量,以种植面积为辅 助变量)分别估计全县总产量,并计算估计量的标准 差。数据如表.
简单随机抽样 分层抽样V(U ˆSE )N2(N11)2K ( 1)
V(UˆSt)NK(1K221)
此时分层抽样精度最高,系统抽样次之,简单随 机抽样精度最低
与次序有某种周期关系
设个体指 t为标 周(以 N期 M)t
Y 1 1 , Y 2 2 , , Y t t , Y t 1 1 , , Y 2 t t ,
系统抽样的提法 系统抽样的估值法 系统抽样的效率
系统抽样的提法
选一正K整 ,数 将总 (N体 )中的 N个单元依次
1, 2, , K, K 1, K 2, , 2K, 2K 1, 2K 2, , 3K,
直至N为止
N不是K整数倍的处理方法
1.N/K较大(≥50)可忽略每 群个体差
2.将个体单元首位衔接循 环取样
(2)YˆCPP的 S 均方偏差为
V(YˆCPP)S1kiK 1
pip1i
Ni
2
Yij Y
j1
(3)V(YˆCPP)的 S 一个无偏估计量为
v(YˆCPP)Sk(k11)
k 1 i1pi
Ni
Yi j
j1
2
YˆCPPS
也可将整群抽样看作单阶抽样,同样可以得到上述 两个定理
目标量的估计
例1 在一次针对某城市大学生月生活费支出的调查中, 以小组为群进行整群抽样。每个小组有8名大学生, 采用简单随机抽样在510个组中抽取12个小组,全部 96个样本大学生月生活费支出数据如表.试估计该城 市大学生人均月生活费及其95%的置信区间.
例2 调查一片荒地上蝗蝻数量,以一平方米为单位 。N=5000,K=500,N0=10,k=20,作简单随机的整群抽 样,估计整块荒地蝗蝻数.数据如表
群内相关系数的概念 整群抽样的设计效应
群内相关系数的概念
群内相关系数
K Ni Ni
(Yij Y )(Yil Y )
i1 jl
C
K
Ni
(Ni 1) (Yij Y )2
样本相对集中,方便调查
特定场合具有较高精度
因为样本集中,可增大样本量弥补精度上的损失 群内次级单元差异很大反映总体分布时,其精度 不见得低
整群抽样的提法
整群抽样的适用场合
表6.1 可能适合整群抽样的实例
某个城市 某个城市 某机场 某大学 某乡
城市土地 所有者档案
住户特征 某项消费 旅游信息 就业计划
看作分层抽样
将两行个体看作一个层,每层有两个样本单元。 两个样本单元构造一个该层的方差估计,再按分层抽 样汇总出一个均方偏差的估计
v2(Y ˆSY ) SK 2 1K 1 N j0 /1 2Y (2j)Y (2j 1)2 v 3(Y ˆSY ) S N N 0 2 1 K 1 2 (N 1 0 1 )jN 0 2Y j Y (j 1 )2
v2,v3有很广适用范围,特别是v3为许多实际工作者 所采用。
看作分层抽样
例 调查某单位员工档案工资外的收入情况,该单位有 员工660人,备有以出生年月为顺序的花名册。以花 名册作为抽样框,拟抽取30个样本单元,故取K=22作 系统抽样。从1,2,……,22中随机取出一数为R=7, 入样的单元号码为7,29,……,623,645。对花名 册对应号码的员工进行调查,得当月各人收入资料如 表(单位:元),估计每人平均收入及估计量的均方 偏差.
当个体指标具有某种特殊结构时,常对取样方法进行 人为调整,有点典型抽样的味道,非完全概率抽样
看作简单随机抽样 看作分层抽样
看作简单随机抽样
将系统抽样看 机作 抽简 样 V(Y 单 ˆS, Y)S随 可用
v1(YˆSY)SN N02
1N0s2 N
来估计,其中
s2
1 N0
N01j1
Yj
Y
2
当个体单元并非完全随机排列时这个估计会产生 偏量:群内相关系数小,会高估均方偏差;群内 相关系数大,会低估均方偏差。
j1
(2)V(YˆSY)SKiK 1N j01YijK Y2
K
N0N
i1
Yi Y
2
由这个思路无法给出其均方偏差的估计量
系统抽样的效率
与简单随机抽样的比较 (N 1 )S 2 N 0 (K 1 )S 外 2 (N 0 1 )K 内 2S V(Y ˆS)EN(K1)S2
相关文档
最新文档