整群抽样

合集下载

(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。

如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。

群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样壹样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。

整群抽样

整群抽样

当各群所含次级单元数相等时,就称群
的大小相等;当各群所含次级单元数不 相等时,就称群的大小不相等。
第二节 群规模相等时的估计
一、符号说明 二、估计量 三、整群抽样效率分析

一、符号说明
设总体有N个群,每个群包含的单元数M相等 (或相近). 符号: 总体群数: N 样本群数:n 总体第 i 群中第 j 个单元的指标值: Yij 样本第 i 群中第 j 个单元的指标值: yij 第 i 群中的单元数: M i

注意: 整群抽样的随机性体现在群与群间不重 叠,也无遗漏,群的抽选按概率确定。 如果把每一个群看作一个单位,则整群 抽样可以被理解为是一种特殊的简单随 机抽样。 整群抽样是由一阶抽样向多阶段抽样过 渡的桥梁.此章介绍的是单阶段整群抽样.

(二)特点 优点: 1. 抽样框编制得以简化。
M1 M 2 ... M N M
它们之间的关系为:
1 2 2 S [( N 1) Sb N ( M 1) S w ] NM 1
2
M 仍为M ,不难 将 Y 改为 y ,n 代替 N ,由于是整群抽样, 得到样本方差平方和的关系式:
1 2 2 s [( n 1) sb n( M 1) sw ] nM 1
二、估计量

(一)均值估计量的定义
若群的抽取是简单随机的,且群的大小(M)相等, 则总体均值的估计为:
1 n y yi n i 1 i 1 j 1 nM
n
M
yij
(二)估计量 y 的性质

性质1
y 是 Y 的无偏估计
Y E( y) Y M

性质2
y 的方差为:

(抽样检验)第七章整群抽样

(抽样检验)第七章整群抽样

第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。

确切地说,这种抽样组织形式应称为单级整群抽样。

如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。

本章只讨论单级整群抽样。

设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。

当诸Mi都相等时,称为等群;否则,称为不等群。

采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。

整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。

如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。

或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。

群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。

二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。

同分层抽样一样,整群抽样的前提是先要对总体进行分群。

关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。

分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。

这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。

而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。

因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。

抽样理论与方法:整群抽样

抽样理论与方法:整群抽样
整群抽样
7.1 概述
一、整群抽样(cluster sampling)的定义: 由若干个基本单元所组成的集合称为群。将总体 划分为若干群,然后以群为抽样单元,从总体中随 机抽取一部分群,对抽中的群中的所有基本单元进 行调查的一种抽样技术。 严格来讲也称为单阶整群抽样。
二、特点: 1.可以简化抽样框的编制。 2.实施调查便利,节省费用。 3.但通常比简单随机抽样的抽样误差大。 三、分群的原则:群内单元差异大,群间差异 小。 这样,被抽到的群代表性好,整群抽样的效率 就高。
( 3)P的估计 : 总体小单元的指标值Yij只能取0或1。 YP
Y
i 1 j1
N
M
ij
NM

A
i 1
N
i
NM
n i 1 i


i 1 n
N
Ai N
M

n
P
i 1
N
i
N
i
nM nM n n E( y ) Y E(p ) P即p是P的无偏估计。 1 f 1 N 2 V(p) ( Y Y ) i n N 1 i 1 1 f 1 N 2 (Pi P) n N 1 i 1 1 f 1 n 2 v(p) ( y y ) n n 1 i 1 i 1 f 1 n 2 ( p p ) , 且E( v(p) ) V(p)。 i n n 1 i 1
y 1 1 f 1 n 2 v(y ) v( ) 2 v(y ) ( y y ) M M nM 2 n 1 i 1 i 1 f M n 1 f 2 2 ( y y ) sb i nM n 1 i 1 nM 是V(y )的无偏估计。

第4章整群抽样

第4章整群抽样
具有某特征的次级单元的总体比例: 1 N 1 N P Ai Pi NM i 1 N i 1 具有某特征的次级单元的样本比例:
1 p nM 1 n ai pi n i 1 i 1
n
1 并令: A N

A
i 1
N
i
1 n a ai n i 1
定理4.2.2 在整群抽样中,若群的大小相等, 且对群进行简单随机抽样,则:
yij , i 1, 2,, n; j 1, 2,, M
总体第i个群的指标总值(简称群和):
Yi Yij , i 1, 2,, N
j 1 M
样本第i个群的指标总值(简称群和):
yi yij , i 1, 2,, n
j 1 M
总体第i个群的指标均值(简称群均值):

记:
总体第i个群中具有某特征的次级单元数: Ai , i 1, 2,, N 样本第i个群中具有某特征的次级单元数: ai , i 1, 2,, n
总体第i个群中具有某特征的次级单元所占比例: Ai Pi , i 1, 2,, N Mi
样本第i个群中具有某特征的次级单元所占比例: ai pi , i 1, 2,, n mi

书上P118例4-1
例 某厂近两年来积压了某种零件100箱,每箱20 只。最近有用户要货,急需估计100箱中有多少报 废零件,以尽快安排生产及时供应用户。现随机抽 取5箱,对箱中的零件全部检查,结果如下表。 (1)对零件的废品率作点估计,并估计其标准差; (2)对100箱中的废品数作点估计,并估计其标准 差。
m0 mi 样本中的次级单元数:
i 1 N
n
1 总体的平均群大小: M N

抽样技术 5 整群抽样

抽样技术 5 整群抽样

2.群内相关系数:是表达总体中群内小单元间相关程度 的一个指标。 定义:
(Y

E (Yij Y )(Yik Y ) E (Yij Y )
2 i 1 j k
N
M
ij
Y )(Yik Y )

2 NCM 2 ( Y Y ) ij i 1 j 1 N M
NM 2 (Yij Y )(Yik Y )
学生2
学生3 学生4 学生5 学生6
83
74 82 66 87
83
79 111 101 69
89
94 109 79 80
105
98 107 129 90
99
132 87 99 124
100
116 99 107 105
115
117 99 106 120
80
63 130 105 86
试估计该学校平均每个学生每周的零花钱,并给出置信 度为95%的置信区间。
11 22 17 26 16 27
12 33 17 40 24 17
13 15 10 4 6 8
14 17 18 12 11 10
15 13 9 5 7 9
16 18 23 13 15 8
17 33 5 26 30 11
18 26 15 13 17 3
19 7 32 4 6 9
20 15 1 1 6 5
2 ( Y Y ) i N
Y
N 1
i
Y

2
N 1
5.2 群规模大小相等时的估计
3、 V ( y ) 的样本估计为
1 f 2 1 f v( y ) sb nM n
M n s ( yi y)2 n 1 i 1

整群抽样

整群抽样


(Yij Y )(Yik Y )
i 1 j k
NM ( M 1) / 2 2 (Yij Y )(Yik Y )
i 1 j k N M
MN

( M 1)( NM 1) S 2
M ( N 1) Sb2 ( NM 1) S 2 c ( M 1)( NM 1) S 2
ˆ) 1 f ˆ V (Y V (Y ) 2 M0 nM 2
(Y Y )
i 1 i
N
2
N 1
ˆ) 1 f ˆ v(Y v(Y ) 2 M0 nM 2
(y
i 1
n
i
y )2
n 1
按简单随机抽样抽群,采用比率估计量
对群进行简单随机抽样,总体均值的比估计量为
ˆ YR
1 Y N
Y
j 1
N
i
为总体的“群和平均”。 为样本的“群和平均”。
1 y y yi n j 1
Y 1 N M Y Yij 为总体均值。 M NM i 1 j 1 y 1 n M y yij 为样本均值。 M nM i 1 j 1
N M 1 S (Yij Y )2 NM 1 i 1 j 1 2
ˆ 是无偏估计,其方差为 Y HH
N N Y M 1 2 2 i 0 ˆ ) Z ( Y ) V (Y M ( Y Y ) i i HH i n i 1 Zi n i 1 V (Yˆ ) 的一个无偏估计为
HH
v(YHH )
ˆ
n yi ˆ 2 M 02 n 1 2 ( Y ) ( y y ) i HH n(n 1) i 1 zi n(n 1) i 1

第四章整群抽样

第四章整群抽样

1 (M 1)c
上面结果意味着:按同样的样本量(以次级单元计) 整群抽样的方差约为简单随机抽样的方差的 1 (M 1)c 倍。换句话说,为了获得同样的精度,整群抽样的样本 量必须是简单随机抽样的样本量的 1 (M 1)c 倍。
20
第21页/共49页
群内相关系数
NM
2
(Yij Y )(Yik Y )
• Def.1 一般地说,如果总体中所有较小的基本单元可 以以某种形式组成数量较少但规模较大的单元;或反 过来说,每个“大”单元都由若干“小”单元组成, 称这些 “大”单元为初级(抽样)单元(primary sampling unit),“小”单元为次级(抽样)单元 (secondary sampling unit).
Deff = (所考虑抽样设计估计量的方差)/(相同样 本量下简单随机抽样估计量的方差)
18
第19页/共49页
设计效应值愈大,表明它的效率愈低。若deff>1,表明
所考虑的抽样设计的效率不如简单随机抽样;若deff<1,
表明该抽样设计的效率比简单随机抽样高。
在整群抽样中,我们在前面已经指出:如何划分群以
27
第28页/共49页
(3) 若 令为简单随机抽样的样本量 则
nsrs
即可达到整群抽样96户样本量相同的估计精度
Mn nsrs deff
812 20(户) 4.7
28
第29页/共49页
群规模不相等的整群抽样
一、等概抽样,简单估计 二、等概抽样,加权估计 三、等概抽样,比率估计 四、例子
29
8 230,205,187,176,212,253,189,240 211.50 27.48
9 274,208,195,307,264,258,210,309 253.13 44.52
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
M
上式中的分子为:
பைடு நூலகம்
(Y
N
ij
Y )(Yik Y )
NM ( M 1) 2
第二节 群规模大小相等时的估计
上式中的分母为:
2 ( Y Y ) ij N M
NM
故 又可写为:
NM 1 2 S MN

2 (Yij Y )(Yik Y ) ( NM 1)(M 1) S 2
(1)
第二节 群规模大小相等时的估计
2.
估计量
性质1:
y 的性质
y 是 Y 的无偏估计,即
E y Y
因为是按简单随机方法抽取群,所以样本群均值 总体群均值 Y 的无偏估计,因而
y是
Ey Y
M
Y
第二节 群规模大小相等时的估计
性质2
y 的方差为
1 f V ( y) n N 1 1 f 2 Sb nM
从方法上看,整群抽样可以看成单阶段抽样向多阶段抽样 过渡的桥梁。如果抽出群后,对其中所有的次级单元进 行调查,称为单阶段整群抽样;如果抽出群后,在次级 单元中进一步抽取子样本,称为两阶段抽样;如果进一 步在两阶段抽样的子样本中按更低一级的单元再抽子样 本,称为三阶段抽样;如此类推,等等。如果最后一个 阶段所抽出的单元是组成总体的基本单元,一般称为多 阶段抽样,将在后面章节讨论;如果最后一个阶段所抽 出的单元是群(基本单元的集合),可将其称为多阶段 整群抽样,也即是多阶段抽样中的一种情形。本章仅介 绍单阶段整群抽样。
Y Yi N y yi n
n
N
第二节 群规模大小相等时的估计
Y
: 总体中的个体均值
(各群 M i M)
Y Y
M
y
: 样本中的个体均值
y y
M
第二节 群规模大小相等时的估计
S
2:
总体方差
N M 1 2 S Yij Y M t 1 i j
N M 2 2 Sb (Yi Y ) N 1 i
第一节 概述
一 整群抽样及特点
1. 什么是整群抽样 将总体划分为若干群,以群为抽样单元,对群中 的所有单位进行调查。
如果总体中所有的基本单元可以依据存在的某种联系组成规模较大的单 元集合,则在抽样时可以将这种单元集合称为“初级抽样单元” (primary sampling unit),而基本单元称为“次级(抽样)单元” (secondary sampling unit)。从总体中随机抽取一部分初级抽样单 元,并对中选的初级单元中的所有次级单元都进行调查的抽样方法 称为整群抽样(cluster sampling)。
278.50
182.75 211.50
63.87
38.77 27.48
9
10 11
274,208,195,307,264,258,210,309
232,187,150,182,175,212,169,222 342,294,267,309,258,198,244,286
253.13
191.13 274.75
44.52
28.29 43.70
12
228,294,182,312,267,254,232,298
258.38
43.52
第二节 群规模大小相等时的估计
解:
已知N=510,n=12,M=8,f=n/N=0.0235

1 n 188 180.5 258.38 y yi 218.38(元) n i 1 12
的取值范围是 1 ,1 M 1
例一
i
1 2 3 4 5
yij
240,187,162,185,206,197,154,173 210,192,184,148,186,175,169,180 149,168,145,130,170,144,125,167 202,187,166,232,205,263,198,210 210,285,308,198,264,275,183,231
第一节 概述
二 群的划分
大致可分为两类
1. 2.
根据行政或地域形成的群体(目的是为了方便调
查,节省费用)
调查人员人为确定的(使得调查费用和抽样误差达
到最优)
分群的原则可用方差分析原理说明:
群内差异尽可能大,群间差异尽可能小
极端情况下,当各群基本单元的分布完全相同, 即群间不存在任何差异时,那么只需抽取一 个群进行调查就能充分满足抽样估计精确度 的要求,整群抽样的效率就很高。这和分层 抽样时分层的原则恰好相反。由此看来,整 群抽样和分层抽样是针对不同总体结构而提 出的两种不同抽样方式。对于一些复杂结构 的总体,可以把两种抽样方式结合起来,以 发挥各自的特点。
如果总体中各群的基本单元数目相等,称为群规 模相等或群大小相等。例如对以包装箱生产 的产品进行抽检,如果把每箱看作一个群, 则每箱内的产品数量是相同的。如果总体中 各个群的基本单元数目不等,称为群规模不 等,例如对某辖区内住户进行调查,将辖区 内的每个街道看作群,则每个街道的居住人 数是不相等的。本章在说明整群抽样估计量 及其特性时,将分别对群规模相等和不等这 两种情况进行讨论。
2.整群抽样的特点
1) 2) 3) 4) 5)
抽样框编制得以简化 实施调查便利,节省费用 估计效率较低(群内单元有趋同性) 对某些特殊结构的总体却有好的估计效果 采用整群抽样时,通常无法提前知道调查的总 样本量,因为在进行调查前,通常不知道一个 群内到底有多少个单元。
整群抽样有特殊的用途。有些现象的研究 必须以一定范围所包括的基本单元为群 体,进行整群抽样,才能满足调查的目 的。如人口普查后的复查,要想对普查 的数据质量进行评估,只有采用整群抽 样对一定地理区域内的人口群体作全面 调查才行。类似地诸如人口出生率、流 动率等调查都需要采用整群抽样。


2
S : 总体群间方差
2 : 总体群内方差 Sw
2 b
N M 1 2 2 Yij Yi Sw N ( M 1) i j
第二节 群规模大小相等时的估计
s : 样本方差
2
n M 1 2 2 yij y s nM 1
n M 2 2 sb ( yi y ) n 1 i
有群规模相等与不相等两种情况
第二节 群规模大小相等时的估计
一 符号说明
N: 总体群数 n: 样本群数 Yij: 总体第i群的第j单位数值 yij: 样本中第i群的第j单位数值 Mi: 第i群规模(单位个数) 本节中,M1= M2 =……=MN =M
第二节 群规模大小相等时的估计
Mt: 总体单位总数
Y Y
N i
2
第二节 群规模大小相等时的估计
性质3 V ( y )的样本估计为
1 f 2 v( y ) sb nM
2 2 s 因为 b 是的 Sb 无偏估计,所以v( y )是 V ( y )的
无偏估计
第二节 群规模大小相等时的估计
总体总值 Y NMY
据此,可直接推出其估计量及相应的方差
2
Y Y
N i
第二节 群规模大小相等时的估计
简单随机抽样的方差公式为
1 f 2 Vsrs ( y ) S nM
由此可计算出等群抽样的设计效应为
V ( y) deff 1 (M 1) Vsrs ( y )
表明当样本量相同时,群规模相等的整群抽样估计量 y 的方差是简 单随机抽样方差的1 (M 1) 倍,也即为了获得相同的估计精度, 整群抽样的样本量是简单随机抽样的1 (M 1) 倍。
于是 Y的置信度为95%的置信区间为 也即 218.38 1.96(12.013)
194.83元, 241.93元
第二节 群规模大小相等时的估计
例2 由例1数据,计算以楼层为群的群内相关 系数与设计效应
2 s .18 解:由前已算出样本群间方差 b 14186 而群内方差为 n M 1 2 2 sw ( y y ) ij i n( M 1) i 1 j 1
例如,对某居民小区的户均消费情况进行调查,可以采用两种不同的抽 样方法,一种是将住户看作抽样的基本单元,采用简单随机抽样对 被选中的住户实施调查;另一种方法是将小区内每幢居民楼看成一 个群,随机抽取一定数量的居民楼,然后对楼内的所有住户进行调 查,这就是整群抽样。同样道理,如果调查是人均消费情况,此时 人是基本单元,按照前述的简单随机原则先抽户,并对入选户的所 有成员进行调查,此时也是整群抽样。 因此,整群抽样中的群(cluster)指的就是初级抽样单元,是由若干个 基本单元按照一定的形式联系起来所组成的集合体。整群抽样与前 面介绍的抽样方法的不同点在于抽样单元是群,而不是基本单元。 也就是调查时将总体划分为若干群,然后以群为抽样单元,从总体 中随机抽取一部分群,对中选群的所有基本单元进行调查。
2 ( 188 218 . 38 ) M 8 2 2 sb ( yi y ) 14186 .18 2 n 1 i 1 12 1 (258.38 218.38) n
第二节 群规模大小相等时的估计
1 f 2 1 0.0235 v( y ) sb 14186 .18 144.3 nM 12 8 s( y ) v( y ) 144.3 12.013
ˆ NMy Y ˆ ) V ( NMy ) N 2 M 2V ( y ) V (Y
2 2 ˆ v(Y ) N M v( y )
第二节 群规模大小相等时的估计
三 整群抽样效率分析 群内相关系数 表达式为:

E (Yij Y )(Yik Y ) E (Yij Y ) 2
Y
N
相关文档
最新文档