整群抽样[1]
(抽样检验)第七章整群抽样最全版

(抽样检验)第七章整群抽样第七章整群抽样第壹节整群抽样概述壹、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取壹部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元能够分成多级,则能够对前几级单元采用多阶抽样,而在最后壹阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的俩个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中且不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括俩步:首先,总体被分为群;然后,在总体中抽取群的样本且访问群中的所有单元。
如果总体单元是自然分成组或群的,创建壹个这种关于群的抽样框且对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而能够创建地域框。
群的抽取能够采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样壹样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有俩个问题:壹是如何定义群,即当群且非是壹个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取壹部分群进行调查,且在抽中的群内作全面调查。
(抽样检验)第七章整群抽样

第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:- 抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;- 从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
因此,群间差异的大小直接影响到抽样误差的大小,而群内差异的大小则不影响抽样误差。
整群抽样

上式中的分子为:
பைடு நூலகம்
(Y
N
ij
Y )(Yik Y )
NM ( M 1) 2
第二节 群规模大小相等时的估计
上式中的分母为:
2 ( Y Y ) ij N M
NM
故 又可写为:
NM 1 2 S MN
2 (Yij Y )(Yik Y ) ( NM 1)(M 1) S 2
(1)
第二节 群规模大小相等时的估计
2.
估计量
性质1:
y 的性质
y 是 Y 的无偏估计,即
E y Y
因为是按简单随机方法抽取群,所以样本群均值 总体群均值 Y 的无偏估计,因而
y是
Ey Y
M
Y
第二节 群规模大小相等时的估计
性质2
y 的方差为
1 f V ( y) n N 1 1 f 2 Sb nM
从方法上看,整群抽样可以看成单阶段抽样向多阶段抽样 过渡的桥梁。如果抽出群后,对其中所有的次级单元进 行调查,称为单阶段整群抽样;如果抽出群后,在次级 单元中进一步抽取子样本,称为两阶段抽样;如果进一 步在两阶段抽样的子样本中按更低一级的单元再抽子样 本,称为三阶段抽样;如此类推,等等。如果最后一个 阶段所抽出的单元是组成总体的基本单元,一般称为多 阶段抽样,将在后面章节讨论;如果最后一个阶段所抽 出的单元是群(基本单元的集合),可将其称为多阶段 整群抽样,也即是多阶段抽样中的一种情形。本章仅介 绍单阶段整群抽样。
Y Yi N y yi n
n
N
第二节 群规模大小相等时的估计
Y
: 总体中的个体均值
(各群 M i M)
06第六章 整群抽样

n
n
M
N M 1 S ( yij Y ) 2 为总体方差; NM 1 i 1 j 1 2
n M 1 s ( yij y ) 2 nM 1 i 1 j 1 2
2 b
为样本方差; 为总体群间方差;
M N 1 N 2 S (Yi Y ) N 1 (Yi Y ) 2 N 1 i 1 i 1
第一节 第二节 第三节 第四节
整群抽样概述 等概率整群抽样的情形 不等概率整群抽样的情形 设计效应和样本容量的确定
第一节 整群抽样概述
一、整群抽样的概念 整群抽样是先将总体各单元划分成若干群(组),然后以 群为单位,从中随机抽取一部分群,对中选群内的所有单 元进行全面调查。确切地说,这种抽样组织形式应称为单 级整群抽样。 如果总体中的单元可以分成多级,则可以对前几级单元采 用多阶抽样(详见下章),而在最后一阶中对该阶抽样单 元所包含的全部个体(最基本单元)进行调查,这种抽样 称作多级整群抽样。本章只讨论单级整群抽样。 设总体被划分为N群,第i群含有Mi个次级单元,全部总 体次级抽样单元数记为M 0,即 M 0 M i 。当诸Mi都相等 时,称为等群;否则,称为不等群。
M n 1 n 2 (Yi y ) (Yi y ) 2 s n 1 i 1 n 1 i 1
2 b
为样本群间方差;
N M 1 S ( yij Yi ) 2 N ( M 1) i 1 j 1 2
为总体平均群内方差; 为样本平均群内方差;
二、分群的原则 尽量扩大群内差异,而缩小群间差异。 三、整群抽样的特点 1.在大规模抽样调查中,常常没有或很难编制出包括总 体所有次级单元在内的抽样框,而整群抽样则不需要编制 庞大的抽样框。 2.在样本单元数相同的条件下,整群抽样与简单随机抽 样相比,样本单元的分布相对较集中,虽然样本的代表性 较差,但调查组织实施过程更加便利,同时还可以大大地 节省调查费用。因此,实际工作中,在权衡费用和精度之 后,有时宁可适当增加一些样本单元数,也采用整群抽样 方法。 3.整群抽样的随机性体现在群与群间不重叠,也无遗漏, 群的抽选按概率确定。
第四章整群抽样

1 (M 1)c
上面结果意味着:按同样的样本量(以次级单元计) 整群抽样的方差约为简单随机抽样的方差的 1 (M 1)c 倍。换句话说,为了获得同样的精度,整群抽样的样本 量必须是简单随机抽样的样本量的 1 (M 1)c 倍。
20
第21页/共49页
群内相关系数
NM
2
(Yij Y )(Yik Y )
• Def.1 一般地说,如果总体中所有较小的基本单元可 以以某种形式组成数量较少但规模较大的单元;或反 过来说,每个“大”单元都由若干“小”单元组成, 称这些 “大”单元为初级(抽样)单元(primary sampling unit),“小”单元为次级(抽样)单元 (secondary sampling unit).
Deff = (所考虑抽样设计估计量的方差)/(相同样 本量下简单随机抽样估计量的方差)
18
第19页/共49页
设计效应值愈大,表明它的效率愈低。若deff>1,表明
所考虑的抽样设计的效率不如简单随机抽样;若deff<1,
表明该抽样设计的效率比简单随机抽样高。
在整群抽样中,我们在前面已经指出:如何划分群以
27
第28页/共49页
(3) 若 令为简单随机抽样的样本量 则
nsrs
即可达到整群抽样96户样本量相同的估计精度
Mn nsrs deff
812 20(户) 4.7
28
第29页/共49页
群规模不相等的整群抽样
一、等概抽样,简单估计 二、等概抽样,加权估计 三、等概抽样,比率估计 四、例子
29
8 230,205,187,176,212,253,189,240 211.50 27.48
9 274,208,195,307,264,258,210,309 253.13 44.52
第六章 整群抽样

n
n 1
➢比估计
n
N
YˆR M 0Yˆ M 0
yi
i 1 n
mi
,V (YˆR )
N 2 (1
i
Y
)2
N 1
i 1
v(YˆR )
N 2 (1 n
f
)
1 n n 1 i1
yi2
2
Y R
n i 1
mi2
2Y
R
n i 1
mi
yi
例4:从共有790个单位的某系统中按简单 随机抽样抽取n=20个单位,这些单位的职
1
n
1
n i 1
ai2
p2
n i 1
mi2
2p
n i 1
ai mi
M
第四节 群大小不等的一般情形
若群大小Mi 相差不多,以平均群大小M 代替M, 仍可按群大小相等处理;若Mi 相差较大,有两 种处理方法。
一、记号
➢ 总体第i群第j个小单位指标值 Yij,i=1,2,…,N; j=1,2,…, Mi,Mi 是群的大小。
费额的户平均值 Y ,并给出其95%的置信区
间(P213)。
12个楼层96户居民人均月食品消费额资料
i
yij
1 240, 187, 162, 185, 206, 197, 154, 173
2 210, 192, 184, 148, 186, 175, 169, 180
3 149, 168, 145, 130, 170, 144, 125, 167
yi
yi M
➢总体平均群和 Y Yi N
➢样本平均群和 y yi n
➢总体均值
NM
Y Yij MN Y M i1 j1
(标准抽样检验)第七章整群抽样

(标准抽样检验)第七章整群抽样第七章整群抽样第一节整群抽样概述一、整群抽样的概念整群抽样是先将总体各单元划分成若干群(组),然后以群为单位,从中随机抽取一部分群,对中选群内的所有单元进行全面调查。
确切地说,这种抽样组织形式应称为单级整群抽样。
如果总体中的单元可以分成多级,则可以对前几级单元采用多阶抽样,而在最后一阶中对该阶抽样单元所包含的全部个体(最基本单元)进行调查,这种抽样称作多级整群抽样。
本章只讨论单级整群抽样。
设总体被划分为N群,第i群含有Mi个次级单元,全部总体次级抽样单元数记为M0,即M0=∑M i。
当诸Mi都相等时,称为等群;否则,称为不等群。
采用整群抽样的两个理由:-抽选群能大大降低数据收集的费用,当总体的分布比较广且调查采用面访时更是如此;-从总体中直接抽选个体在实际中并不总是可行的(没有关于个体的抽样框);有时,抽选单元组成群体组更简便易行(如整个住户)。
整群抽样包括两步:首先,总体被分为群;然后,在总体中抽取群的样本并访问群中的所有单元。
如果总体单元是自然分成组或群的,创建一个这种关于群的抽样框并对它们进行抽样比创建总体中所有单元的名录框更为容易。
或者,无法得到关于总体中所有单元的名录框,但却有这些单元分布地域的地图,因而可以创建地域框。
群的抽取可以采用简单随机抽样、系统抽样或PPS抽样等各种不同的方法。
二、群的划分问题整群抽样策略的统计效率取决于群内单元的相似程度有多大,每个群中有多少单元,及抽中群的数量。
同分层抽样一样,整群抽样的前提是先要对总体进行分群。
关于群的划分,有两个问题:一是如何定义群,即当群并非是一个自然形成的单位时,确定每个群的组成;二是如何确定群的规模即群的大小。
分层抽样是在各层都进行随机抽样,“层是缩小了的总体”,抽样单元仍然是总体基本单元。
这决定了分层的原则是:尽量缩小层内差异,而扩大层间差异。
而整群抽样只是在各群之间抽取一部分群进行调查,并在抽中的群内作全面调查。
抽样调查方法与技术:整群抽样

需要估计: Y(按小单元平均的总体均值)、 Y(总体总值)
二、估计量及其性质
由于 及YY仅相差一个常数NM,故仅需讨论
的估Y 计量及其性质即可,Y的估计量及其性质 很容易由 的结Y果得到。
(一)总体均值( 按Y小单元计算的总体均 值)
1、
E(y) Y
y是Y的无偏估计
即Y = y= y nM
1 nM
(按小单元计算的总体群间方差)(定义)
(13)
Si2
1 M 1
M
(Yi j
j 1
Yi )2
:第i个群的总体
群内方差。 (当然按小单元计)
一、简单随机抽样(等概率抽样)下记号
(13) Sw2
1 N
N
Si2
i 1
1 N (M 1)
ห้องสมุดไป่ตู้
N i 1
M
(Yi j Yi )2 :总体
j 1
群内方差(已经是个平均数了)。(定义)
则: (1)N:总体的群数为N i=1,2,3,…,N (2)M:每个群内含有M个调查单位(小单元)
j=1,2,3,…,M (3)NM:全部总体单位(小单元)总数 (4)n:从N群中随机抽n群
第二节 群大小相等的整群抽样
一、简单随机抽样(等概率抽样)下记号
(5)f=n/N
群抽样比
=nM/NM 调查单位抽样比
自己去证明以下三者之间的关系:
S(2 总方差)、S(b2 总体群间方差)、S(w2 总体群内方差)
对于n群样本的记号
①yij : 样本中第i群第j个单位的标志值 (i 1, 2,...,n; j 1, 2,..., M )
M
②yi yij j 1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
习题七一、 单选题1.整群抽样中的群的划分标准为( A )。
A.群的划分尽可能使群间的差异小,群内的差异大B.群的划分尽可能使群间的差异大,群内的差异小C.群的划分尽可能使群间的差异大,群内的差异大D.群的划分尽可能使群间的差异小,群内的差异小 2.整群抽样的一个主要特点是( C )。
A.方便B.经济C.可以使用简单的抽样框D.特定场合中具有较高的精度 3.群规模大小相等时,总体均值Y 的简单估计量为( A )。
A.∑∑===n i Mj ijynM Y 111ˆB.()∑∑==-=n i Mj ij y M n Y 1111ˆ C.∑∑===n i Mj ij y n Y 111ˆD.∑∑===n i Mj ijyNY 111ˆ4.下面关于群内相关系数的取值说法错误的是(D )。
A.若群内次级或基本单元变量值都相等则20S ω=,此时ρ取最大值1B.若群内方差与总体方差相等,则0≈ρ,此时表示分群是完全随机的C.若群内方差大于总体方差时,则ρ取负值D.若20b S =时,ρ达到极小值,此时11-=M ρ5.整群抽样中,对比例估计说法正确的是( B )。
A.群规模相等时,总体比例P 的估计可以为:11ni i p n A ==∑B.群规模不等时,总体比例P 的估计可以为:11()/()n niii i p A M===∑∑C.群规模相等时,总体比例P 的方差估计为:211()(1)()n i v p in n p P ==--∑D.群规模不等时,总体比例P 的方差估计为:2121()1()ni i i v p n n p A M M==•--∑二、多选题1.下面关于整群抽样的说法,有哪些是正确的?(ABC DE ) A.通常情况下抽样误差比较大B.整群抽样可以看作为多阶段抽样的特殊情形,即最后一阶抽样是100%的抽样C.调查相对比较集中,实施便利,节省费用D.整群抽样的方差约为简单随机抽样的方差的1(1)cM ρ+-倍E.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍2.关于整群抽样(群规模相等)的设计效应,下面说法正确的有(ABCD ) A.()1(1)()c srsV y deff M y V ρ=≈+-B.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)cM ρ+-倍C.群内相关系数的估计值为2222(1)ˆb cbM s s ss ωωρ-=+-D.要提高整群抽样估计效率,可通过增大群内单元的差异实现E.整群抽样的精度取决于群内相关系数,群内相关系数越大,则估计量的精度越高 3.关于群规模不等时,可以采用的估计量形式有( B CD )。
A.11111(/)in n i i ij i i j M y n n y y M =====∑∑∑B.0111nnii i i iiy n n y y M z M====∑∑C.11ˆnii n Rii yYM===∑∑D.10ˆˆ1nii Y Y Mn y M ===∑ E.11nii y n y ==∑三、名次解释群内相关系数 四、计算题1. 设某灯泡厂每天生产一批灯泡共200盒,每盒装灯泡6只,今随机抽取8盒,检验其点燃小时数的资料,如下表所列。
(1)计算样本平均点燃时数,并分别按整盒和按灯泡计算其抽样平均误差,比较其估计精度。
(2)如果点燃小时数不到1000的为不良品,计算其样本不良率,并分别按整盒和按灯泡计算其抽样方差,比较何者较优。
2. 某大学为了估计全校学生在1991年夏天对安徽、江苏灾区的捐款总数,从全校124个班随机的抽取10个班级进行调查,数据如下表所示,并假定这10个班的400名学生中分别捐4.5元,5.0元,5.5元,6.0元和6.5元的都各有80名。
10个班级的捐款情况 单位:元(1)求该校学生平均捐款数和捐款总数的估计值;(2)计算该校学生捐款总数估计值的抽样方差,以及捐款总数的95%的置信区间。
3. 在一次对某寄宿中学在校生零花钱的调查中,以宿舍作为群进行整群抽样。
每个宿舍有6名学生。
用简单随机抽样在全部315间宿舍中抽取n=8间宿舍、全部48个学生上周每人的零花钱ijy及相关计算数据如下表。
试估计该学校平均每个学生每周的零花钱Y ,并给出其95%的置信区间。
4. 估计上题中以宿舍为群的群内相关系数与设计效应。
5. 带锯厂负责对他的用户进行修理,其修理费用每季结算一次。
该厂共有96家用户,各拥有不同带锯数,现采用等概简单随机方法抽取20家为样本,资料如下:(2)根据上述资料估计96家用户的修理费用及置信区间(а=0.05)。
(3)若已知这96家用户有710条带锯,利用这一补充信息估计总的修理费用和置信区间。
(4)欲估计下一季度的每带锯平均管理费用,绝对误差Δ=2,试问应抽取多少户作样本。
6. 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群试估计平均每户家庭的订报份数及总的订报份数及估计量的方差。
7. 汽车运输公司抽样调查在使用的车辆中不安全轮胎的比例,在175辆车中抽中了25 请估计该运输公司的汽车中不安全轮胎的比例及估计量的方差。
8. 某市建筑行业集团共有48个单元,有载货汽车186辆。
按每个单元的车辆拥有量成比例的概率进行放回的PPS 抽样,共抽取10次,对抽中单元的所有车辆调查季度运量(单位:吨)。
样本数如下(其中有一单元被抽中2次,即i=3,7)。
试估计全集团的季度总运量及95%的置信区间。
9. 对某居民小区居民进行电话拥有情况的调查,以每个楼层(相当于居民小组)为群进行整群抽样,每个楼层都有M=8个住户。
用简单随机抽样在全部N=510个楼层中抽取n=12个楼层。
下表是12个样本楼层装有电话的住户数i a 及在楼层8户中所占的比例i p 的资料,10. 若欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合适,如果不合适你认为采用什么抽样方式好。
(1)少数民族的居住比较集中;(2)少数民族比较均匀得分布在各街道;(3)少数民族分散在各街道但比重不同。
11. 某一社会研究机构,研究南方某一城镇的社会民俗等情况。
设该镇共有415个居民小组,现从中按简单随机抽样抽取25个居民小组作样本,取得了以下一些数据。
(1)估计该地区户平均收入及其标准差。
(2)估计三代人的户占总户数的比例,并计算其标准差;(3)若以上两项估计的相对标准差均控制在5%,应抽取多少居民小组(群)作样本。
12. 一带锯厂对它的用户负责进行维修,按季定期进行结算,但缺乏每一带锯的平均修理费用,该厂共有96家用户,各拥有不同的带锯数。
现用简单随机抽样抽取20家作样本,要求:(1)估计每一带锯的平均修理费用及其抽样标准误差;(2)在未知总体带锯数的条件下估计96家用户总的修理费用及估计标准误;(3) 若已知这96家用户共有740条带锯,利用这一补充信息估计总的修理费用和估计的标准误;(4) 若欲估计下一季度每一带锯饿平均修理费用,允许最大绝对误差为d=2,置信度为95%,应抽取多少家用作样本。
13. 汽车运输公司抽样检查在使用的车辆中不安全轮胎的比例,在175辆车中抽取了25辆,14. 某工业系统准备一项改革措施,对全系统的人进行一项民意测验,该系统共有87个单位,现采用整群抽样,用简单随机抽取15个单位作为样本,读抽中的单位作全面征求意见,其结果如下:要求:(1) 估计该系统同意这一改革人数的比例,并计算估计标准误;(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的绝对误差不超过4%,置信度为95%,则应抽多少个单位作样本。
15. 在一个估计总体比例问题的抽样设计中,首先作了试调查,研究群的大小与群间方假设费用函数M n n C 7.01.21000++=,确定估计P 时在固定费用为10000元的条件下最优的M 和n 。
16. 假设整群抽样的样本群数为n ,每个群有M 个单元,群间方差为2b S ,群内方差为2w S 试对整群抽样与相同样本量的简单随机抽样的效率的比较进行讨论(fpc 可忽略不计)。
17. 在一次农村调查中,抽样单元是包含M 个农场的群,当抽取n 个群作样本时,其费用是:n tMn C 604+=,其中t 是调查一个农场所花的时间(按小时计算)。
如果这一 样本均值的方差是[]c M MnS ρ)1(12-+,fpc 忽略不计。
如果M 在1—10之间,c ρ=0.1,试问(1)t=0.5,(2)t=2小时,单元多大能得到最精确的结果?你这样解释两个结果的差别。
五、简答题1. 什么是整群抽样,整群抽样有哪几个步骤?2. 整群抽样有哪些优点?3. 整群抽样与多阶段抽样及分层抽样的区别?4. 整群抽样与分层抽样的区别;5. 整群抽样群大小的计量方法;6. 整群抽样的设计效应。
六、设计题欲调查城市的猪肉人均消费量,讨论下列情况下采用街道作为群的整群抽样是否合适,如果不合适,你认为采用什么抽样方式好。
(1)少数民族的居住比较集中;(2)少数民族比较均匀地分布在各条街道;(3)少数民族分散在各街道,但比重不同。