多阶段抽样PPT课件

合集下载

第八章 二阶及多阶抽样课件

第八章 二阶及多阶抽样课件

n
M
i 2V
( yi)
V1
N
i1
n
E
1
N
2
i1
n2
V1
N
n
Y
i
i1
n
E
1
N
2
n i1
M
2 i
1 f2i mi
S
2 2i
n2
PPT学习交流
15
(2)比估计:
N
Yi
Y M0
i1 N
, 可用比估计
Mi
i1
,以
M
为辅助变量:
i
n
Yˆi
YˆR M 0
i1 n
Mi
PPT学习交流
2
性质l 对于两阶抽样,有
(1)E(ˆ)E1E2(ˆ)
(2 )V (ˆ) V 1 E 2 (ˆ) E 1 V 2 (ˆ)
式中,E2,V2为在固定初级单元时对第二阶抽样 求均值和方差;E1,V1为对第一阶抽样求均值和 方差。
PPT学习交流
3
8.2 初级单元大小相等时的二阶抽样
9.2.1总体均值的估计量: 假定总体由N个初级单元组成,每个初级单元都含有M个次级单元。 从N个初级单元中按简单随机抽样抽取n个初级单元, 在每个被抽中的初级单元中按简单随机抽样抽取m个次级单元。
142 5[1 ( 51.8 4)2(16.15.8 4)2(1 61.8 4)2(1 31.8 4)2(1.5 31.8 4)2] 5(51)
97.6 72 65
PPT学习交流
21
估计量的标准差为 s(Y ˆPP ) S v(Y ˆPP ) S 97.672 6 9 5.8 88 因此,小区居民数为2146人,在置信度为 95%时,估计的相对误差为

多阶段抽样(PPT69页)

多阶段抽样(PPT69页)

2.比率估计量 为了减小方差,可以考虑将初级单元的大小
Mi作为辅助变量,采用比率估计量对总体总 和进行估计。 对总体总和的比率估计量:
这个比率估计量是有偏的,但随着样本量的增加,其偏倚将趋于0。
• 其近似均方误差为:
• 因为 的差异一般不会很大,因此,当Mi相
差很大时,
要比无偏估计量 的方差
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
• 估计量p的方差为: V(p)的无偏估计为:
类似于前面总体方差的表达形式,有:
• 【例8.2】欲调查某个新小区居民户家庭装潢聘请专业装潢 公司的比例。在15个单元中随机抽取了5个单元,在这5个 单元中分别随机抽取了4户居民并进行了调查,对这20户 调查结果如下:
样本单元 一栋A座 二栋C座 三栋C座 四栋C座
样本企业
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
置信区间:
三、对总体的比例的估计
总体中具有所研究特征的二级单元占全体二级 单元数的比例为:
式中:Ai为第i个初级单元中具有所研究特征的二级单元数。 对总体比例P的估计是:
式中:ai为第i个样本初级单元中具有所研究特征的二级单元数 。
• 性质3: 对于二阶抽样,如果两个阶段都是简单 随机抽样,则有

第九章 多阶段抽样

第九章 多阶段抽样

第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念1、单阶抽样:从总体中通过一次抽样就能够产生一个完整的样本,这类抽样即为单阶抽样。

前面介绍的几种抽样方式均为单阶抽样。

适合用于总体单元数相对较少的抽样过程。

2、多阶抽样:将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。

当我们面对的总体单元数很庞大,而且分布范围很广时,如果使用前面所学习的单阶抽样方法,不仅工作量大,而且在精度上很难把握,此时如果改用多阶抽样方法,就会避免上述困难,从而达到理想的抽样效果。

3、关于多阶抽样的具体描述:如果我们面对的一阶单元内总体基本单元数相当大,作全面的调查就会比较困难,或者一阶单元内各二阶单元可以给出相近的结果,作全面的调查又无必要。

此时从费用和抽样估计效率考虑,便可以从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对他们作全面调查,我们把这种抽样技术称为两阶抽样。

如果在被抽中的二阶单元中,再抽取部分三阶单元组成样本,并对抽中的三阶单元进行全面的调查,这就是三阶抽样。

类似地,可以定义四阶抽样或更高阶的抽样,通常将两阶以上的抽样称为多阶抽样。

需要指出的是,多阶抽样中,各阶可以采用不同的抽样方法,也可采用同一种抽样方法,要视具体情况和要求而定。

在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相等和不相等的两种情况。

前者无论在样本的抽取还是在指标的估算方面都相对比较简单,然而在抽样实践中却很少有这种情况的存在,但作为基本方法仍然有其实际意义;后种情况在抽样和指标的估算方法上都较为复杂,然而在实际中普遍存在此种情况。

4、两阶抽样与分层抽样和整群抽样的关系:将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。

第8-9章-多阶段抽样和二重抽样

第8-9章-多阶段抽样和二重抽样
2 1 2




ˆ ˆ E E E E
2
2
1
2
E 2 E E 2 V E ˆ ˆ E1 2 ˆ 1 2 1 2

E 2 E E 2 ˆ ˆ V1 E2 E1 2 ˆ 1 2 ˆ ˆ V1 E2 E1 V2
2 S2 V ( y ) S12 m
2 当n=1时, V1 (Yi ) S1
这时, 若以n个
yi 的均值 y 推断 Y
,其方差为
2 2 S1 S2 V ( y) n nm
再考虑fpc,则(1)式成立。
V y 的无偏估计为:
证明:
2 1
E (s ) S
2 2
1 f1 2 f1 1 f 2 2 v y s1 s2 n nm
1 1 n 1 1 E1 M iYi M n i 1 MN
M iYi Y i 1
N
估计量的方差为:
1 f1 M i 1 V y M Yi Y nNM 2 nN i 1 i 1
N N

二.按不等概抽初级单元
1.按PPS抽取初级单元 N 第i个单元被选中概率 Z i ,( Z i 1 ) i 1 以总量估计为例,利用Hansen-Hurwitz估计量 ˆ Y的估计: 1 n Y 1 n M y
ˆ YHH
z n
i 1
i

i
n
i 1
i
i
zi
ˆ 可以证明 YHH是Y的无偏估计

第4章-等概率整群抽样和多阶段抽样

第4章-等概率整群抽样和多阶段抽样

4.1.1 定义
整群抽样(cluster sampling)是将总体 划分为若干群,然后以群(cluster)为抽 样单元,从总体中随机抽取一部分群,对 被选群内的所有单元进行调查的一种抽样 技术。
2024/7/17
3

欲估计某高校大学生拥有手机数量,大学共有40000 名学生,10000个宿舍(每个宿舍4名学生)。
V (ˆ) E1 E2 (ˆ)2 E1 V2 (ˆ ) E1E2 (ˆ)2 V1 E2 (ˆ) E1 V2 (ˆ )
4.3.3 等概率两阶段抽样的符号说明
表4-5
4.3.4 初级单元(PSU)规模相等的 两阶段抽样
定理4.5 对于初级单元规模相等的两阶段抽样 ,如果两个阶段都是简单随机抽样,且对每个 初级单元,第二阶抽样是相互独立进行的,则 对总体均值 Y 的无偏估计为:
定理 4.1:y 是 Y 的无偏估计,即
Ey Y
定理 4.2: y 的方差为:
V ( y) 1 f n
1N N 1 i1
Yi Y
2
1 f nM
Sb2
定理 4.3:V ( y) 的样本估计为:
v( y) 1 f nM
sb2
Yˆ NMy V (Yˆ) V (NMy) N 2M 2V ( y) v(Yˆ) N 2M 2v( y)
(NM 1)(M 1)S 2
用简单随机抽样方法抽取n个群,每个群内的M个
单元全部进入样本,则等群抽样均值估计量 y 的方
差可用群内相关系数近似表示
N
2
V (y)
1 V(y) 1 f
Yi Y
i 1
M2
nM 2 N 1
1 f n
(NM 1) M 2 (N 1)

第八章 二阶及多阶抽样课件

第八章 二阶及多阶抽样课件

n
M
i 2V
( yi)
V1
N
i1
n
E
1
N
2
i1
n2
V1
N
n
Y
i
i1
n
E
1
N
2
n i1
M
2 i
1 f2i mi
S
2 2i
n2
PPT学习交流
15
(2)比估计:
N
Yi
Y M0
i1 N
, 可用比估计
Mi
i1
,以
M
为辅助变量:
i
n
Yˆi
7
(2)V(y)1 nf1S1 21m f2n S2 2
证明:
V
(
y
)
V1
E
2
(
1 n
n i1
y
i
)
1
E
1
V
2
n
n i1
yi
V
1
1 n
n i1
Yi
E
1
1 n
2
n 1 f2 i1 m

M
( Y ij
Yi)2
i1
M 1
1 f1 n
S
2 1
1
f2 nm
E
1
1 n
m
(yijyi)2
j1
PPT学习交流
6
(1) y是Y 的无偏估计量;
证明: E ( y ) E 1 E 2 ( y )
nm
y ij
n
yi
E
1
E
2
(
i1 j1
nm

二阶与多阶抽样抽样调查理论与方法ppt课件

二阶与多阶抽样抽样调查理论与方法ppt课件

v(yst)h k 1W h 2(1 n h f1hs1 2 hf1h n (1 h m h f2h)s2 2 h) (9.12)
其中
f1h
N nhh、f2h
mh Mh
分别为第
h
层中的两个抽样比。
精选ppt课件
16
S
2 1
h
和S
2 2
h是第
h
层中的群间和群内方差,s
2 1
h

s
2 2
h是第
h
层中
(9.9)
nh m h
y hij而yh 源自i1 j1nhm h
(9.10)
由于各层的抽样相互独立,而由二阶抽样的有关讨论, y h 的
方差及其方差估计是已知的,因此:
V ar(yst)h k 1W h 2(1 n h f1hS 1 2 h1 n h m f2 h hS 2 2 h)
(9.11)
y
2 ij
j 1
11280.25
yi 25.02
s
2 2
i
135.02
2 408.30 12115.99
27.22
71.58
3 323.40 8752.76
21.56
127.16
4 502.50 17833.75
33.50
71.43
5 234.00 3953.00
15.60
21.61
6 387.75 11302.50
(y 1 .9 6 v(y),y 1 .9 6 v(y))
精选ppt课件
(9.1) (9.2)
7
例9.1:新华书店某柜台上月共用去发票70本,每本100张, 现随机从中抽出10本,每本随机抽出15张发票,得到数据 如下表:给出上月柜台营业总额的估计及其方差。

抽样调查-第8节多阶段抽样

抽样调查-第8节多阶段抽样
式中,E2 ,V2 为在固定初级单元时对第二阶抽样求均 值和方差; E ,V 为对第一阶抽样求均值和方差。
1 1



性质1可以推广到多阶段抽样的情形,例如
对于三阶段抽样,有
E ( ) E1 E2 E3 ( ) V ( ) V1[ E2 E3 ( )] E1{V2 [ E3 ( )]} E1 E2 [V3 ( )]
N n 1 1 按二级单元的平均值: Y Y i , y y i N i 1 n i 1 N 1 2 2 ( Y Y ) , 初级单元间的方差: S1 i N 1 i 1
1 n 2 s ( y y ) i n 1 i 1
2 1
返回
N M 1 2 S ( Y Y ) i ij N ( M 1) i 1 j 1 初级单元内的方差: 2 2 n m 1 2 s ( yij y i ) n(m 1) i 1 j 1 2 2
n
第i个初级单元二级单元间的方差:
mi 1 2 2 1 2 2 s ( y y ) S 2i (Yij Y i ) , 2i ij i mi 1 j 1 M i 1 j 1 Mi

9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 返回
式中,
Qi 1 Pi ; qi 1 pi.
返回
【例8.2】 欲调查某个新小区居民家庭装潢聘请装潢
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Yi M 1jM 1Yij,
yi m 1jm 1yij
总体和样本按二级单元的平均值:
1 N
YNi1Yi,
1n
yni1yi
总体和样本初级单元间的方差:
S12 N11iN 1(Yi Y)2,
4、多阶段抽样可用于散料的抽样.
所谓散料是指连续松散的不易区分为个体或 抽样单元的材料.如:矿石、煤、粮食、水泥、 化肥等等。
例如:对贮藏在仓库中的小麦中农药残留量 的监测.
首先,从仓库中抽若干麻袋
然后,再从每个抽中的麻袋中的不同部位抽取一 定数量的小麦样品(称为份样)进行测试。
三、抽选方法与推断原理
此时两阶抽样中的每一阶都可采用简单随机 抽样:第一阶抽样从总体N个初级单元中抽 取n个初级单元,第二阶抽样则是从每个被 抽中的初级单元(设每个包含M个次级单元) 中抽取m个次级单元。
假定:在抽中的若干初级单元中作第二阶抽 样是相互独立地进行的。
一、符号说明
初级单元的个数:N
二级单元的个数:M
性质1可) V(ˆ) V1[E2E3(ˆ)]E1{V2[E3(ˆ)]} E1E2[V3(ˆ)]
第二节 初级单元大小相等的二阶抽样
一、符号 二、总体均值的估计量及其性质 三、关于总体比例的估计
引:本节先讨论初级单元大小(即所包含的 次级单元数目)相等情形的二阶抽样。
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
3、抽样框编制得以简化
多阶段抽样是分阶段实施的,因此抽样框也可以分 级进行准备:在第一阶抽样中,仅需准备总体中关 于初级单元的抽样框;在第二阶抽样中,仅需对那 些被抽中的初级单元准备二级单元的抽样框。更高 阶的也是如此,每次只需要对被抽中的单元准备下 一级抽样单元抽样框。
它的最大缺点是由于群内小单元存在一定程度 的相似性(群内相关系数大于0),其抽样误 差高于同样样本量的简单随机抽样。
事实上,在多数情形,特别是当群的规模比较 大时,确实没有必要对群内所有次级单元都进 行调查。因此很自然地想到可以对每个被抽到 的群中的次级单元再次进行抽样。
二、多阶段抽样的定义及其与其他抽样的关系
(一)二阶段抽样
设总体由N个初级单元组成,每个初级单元又 由若干二级(次级)单元组成,若在总体中按 一定方法抽取n个初级单元,对每个被抽中的 初级单元再抽取若干二级单元进行调查,则这 种抽样称为二阶抽样,或二级抽样(two-stage sampling)
在二阶抽样中,全部抽样是分两步实施的:
第一步是从总体中抽初级单元,称为第一阶抽样;
在社会经济调查中,多阶抽样常用于抽样单元 为各级行政单位的情况。例如,在一项全国性 调查中,往往将省、地市、县、街道(乡、 镇)、居(村)民委员会、居(村)民小组及 住户作为各级南样单元。在此,采用多阶段抽 样显然十分方便。
再如,在一个城市中,可以将区作为其中一级 单元,也可直接将街道作为一级单元;可以将 居委会作为街道下一级的单元,也可以将居民 小组作为街道下一级的单元。
多阶段抽样每一阶段的抽样可以相同,也 可以不同,它通常与整群抽样、分层抽样、 系统抽样结合使用.
实际工作中,多阶段抽样通常与整群抽 样结合使用,即前几阶是多阶段抽样, 最后一阶为整群抽样。
多阶段抽样时,抽样是分步进行的,因此, 讨论估计量 ˆ的均值及方差时需要分阶段 进行,则用到下面的性质:
第九章 多阶段抽样
第一节 引言 第二节 初级单元大小相等的二阶抽样 第三节 初级单元大小不相等的二阶抽样 第四节 其他问题
第一节 概述
一、概述 二、多阶段抽样的定义及其与其他抽样的关系 二、多阶段抽样的特点和作用 三、抽选方法与推断原理
一、引言
采用整群抽样的主要理由是整群样本比较集中, 实施便利,每个基本单元的调查费用较低。
(二)多阶段抽样与其他抽样的关系
整群抽样可以看作是多阶段抽样的一种特殊情 形,即最后一阶抽样是100%的抽样。
分层抽样也可看作是多阶抽样的特例:此时每 个初级单元即是层,第一阶抽样是100%抽样, 而层内抽样是第二阶抽样。当然,层内抽样本 身也可能是多阶的。
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
第一阶段和第二阶段的样本量:n,m;
第i个初级单元中第j个二级单元的观测 值:Yij(i=1,2,…N;j=1,2,…M)
样本中第i个初级单元中的第j个二级单元的观测 值:yij(i=1,2,…n;j=1,2,…m)
第一阶段和第二阶段的抽样比:
f1
n, N
f2
m M
总体和样本中第i个初级单元按二级单元的平均 值:
性质1 对于两阶段抽样,有
E(ˆ)E( 1 E2(ˆ)) V(ˆ)V1[E2(ˆ)]E1[V2(ˆ)]
• 式中,E2、V2为在固定初级单元时对第 二阶抽样求均值和方差;E1 、 V1为对第 一阶抽样求均值和方差.
上述1式是显然的。
2式证明如下:
V() E(ˆ2) [E(ˆ)]2 E1[E2(ˆ2)]{E1 [E2(ˆ)]}2 E1[E2(ˆ2)]{E1[E2(ˆ)]2 V1[E2(ˆ)]} V1[(E2(ˆ)]{E1[E2(ˆ2) E1[E2(ˆ)]2} V1[E2(ˆ)] E1[V2(ˆ)]
第二步是从每个被抽中的初级单元中抽二级单元, 称为第二阶抽样。
如果每个二级单元又由更小的三级单元 组成,那么第二阶抽样后,若对每个被 抽中的二级单元中的三级单元再进行抽 样,则是三阶抽样。
如果对每个被抽中的二级单元不再抽样, 调查其中每个三级单元,则称为二阶整 群抽样。
以此类推,可定义更高阶的多阶抽样 (multi-stage sampling)或多阶整群抽 样(multi-stage cluster sampling)。
相关文档
最新文档