不等概抽样ppt课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

不等概抽样的优点:大大提高了估计精度,减少了 抽样误差。(适用不等概抽样必须要有说明每个单 元规模大小的辅助变量来确定每个单元入样的概率 )
缺点:与简单随机抽样相比,不等概抽样编制样本 框的过程有时要复杂一些。
.
4
5.1.3 不等概抽样的分类
按照样本单元是否放回可以分为放回不等概 抽样和不放回不等概抽样。
sY ˆHHvY ˆHH 174118 (百元)
(2)采用不等概抽样来减少抽样方差,即赋予 每个单元与其规模成比例的入样概率,然后在估 计中采用不同的权数来进行弥补。
• 大单元入样概率大,小单元入样概率小;
.
3
5.1.2 不等概抽样适用情况
(1)抽样单元在总体中所占的地位不一致。 (2)调查的总体单元与抽样总体的单元不一致。 (3)改善估计量。
yi zi
M0 n yi n m i1 i
总体总值的无偏估计量
PPS抽样:
YHH1 ni n1
yi Zi
M0 n
n i1
yi Mi
.
12
V (YˆH H )
1 n
N i1
Z
i
(
Y Z
i i
Y )2
v (YˆH H )
1 n
n i1
( yi Zi
YˆH H
)2
(n 1)
PPS抽样:
vY ˆH H 1 nn 1 1i n 1 Z y ii Y ˆH H 2 nM n 0 21i n 1 M y ii Y M ˆH H 0 2
抽样误差较大;
不同规模医院的病人样本调查难易度和单位成本 不同;
抽样前大医院样本数量未知,容易给调查的管理 造成困难;
.
2
5.1.1不等概抽样的概念
通常的做法:牺牲“简单”来提高抽样效率。
(1)将总体单元按规模分层,对较大单元的层 抽样比高一些,特大层的抽样比甚至可以100%, 而较小单元的层抽样比低一些。
.
13
例5.2
某部门要了解所属8500家生产企业当月完成的 利润,该部门手头已有一份去年各企业完成产 量的报告,将其汇总得到所属企业去年完成的 产量为3676万吨。考虑到时间紧,准备采用抽 样调查来推算当月完成的利润。根据经验,企 业的产量和利润相关性比较强,且企业的特点 是规模和管理水平差异比较大,通常大企业的 管理水平较高些,因此采用以与去年产量成比 例的PPS抽样,从所属企业中抽出一个样本量 为30的样本,
5
2.00 1102 14 12.30 220 23
0.75
480
6
5.00
7 10.80
600 15 290 16
3.86 4600 24 15.80 2370 25
6.00 28.43
311 9284
8
2.00
430 17
9.00 940 26
9.97
842
9
8.81
992 18* 21.00 640 27
727
10
1.1
11
738
M 0=738
738
代码 1~6
7~151 152~166 167~303 304~381 382~531 532~631 632~667 668~727 728~738
.
7
2 拉希里法

M*max 1iN
Mi
(1)从1-N之间产生一个随机数i;
(2)从1- M * 之间产生一个随机数m;
(1)放回不等概抽样;
(2)不放回不等概抽样;
.
5
放回不等概抽样
最常用的是按照总体单元的规模大小来确定单
元再每次入样的概率。假设总体中第i个单元
N
的大小和规模为
M
i
,总体的总规模
M 0 M i i 1
,每次抽样中第i个单元被抽中的概率用 Z i
表示,如果
Z i
Mi M0
Mi
N
Mi
i 1
这种不等概抽样称作放回的与规模大小成比例的概
第5章 不等概抽样
.
1
例:欲调查某城市住院病人对于某项医疗服务的偏好。
目标总体:某一时段该城市所有医院的病人。
等概率两阶段抽样:第一阶段中拥有20个病床的医 院和拥有1000个病床的医院被抽中的概率是一样的 ;第二阶段若采用等概抽样,20个病床的医院抽取2 个,1000个病床的医院需要抽取100个。
表5-3
E(Y)P(s)YS 可 能
无偏性: E(Y)Y
方差:V (Y ) P (S )(Y S Y )2NZ iY i Z i Y 2
S
i 1
.
11
5.2.2 有放回不等概抽样
对于放回不等概抽样,对总体总量的估计 是汉森-赫维茨(Hansen-hurwitz)估计:
Y ˆHH1 ni n1
(3)如果Mi> m,则第i个单位被抽中, 否则,重抽。
.
8
不放回不等概抽样
放回抽样:对总体参数的估计及其方差估计 比较简单,但样本单元中可能有单元被 多次抽中。
不放回抽样:效率比较高,但是样本不独立
会加大抽样实施、参数估计以及精度计
算的难度。
(1)逐个抽取
(2)重抽法
(3)全样本抽取;样本量随机
率抽样(Probability Proportional to Size),,简称 PPS。
.
6
1代码法案例
i
Mi
M i 10 累计 M i 10
1
0.6
6
6
2
14.5
145
151
3
1.5
15
166
4
13.7
137
303
5
7.8
78
381
6
15
150
531
7
10百度文库
100
631
8
3.6
36
667
9
6
60
.
14
i
Mi
yi
i
Mi
yi
i
Mi
yi
1* 38.23 10926 10
6.50 1900 19
1.50
10
2 13.70 1024 11 15.00 864 20
8.00
80
3
0.75
13 12
7.00
17 21 28.42 13672
4
2.85
30 13 16.00 1045 22*
9.01 3845
6.20
510
.
15
n
Yˆ M y HH
0
i 3 36 0 1 3 7 .2 0 8 6 3 9 1 3.2 2 0 8 6 3 9 1 1.7 2 3 0 0 6 2 4 5 6 .2 7 157057 087(百元)
n m i1 i
vYˆHHnM n 021i n1m yii Y M ˆH0H2
(4)系统抽样法
.
9
5.2 放回不等概抽样
5.2.1 只抽取一个样本单元(n=1)的不等概抽样 表5-2
(1)包含概率与超市营业面积成正比 iZ iP (超 市 i被 中 )
如果超市营业面积近似正比于超市的销售额,
那么样本量为1的不等概抽样的总体总值估计量:
Y
iS
i yi
iS
.
yi Zi
10
相关文档
最新文档