第八章(多阶段抽样)

合集下载

抽样调查第8章多阶段抽样18210

抽样调查第8章多阶段抽样18210

置信度为95%的置信区间为:160800±1.96×9216 在上面的方差估计式中,第一项是主要的,第二项 要小得多!
返回
(二)对总体比例的估计
如果要估计总体中具有所研究特征的二级单元数占全 体全体二级单元数的比例,则
P
1 N
N
Pi
i1
1 NM
N i1
Ai
式中,Ai 为第i个初级单元中具有所研究特征的二级单元
(1)多阶段抽样保持了整群抽样的样本比较集中、 便于调查、节约费用等优点。
(2)多阶段抽样不需要编制所有小单元的样本框。
三、抽选方法与推断原理
多阶段抽样时,每一个阶段的抽样可以相同,也 可以不同。它通常与分层抽样、整群抽样、系统抽样 结合使用。多阶段抽样时,抽样是分步进行的,因此, 讨论估计量的均值及其方差时,需要分阶段进行这要
S 2 2i
M
1 i
1
Mi j 1
(Yij
Y i )2,
s 2 2i
1 mi 1
mi
( yij
j 1
yi )2
返回
二、估计量及其性质
(一)对初级单元进行简单随机抽样
如果二阶抽样中每个阶段都采用简单随机抽样,并且 每个初级单元中二级单元的抽样是相互独立的,则对 总体总和的估计可以采用简单估计,也可以考虑采用 比率估计。
表中红字为抽中的房号。 这时,初级单元有15个,每个初级单元拥有二级单元 12个。首先将单元从1到15编号,在15单元中随机抽取 5个单元,分别是1,6,9,12,13号;然后在被抽中的 单元中,进行第二次抽样,即分别在12户居民户中随机 抽取4户。
一、符号说明
初级单元和初级单元拥有的二级单元个数:N,M 第一阶段和第二阶段抽样的样本量:n ,m

《抽样技术》第八章-二阶及多阶抽样

《抽样技术》第八章-二阶及多阶抽样
j 1
m
Yi Yi / M ,
yi yi / m
Y Yij / NM Yi / N ,
i 1 j 1 n m i 1
N
M
N
y yij / nm yi / n
i 1 j 1 i 1 N n 2 1 1 2 2 2 S1 Yi Y , s1 yi y N 1 i 1 n 1 i 1 N M 2 1 1 N 2 S Yij Yi S 2i N M 1 i 1 j 1 N i 1 2 2 M 2 1 2 其中S 2i Yij Yi M 1 j 1 n m 2 1 s yij yi n(m 1) i 1 j 1 2 2
n


二、总体均值Y 的估计量及其性质

如果二阶抽样中的每一阶抽样都是简单随机的,且 对每个初级单元,第二阶抽样是相互独立的,则样 本按次级单元的均值 1 n m 1 n y yij yi nm i 1 j 1 n i 1
是总体均值
1 N M 1 N Y Yij Yi NM i 1 j 1 N i 1 的无偏估计,即E y Y ,且
其中Qi =1−Pi。故p是P的无偏估计,其方差为 N 1 f1 1 N 1 f2 M 2 V p PQ Pi P i i n N 1 i 1 nm N M 1 i 1 V(p)的一个无偏估计为 n n f 1 f 1 f 2 1 2 1 s2 p p p pi qi i 2 n n 1 i 1 n m 1 i 1 其中qi =1−pi。




ˆ Y 1 2 ˆ i ˆ s YHH YHH n n 1 i 1 zi ˆ M y 是Yi 的无偏估计 如果第二阶抽样是简单随机的,则 Y i i i ,而 1 2 2 ˆ V2 Yi M i V2 yi M i2 1 f 2i S 2 i mi 于是有 n M i yi 1 ˆ YHH n i 1 zi

多阶段抽样(PPT69页)

多阶段抽样(PPT69页)

2.比率估计量 为了减小方差,可以考虑将初级单元的大小
Mi作为辅助变量,采用比率估计量对总体总 和进行估计。 对总体总和的比率估计量:
这个比率估计量是有偏的,但随着样本量的增加,其偏倚将趋于0。
• 其近似均方误差为:
• 因为 的差异一般不会很大,因此,当Mi相
差很大时,
要比无偏估计量 的方差
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
• 估计量p的方差为: V(p)的无偏估计为:
类似于前面总体方差的表达形式,有:
• 【例8.2】欲调查某个新小区居民户家庭装潢聘请专业装潢 公司的比例。在15个单元中随机抽取了5个单元,在这5个 单元中分别随机抽取了4户居民并进行了调查,对这20户 调查结果如下:
样本单元 一栋A座 二栋C座 三栋C座 四栋C座
样本企业
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
置信区间:
三、对总体的比例的估计
总体中具有所研究特征的二级单元占全体二级 单元数的比例为:
式中:Ai为第i个初级单元中具有所研究特征的二级单元数。 对总体比例P的估计是:
式中:ai为第i个样本初级单元中具有所研究特征的二级单元数 。
• 性质3: 对于二阶抽样,如果两个阶段都是简单 随机抽样,则有

第八章抽样调查ppt课件全

第八章抽样调查ppt课件全

XP
• 总体比率的方差为: • σ2=P(1-P) • 样本比率也是两个变量(0,1)的平均数
• 其标准差为:
s p(1p)
x
n 1
p
n
• 抽样比率的平均数及标准误差相应为: pP
(8-11)

P(1P)
p
n
(8-12)
• 与抽样平均数分布一样,抽样比率分布的平均数未知,所以同样用 一个样本的比率p来推断总体比率P,在推理上其基本原理和用样 本平均数推断总体平均数是相同的,这里不再赘述。
AN=N(N-1)(N-2)…(N-n+1)=N!/(N-n)!
(8-1)
(2)考虑顺序的重复抽样数目,即通常所说的可重复排列数:
BnN=Nn
(8-2)
(3)不考虑顺序的不重复抽样数目,即通常所说的不重复组合数:
CnN=N(N-1)(N-2)…(N-n+1)/n!=N!/n!(N-n)!
(8-3)
(4)不考虑顺序的重复抽样数目,即通常所说的可重复组合数:
(2) 在实际工作中可以取得全面资料,但不能进行全面调查时, 要运用统计抽样。例如工业上有些产品的质量检查,需要 对产品进行破坏性试验,如灯泡的寿命检查等,只有通过科 学的统计抽样进行检查,才能确定产品的质量
• (3) 对时间序列总体,根据一定顺序的抽查,可以对 生产过程进行控制和检验。例如对工业产品质量 控制就要运用统计抽样来进行。
三、统计抽样的重要作用
(1) 对于那些从理论上讲可以取得全面资料,但实际工作中,没 有必要进行全面调查的事物,运用统计抽样这种非全面调 查的方法同样可以取得资料,从而用更少的人力、时间、 费用达到对总体的认识。例如要了解居民家庭收入情况, 如果对所有的居民家庭收支进行逐户登记,工作量太大,客 观上有困难,事实上也办不到,所以只要抽取若干个具有代 表性居民家庭进行调查,就可以获得满足调查任务要求的 统计资料。

统计学(第八章抽样推断)

统计学(第八章抽样推断)

统计学(第⼋章抽样推断)第⼋章抽样推断【教学⽬的】抽样推断是统计研究中⼀种重要的分析⽅法。

通过本章的学习,要求掌握利⽤样本统计资料来推断总体数量特征的原理及⽅法;深刻理解抽样推断的概念及特点;了解抽样误差产⽣的原因,并对抽样误差、抽样平均误差、抽样极限误差加以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的⽅法;掌握必要样本单位数的确定⽅法。

第⼀节抽样推断概述⼀、抽样推断的概念及特点(⼀)概念按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进⾏科学估计与推断的⽅法。

包括抽样调查和统计推断抽样调查:⼀种⾮全⾯调查,按随机原则从总体中抽取部分单位进⾏调查以获得相关资料,以推断总体统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有⼀定程度的估计和推断。

(⼆)特点1.按随机原则(等可能性原则)抽取调查单位.随机抽样的⽬的是为了排除⼈的主观影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。

随机性原则是保证抽样推断正确性的⼀个重要前提条件。

随机抽样不是随便抽样。

2.根据部分推断总体的数量特征3.抽样推断的结果具有⼀定的可靠性和准确性,抽样误差可以事先计算和控制其他特点有经济性、时效性、准确性、灵活性等(三)抽样推断的应⽤ 1.不可能进⾏全⾯调查时 2.不必要进⾏全⾯调查时 3.检查⽣产过程正常与否4.对全⾯调查资料进⾏补充修正时⼆、抽样的⼏个基本概念 1.样本容量与样本个数(1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的⼤⼩称为样本容量,⼀般⽤n 表⽰,它表明⼀个样本中所包含的单位数。

⼀般地,样本单位数⼤于30个的样本称为⼤样本,不超过30个的样本称为⼩样本。

(2)样本个数:⼜称样本可能数⽬,它是指从⼀个总体中可能抽取多少个样本。

样本个数的多少与抽样⽅法有关。

2.总体参数与样本统计量(1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。

现代心理与教育统计学课后题答案第八章

现代心理与教育统计学课后题答案第八章

现代心理与教育统计学课后题答案第八章1.对某河流污染状况进行统计调查,需采用( ) [单选题] *A.重点调查(正确答案)B.普查C.典型调查D.抽样调查3.下列指标属于强度相对指标是( ) [单选题] *A.产品质量等级(正确答案)B.人口平均寿命C.手机普及率D.产品合格率2.下列指标中必须以整数形式进行统计的是( ) [单选题] *A.工资总额(正确答案)B.股价指数C.恩格尔系数D.设备台数5.某一特定类别或组中的数据个数称为( )。

[单选题] *A.频数(正确答案)B.累积频数D.累积频率7.下列指标中属于时点指标的是( )。

[单选题] *A. 股票购买量(正确答案)B. 商品销售额C. 股票收盘价格D. 股票成交金额8.下列属于连续变量的是( )。

[单选题] *A、职工人数(正确答案)B、设备台数C、职工工资总额D、生猪存栏头数9.若某组数据呈现出右偏分布,则该组数据的众数、中位数、均值的大小关系是( )。

[单选题] *A.众数>中位数>均值(正确答案)B.均值>中位数>众数C.中位数>众数>均值D.中位数>均值>众数4.某银行5年期间利率(复利)变动情况为:第1年—第3年7%;第4年—第5年8.2%。

则该银行5年期间平均年利率为( ) [单选题] *A.108%(正确答案)C.107.5%D.7.5%6一般情况下,计算数量指标综合指数时,采用( )方法。

[单选题] *A.拉式数量指数(正确答案)B.拉式质量指数C.帕式数量指数D.帕式质量指数10.增长一个百分点对应增加的绝对量称为( )。

[单选题] *A.平均增长率(正确答案)B.环比增长率C.增长1%的绝对值D.定基增长率12某公司12月份与11月份相比产品销售价格平均下降6%,产品销售量平均增长6%,则12月份与11月份相比产品零售额( )。

[单选题] *A.保持不变(正确答案)B.平均下降0.36%C.平均下降36%D.平均下降0.9964%13.各变量值与其算数平均数离差平方的算术平均数的平方根称为( )。

统计学第八章 抽样推断

统计学第八章 抽样推断


和P的使用及使用条件
(1)σ2取最大值;(2)P取接近于0.5的值
(3)可以用样本 s或2 代p替;(4)可以用估计值或实验值代替。
计算例题:
在10000只电池中,随机抽检1%的产品进行检查,检查结果如下:
电流强度 (安培) 4-4.5 4.5-5 5-5.5 5.5-6 6-6.5 6.5-7
2
f
P 2N 0 1 P 2 N1
f
N
P2N0 1 P2 N1 P2Q 1 P2 P
N
N
P2Q Q2P PQP Q PQ P1 P
例(1):已知某产品的合格率为95%,则其标准差为:
0.951 0.95 21.79%.
2、样本指标(统计量)
根据样本总体各单位的数量标志值或属性计算所得的指 标,称为样本指标。样本指标通常包括:
统计指标 抽样平均数 抽样成数 抽样平均数的标准差 抽样成数的标准差 抽样平均数的方差
抽样成数的方差
未分组资料
x x n
p n1 n
sx
xx 2
n
分组资料
x xf f
sx
x
2
x
f
f
sP p(1p)
s2
2
xx
x
n
sP2 p(1 p)
s2
2
xx f
x
f
四、抽样方法(P151)
(二)抽样极限误差的意义
(三)抽样极限误差的计算
平均数的抽样极限误差
Δx
t
μ x
成数的抽样极限误差
Δp
t
μ p
正态分布图示
68.27%
95.45%
99.73%

2012年统计学第8章抽样调查理论与方法

2012年统计学第8章抽样调查理论与方法

8-26
一、估计总体均值时样本容量的确定
重复抽样时
1. 估计总体均值时样本容量n为 允许误差
n x
(z 2 )2 2
2
x
其中: x
z 2
n
2. 可见,样本容量
✓ 与总体方差成正比 ✓ 与允许误差成反比 ✓ 与置信度成正比
《统计学》第8章抽样调查理论与方法
8-27
不重复抽样时:
n x
NZ2 / 2 2
X
1 N
N i 1
Xi
N
X Xi N X
i 1
总体比例 总体方差 标准差
P N1 ,Q N0 N N1 1 P N NN
2
1 N
N
(Xi X )2
i 1
1 N
N
( Xi X )2
i 1
《统计学》第8章抽样调查理论与方法
8-9
统计量:是根据样本的n个单元的变量值计 算出来一个量,也叫估计量
解:Q N 15000 n 150
p 147 98% 150
p
p(1 p) n
0.98 (1 0.98) 1.14% 150
若按不重复抽样方式:
p
p(1 p) (1 n ) 0.98 (1 0.98) (1 150 ) 1.1374%
n
N
150
15000
《统计学》第8章抽样调查理论与方法
8-24
8.5.1影响样本容量确定的主要因素
总体被研究标志的变异程度 调查者对推断精确度的要求 抽样调查的方式和方法 人力、物力和财力的允许条件
《统计学》第8章抽样调查理论与方法
8-25
8.5.2 样本容量的确定
一、估计总体均值时样本容量的确定 二、估计总体比率时样本容量的确定
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

E1[
S22i ]
n
S12
1 f2 m
S22
抽样调查
原理与方法
所以S12 的无偏估计为
Sˆ12
s12
1
f2
m
s22
将(2)、(3)式结合,得到
(y)
1 f1 n
s12

f1(1 f nm
2
)
s22
(3)
抽样调查
原理与方法
类似的,可以构造三阶抽样 y 的估计方差
( y) 1 f1
抽样过程
前二阶采用PPS,最后一阶按等概率抽取最终单元,且各阶 段样本量对不同单元都等于常数,则所得样本是自加权的。 此时有:
Zi

Mi M0
, Zij

Kij Mi
, Zij

1 Kij
抽样调查
原理与方法
N
N Mi
M 0 Mi
Kij
Yˆ M0 n nmk
m
k
抽样调查
原理与方法
第八 章 多阶段抽样
抽样调查
原理与方法
第一节 概述
一.什么是多阶段抽样
分多个阶段抽到最终接受调查的样本。 初级单元(PSU)----Primary Sampling Unit 二级单元 (SSU)----Second-stage Sampling Unit 三级单元(TSU)----Third-stage Sampling Unit 最终单元 (SSU)----Ultimate Sampling Unit
在 PPS 抽样中
Zi

Mi M0
,代入上式,得
YˆPPS

M0 n
n
yi
抽样调查
原理与方法
若进一步令mi=m,这时估计量是自加权的。
自加权含义:
各最终单元入选样本的概率相同, 如果一个估计量可以表达为样本观测值的常倍数, 则称这种估计量是自加权的。 对汉森—赫维茨估计量而言
YˆHH
原理与方法
二、Y 估计量的性质
ˆ
1n
1 nm
Y y n
yi nm
yij
E(y) Y
抽样调查
原理与方法
E(
y)

E1 E 2
(
1 n
n
yi )

E1[
1 n
n
E2 ( yi )]

E1[
1 n
n
Yi ] Y
抽样调查
原理与方法
估计量方差一般公式为:
V (ˆ) V1 E2(ˆ) E1 V2(ˆ)
mn
m
yij

1 n
n
yi
抽样调查
原理与方法
V(YˆPPS) 与V(y) 的无偏估计为:
(YˆPPS)

M02 n(n1)
n
(yi y)2
(y) 1 n(n 1)
n
(yi y)2
抽样调查
原理与方法
第四节 不等概抽样在 多阶段抽样中的应用
为简化,以三阶抽样为例,给出结论。
yij M 0 y
y 1 n nmk
m
k
yij
抽样调查
原理与方法
(Yˆ) M 02
n(n 1)
n
( yi y)2
yi
1 mk
m
k
yiju

1 n
n
Mi yi Zi
1 n
n
Mi Zi mi
mi
yij
抽样调查
原理与方法
所以,它成为自加权估计量的条件是
Mi nZimi

1 ,或n.Zimi
f0
Mi

f0
第二Байду номын сангаас段抽样比
f2i

mi Mi
f0 nZ i
f 0 为常数
抽样调查
原理与方法
在自加权条件下
YˆPPS M0y
y 1 n
V ( y)

S12

S
2 2
m
若以n个 yi 的均值 y 推断 Y ,其方差为
V(y)
S12

S
2 2
n nm
再考虑fpc,则(1)式成立。
抽样调查
原理与方法
V (y)的无偏估计为
v( y) 1 f1 n
s12

f1
(1 nm
f
2
)
s22
证明:
E(s22
)

S
2 2

s12
1 n 1
二、Y的估计
N
入选概率 Z i , Z i 1
估计过程 先估计Yi , 然后利用Yˆi 估计Y 汉森—赫维茨估计量
抽样调查
原理与方法
YˆHH
1 n
n
Yˆi Zi
E(YˆHH) Y
V(YˆHH)

1[ n
N
Zi
(Yi Zi
Y)2

N
V2(Yˆi ) Zi
V(YˆHH)的无偏估计量为:
n
s12
f1 (1 nm
f2
)
s22

f1 f2 (1 nmk
f3 ) s32
抽样调查
原理与方法
三、总体比例的估计
ai,第i 个初级单元中具有某特征的次级单元数。
1 n
1 nm
p n
pi nm
ai
V(P) 1 f1 n
1 N 1
N
(Pi

P)2

1 f2 nm
C2m)
(S2 Sm22 )(C1 C2m)
其中:
S
2

S
2 1

S
2 2
M
抽样调查
原理与方法
使上式达到极小的充要条件是
S S2 m
C1 C2m
从而mopt 满足
mopt

S2 S
C1 C2
抽样调查
原理与方法
由上式看出,m与
S
2 2
,C1成正比,与
S12
,C2
成反比。
求出m后,利用(4),(5)式,即可求出n.
于是有:
V ( y) 1 f1 n
S12

1 f2 mn
S22
(1)
抽样调查
原理与方法
假定n=1, 第二阶段抽取m个单位

yi
估计 Yi

误差大小取决于
S
2 2
和m,即
V2 ( yi )
S
2 2
m
其次,用 Yi 推断 Y 时,第二次推断误差大小取决于 S12 和n,
当n=1时,V1(Yi ) S12 ,这时
抽样调查
原理与方法
(YˆHH
)

1 n(n 1)
n
( Yˆi Zi
YˆHH )2
若二阶抽样采用 srs,即
Yˆi M i yi 是 Yi 的无偏估计
而:
V 2(Yˆi )

M i2V2 ( yi )

M
2 i
mi
(1
f
2i
)S
2 2i
抽样调查
原理与方法
于是有
YˆHH
1 n
n
M i yi Zi
V
(YˆHH
)

1 n
N
Z
i
(
Yi Zi
Y)2 1 n
M
2 i
(1
mi
Z
i
f
2i
) S
2 2i

(YˆHH
)

1 n(n 1)
n
( M i yi Zi
YˆHH )2
抽样调查
原理与方法
三、初级单元的 PPS 抽样
由前知: YˆHH
1 n
n
M i yi Zi
M N(M 1)
N
PiQi
抽样调查
原理与方法
v(p) 1 f1 n(n 1)
n
(
pi

p)2

f1(1 f2) n2(m1)
n
piqi
四、最优样本量 m 与 n 的确定 目标:
CT 给定条件下,如何确定m与n,从而使V(y) 最小。
抽样调查
原理与方法
二阶抽样费用函数
CT C0 C1n C2 nm
一、符号
Yij ,总体中第i 个初级单元中第j 个次级单元指标值
i =1,2,….N, j=1,2,….M
yij ,样本中第i 个初级单元中第j 个次级单元观测值 i =1,2,…n, j=1,2,….m
抽样调查
原理与方法
f1

n N
,
f2

m M
M
Yi Yij
m
yi yij
Yi

Yi M
抽样调查
原理与方法
yi

yi m
Y N Yi N
y n yi
n
抽样调查
原理与方法
S12

1 N1
N
(Yi
Y
)2
s12
1 n1
n
(yi
y
)2
S22
1 N(M1)
N
M
(Yij Yi)2
相关文档
最新文档