抽样技术多阶段抽样
抽样调查第8章多阶段抽样18210

置信度为95%的置信区间为:160800±1.96×9216 在上面的方差估计式中,第一项是主要的,第二项 要小得多!
返回
(二)对总体比例的估计
如果要估计总体中具有所研究特征的二级单元数占全 体全体二级单元数的比例,则
P
1 N
N
Pi
i1
1 NM
N i1
Ai
式中,Ai 为第i个初级单元中具有所研究特征的二级单元
(1)多阶段抽样保持了整群抽样的样本比较集中、 便于调查、节约费用等优点。
(2)多阶段抽样不需要编制所有小单元的样本框。
三、抽选方法与推断原理
多阶段抽样时,每一个阶段的抽样可以相同,也 可以不同。它通常与分层抽样、整群抽样、系统抽样 结合使用。多阶段抽样时,抽样是分步进行的,因此, 讨论估计量的均值及其方差时,需要分阶段进行这要
S 2 2i
M
1 i
1
Mi j 1
(Yij
Y i )2,
s 2 2i
1 mi 1
mi
( yij
j 1
yi )2
返回
二、估计量及其性质
(一)对初级单元进行简单随机抽样
如果二阶抽样中每个阶段都采用简单随机抽样,并且 每个初级单元中二级单元的抽样是相互独立的,则对 总体总和的估计可以采用简单估计,也可以考虑采用 比率估计。
表中红字为抽中的房号。 这时,初级单元有15个,每个初级单元拥有二级单元 12个。首先将单元从1到15编号,在15单元中随机抽取 5个单元,分别是1,6,9,12,13号;然后在被抽中的 单元中,进行第二次抽样,即分别在12户居民户中随机 抽取4户。
一、符号说明
初级单元和初级单元拥有的二级单元个数:N,M 第一阶段和第二阶段抽样的样本量:n ,m
多阶段抽样(PPT69页)

2.比率估计量 为了减小方差,可以考虑将初级单元的大小
Mi作为辅助变量,采用比率估计量对总体总 和进行估计。 对总体总和的比率估计量:
这个比率估计量是有偏的,但随着样本量的增加,其偏倚将趋于0。
• 其近似均方误差为:
• 因为 的差异一般不会很大,因此,当Mi相
差很大时,
要比无偏估计量 的方差
在多阶段抽样中,各阶抽样的方法可以采用简 单随机抽样,也可以采用放回或不放回的不等 概抽样,或者用系统抽样。
三、多阶段抽样的特点及作用
1、实施方便,节省费用
保持了整群抽样的优点,即由于样本比较集中,便于调查、节省 费用;.
2、对抽中的次级单元进行再抽样,提高了效率
多阶段抽样能充分发挥抽样的效率,克服了整群抽样的缺点,即 避免了对小单元过多调查造成的浪费。
• 估计量p的方差为: V(p)的无偏估计为:
类似于前面总体方差的表达形式,有:
• 【例8.2】欲调查某个新小区居民户家庭装潢聘请专业装潢 公司的比例。在15个单元中随机抽取了5个单元,在这5个 单元中分别随机抽取了4户居民并进行了调查,对这20户 调查结果如下:
样本单元 一栋A座 二栋C座 三栋C座 四栋C座
样本企业
1
60
13
2
43
39
3
58
39
4
50
7
5
57
19
置信区间:
三、对总体的比例的估计
总体中具有所研究特征的二级单元占全体二级 单元数的比例为:
式中:Ai为第i个初级单元中具有所研究特征的二级单元数。 对总体比例P的估计是:
式中:ai为第i个样本初级单元中具有所研究特征的二级单元数 。
• 性质3: 对于二阶抽样,如果两个阶段都是简单 随机抽样,则有
抽样的方案有哪几种方法组合的

抽样的方案有哪几种方法组合的抽样的方案有哪几种方法组合的摘要:在许多调查研究中,抽样是一种常用的方法。
抽样的方案是指根据具体的研究目的和样本特征,选择适当的抽样方法进行样本选择的过程。
本文将介绍六种常见的抽样方法,并分析它们的优缺点,最后提出一种结合多种抽样方法的综合方案,以满足不同研究需求。
第一部分:随机抽样在随机抽样中,每个个体有相等的机会被选入样本,从而确保样本的代表性和可靠性。
随机抽样有简单随机抽样、分层随机抽样和整群抽样等方法。
其优点是简单易行,适用于大样本量的研究,但也存在样本偏差的问题。
第二部分:系统抽样系统抽样是指按照某种规则从总体中选择样本,例如每隔固定的时间或空间间隔选择一个个体作为样本。
系统抽样适用于总体有明显的排列规律的情况,具有操作简单、适用范围广的优点。
然而,如果总体的排列规律与研究目的不一致,可能会引入系统性的抽样偏差。
第三部分:整群抽样整群抽样是指将总体划分为若干个互不重叠的群体,然后随机选择部分群体进行调查,最后在所选群体中进行样本选择。
整群抽样适用于总体分布不均匀、群体之间差异明显的情况,具有简化抽样过程、减少成本的优点。
然而,由于群体内个体的相似性,可能引入群体内部的抽样偏差。
第四部分:分层抽样分层抽样是指将总体划分为若干层,然后根据每层的特征,分别进行抽样。
分层抽样适用于总体存在明显的层次结构的情况,可以提高样本的代表性和效率。
但是,如果确定了错误的分层变量或分层变量的划分不准确,可能导致抽样偏差。
第五部分:整体抽样整体抽样是指将总体中的全部个体都作为样本进行研究。
整体抽样适用于总体规模较小、资源有限的情况,可以提高研究结果的准确性。
然而,由于需要涉及到总体的每个个体,整体抽样的成本和时间开销较大。
第六部分:多阶段抽样多阶段抽样是指将抽样过程划分为若干个阶段进行,每个阶段从前一阶段抽样的单位中选择样本。
多阶段抽样适用于总体分布复杂、难以直接抽样的情况,具有灵活性和成本效益的优点。
第九章 多阶段抽样

第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念1、单阶抽样:从总体中通过一次抽样就能够产生一个完整的样本,这类抽样即为单阶抽样。
前面介绍的几种抽样方式均为单阶抽样。
适合用于总体单元数相对较少的抽样过程。
2、多阶抽样:将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
当我们面对的总体单元数很庞大,而且分布范围很广时,如果使用前面所学习的单阶抽样方法,不仅工作量大,而且在精度上很难把握,此时如果改用多阶抽样方法,就会避免上述困难,从而达到理想的抽样效果。
3、关于多阶抽样的具体描述:如果我们面对的一阶单元内总体基本单元数相当大,作全面的调查就会比较困难,或者一阶单元内各二阶单元可以给出相近的结果,作全面的调查又无必要。
此时从费用和抽样估计效率考虑,便可以从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对他们作全面调查,我们把这种抽样技术称为两阶抽样。
如果在被抽中的二阶单元中,再抽取部分三阶单元组成样本,并对抽中的三阶单元进行全面的调查,这就是三阶抽样。
类似地,可以定义四阶抽样或更高阶的抽样,通常将两阶以上的抽样称为多阶抽样。
需要指出的是,多阶抽样中,各阶可以采用不同的抽样方法,也可采用同一种抽样方法,要视具体情况和要求而定。
在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相等和不相等的两种情况。
前者无论在样本的抽取还是在指标的估算方面都相对比较简单,然而在抽样实践中却很少有这种情况的存在,但作为基本方法仍然有其实际意义;后种情况在抽样和指标的估算方法上都较为复杂,然而在实际中普遍存在此种情况。
4、两阶抽样与分层抽样和整群抽样的关系:将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。
抽样方案的种类包括哪些方面

抽样方案的种类包括哪些方面抽样方案的种类包括哪些方面摘要:抽样是研究和调查中常用的一种方法,它可以通过获取样本来推断总体特征。
抽样方案的种类非常丰富,每种方案都有其适用的场景和优缺点。
本文将介绍六种常见的抽样方案,包括简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样和方便抽样,并对其特点、适用性和误差源进行详细分析。
1. 简单随机抽样简单随机抽样是最常用的抽样方法之一,它的特点是每个样本有相等的机会被选中,并且选取一个样本不会影响其他样本的概率。
在进行简单随机抽样时,研究者需要确保每个样本都是独立、随机、代表性的。
这种抽样方法适用于总体分布均匀、样本容量较小的情况下,但如果总体分布不均匀或样本容量较大,可能会导致抽样误差较大。
2. 系统抽样系统抽样是在总体中按照一定的规律选取样本,例如每隔k个样本选取一个样本。
系统抽样相对于简单随机抽样更加方便,但需要注意的是,如果总体中存在某种规律性的分布,可能会导致样本的偏差。
因此,在使用系统抽样时,需要确保总体的分布和规律性与样本的选取规律相一致。
3. 分层抽样分层抽样是将总体分为若干个层次,然后从每个层次中进行抽样。
这种抽样方法可以保证每个层次的样本都有代表性,并且能够更好地反映总体的特征。
分层抽样适用于总体具有明显的层次结构,每个层次内的个体之间相似度较高的情况。
但需要注意的是,在分层抽样中,每个层次的样本容量需要相对均衡,否则可能会导致抽样误差。
4. 整群抽样整群抽样是将总体分为若干个群体,然后从每个群体中选取全部样本。
这种抽样方法适用于群体内的个体相似度较高,并且群体之间差异较大的情况。
整群抽样的优势在于减少调查的成本和时间,但需要确保每个群体的代表性,否则可能会导致抽样结果不准确。
5. 多阶段抽样多阶段抽样是将总体按照一定的层次结构分为多个阶段,然后在每个阶段中进行抽样。
这种抽样方法适用于总体的层次结构非常复杂,且样本容量较大的情况。
多阶段抽样的优点是能够减少调查的成本和时间,并且可以根据每个阶段的特点进行精细化的抽样,但需要注意的是,每个阶段的抽样误差会逐渐累积,可能会影响抽样结果的准确性。
第4章-等概率整群抽样和多阶段抽样

4.1.1 定义
整群抽样(cluster sampling)是将总体 划分为若干群,然后以群(cluster)为抽 样单元,从总体中随机抽取一部分群,对 被选群内的所有单元进行调查的一种抽样 技术。
2024/7/17
3
例
欲估计某高校大学生拥有手机数量,大学共有40000 名学生,10000个宿舍(每个宿舍4名学生)。
V (ˆ) E1 E2 (ˆ)2 E1 V2 (ˆ ) E1E2 (ˆ)2 V1 E2 (ˆ) E1 V2 (ˆ )
4.3.3 等概率两阶段抽样的符号说明
表4-5
4.3.4 初级单元(PSU)规模相等的 两阶段抽样
定理4.5 对于初级单元规模相等的两阶段抽样 ,如果两个阶段都是简单随机抽样,且对每个 初级单元,第二阶抽样是相互独立进行的,则 对总体均值 Y 的无偏估计为:
定理 4.1:y 是 Y 的无偏估计,即
Ey Y
定理 4.2: y 的方差为:
V ( y) 1 f n
1N N 1 i1
Yi Y
2
1 f nM
Sb2
定理 4.3:V ( y) 的样本估计为:
v( y) 1 f nM
sb2
Yˆ NMy V (Yˆ) V (NMy) N 2M 2V ( y) v(Yˆ) N 2M 2v( y)
(NM 1)(M 1)S 2
用简单随机抽样方法抽取n个群,每个群内的M个
单元全部进入样本,则等群抽样均值估计量 y 的方
差可用群内相关系数近似表示
N
2
V (y)
1 V(y) 1 f
Yi Y
i 1
M2
nM 2 N 1
1 f n
(NM 1) M 2 (N 1)
抽样的方案有哪些方法和技巧

抽样的方案有哪些方法和技巧抽样的方案有哪些方法和技巧摘要:抽样是统计学中常用的一种数据收集方法,能够在大规模数据中获取代表性样本。
本文将介绍抽样的概念,以及常用的抽样方法和技巧,包括简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样和非随机抽样,希望能够帮助读者更好地设计和实施抽样方案。
1. 简单随机抽样:简单随机抽样是最基本的一种抽样方法,适用于总体中的每个个体具有相同概率被选中的情况。
实施简单随机抽样的步骤包括:确定总体和样本的定义、编制总体名单、确定样本容量、使用随机数表或随机数发生器选取样本。
在实施简单随机抽样时,需要注意随机性和代表性的保证,以及样本容量的确定。
2. 系统抽样:系统抽样是按照固定的间隔或规则从总体中选取样本的方法。
它比简单随机抽样更具操作性,且样本的代表性较好。
实施系统抽样需要确定总体和样本的定义、计算抽样间隔、确定起始点、按照抽样间隔选取样本。
在实施系统抽样时,需要注意抽样间隔的合理性、起始点的选择和样本的代表性。
3. 分层抽样:分层抽样将总体划分为若干个层次,然后在每个层次中进行抽样。
这种方法可以提高样本的代表性,并减小样本误差。
实施分层抽样的步骤包括:确定总体和样本的定义、划分层次、确定每个层次的样本容量、使用相应的抽样方法选取样本。
在实施分层抽样时,需要注意层次的划分准确性、样本容量的确定和样本的代表性。
4. 整群抽样:整群抽样是将总体划分为若干个群组,然后从选取的群组中抽取全部个体作为样本。
这种方法可以降低抽样误差,提高效率。
实施整群抽样的步骤包括:确定总体和样本的定义、划分群组、确定每个群组的样本容量、从每个群组中抽取全部个体作为样本。
在实施整群抽样时,需要注意群组的划分准确性、样本容量的确定和样本的代表性。
5. 多阶段抽样:多阶段抽样是将总体分层,然后在每个层次中采用不同的抽样方法进行抽样。
这种方法可在保证样本代表性的同时减小抽样误差和成本。
实施多阶段抽样的步骤包括:确定总体和样本的定义、划分层次、确定每个层次的样本容量和抽样方法,在各层次中进行抽样。
多阶抽样

第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
分层抽样实际是第一阶抽样比为100%时的一种特殊的两阶抽样;而整群抽样实际上是第二阶抽样比为100%时的一种特殊的两阶抽样,故也称单级整群抽样。
多阶抽样的特征:便于组织抽样;抽样方式灵活,有利于提高抽样的估计效率;多阶段抽样对基本调查单元的抽选不是一步到位的;多阶段抽样实质上是分层抽样与整群抽样的有机结合;多阶抽样在抽样时并不需要二阶或更低阶单元的抽样框;多阶抽样还可用于“散料”的抽样,即散料抽样。
第二节 一阶单元等大小的二阶抽样第一阶段在总体N 个初级单元中,以简单随机抽样抽取n 个初级单元,第二阶段在被抽取的初级单元包含的M 个二级单元中,以简单随机抽样抽取m 个二级单元,即最终接受调查的单元。
(一)估计量及其方差对于二阶抽样,若两个阶段的抽样都是简单随机的,则其总体均值Y 的无偏估计量为0111ˆ1n mnij i i j i Y y y m y n ======∑∑∑.由于在每个一阶单元中的第二阶抽样是相互独立进行的,所以,在二阶段都用不放回方法抽样时,其总体均值估计量的方差可构造为22221111)(S mnf S n f y V -+-==NS mn S M SS n 21222221)(1-+- 可以证明其方差的无偏估计量为2221211)1(1)(ˆs mnf f s n f y V -+-= 其中,22s 为22S 的无偏估计,21s 不属于21S 的无偏估计,21S 的无偏估计为22221211ˆs mf s S --= 式中右边第一部分相当于第一阶段抽样的误差,它只与各一阶单元间差异大小有关;第二部分相当于第二阶段抽样的误差,它只与各一阶单元内(即各二阶单元间)差异有关。
(二)最佳抽样比的确定在总费用一定时,考虑下述简单的线性费用函数:nm C n C C C 210++=若一阶级单元间的旅费不占重要位置,则上述费用函数被证明是适用的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多阶段抽样一、 单选题1. 两阶(段)抽样中,对于一个估计量θˆ的均值可以表示为(A )。
A.)]ˆ([)ˆ(21θθE E E =B.)]ˆ([)ˆ(12θθE E E = C. )]ˆ()ˆ([21)ˆ(21θθθE E E -= D. )]ˆ()ˆ([21)ˆ(21θθθE E E +=2. 在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用(B )。
A.系统抽样 B.简单随机抽样 C.不等概率抽样 D.非概率抽样3.初级单元大小不等的多阶段抽样中,无偏估计量成为自加权的条件是(C )。
A.第一阶段每个单元被抽中的概率相等 B.第二阶段每个单元被抽中的概率相等 C.最终阶段每个单元被抽中的概率相等 D.最终阶段每个单元被抽中的概率不等4.在初级单元大小相等的二阶段抽样中,当抽取次级单元的数量相等时,二阶段抽样的方差与整群抽样方差以及分层抽样方差之间的关系通常为(C )。
A.二阶段抽样的方差<整群抽样的方差<分层抽样的方差 B. 二阶段抽样的方差>整群抽样的方差>分层抽样的方差 C. 分层抽样的方差<二阶段抽样的方差<整群抽样的方差 D. 分层抽样的方差>二阶段抽样的方差>整群抽样的方差 二、多选题1.二阶段抽样中,初级单元大小不等时,一般可采用下面方法(AC )。
A.通过分层,将大小近似的初级单元分到一层,然后采用分层二阶段抽样B.可按初级单元大小相等的方法处理C.考虑用不等概率的抽样方法抽取初级单元D.采用简单随机抽样抽取初级单元但改变估计量的形式E.近似看成初级单元大小相等2.确定样本量时需要考虑的因素有(AB )。
A.调查的费用 B.调查要求的精度 C.调查的时间 D.调查的技术E.调查的目的3.初级单元大小不等时,下面关于二阶段抽样总体总和Y 的估计的说法正确的有(ABCD )。
A.可以采用放回的抽样方式,按不等概率抽取初级单元,此时可得总体总和Y 的估计量∑∑====n i ii i n i i i HH z y M n z Y n Y 111ˆ1ˆ B.采用不放回抽样方式,按简单随机抽样抽取初级单元,此时有∑∑====ni i ni i i uY n Ny M nN Y 11ˆˆC. 采用不放回抽样方式,按简单随机抽样抽取初级单元,此时∑∑===n i ini iR MY M Y 110ˆˆD. 采用不放回抽样方式,按不等概率抽样,此时有∑∑====n i ii n i ii i HT Y y M Y 11ˆˆππE.可以采用放回的抽样方式,按简单随机抽样抽取初级单元,此时有i ni iy MnN Y∑==1ˆ4.多阶段抽样相对于简单随机抽样的优点有(ACDE )。
A.实施方便B.每个基本单元的调查费用比较低C.能够充分发挥抽样的效率D.节省人力、物力E.可以分级准备抽样框5.二阶段抽样中,关于总体比例P 的表达可以为(AE )A. Y P =B. ∑==ni iP N P 11C. ∑==n i i Y MN P 11D. ∑==ni i A M P 11E. ∑==Ni i A MN P 11 三、计算题1. 对某商店上月销售额根据发票进行抽样估计,若该商店上月共用了18本发票,现用随机方法抽取了4本发票,每本发票有200张,从抽中的发票本中,每本分别随机抽取了40张发票,经过整理取得数据如下:发票调查情况2. 欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水账。
调查的结果如下表:对5家企业的调查结果要求根据这些数据推算100家企业改指标的总量,并给出估计的95%置信区间。
3. 某部委对所属企事业单位就一项改革方案进行抽样调查,采用二阶抽样。
先在全部1250 N 个单位(平均每个单位职工人数M =250)中按简单随机抽样抽取n=350个单位,然后对抽中的每个单位再按简单随机抽样抽取m=8个职工进行调查。
样本单位中赞成此项改革方案人数为k 的单位频数k n (k=0,1,…,8),及赞成比例k p 列在下表中,试估计该部委全体职工赞成该项方案的比例p ,给出估计两的方差估计。
4. 欲调查某个新小区居民户家庭装潢聘请专业装潢公司的比例。
我们在15个单元中随机抽取了5个的单元,每个单元有12户,在这5个单元中分别随机抽取了4户居民并进行了调查,对这20户的调查结果如下表:要求根据这些数据推算居民家庭装潢聘请专业装潢公司的比例。
5. 某县农村共有14个乡509个村,在实现小康的进程中欲计算该县农村的恩格尔系数,即居民户的食品支出占总支出的比例。
首先要调查全县的食品总支出,现采用了二阶抽样,第一阶段先在14个乡中,按村的数目多少进行pps 抽样,共抽了5个乡,第二阶段在抽样中的乡中随机的抽取6个村做调查,然后对抽中的村做全面调查,取得数据如下:要求估计全县的食品支出总金额及估计的标准误差。
6. 某服装联合企业,下面有90个缝纫厂,共有缝纫机4500台,据反映由于机器经常出现故障影响生产,管理部门拟用抽样方法调查上月每台机器因故障而停工的平均小时数,现采用二阶段抽样,第一阶段按简单随机抽样抽取10个工厂,第二阶段在抽中的工厂中抽20%的机器做样本,根据样本机器得如下数据:样本机器调查结果要求估计上月每台机器平均的停工时间和由于停工引起的总时间损失,并计算相对标准差。
7. 某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下表所示:每座高层建筑拥有的楼层数有的楼层数成比例的不等概率抽样抽取5座建筑,第二阶段按简单随机抽样对每座建筑抽取两个楼层。
对10个楼层居民人数的调查结果如下,请对小区总居民数进行估计,并给出估计的精度。
(95%的置信度)200间,每间住6位同学。
学生会的同学运用二阶段抽样设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取了3位同学分别进行单独访问,两个阶段的抽样都是简单随机抽样,调查的结果如下:试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。
9. 上题中,学生会对女生勤工俭学月收入的一项调查中,根据以往同类问题的调查,宿舍的标准差为1s =326元,宿舍内同学之间的标准差为2s =188元。
以一位同学进行调查来计算,调查每个宿舍的时间1c 为10分钟,调查每一学生的时间2c 为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间是0c 为4小时,如果总的时间控制在8个小时内,则最优的样本宿舍和样本学生数为多少?10. 苗圃职工用二阶抽样方法估计树苗的平均高度,该苗圃共有N=50块地,先从中抽 0(1)若两阶抽样都是简单随机的,调查结果用加权平均数∑==ni i i y M n M N Y 10)1(ˆ来估计总体均值,求估计值)1(ˆY,并计算)ˆ()1(Yv ;(2) 抽样方法同(1),但估计量不加权,即用∑==n i i y n Y 1)2(1ˆ,求估计值并计算)ˆ()2(Y v(3) 抽样方法不变,使用比估计,即∑∑=iii My M Y)3(ˆ,求估计值及其标准误差)ˆ()3(Yv(4) 讨论上述三种方法的适用条件11. 省卫生部门对32个城市的饮食业采用二阶抽样方法检查卫生合格情况,第一阶抽样从32个城市中简单随机抽取4个城市,第二阶抽样在每个抽中的城市用同样方法抽取一要求估计这32个城市不合卫生要求的饮食店所占的比例及95%的置信区间。
12. 某城市共有六家医院,欲估计住院病人中长期住院病人所占的比例。
现从这六家医院根据病床的多少采用放回按规模大小成比例的抽样方法抽取3个医院,再从抽中的医院中用简单随机抽样抽取10%的病人,调查长期住院病人(住院一个月以上)所占的比例.其数据如下:要求估计住院在一个月以上病人占总住院病人的比例及其95%的置信区间.13. 为估计一本英语字典的总字条效.先从26个字母中用放回的PPS 抽样方法抽出10个字母,在抽中的字母中又不放回地抽取2页进行计数,其样本数据如下:用汉森一赫维茨估计量估计该字典的总字数和它的相对标准差,并估计它的设计效应deff 。
14. 估计一个地区的每一住户平均消费支出,拟采用二阶抽样设计,第一阶抽村,第二阶抽户,都采用简单随机抽样。
为了设计这一调查先作了一试调查获得以下信息:(a)50=Y ,(b)村与村之间的方差5.8521=S ,(c)村内户与户之间的方差5.3622=S ,(d)调查每个村的费用91=c 元,(e)调查每一住户的费用12=c 元,(f)调查的组成管理费用为10000=c 元。
若总的调查费用C T =10000元。
请计算最忧的样本村数和每村的样本住户数。
15.班中每班抽选5个孩。
.假设抽中的班级为B 和C 班.在B 班中用简单随机抽样抽5个小孩,他们平均吃糖果数为3,5,4,5,3;在C 班中抽选的5个孩子其吃糖果数为4,6,4,4,3。
要求:(1) 估计全幼儿园平均每人每天吃糖果数; (2) 计算抽样标准误.16. 假设总体初级单元的大小均为M 。
为了估计总体均值Y (按次级单元),采用如下的二阶抽样法,先随机地抽取n 个初级单元,然后从每个初级单元中抽取一个次级单元。
记 M S S S U22212-=其中∑=--=N i i Y Y N S 1221)(11 ∑∑==--=N i Mj i ij Y Y M N S 11222)()1(1 试证:若02>u S ,则上述简单随机样本比直接从全体次级单元中抽取的样本量为n 的简单随机样本更有效,如果n /N 忽略不计,则两组样本同样有效。
17. 对于各级单元大小相等情形的三阶抽样,若每阶抽样都是简单随机的,根据9.5.1中的记号,证明233222212111)(S mkf S m f S s E -+-+= 23322221)(S kf S s E -+= 2323)(S s E = 四、简答题1. 什么是多阶段抽样?多阶段抽样有哪些优点?2. 能否举例说明多阶段抽样在实际生活中有哪些应用?3. 多阶抽样与单阶抽样的关系;4.二阶抽样与整群抽样和分层抽样的关系。
五、设计题某学校欲调查学生每月的零用钱数量。
假设该学校共有18个班级,每个班级都有60个学生。
请你设计一个调查方案,并说明你是如何确定样本量的。