多阶段抽样
抽样调查第8章多阶段抽样18210

置信度为95%的置信区间为:160800±1.96×9216 在上面的方差估计式中,第一项是主要的,第二项 要小得多!
返回
(二)对总体比例的估计
如果要估计总体中具有所研究特征的二级单元数占全 体全体二级单元数的比例,则
P
1 N
N
Pi
i1
1 NM
N i1
Ai
式中,Ai 为第i个初级单元中具有所研究特征的二级单元
(1)多阶段抽样保持了整群抽样的样本比较集中、 便于调查、节约费用等优点。
(2)多阶段抽样不需要编制所有小单元的样本框。
三、抽选方法与推断原理
多阶段抽样时,每一个阶段的抽样可以相同,也 可以不同。它通常与分层抽样、整群抽样、系统抽样 结合使用。多阶段抽样时,抽样是分步进行的,因此, 讨论估计量的均值及其方差时,需要分阶段进行这要
S 2 2i
M
1 i
1
Mi j 1
(Yij
Y i )2,
s 2 2i
1 mi 1
mi
( yij
j 1
yi )2
返回
二、估计量及其性质
(一)对初级单元进行简单随机抽样
如果二阶抽样中每个阶段都采用简单随机抽样,并且 每个初级单元中二级单元的抽样是相互独立的,则对 总体总和的估计可以采用简单估计,也可以考虑采用 比率估计。
表中红字为抽中的房号。 这时,初级单元有15个,每个初级单元拥有二级单元 12个。首先将单元从1到15编号,在15单元中随机抽取 5个单元,分别是1,6,9,12,13号;然后在被抽中的 单元中,进行第二次抽样,即分别在12户居民户中随机 抽取4户。
一、符号说明
初级单元和初级单元拥有的二级单元个数:N,M 第一阶段和第二阶段抽样的样本量:n ,m
抽样技术的种类与差异

抽样技术的种类与差异抽样技术是统计学中常用的一种数据收集方法,通过从总体中选取一部分样本进行观察和测量,从而推断总体的特征。
在实际应用中,不同的抽样技术适用于不同的研究目的和数据类型。
本文将介绍几种常见的抽样技术,并分析它们之间的差异。
一、简单随机抽样简单随机抽样是最基本的抽样技术,它的特点是每个样本有相等的机会被选中。
在进行简单随机抽样时,需要先给每个样本编号,然后通过随机数表或随机数发生器来选择样本。
简单随机抽样的优点是抽样误差小,结果具有代表性。
然而,由于需要对总体进行编号,对于总体较大或分散的情况,简单随机抽样的成本较高。
二、系统抽样系统抽样是按照一定的规则从总体中选取样本,例如每隔一定间隔选取一个样本。
系统抽样的优点是操作简单,适用于总体有序的情况。
然而,如果总体的有序性与抽样规则不一致,可能会引入抽样偏差。
三、分层抽样分层抽样是将总体划分为若干个层次,然后从每个层次中分别抽取样本。
分层抽样的优点是可以保证每个层次的代表性,从而提高总体估计的准确性。
然而,分层抽样需要对总体进行合理的划分,如果划分不准确,可能会引入抽样误差。
四、整群抽样整群抽样是将总体划分为若干个互不重叠的群组,然后从部分群组中抽取样本。
整群抽样的优点是操作简单,适用于总体分布不均匀的情况。
然而,如果群组内部的差异较大,可能会导致抽样结果的偏差。
五、多阶段抽样多阶段抽样是将总体划分为多个阶段,然后在每个阶段中进行抽样。
多阶段抽样的优点是可以逐步缩小样本规模,减少调查成本。
然而,多阶段抽样可能会引入额外的抽样误差,需要进行相应的校正。
六、整体抽样整体抽样是将总体中的每个个体都作为样本进行观察和测量。
整体抽样的优点是结果具有最高的准确性,可以得到总体的精确特征。
然而,整体抽样的成本较高,适用于总体规模较小的情况。
综上所述,不同的抽样技术适用于不同的研究目的和数据类型。
在选择抽样技术时,需要考虑总体的特征、调查成本和时间限制等因素。
多阶段抽样

设总体由N个初级单元组成,每个初级单元又 由若干二级(次级)单元组成,若在总体中按 一定方法抽取n个初级单元,对每个被抽中的 初级单元再抽取若干二级单元进行调查,则这 种抽样称为二阶抽样,或二级抽样(two-stage sampling)
在二阶抽样中,全部抽样是分两步实施的:
第一步是从总体中抽初级单元,称为第一阶抽样; 第二步是从每个被抽中的初级单元中抽二级单元,
1
Yi
Mi
Mi j1
Yij
Yi Mi
yi
ai
1 (21101) 54
10.25 4
v(p)
1- f1 n(n-1)
n i1
(pi
p)2
f1(1f2) n2(m-1)
n i1
piqi
1 5 15
2
1
2
1
1
2
1
1
2
0
1
2
1
1
2
5(51) 4 4 4 4 4 4 4 4 241
2 4
多阶段抽样每一阶段的抽样可以相同,也 可以不同,它通常与整群抽样、分层抽样、 系统抽样结合使用.
实际工作中,多阶段抽样通常与整群抽 样结合使用,即前几阶是多阶段抽样, 最后一阶为整群抽样。
多阶段抽样时,抽样是分步进行的,因此, 讨论估计量 ˆ的均值及方差时需要分阶段 进行,则用到下面的性质:
性质1 对于两阶段抽样,有
E(ˆ)E( 1 E2(ˆ)) V(ˆ)V1[E2(ˆ)]E1[V2(ˆ)]
• 式中,E2、V2为在固定初级单元时对第 二阶抽样求均值和方差;E1 、 V1为对第 一阶抽样求均值和方差.
上述1式是显然的。
2式证明如下:
抽样方案的种类包括哪些内容

抽样方案的种类包括哪些内容抽样方案的种类包括哪些内容摘要:抽样方案是市场调研中常用的一种方法,通过抽取一定数量的样本来代表整个调研对象群体,以达到节省成本和提高效率的目的。
本文将从六个方面详细介绍抽样方案的种类及其内容,包括简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样和速查抽样。
1. 简单随机抽样简单随机抽样是最基本的抽样方法,通过随机地从总体中抽取样本,确保每个样本都有相同的机会被选中。
其主要内容包括:(1)明确研究目标和总体:确定需要研究的问题和总体范围。
(2)建立抽样框架:构建包含总体中所有个体的名单或编号。
(3)确定样本量:根据总体大小和置信水平确定抽样量。
(4)使用随机数生成器进行抽样:利用随机数表或软件生成随机数,从抽样框架中按照随机数抽取样本。
(5)样本调查:对抽取的样本进行调查,收集数据。
2. 系统抽样系统抽样是指将总体按照一定规则排列,然后按照一定的间隔从中抽取样本。
其主要内容包括:(1)明确研究目标和总体。
(2)确定抽样框架和样本容量。
(3)计算抽样间隔:将总体容量除以样本容量得到抽样间隔。
(4)确定起始点:通过随机数生成器或者其他方法确定起始点。
(5)按照间隔抽样:从起始点开始,按照抽样间隔抽取样本。
3. 分层抽样分层抽样是将总体分为若干个层次,然后从每个层次中抽取样本。
其主要内容包括:(1)明确研究目标和总体。
(2)确定分层依据:根据研究目标和总体特征,确定分层依据。
(3)划分层次:根据分层依据将总体划分为若干个层次。
(4)确定每层样本容量:根据总体和样本容量确定每个层次的样本容量。
(5)在每个层次中进行抽样:根据每个层次的样本容量,利用简单随机抽样或其他抽样方法在每个层次中抽取样本。
4. 整群抽样整群抽样是将总体划分为若干个群体,然后从每个群体中抽取全部样本。
其主要内容包括:(1)明确研究目标和总体。
(2)确定群体划分依据:根据总体特征和研究目标,确定群体划分依据。
抽样的方案有哪几种方法组合的

抽样的方案有哪几种方法组合的抽样的方案有哪几种方法组合的摘要:在许多调查研究中,抽样是一种常用的方法。
抽样的方案是指根据具体的研究目的和样本特征,选择适当的抽样方法进行样本选择的过程。
本文将介绍六种常见的抽样方法,并分析它们的优缺点,最后提出一种结合多种抽样方法的综合方案,以满足不同研究需求。
第一部分:随机抽样在随机抽样中,每个个体有相等的机会被选入样本,从而确保样本的代表性和可靠性。
随机抽样有简单随机抽样、分层随机抽样和整群抽样等方法。
其优点是简单易行,适用于大样本量的研究,但也存在样本偏差的问题。
第二部分:系统抽样系统抽样是指按照某种规则从总体中选择样本,例如每隔固定的时间或空间间隔选择一个个体作为样本。
系统抽样适用于总体有明显的排列规律的情况,具有操作简单、适用范围广的优点。
然而,如果总体的排列规律与研究目的不一致,可能会引入系统性的抽样偏差。
第三部分:整群抽样整群抽样是指将总体划分为若干个互不重叠的群体,然后随机选择部分群体进行调查,最后在所选群体中进行样本选择。
整群抽样适用于总体分布不均匀、群体之间差异明显的情况,具有简化抽样过程、减少成本的优点。
然而,由于群体内个体的相似性,可能引入群体内部的抽样偏差。
第四部分:分层抽样分层抽样是指将总体划分为若干层,然后根据每层的特征,分别进行抽样。
分层抽样适用于总体存在明显的层次结构的情况,可以提高样本的代表性和效率。
但是,如果确定了错误的分层变量或分层变量的划分不准确,可能导致抽样偏差。
第五部分:整体抽样整体抽样是指将总体中的全部个体都作为样本进行研究。
整体抽样适用于总体规模较小、资源有限的情况,可以提高研究结果的准确性。
然而,由于需要涉及到总体的每个个体,整体抽样的成本和时间开销较大。
第六部分:多阶段抽样多阶段抽样是指将抽样过程划分为若干个阶段进行,每个阶段从前一阶段抽样的单位中选择样本。
多阶段抽样适用于总体分布复杂、难以直接抽样的情况,具有灵活性和成本效益的优点。
第九章 多阶段抽样

第九章 多阶段抽样第一节 多阶抽样概述一、 多阶抽样的概念1、单阶抽样:从总体中通过一次抽样就能够产生一个完整的样本,这类抽样即为单阶抽样。
前面介绍的几种抽样方式均为单阶抽样。
适合用于总体单元数相对较少的抽样过程。
2、多阶抽样:将整个抽样过程分成若干个阶段,一个阶段一个阶段地进行抽样以完成整个抽样过程,这种抽样即为多阶抽样。
当我们面对的总体单元数很庞大,而且分布范围很广时,如果使用前面所学习的单阶抽样方法,不仅工作量大,而且在精度上很难把握,此时如果改用多阶抽样方法,就会避免上述困难,从而达到理想的抽样效果。
3、关于多阶抽样的具体描述:如果我们面对的一阶单元内总体基本单元数相当大,作全面的调查就会比较困难,或者一阶单元内各二阶单元可以给出相近的结果,作全面的调查又无必要。
此时从费用和抽样估计效率考虑,便可以从总体中随机抽取一部分一阶单元,然后再从被抽中的一阶单元内,随机抽取部分二阶单元并对他们作全面调查,我们把这种抽样技术称为两阶抽样。
如果在被抽中的二阶单元中,再抽取部分三阶单元组成样本,并对抽中的三阶单元进行全面的调查,这就是三阶抽样。
类似地,可以定义四阶抽样或更高阶的抽样,通常将两阶以上的抽样称为多阶抽样。
需要指出的是,多阶抽样中,各阶可以采用不同的抽样方法,也可采用同一种抽样方法,要视具体情况和要求而定。
在两阶抽样中,总体各一阶单元所包含的二阶单元数,有相等和不相等的两种情况。
前者无论在样本的抽取还是在指标的估算方面都相对比较简单,然而在抽样实践中却很少有这种情况的存在,但作为基本方法仍然有其实际意义;后种情况在抽样和指标的估算方法上都较为复杂,然而在实际中普遍存在此种情况。
4、两阶抽样与分层抽样和整群抽样的关系:将总体分为若干个一阶单元,如果在每一个一阶单元中,都随机抽取部分二阶单元,由这些二阶单元中的总体基本单元组成的样本,在抽样的方式上,就相当于分层抽样;如果在全部的一阶单元中,只抽取了部分一阶单元,并对抽中的一阶单元中的所有的基本单元都做全面调查,这就是整群抽样。
抽样方法和抽样方案

抽样方法和抽样方案抽样方法是研究中用来从总体中抽取样本的方式。
常用的抽样方法有以下几种:1.随机抽样:随机抽样是指从总体中以随机的方式选择样本的方法。
这种方法能在一定程度上减小选择样本时的主观性和偏见,增加样本的代表性。
随机抽样又分为简单随机抽样、系统抽样和分层抽样等方式。
2.非随机抽样:非随机抽样是指从总体中以非随机的方式选择样本的方法。
这种方法常用于总体中一些特定群体的研究,如专业人员、地区居民等。
非随机抽样又分为便利抽样、判断抽样和配额抽样等方式。
3.多阶段抽样:多阶段抽样是指将总体分成多个较小的群组或阶段,然后在每个群组或阶段中进行抽样的方法。
这种方法常用于总体中存在明显层次结构的研究对象,例如不同地区的居民或不同学校的学生等。
4.整群抽样:整群抽样是指将总体分成多个群组,然后在每个群组中选择全体样本的方法。
这种方法常用于总体中的群组间差异较小,但群组内差异较大的情况,例如同一学校的不同班级。
抽样方案是研究中具体实施抽样方法的方案。
一个好的抽样方案应当包含以下几个方面的内容:1.抽样目标:明确研究的目标和需要回答的问题,确定所需的样本规模和要求。
2.总体定义:清楚地定义研究对象的总体,明确总体的边界和范围,以及总体中存在的各种特征和差异。
3.抽样框架:确定用于抽样的框架,即总体中包含的样本单位,例如个人、家庭、组织等。
抽样框架应能反映总体的特征和结构。
4.抽样方案:根据研究的目标和总体的特征,选择适当的抽样方法和抽样比例。
同时,要确定具体的实施步骤和时间安排,以确保样本的有效抽取。
5.抽样误差控制:考虑到抽样过程中的误差,必须采取相应的措施来控制误差的大小。
例如,通过增加样本量、优化抽样方法和加强质量管理等方法来降低抽样误差。
6.数据分析计划:在抽样方案中应当明确研究中将使用的数据分析方法和统计工具,以尽量充分地利用样本数据进行研究。
综上所述,抽样方法和抽样方案对研究的质量和可靠性有着重要影响。
第4章-等概率整群抽样和多阶段抽样

4.1.1 定义
整群抽样(cluster sampling)是将总体 划分为若干群,然后以群(cluster)为抽 样单元,从总体中随机抽取一部分群,对 被选群内的所有单元进行调查的一种抽样 技术。
2024/7/17
3
例
欲估计某高校大学生拥有手机数量,大学共有40000 名学生,10000个宿舍(每个宿舍4名学生)。
V (ˆ) E1 E2 (ˆ)2 E1 V2 (ˆ ) E1E2 (ˆ)2 V1 E2 (ˆ) E1 V2 (ˆ )
4.3.3 等概率两阶段抽样的符号说明
表4-5
4.3.4 初级单元(PSU)规模相等的 两阶段抽样
定理4.5 对于初级单元规模相等的两阶段抽样 ,如果两个阶段都是简单随机抽样,且对每个 初级单元,第二阶抽样是相互独立进行的,则 对总体均值 Y 的无偏估计为:
定理 4.1:y 是 Y 的无偏估计,即
Ey Y
定理 4.2: y 的方差为:
V ( y) 1 f n
1N N 1 i1
Yi Y
2
1 f nM
Sb2
定理 4.3:V ( y) 的样本估计为:
v( y) 1 f nM
sb2
Yˆ NMy V (Yˆ) V (NMy) N 2M 2V ( y) v(Yˆ) N 2M 2v( y)
(NM 1)(M 1)S 2
用简单随机抽样方法抽取n个群,每个群内的M个
单元全部进入样本,则等群抽样均值估计量 y 的方
差可用群内相关系数近似表示
N
2
V (y)
1 V(y) 1 f
Yi Y
i 1
M2
nM 2 N 1
1 f n
(NM 1) M 2 (N 1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多阶段抽样一、 单选题1. 两阶(段)抽样中,对于一个估计量θˆ的均值可以表示为(A )。
A.)]ˆ([)ˆ(21θθE E E =B.)]ˆ([)ˆ(12θθE E E = C. )]ˆ()ˆ([21)ˆ(21θθθE E E -= D. )]ˆ()ˆ([21)ˆ(21θθθE E E +=2. 在多阶段抽样中,当初级单元大小相等时,第一阶段抽样通常采用(B )。
A.系统抽样 B.简单随机抽样 C.不等概率抽样 D.非概率抽样3.初级单元大小不等的多阶段抽样中,无偏估计量成为自加权的条件是(C )。
A.第一阶段每个单元被抽中的概率相等 B.第二阶段每个单元被抽中的概率相等 C.最终阶段每个单元被抽中的概率相等 D.最终阶段每个单元被抽中的概率不等4.在初级单元大小相等的二阶段抽样中,当抽取次级单元的数量相等时,二阶段抽样的方差与整群抽样方差以及分层抽样方差之间的关系通常为(C )。
A.二阶段抽样的方差<整群抽样的方差<分层抽样的方差 B. 二阶段抽样的方差>整群抽样的方差>分层抽样的方差 C. 分层抽样的方差<二阶段抽样的方差<整群抽样的方差 D. 分层抽样的方差>二阶段抽样的方差>整群抽样的方差 二、多选题1.二阶段抽样中,初级单元大小不等时,一般可采用下面方法(AC )。
A.通过分层,将大小近似的初级单元分到一层,然后采用分层二阶段抽样B.可按初级单元大小相等的方法处理C.考虑用不等概率的抽样方法抽取初级单元D.采用简单随机抽样抽取初级单元但改变估计量的形式E.近似看成初级单元大小相等2.确定样本量时需要考虑的因素有(AB )。
A.调查的费用 B.调查要求的精度 C.调查的时间 D.调查的技术E.调查的目的3.初级单元大小不等时,下面关于二阶段抽样总体总和Y 的估计的说法正确的有(ABCD )。
A.可以采用放回的抽样方式,按不等概率抽取初级单元,此时可得总体总和Y 的估计量∑∑====n i ii i n i i i HH z y M n z Y n Y 111ˆ1ˆ B.采用不放回抽样方式,按简单随机抽样抽取初级单元,此时有∑∑====ni i ni i i uY n Ny M nN Y 11ˆˆC. 采用不放回抽样方式,按简单随机抽样抽取初级单元,此时∑∑===n i ini iR MY M Y 110ˆˆD. 采用不放回抽样方式,按不等概率抽样,此时有∑∑====n i ii n i ii i HT Y y M Y 11ˆˆππE.可以采用放回的抽样方式,按简单随机抽样抽取初级单元,此时有i ni iy MnN Y∑==1ˆ4.多阶段抽样相对于简单随机抽样的优点有(ACDE )。
A.实施方便B.每个基本单元的调查费用比较低C.能够充分发挥抽样的效率D.节省人力、物力E.可以分级准备抽样框5.二阶段抽样中,关于总体比例P 的表达可以为(AE )A. Y P =B. ∑==ni iP NP 11C. ∑==ni iY MN P 11D. ∑==ni i A M P 11E. 三、计算题1. 对某商店上月销售额根据发票进行抽样估计,若该商店上月共用了18本发票,现用随机方法抽取了4本发票,每本发票有200张,从抽中的发票本中,每本分别随机抽取了40张发票,经过整理取得数据如下:发票调查情况2. 欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水账。
调查的结果如下表:对5家企业的调查结果要求根据这些数据推算100家企业改指标的总量,并给出估计的95%置信区间。
3. 某部委对所属企事业单位就一项改革方案进行抽样调查,采用二阶抽样。
先在全部1250 N 个单位(平均每个单位职工人数M =250)中按简单随机抽样抽取n=350个单位,然后对抽中的每个单位再按简单随机抽样抽取m=8个职工进行调查。
样本单位中赞成此项改革方案人数为k 的单位频数k n (k=0,1,…,8),及赞成比例k p 列在下表中,试估计该部委全体职工赞成该项方案的比例p ,给出估计两的方差估计。
4. 欲调查某个新小区居民户家庭装潢聘请专业装潢公司的比例。
我们在15个单元中随机抽取了5个的单元,每个单元有12户,在这5个单元中分别随机抽取了4户居民并进行了调查,对这20户的调查结果如下表:要求根据这些数据推算居民家庭装潢聘请专业装潢公司的比例。
5. 某县农村共有14个乡509个村,在实现小康的进程中欲计算该县农村的恩格尔系数,即居民户的食品支出占总支出的比例。
首先要调查全县的食品总支出,现采用了二阶抽样,第一阶段先在14个乡中,按村的数目多少进行pps 抽样,共抽了5个乡,第二阶段在抽样中的乡中随机的抽取6个村做调查,然后对抽中的村做全面调查,取得数据如下:要求估计全县的食品支出总金额及估计的标准误差。
6. 某服装联合企业,下面有90个缝纫厂,共有缝纫机4500台,据反映由于机器经常出现故障影响生产,管理部门拟用抽样方法调查上月每台机器因故障而停工的平均小时数,现采用二阶段抽样,第一阶段按简单随机抽样抽取10个工厂,第二阶段在抽中的工厂中抽20%的机器做样本,根据样本机器得如下数据:样本机器调查结果要求估计上月每台机器平均的停工时间和由于停工引起的总时间损失,并计算相对标准差。
7. 某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下表所示:每座高层建筑拥有的楼层数有的楼层数成比例的不等概率抽样抽取5座建筑,第二阶段按简单随机抽样对每座建筑抽取两个楼层。
对10个楼层居民人数的调查结果如下,请对小区总居民数进行估计,并给出估计的精度。
(95%的置信度)200间,每间住6位同学。
学生会的同学运用二阶段抽样设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取了3位同学分别进行单独访问,两个阶段的抽样都是简单随机抽样,调查的结果如下:试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。
9. 上题中,学生会对女生勤工俭学月收入的一项调查中,根据以往同类问题的调查,宿舍的标准差为1s =326元,宿舍内同学之间的标准差为2s =188元。
以一位同学进行调查来计算,调查每个宿舍的时间1c 为10分钟,调查每一学生的时间2c 为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间是0c 为4小时,如果总的时间控制在8个小时内,则最优的样本宿舍和样本学生数为多少?10. 苗圃职工用二阶抽样方法估计树苗的平均高度,该苗圃共有N=50块地,先从中抽 0(1)若两阶抽样都是简单随机的,调查结果用加权平均数∑==ni i i y M n M N Y 10)1(ˆ来估计总体均值,求估计值)1(ˆY,并计算)ˆ()1(Yv ;(2) 抽样方法同(1),但估计量不加权,即用∑==ni i y n Y1)2(1ˆ,求估计值并计算)ˆ()2(Y v(3) 抽样方法不变,使用比估计,即∑∑=iii My M Y)3(ˆ,求估计值及其标准误差)ˆ()3(Yv(4) 讨论上述三种方法的适用条件11. 省卫生部门对32个城市的饮食业采用二阶抽样方法检查卫生合格情况,第一阶抽样从32个城市中简单随机抽取4个城市,第二阶抽样在每个抽中的城市用同样方法抽取一要求估计这32个城市不合卫生要求的饮食店所占的比例及95%的置信区间。
12. 某城市共有六家医院,欲估计住院病人中长期住院病人所占的比例。
现从这六家医院根据病床的多少采用放回按规模大小成比例的抽样方法抽取3个医院,再从抽中的医院中用简单随机抽样抽取10%的病人,调查长期住院病人(住院一个月以上)所占的比例.其数据如下:要求估计住院在一个月以上病人占总住院病人的比例及其95%的置信区间.13. 为估计一本英语字典的总字条效.先从26个字母中用放回的PPS 抽样方法抽出10个字母,在抽中的字母中又不放回地抽取2页进行计数,其样本数据如下:用汉森一赫维茨估计量估计该字典的总字数和它的相对标准差,并估计它的设计效应deff 。
14. 估计一个地区的每一住户平均消费支出,拟采用二阶抽样设计,第一阶抽村,第二阶抽户,都采用简单随机抽样。
为了设计这一调查先作了一试调查获得以下信息:(a)50=Y ,(b)村与村之间的方差5.8521=S ,(c)村内户与户之间的方差5.3622=S ,(d)调查每个村的费用91=c 元,(e)调查每一住户的费用12=c 元,(f)调查的组成管理费用为10000=c 元。
若总的调查费用C T =10000元。
请计算最忧的样本村数和每村的样本住户数。
15.班中每班抽选5个孩。
.假设抽中的班级为B 和C 班.在B 班中用简单随机抽样抽5个小孩,他们平均吃糖果数为3,5,4,5,3;在C 班中抽选的5个孩子其吃糖果数为4,6,4,4,3。
要求:(1) 估计全幼儿园平均每人每天吃糖果数; (2) 计算抽样标准误.16. 假设总体初级单元的大小均为M 。
为了估计总体均值Y (按次级单元),采用如下的二阶抽样法,先随机地抽取n 个初级单元,然后从每个初级单元中抽取一个次级单元。
记 M S S S U22212-=其中∑=--=N i i Y Y N S 1221)(11 ∑∑==--=N i Mj i ij Y Y M N S 11222)()1(1 试证:若02>u S ,则上述简单随机样本比直接从全体次级单元中抽取的样本量为n 的简单随机样本更有效,如果n /N 忽略不计,则两组样本同样有效。
17. 对于各级单元大小相等情形的三阶抽样,若每阶抽样都是简单随机的,根据9.5.1中的记号,证明233222212111)(S mkf S m f S s E -+-+= 23322221)(S kf S s E -+= 2323)(S s E =四、简答题1. 什么是多阶段抽样?多阶段抽样有哪些优点?2. 能否举例说明多阶段抽样在实际生活中有哪些应用?3. 多阶抽样与单阶抽样的关系;4.二阶抽样与整群抽样和分层抽样的关系。
五、设计题某学校欲调查学生每月的零用钱数量。
假设该学校共有18个班级,每个班级都有60个学生。
请你设计一个调查方案,并说明你是如何确定样本量的。