《抽样技术复习题》
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《抽样技术》期末复习
1、设计效应(Deff)
答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:deff二V%,其中V srs(y)为不放回简单随机抽样简单估计量的方差;V(y)为某个(y)
V
srs
抽样设计在同样样本量条件下估计量的方差。设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。如果deff < 1 ,则所考虑的抽样设计比简单随机抽样的效率高;反之,如果deff > 1,则所考虑的抽样设计比比简单随机抽样的效率低。
deff对复杂抽样时确定样本量有很大作用,在一定精度条件下,简单随机抽样所需的样本量n •比较容易得到,如果可以估计复杂抽样的deff,那么复杂抽样所需的样本量为:n = n deff。
2、概率抽样
答:概率抽样也称随机抽样。概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。
具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。(2)
每个单元被抽中的概率是已知的,或是可以计算出来的。(3)当用样本对总体目标量进行
估计时,要考虑到该样本(或每个样本单元)被抽中的概率。也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关。
概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。从另一方面讲,也可以按照要求的精确度,计算必要的样本单元数目。
因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本。
3、非抽样误差
答:非抽样误差是指除了抽样误差以外的,由于各种原因引起的误差。同抽样误差相比,非抽样误差有如下特点:(1)非抽样误差不是由于抽样的随机性带来的,所以在抽样调查
中,它不可能随着样本量的增大而减小。(2)在抽样调查中,由于非抽样误差的影响,往往
造成估计量的有偏。(3)有些非抽样误差难以识别和测定。(4)产生非抽样误差的渠道众多,成因复杂,对调查数据质量和估计结果的负面影响非常大。非抽样误差按其来源、
性质的不同,可以分为抽样框误差、无回答误差和计量误差等三类。
4、不等概率抽样
答:不等概率抽样在抽样前赋予总体每个单元一个入样概率,当然这个入样概率是不相同的,否则抽样就成为等概率的抽样。不等概抽样的优点是大大提高估计精度,减少抽样误差,但使用它也有条件,就是必须要有说明每个单元规模大小的辅助变量来确定每个单元人样的概率,这在抽样及推算时都是必须的。不等概率抽样可以按样本单元是否放回分为放回不等概抽样和不放回不等概抽样。
5、最优分配
答:在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下估计量的方差达到最小,或在给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。
6、比率估计
答:比率估计(radio estimator )又称比估计,在进行抽样调查时,目标量本身就
是总体比率,这样对目标量的估计就叫做比率估计,也可用来提高估计量的精度,它是有 偏的。
7、试述分别比估计和联合比估计的比较 答:如果每一层都满足比率估计量有效的条件,则除非 R h 二R ,都有分别比率估计量 的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计 量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。
实际使用时,如果各层的样本量都较大,且有理由认为各层的比率R h 差异较大,则分 别比率佑计优于联合比率估计。当各层的样本量不大,或各层比率R h 差异很小,则联合比 率估计更好些。
&试述设计效应在抽样设计中的应用。
答:设计效应(design effect ,简称deff )是指在相同样本量的条件下,采用特定 的抽样设计(一般为较复杂的抽样设计)与不放回简单随机抽样简单估计量的方差之比, 如果deff<1,则所考虑的抽样设计比简单随机抽样的效率高;反之,如果 deff>1,则所 考虑的抽样设计比简单随机抽样的效率低。设计效应是抽样调查中的一个重要参数,它可 以表明特定抽样设计的估计效率;如果有设计效应的经验数据,也可以用于确定不同调查 方式所需要的样本量,从而大大节约计算样本量的时间,因此倍受抽样调查设计人员的关 注。
9、 有人认为“总体愈大,应抽的样本量也愈大”,请对此加以评价。
答:这种说法是不正确的。因为,虽然在其他条件相同的条件下,样本量越大,抽样 误差越小,但是从抽样误差与样本量的关系图可以看出,抽样误差在开始时随着样本量的 增大而显着减小,但经过一定阶段后便趋于稳定。也就是说,经过一定阶段后,用增大样 本量的方式减少抽样误差一般是不合算的。当样本增大到一定能够程度,无论总体再大, 抽样的精度都差不多。所以,这种说法是不正确的。
10、 (简单随机抽样的均值、比例估计和样本量的确定)某住宅区调查居民的用水情 2
况,该区共有N=1OOO 户,调查了 n =100户,得y
=12.5吨,s =1252,有40户用水超过 了规定的标准。 要求计算:
①该住宅区总的用水量及95%勺置信区间;
①若要求估计的相对误差不超过10%应抽多少户作为样本? O 以95%勺可靠性估计超过用水标准的户数;
解:已知 N = 1000,n = 100,
100
0.1,y=12.5,s^1252
N 1000
①估计该住宅区总的用水量 丫为:
估计该住宅区总的用水量 丫的方差和标准差为:
因此,在95%勺置信度下,该住宅总的用水量的置信区间估计为:
即,我们可以以95%勺把握认为该住宅总的用水量在 5921吨〜19079吨之间 ②根据题意,要求估计的相对误差不超过 10%即r < 0.1,假定置信度为95%
由于 皿=3.078 0.05,所以需要对n 0进行修正: N
若要求估计的相对误差不超过10%应抽不少于755户作为样本。
③以95%勺可靠性估计超过用水标准的户数;
根据公式: .2 2 t S n ° 2 2 r y
1.962 1252
2 2 0.12
12.52
:3078