中国人民大学题库答案详解-抽样技术
抽样技术课后习题答案

12
160
1700
3
170
2000
13
180
2000
4
150
1500
14
130
1400
5
160
1700
15
150
1600
6
130
1400
16
100
1200
7
140
1500
17
180
1900
8
100
1200
18
100
1100
9
110
1200
19
170
1800
10
140
1500
20
120
1300
20
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到 , , ,
故 (份)
(份)
(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区总的订阅份数为7500,估计量方差为62700。
4.2
某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:
1
42
6.2
11
60
6.3
2
51
5.8
12
52
6.7
3
49
6.7
13
61
5.9
4
55
4.9
14
49
6.1
5
47
5.2
15
57
6.0
《抽样技术》习题答案(答案参考)

第2章项目相同之处不同之处定义都是根据从一个总体中抽样得到的样本,然后定义样本均值为_11ni i y y n ==∑。
抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复;而数理统计中的样本是从无限总体中利用有放回的抽样方法得到的,样本点有可能是重复的。
性质(1) 样本均值的期望都等于总体均值,也就是抽样理论和数理统计中的样本均值都是无偏估计。
(2) 不论总体原来是何种分布,在样本量足够大的条件下,样本均值近似服从正态分布。
(1) 抽样理论中,各个样本之间是不独立的;而数理统计中的各个样本之间是相互独立的。
(2) 抽样理论中的样本均值的方差为()21f V y S n -=,其中2_211i S Y Y N ⎛⎫=- ⎪-⎝⎭∑。
在数理统计中,()21V y nσ=,其中2σ为总体的方差。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大样本的条件下,()()_y E y y V y V y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为()()()(), 1.96, 1.96y z V y y z V y y V y y V y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为111.96, 1.96f fy s y s n n ⎡⎤---+⎢⎥⎣⎦由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得_21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知()()______11y Y P y Y r Y P V y V y αα⎧⎫-⎪⎪⎧⎫⎪-≤≥-⇒≤≥-⎨⎬⎨⎩⎭⎪⎪根据正态分布的分位数可以知道()__1y Y P Z V y αα⎫-⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
《抽样技术》第四版习题答案

第2章2.1 解:()1 这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2rY V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
抽样技术简答题及答案

抽样技术各类简答题参考答案习题一1. 请列举一些你所了解的以及被接受的抽样调查。
略2. 抽样调查基础理论及其意义;答:大数定律,中心极限定理,误差分布理论,概率理论。
大数定律是统计抽样调查的数理基础,也给统计学屮的大量观察法提供了理论和数学方面的依据;屮心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集屮在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学屮,是统计学发展史上的重要事件。
3. 抽样调查的特点。
答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。
4. 样本可能数目及其意义;答:样本可能数目是在容量为N的总体屮抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A 表示。
意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。
5. 影响抽样误差的因素;答:抽样误差是用样本统计量推断总体参数时的误差,它属于一・种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。
在实际工作屮,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。
抽样技术简答题及答案

抽样技术各类简答题参考答案习题一1.请列举一些你所了解的以及被接受的抽样调查。
略2. 抽样调查基础理论及其意义;答:大数定律,中心极限定理,误差分布理论,概率理论。
大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。
3.抽样调查的特点。
答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。
4.样本可能数目及其意义;答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。
意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。
5. 影响抽样误差的因素;答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法,如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误差。
在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。
抽样技术期末试题及答案

抽样技术期末试题及答案1. 选择题1.1. 在随机抽样中,下列哪种方法可以保证每个个体都有被选中的机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样答案:A. 简单随机抽样1.2. 下列哪种抽样方法适用于对城市中不同居住区的居民进行调查?A. 简单随机抽样B. 道路抽样C. 有限总体抽样D. 群集抽样答案:B. 道路抽样1.3. 在抽样调查中,误差来源主要包括以下几个方面,下列哪个不是?A. 非抽样误差B. 抽样误差C. 召回误差D. 地区误差答案:C. 召回误差2. 判断题2.1. 分层抽样是按照抽样单元的层次结构进行抽样的方法。
(×)错误2.2. 构成总体的个体是抽样的单位。
(√)正确2.3. 方便抽样是一种常用的抽样方法,可以得到客观有效的数据。
(×)错误3. 简答题3.1. 请简要解释什么是整群抽样,并说明适用的情况。
整群抽样是在调查研究中,将总体划分为若干个不相交的群组,再从中随机选取一部分群组作为样本,对所选群组中的所有个体进行调查和观察的方法。
适用情况:适用于总体中的个体具有较大的相似性,并能够通过群组进行划分的情况。
例如,在调查某个城市的居民满意度时,可以将城市的街道或社区作为群组,通过整群抽样来获取样本。
3.2. 简要介绍一种非概率抽样方法,并讨论其优缺点。
一种非概率抽样方法是方便抽样。
方便抽样是在调查过程中,选择离调查者最为便利的、容易获取的个体作为样本。
优点:方便抽样方法简单、快速,可以节省调查时间和成本。
适用于在研究设计初期或资源有限的情况下进行初步探索和观察。
缺点:方便抽样容易导致抽样偏差,样本的代表性较差,结果可能不具有普遍适用性。
调查者的主观意愿会对样本选择产生较大的影响,结果可能存在较大的偏差和误差。
4. 计算题4.1. 一个城市有5个区,每个区的居民数分别为1000、1500、2000、1200和1800人。
如果采用分层随机抽样方法,每个区的抽样比例分别为0.2、0.3、0.1、0.25和0.15,求总体的抽样比例。
抽样技术期末考试试题及答案

抽样技术期末考试试题及答案一、选择题(每题2分,共20分)1. 抽样调查中,样本容量的大小与抽样误差之间的关系是:A. 正相关B. 负相关C. 无关D. 有时正相关,有时负相关答案:B2. 以下哪种抽样方法属于概率抽样?A. 方便抽样B. 系统抽样C. 雪球抽样D. 判断抽样答案:B3. 在分层抽样中,各层的样本容量分配原则是:A. 各层样本容量相等B. 各层样本容量与总体容量成比例C. 各层样本容量与层内变异程度成反比D. 各层样本容量与层内变异程度成正比答案:D4. 以下哪种情况适合使用整群抽样?A. 总体单位分布均匀B. 总体单位分布不均匀C. 总体单位之间相互独立D. 总体单位之间存在明显的关联性答案:B5. 抽样调查中,如果样本容量增加,抽样误差将:A. 增加B. 减少C. 不变D. 先增加后减少答案:B6. 以下哪项不是抽样调查的优点?A. 节省时间和成本B. 可以对整个总体进行研究C. 可以估计总体参数D. 可以控制抽样误差答案:B7. 随机抽样的基本原则是:A. 抽样单位的选取具有随机性B. 抽样单位的选取具有系统性C. 抽样单位的选取具有主观性D. 抽样单位的选取具有代表性答案:A8. 在简单随机抽样中,每个单位被抽中的概率是:A. 不确定的B. 相等的C. 与总体大小成反比D. 与总体大小成正比答案:B9. 抽样调查中,样本的代表性是指:A. 样本能够代表总体B. 样本大小C. 样本的误差D. 样本的抽样方法答案:A10. 以下哪种抽样方法属于非概率抽样?A. 系统抽样B. 分层抽样C. 方差抽样D. 判断抽样答案:D二、简答题(每题10分,共20分)1. 简述分层抽样的优缺点。
答案:分层抽样的优点包括:(1)可以提高样本的代表性;(2)可以减少抽样误差;(3)可以对不同层进行单独分析。
分层抽样的缺点包括:(1)分层标准的选择可能存在主观性;(2)分层后各层的样本容量分配需要精心设计;(3)如果分层不准确,可能会增加抽样误差。
《抽样技术》第四版习题答案

第2章2.1解:()1这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是1 100。
()2这种抽样方法不是等概率的。
利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2100,而尚未被抽中的编号为36~63的每个单元的入样概率都是1 100。
()3这种抽样方法是等概率的。
在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是11000,所以这种抽样是等概率的。
2.2解:2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大样本的条件下_y E yy -=近似服从标准正态分布, _Y 的195%α-=的置信区间为2y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦。
由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道1P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/21111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫ ⎪⎛⎫⎝⎭ ⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国人民大学同等学力申请硕士学位课程考试试题课程代码:123105 课程名称:抽样技术与方法试题卷号: 1名词解释非概率抽样非概率抽样又称为非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法,其最主要的特征是抽取样本时并不依据随机原则。
包含有判断选样、方便抽样、自愿样本、配额抽样等。
最优分配在分层随机抽样中,对于给定的费用,使估计量的方差V(y_st)达到最小,或者对于给定的估计量方差V,使总费用达到最小的各层样本量的分配,称为最优分配。
PPS抽样是有放回的按规模大小成比例的概率抽样。
其抽选样本的方法有代码法、拉希里方法等。
PPS 抽样是按概率比例抽样,属于概率抽样中的一种。
是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。
就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。
自加权样本指调查中每个样本单元的设计权数是相同的,也就是说每个单元最终入样的概率是相等的。
在不考虑非抽样误差的情况下,可以认为自加权样本完全代表总体,因为每个样本单元都代表了总体中相同数目的单元。
(此时可以使用标准统计方法来进行点估计。
此外,自加权样本往往方差较小,样本统计量更稳健)简述题有人认为“抽样调查除了调查误差以外,还有抽样误差,因此抽样调查不如全面调查准确”,请对此加以评价。
一项调查的误差来自多个方面,抽样调查因为只调查总体中的一小部分,用部分的调查结果推断总体,所以存在着抽样误差,但这只是所有误差中的一部分。
对于抽样调查,误差包括抽样误差和非抽样误差。
有些情况下,全面调查由于参与的人员众多、涉及范围大,因此虽然没有抽样误差,但在数据采集和数据汇总整理的过程中却有产生其他误差的更大可能性,所以调查规模并不是越大越好。
与全面调查相比,抽样调查的工作量小,这就为使用素质较高的工作人员并对他们进行深入的培训创造了条件。
此外,如果能对调查过程实施更为细致的监督、检查和指导,可以使抽样调查所得到的数据质量比同样的全面调查数据质量更高,从而使调查的总误差更小。
试对分层抽样中的联合比率估计和分别比率估计方法进行比较。
如果每一层都满足比率估计量有效的条件,则除非R h=R,都有分别比率估计量的方差小于联合比率估计量的方差。
但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。
实际使用时,如果各层的样本量都较大,且有理由认为各层的比率R h差异较大,则分别比率估计优于联合比率估计。
当各层的样本量不大,或各层比率R h差异很小,则联合比率估计更好些。
此外,联合比估计不像分别比那样需要已知每层的辅助信息X h。
计算题某住宅区调查居民的用水情况,该区共有N =1000户,调查了n =100户,得y _=12.5吨,s 2 =1252,有40户用水超过了规定的标准。
要求计算:(1)该住宅区总的用水量及95%的置信区间;(2)若要求估计的相对误差不超过10%,应抽多少户作为样本?(3)以95%的可靠性估计超过用水标准的户数;(4)若认为估计用水超标户的置信区间过宽,要求缩短一半应抽多少户作为样本?【解】已知N=1000,n=100,f=n N =1001000 =0.1, y _=12.5, s 2 =1252(1)估计该住宅区总的用水量Y 为:Y ^=Ny _=1000*12.5=12500吨估计该住宅区总的用水量Y 的方差和标准差为:V(Y ^)=N 2v(y _)=N 21−f n s 2=10002*1−0.1100*1252=11268000 s(Y ^)=SQRT(v(Y ^))=√11268000 ≈ 3356.7842因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:Y ^±z 0.025s(Y ^)=12500±1.96*3356.7842≈12500±6579即,我们可以以95%的把握认为该住宅总的用水量在 5921吨~19079吨之间。
(2)根据题意,要求估计的相对误差不超过10%,即r ≤0.1,假定置信度为95% 根据公式:n 0=22r 2y 2=1.962×12520.12×12.52≈3078 由于n 0N=3.078>0.05,所以需要对n 0进行修正: n=n 01+n 0/N =30781+3.078≈755 若要求估计的相对误差不超过10%,应抽不少于755户作为样本。
或:n 0=1/(1/N+d 2/(z α/22s 2)) ≈755 (d=ry _=1.25)(3)令超过用水标准的户数为A ,样本中超过用水标准的户数为a = 40,估计超过用水标准的比例p 为:p=a/n=40/100=40%估计超过用水标准的比例p 的方差和标准差为:v(p)=1−f n−1p(1-p)=1−0.1100−1*40%*60%≈0.002182s(p)=√v(p)=√0.002182≈4.67%在95%的可靠性下,超过用水标准的比例p 的估计区间为:p ±z 0.025 s(p)=40%±1.96*4.67%因此,我们有95%的把握认为,超过用水标准的比例p 在30.85%-49.15%之间,超过用水标准的户数的点估计为:1000*40%=400户,超过用水标准的户数在1000*30.85%户~1000*49.15%户之间,即309户~492户之间。
或:p ±z 0.025√(1−f n−1p(1−p)代入得(0.3089,0.4911)(4)若要置信区间的宽度缩小为原来一半,即要求应抽取的户数n 满足方程z 0.025√1−f n−1p(1−p) = 1/2 * z 0.025√v(p)≈0.045766代入数据解得n=306.25≈306户。
为估计市区人均居住面积,按与各区人数呈比例的概率从12个区中抽了4个区,经调查的数据如下:【解】设居住面积为Y ,人口数为X ,N=12,n=4,f=n/N=1/3。
人均居住面积点估计值为R ^=r=∑y i 41∑x i 41 = 92366062117019 ≈4.363米2/人. s y 2=1n−1∑(y i −rx i )2n 1=13∑(y i −rx i )241= 13[(2835326-4.363*604746)2+(1670996-4.363*456035)2+(1835226-4.363*470981)2+(2895058-4.363*585257)2)≈ 101742707182.336373V(R ^)=V(r)≈1x 21−f n 1n−1∑(y i −rx i )2n 1=1−1/34× s y 2x2≈16 * 101742707182.33637370027647599.390625≈0.24215s(R^)=√V(r)=√0.24215≈0.492因此置信度为95%的区间估计为:4.363±1.96*0.492,即(3.3987,5.3273) 试题卷号:2名词解释概率抽样也称随机抽样,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的抽样方法。
(概率抽样就是使总体中的每一个单位都有一个已知的、不为零的概率进入样本的抽样方法。
)具体说来,概率抽样具有以下几个特点:(1)按一定的概率以随机原则抽取样本。
(2)每个单元被抽中的概率是已知的,或是可以计算出来的。
(3)当用样本对总体目标量进行估计时,要考虑到该样本(或每个样本单元)被抽中的概率。
也就是说,估计量不仅与样本单元的观测值有关,也与其入样概率有关。
概率抽样最主要的优点是,可以依据调查结果计算抽样误差,从而得到对总体目标量进行推断的可靠程度。
从另一方面讲,也可以按照要求的精确度,计算必要的样本单元数目。
因此,概率抽样可以排除调查者的主观影响,抽选出较其他方法更具代表性的样本。
事后分层又称抽样后分层,是对一个总体先进行简单随机抽样或系统抽样,抽取一个样本量为n的样本,然后对样本中的单元按某些特征进行分层并进行分层抽样估计。
πPS抽样是不放回的与单元大小成比例的概率抽样(该抽样方法是在总体抽取样本时,借助总体单元大小或规模(M i)的辅助变量来确定单元入样概率(Z i)或包含概率(πi, πij)的方法)随机化回答在调查中当一个问题是敏感性的或高度私人机密性的,则就会发生拒绝回答或回避回答的情况。
为了获得对这类问题总体比例进行估计的资料,就需要采用随机化的方式来获取回答信息并进行估计的技术,我们称之为随机化回答。
简述题什么是抽样框?简述抽样框的类型和作用,以及良好抽样框的标志。
总体的具体表现是抽样框。
通常,抽样框是一份包含所有抽样单元的名单,给每一个抽样单元编上一个号码,就可以按一定的随机化程序进行抽样。
抽样框又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。
设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。
若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。
抽样框有不同类型:名录框(总体中所有单元实际的名录清单,如在校学生名单、企业名册、电话号码簿等)、区域框(其单元由地理区域构成的集合,抽样总体由这些地理区域组成)、自然框(把相关的自然现象概念(如时间、距离等)作为抽样框使用)。
抽样框对抽样调查具有十分重要的作用。
1)首先,抽样框是代表总体进行抽样的,抽样框的缺陷会造成目标总体与调查总体不一致,在估计中出现偏差;2)其次,抽样框中的联系资料是用来确定总体单元所在的位置和联系地址的,如果出现错误,可能会产生无法联系而造成无回答;3)抽样框中的辅助资料可以用来进行分层等以改进抽样设计或改进估计方法,以提高抽样效率。
因此完备的抽样框是做好抽样调查的前提条件。
良好抽样框的标志是具有充分的辅助信息、目标总体和抽样总体完全重合,也就是目标总体单元和抽样总体单元完全呈一一对应的关系。
具体来讲:1)关联性,指抽样框与目标总体的对应程度,要求两者之间尽可能地关联;2)准确性,涵盖误差尽可能小,分类是否准确?联系资料是否完整?辅助资料是否齐全等;3)时效性,抽样框是否及时更新;4)最后还可以从建立抽样框的费用进行评估。
对多阶段抽样中自加权的有关问题进行论述。
由于不等概率抽样往往不满足自加权,因此在多阶段抽样中,最后一阶按等概率(如SRS等)抽取最终单元(USU),其它阶段采用PPS,且各阶段样本量对不同单元都等于常数,则所得样本是自加权的。