抽样技术期末知识点(附考点大题)

合集下载

大学《抽样技术》期末考试卷(附详细答案)

大学《抽样技术》期末考试卷(附详细答案)

抽样技术试题期末考试卷一.选择题(每小题3分,共45分)1.概率抽样中的基本抽样方法不包括( C)A、简单随机抽样B、分层抽样C、定额抽样D、整群抽样2.下列属于总体参数的是( B)ˆ=N(y+y+L+y)A、Y12nn1 B、Y=(Y1+Y2+L+YN)Nˆ=1(y+y+L+y)C、P12nnˆ=∑y/∑xD、Ri ii=1i=1n n3.抽样框的具体表现形式不包括( B)A、区域框B、初级框C、自然框D、名录框4.估计量方差是( B)A、指按照某一抽样方案反复进行抽样,估计值的数学期望与待估参数之间的离差。

B、用样本统计量对总体参数进行估计时产生的误差。

C、由于抽取样本的随机性造成的样本值与总体值之间的差异。

D、由其他多种原因引起的估计值与总体参数之间的差异。

5.下列选项属于抽样误差的是( C)A.调查误差B.不完整的抽样框引起的误差C.抽取样本的随机性造成的误差D.不回答误差6.在简单随机抽样过程中,某一个个体被抽到的可能性( C)A、与第几次抽样有关,第一次被抽到的概率最大B、与第几次抽样有关,第一次被抽到的概率最小C、与第几次抽样无关,每一次被抽到的概率一样D、与第几次抽样无关,与抽取的样本数有关7.下面的表达式中错误的是( D)A、∑f h=1 B、∑n h=n C、∑W h=1 D、∑N h=18.下面哪种样本量分配方式属于比例分配?( A )A.n n h n= B.h =n N hNN hShchchL∑N h =1hShC.n h N S n W S=L h h D.h =L h h n n N S ∑hh∑W hShh =1h =19.某学校有男、女学生各500名。

为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( D )A.抽签法B.随机数法C.系统抽样法D.分层抽样法10.层权是( B )A 各层样本单元数与总体单元数之比B 各层单元数与总体单元数之比C 各层样本单元数与总体单元数之和D 各层单元数与总体单元数之和11.以下关于参数比率估计的公式中正确的是( A )ˆ=y A R x ˆ=y Y B Y R xˆ)ˆ(Y ˆ)=N V ˆ(Y C VRRˆ=y YD Y R x12.关于群内相关系数的公式,以下说法正确的是( D)2A 当群内方差S w与总体方差S 2相等时,ρ=12B 当群内各个次级单元的指标值都相等时,即S w=0,ρ达到最小值2C 当群内方差S w>总体方差S 2时,ρ取正值D 当群间方差S b 2=0时,ρ达到最小值-1M -113.群内相关系数ρ取值范围( C )A.[ -1/(M-1) , M]B. [ -1/M , 1]B.[ -1/(M-1) , 1] D. [ 1/(M-1) , 1]14.PPS 抽样是( B )。

抽样技术期末内容整理

抽样技术期末内容整理

《抽样调查方法与技术》复习要点1、我国统计调查方法体系改革的目标模式是什么?为什么?目标模式:建立以周期性普查为基础,以经常性抽样调查为主体,以必要的统计报表、重点调查、科学推算等为补充的搜集和整理基本统计资料的统计调查方法体系。

所以,抽样调查在我国统计调查方法体系中应该是使用最广泛的一种调查方法,在调查方法体系中处于主体地位。

为什么?解放前,我国统计工作相当薄弱,解放后,我国统计工作主要是照搬前苏联的体制,根据计划经济的特点和分级管理的要求建立了定期统计报表制度,以全面统计为主。

改革开放后,社会主义市场经济逐渐取代了计划经济,统计调查的对象日趋庞杂,以全面统计报表为主的统计调查体系已完全不能适应国家宏观决策与调控,以及部门、企业、社会公众对统计信息的需要,另外全面统计调查方法不仅笨重,缺乏灵活性,而且财力、物力投入大,统计调查效益差,基层负担重,中间环节多,容易受到行政干挠,统计信息质量很难得到保证。

为了从根本上解决调查对象复杂,调查方法单一的问题,对历史上形成的传统的统计调查方法体系进行了改革,于是抽样调查作为一种科学的非全面调查,越来越受到重视。

2、抽样调查会被大数据的“全样本”分析所取代吗?不会。

第一,抽样调查具有随机性,使得样本可以反映总体的情况。

而大数据样本没有这样的随机性,不能很好的代表总体。

第二,大数据样本不能被当作“总体”,大数据技术本身远远没有达到“普查”的水平,存在统计偏差。

3、大数据时代抽样调查面临哪些挑战与机遇?(熟读:王莹万舒晨《大数据时代抽样调查面临的挑战与机遇》,《统计与信息论坛》,2016年06期)(一)大数据对抽样调查提出挑战第一,《大数据时代》强调“样本=总体”的观点存在争议,事实上不可能完全利用存在无效信息的全部大数据进行分析,因此抽样调查仍然大有可为。

第二,大数据是动态实时变化的,因而统计调查分析的目的可能也随之不断发生变动。

在前期获得部分样本的情况下,需要研究根据已知的样本逐步调整调查的项目,从而获取感兴趣的抽样对象,使得这些“热门”样本数据能够适时入样。

抽样调查期末试题答案

抽样调查期末试题答案

一、简答题1.答:基本的概率抽样方法,如简单随机抽样、分层抽样、整群抽样、系统抽样。

(1)简单随机抽样的思想:从一个单元数为N 的总体中逐个抽取单元并且无放回,每次都在所有尚未进入样本的单元中等概率地抽取,直到n 个单元抽完。

(2)分层抽样的思想:先按照某种规则把总体划分为不同的层,然后在层内再进行抽样,各层的抽样之间独立进行。

(3)整群抽样思想:抽样仅对初级抽样单元进行,对于抽中的初级单元调查其全部的次级抽样单元,对于没有抽中的初级单元则不进行调查。

(4)系统抽样思想:先将总体中的抽样单元按某种次序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的规则抽取其他样本单元。

2.答:(1)可同时对子总体进行参数估计。

(2)便于依托行政管理机构进行组织和实施,同时还可以根据各层的不同特点采用不同的抽样方式。

(3)可使样本在总体中分布更加均匀,从而具有更好的代表性。

这样就避免了样本分布不均衡的现象。

(4)可以提高参数估计的精度。

事实上分层抽样的精度一般要高于其它抽样方式。

二、计算题 1.解:(1)∑===ni i y n y 1667.601(2)V 5.71530111)(222==≈-=S n S n f y S(y )=)(y V =2.739y +Z 0.025×S(y )=60.667+1.96×2.739=66.035y -Z 0.025×S(y )=60.667-1.96×2.739=55.299所以Y 的95%的置信区间(55.299,66.035)。

(3)由样本计算得到s =15.182,所以,Vˆ(y )==≈-2211s n s n f 30115.1822=7.684 Sˆ(y )=)(ˆy V =2.772 y +Z 0.025×S(y )=60.667+1.96×2.772=66.100y -Z 0.025×S(y )=60.667-1.96×2.772=55.234所以Y 的95%的置信区间(55.234,66.100)。

应用抽样技术期末试题及答案

应用抽样技术期末试题及答案

应用抽样技术期末试题及答案一、选择题1. 抽样是统计调查中的一种重要方法,以下关于抽样的说法正确的是:A. 抽样是指从整体中选择出有代表性的样本进行研究或调查B. 抽样是指从部分中选择出有代表性的样本进行研究或调查C. 抽样是指从样本中选择出有代表性的整体进行研究或调查D. 抽样是指从总体中选择出有代表性的样本进行研究或调查2. 在抽样调查中,以下哪种抽样方法可以保证每个个体被等可能地被抽取到样本中?A. 系统抽样B. 随机抽样C. 整群抽样D. 方便抽样3. 利用抽样获得的样本数据,能够推断总体的特征,以下哪种类型的推断是建立在统计学原理基础上的?A. 修改性推断B. 统计推断C. 精确推断D. 直接推断4. 通过抽样的方法,我们可以评估总体参数的数值,以下哪种方法是建立在中心极限定理的基础上的?A. 置信度B. 可信度C. 可靠度D. 信度5. 抽样调查中使用的样本容量过小可能导致结果的不准确,以下哪个因素不会影响样本容量的大小?A. 总体的大小B. 误差容忍度C. 可用资源D. 概率分布二、填空题1. 整群抽样是指将总体按照特定的特征分成多个________,然后从某些群体中选择样本进行调查。

答案:群体2. 抽样误差是指样本的统计特征与总体的真实特征之间的差异,它受到样本容量和________的影响。

答案:抽样方法3. 置信区间是用来估计总体参数的区间范围,常见的置信区间水平有________。

答案:90%、95%、99%4. 在简单随机抽样中,每个个体被选入样本的概率是________。

答案:相等的5. 样本的有效性是指样本是否真实、准确地反映了总体的特征,影响样本有效性的因素有样本的________。

答案:无偏性三、问答题1. 请简要说明抽样方法的分类及其特点。

答:抽样方法可以分为概率抽样和非概率抽样。

概率抽样是指每个个体被抽中的概率是可以计算的,包括简单随机抽样、系统抽样、整群抽样等。

《抽样技术复习习题》

《抽样技术复习习题》

欢迎共阅《抽样技术》期末复习1、设计效应(Deff )答:设计效应(deff )是由基什提出的,用来对不同抽样方法进行比较,其定义为:srs V(y)deff V (y)=,其中srs V (y)为不放回简单随机抽样简单估计量的方差;V(y)为某个抽样设计在同样样本量条件下估计量的方差。

设计效应的定义就是将某个抽样设计的估计量的方差与同样样本量条件下的不放回简单随机抽样简单估计量的方差进行比较。

如果deff<1,则所考虑的抽样率低。

deff n '。

2答:2)每3偏。

(3查数据质量和估计结果的负面影响非常大。

非抽样误差按其来源、性质的不同,可以分为抽样框误差、无回答误差和计量误差等三类。

4、不等概率抽样答:不等概率抽样在抽样前赋予总体每个单元一个入样概率,当然这个入样概率是不相同的,否则抽样就成为等概率的抽样。

不等概抽样的优点是大大提高估计精度,减少抽样误差,但使用它也有条件,就是必须要有说明每个单元规模大小的辅助变量来确定每个单元人样的概率,这在抽样及推算时都是必须的。

不等概率抽样可以按样本单元是否放回分为放回不等概抽样和不放回不等概抽样。

5、最优分配答:在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下估计量的方差达到最小,或在给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。

6、比率估计答:比率估计(radioestimator)又称比估计,在进行抽样调查时,目标量本身就是总体比率,这样对目标量的估计就叫做比率估计,也可用来提高估计量的精度,它是有偏的。

7、试述分别比估计和联合比估计的比较因为这8如9答:但10区共有N=1000户,调查了n=100户,得y=12.5吨,2s=1252,有40户用水超过了规定的标准。

要求计算:该住宅区总的用水量及95%的置信区间;若要求估计的相对误差不超过10%,应抽多少户作为样本?以95%的可靠性估计超过用水标准的户数;解:已知N=1000,n=100,n100f0.1N1000===,2y=12.5s1252=,估计该住宅区总的用水量Y为:估计该住宅区总的用水量Y的方差和标准差为:因此,在95%的置信度下,该住宅总的用水量的置信区间估计为:即,我们可以以95%的把握认为该住宅总的用水量在5921吨~19079吨之间。

抽样技术期末试题及答案

抽样技术期末试题及答案

抽样技术期末试题及答案1. 选择题1.1. 在随机抽样中,下列哪种方法可以保证每个个体都有被选中的机会?A. 简单随机抽样B. 系统抽样C. 分层抽样D. 整群抽样答案:A. 简单随机抽样1.2. 下列哪种抽样方法适用于对城市中不同居住区的居民进行调查?A. 简单随机抽样B. 道路抽样C. 有限总体抽样D. 群集抽样答案:B. 道路抽样1.3. 在抽样调查中,误差来源主要包括以下几个方面,下列哪个不是?A. 非抽样误差B. 抽样误差C. 召回误差D. 地区误差答案:C. 召回误差2. 判断题2.1. 分层抽样是按照抽样单元的层次结构进行抽样的方法。

(×)错误2.2. 构成总体的个体是抽样的单位。

(√)正确2.3. 方便抽样是一种常用的抽样方法,可以得到客观有效的数据。

(×)错误3. 简答题3.1. 请简要解释什么是整群抽样,并说明适用的情况。

整群抽样是在调查研究中,将总体划分为若干个不相交的群组,再从中随机选取一部分群组作为样本,对所选群组中的所有个体进行调查和观察的方法。

适用情况:适用于总体中的个体具有较大的相似性,并能够通过群组进行划分的情况。

例如,在调查某个城市的居民满意度时,可以将城市的街道或社区作为群组,通过整群抽样来获取样本。

3.2. 简要介绍一种非概率抽样方法,并讨论其优缺点。

一种非概率抽样方法是方便抽样。

方便抽样是在调查过程中,选择离调查者最为便利的、容易获取的个体作为样本。

优点:方便抽样方法简单、快速,可以节省调查时间和成本。

适用于在研究设计初期或资源有限的情况下进行初步探索和观察。

缺点:方便抽样容易导致抽样偏差,样本的代表性较差,结果可能不具有普遍适用性。

调查者的主观意愿会对样本选择产生较大的影响,结果可能存在较大的偏差和误差。

4. 计算题4.1. 一个城市有5个区,每个区的居民数分别为1000、1500、2000、1200和1800人。

如果采用分层随机抽样方法,每个区的抽样比例分别为0.2、0.3、0.1、0.25和0.15,求总体的抽样比例。

抽样技术期末考试试题及答案

抽样技术期末考试试题及答案

抽样技术期末考试试题及答案一、选择题(每题2分,共20分)1. 抽样调查中,样本容量的大小与抽样误差之间的关系是:A. 正相关B. 负相关C. 无关D. 有时正相关,有时负相关答案:B2. 以下哪种抽样方法属于概率抽样?A. 方便抽样B. 系统抽样C. 雪球抽样D. 判断抽样答案:B3. 在分层抽样中,各层的样本容量分配原则是:A. 各层样本容量相等B. 各层样本容量与总体容量成比例C. 各层样本容量与层内变异程度成反比D. 各层样本容量与层内变异程度成正比答案:D4. 以下哪种情况适合使用整群抽样?A. 总体单位分布均匀B. 总体单位分布不均匀C. 总体单位之间相互独立D. 总体单位之间存在明显的关联性答案:B5. 抽样调查中,如果样本容量增加,抽样误差将:A. 增加B. 减少C. 不变D. 先增加后减少答案:B6. 以下哪项不是抽样调查的优点?A. 节省时间和成本B. 可以对整个总体进行研究C. 可以估计总体参数D. 可以控制抽样误差答案:B7. 随机抽样的基本原则是:A. 抽样单位的选取具有随机性B. 抽样单位的选取具有系统性C. 抽样单位的选取具有主观性D. 抽样单位的选取具有代表性答案:A8. 在简单随机抽样中,每个单位被抽中的概率是:A. 不确定的B. 相等的C. 与总体大小成反比D. 与总体大小成正比答案:B9. 抽样调查中,样本的代表性是指:A. 样本能够代表总体B. 样本大小C. 样本的误差D. 样本的抽样方法答案:A10. 以下哪种抽样方法属于非概率抽样?A. 系统抽样B. 分层抽样C. 方差抽样D. 判断抽样答案:D二、简答题(每题10分,共20分)1. 简述分层抽样的优缺点。

答案:分层抽样的优点包括:(1)可以提高样本的代表性;(2)可以减少抽样误差;(3)可以对不同层进行单独分析。

分层抽样的缺点包括:(1)分层标准的选择可能存在主观性;(2)分层后各层的样本容量分配需要精心设计;(3)如果分层不准确,可能会增加抽样误差。

抽样技术期末总复习

抽样技术期末总复习

-一、抽样的类型1(一)非概率抽样11.非随机抽样的含义1(二)概率抽样32.概率抽样的程序3(三)多段抽样5二、简单随机抽样〔SRS〕5(四)抽样方案设计5(五)抽选方法6三、分层随机抽样6四、比率估计的性质8(六)比率估计的近似方差8(七)分层随机抽样下的比率估计9(八)比估计量与回归估计量的比拟:10五、样本量在各层的分配10(九)比例分配10(十)最优分配10(十一)Neyman〔曼〕分配11(十二)样本量确实定11一、抽样的类型(一)非概率抽样主要依据研究者的主观意愿、判断或是否方便等因素抽取样本;误差大,难以估计,代表性小,适合探索性研究。

主要有:偶遇抽样、判断抽样、定额抽样、雪球抽样1.非随机抽样的含义它是在不确定总体中,按照非随机原则选取样本,并用这局部样本指标的调查结果,来判断总体指标的一种抽样类型。

⓿非随机抽样的围.当对调查的总体不够清楚,或者太复杂,不适于采取随机抽样时,则,就需要用非随机抽样来抽出样本;⓿.适用于经常性的调查和方便灵活的调查。

a)偶遇抽样方便抽样或自然抽样,指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。

或者说研究可以得到的一组个体.适用围〔1〕可用于经常性的市场调查;〔2〕可用于正式市场调查之前的试验调查;〔3〕任意调查适用于同质总体。

优点:方便、灵活,简便易行,及时取得所需资料,节约时间和费用本钱低缺点:因为个体差异性,抽样误差很大,结果不够可靠,应用价值较低b)判断抽样研究者根据研究目标和自己的主观分析来选择和确定他们认为可以提供所需要信息的人作为样本。

含义:又称立意抽样法,它是指由市场调查的专家依据自己的判断来选取样本的一种方法。

适用围:总体的构成单位差异较大而样本数又很小的情况优点:因为是按照调查人员的需要来选定样本,所以较好地满足了特殊的调查需要。

缺点:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样期末知识点汇总一.绪论(一)抽样调查抽样调查是指非全面调查的总称。

只要是从研究的对象中抽取部分单位加以调查,用来说明全体,就统称为抽样调查。

(广义)选样方法:非概率抽样&概率抽样1.非概率抽样抽样方法:目的抽样、判断抽样、任意抽样、方便抽样、配额抽样(盖洛普民意测验、自愿样本原因:(1)受客观条件限制,无法进行严格的随机抽样。

(2)为了快速获得调查结果。

(3)在调查对象不确定,或无法确定的情况下采用,例如,对某一突发(偶然)事件进行现场调查等。

(4)总体各单位间离散程度不大,且调查员具有丰富的调查经验时。

优点:成本低,而且容易完成;缺点:不能对估计的精度作出客观、准确的说明。

2.概率抽样(狭义抽样调查)按照概率统计的原理,从研究的总体中按随机原则来抽选样本,通过对样本的调查获取数据,以此来对总体的特征作出估计推断;对推断中可能出现的抽样误差可以从概率的意义上加以控制。

特点:(1)对于一个具体的调查,要求总体中的每一个单元都有一个已知的非零概率被抽中。

(2)抽取样本的方法必须是随机的。

(3)根据样本来计算估计值的方法,应符合抽样的方法确定合适的估计量。

(4)能够以一定的概率控制抽样误差的范围。

概率抽样:等概率抽样&不等概率抽样(二)抽样调查的常用概念1. 目标总体:可简称为总体,是指所要研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体所组成,组成总体的各个个体称作总体单元或单位。

2.抽样总体:指从中抽取样本的总体。

3.抽样框:抽样总体的具体表现。

通常抽样框是一份包含所有抽样单元的名单。

4.总体参数:总体的特征。

5. 统计量(估计量):样本观察值的函数。

6.抽样误差:由于抽样的非全面性和随机性所引起的偶然性误差。

7.非抽样误差:由随机抽样的偶然性因素以外的原因所引起的误差。

8.抽样误差表现形式:抽样实际误差、抽样标准误和抽样极限误差。

9. 抽样标准误(S ),抽样方差(V ),V=S 210.偏差:样本估计量的数学期望与总体真值间的离差,ˆˆE()-()ˆB θθθ=。

11.均方误差:22ˆˆˆ()()()MSE E θ-θV θB θ==+。

12.精确度:每次抽样结果之间差别大小13.精度:估计量的抽样标准误差或方差与待估计参数之比。

14.可靠性:置信度(1-a )15.抽样效率:两个抽样方案在样本量相同的情况下的抽样方差之比。

16.设计效果:ˆ()ˆ()D SRS V Deff V θθ=SRSˆ()ˆ()D V V θθ表示某设计方案的方差,表示相同样本量下简单随机抽样的方差。

17. 1-f 称为有限总体校正系数(finite population correction ,简记为fpc ),当抽样比f 很小时,1-f 就接近于1,这样抽样比对y 的精度就没有直接影响;一般地,当抽样比小于5%,甚至小于10%时,fpc 可以忽略不计,即认为1-f 为1;事实上略去fpc 的影响是使()V y 高了一些 18.抽样调查步骤确定调研问题——抽样方案设计——问卷设计 ——实施调查过程 ——数据处理分析——撰写调查报告二.简单随机抽样SRS(一)定义:从容量为N的总体中抽取一个容量为n的样本,若所有可能的nNC个样本中的每一个被抽到的概率都相等,即每个可能样本被抽中的概率均为1nN C,这种抽样方法称为不放回的简单随机抽样,简称简单随机抽样,所得的样本称为不放回的简单随机样本,简称简单随机样本(二)实施方法:将总体中的单元依次从1到N进行编号,然后利用抽签法或随机数法来进行简单随机抽样。

(三)优点:简单直观。

在抽样框完整时,可以直接从中抽选样本,由于抽选的概率相同,用样本统计量对目标量进行估计及计算抽样误差都比较方便。

(四)局限性:它要求将包括所有总体单元的名单作为抽样框,当N很大时,构造这样的抽样框并不容易;根据这种方法抽出的单元很分散,给实施调查增加了困难;这种方法没有利用其他辅助信息以提高估计的效率。

所以在规模较大的调查中,很少直接采用简单随机抽样,一般是把这种方法与其他抽样方法结合在起使用。

(五)估计(1)总体均值对于简单随机抽样,Y y 是的无偏估计。

即Y y E =)( 对于简单随机抽样,221V S nf S nN n N y y -=-=)(的方差为: ()21)(s nf y v y V -=的无偏估计为: 的近似置信区间为的置信度为α-1Y (s n f uy ---121α,s n fu y -+-121α)(2)总体总量(∑===N1i i Y Y N Y nN)对于简单随机抽样,()Y YˆE Y =的无偏估计,即是Y ()()()2221y V N Y ˆV Y ˆSnf N -==的方差为:()()()()2221ˆˆs nf N y v N Y v YV -==的无偏估计为: (3)总体比例设N 2101Y ,,,,,其他征个单元具有所考虑的特,若第 =⎩⎨⎧=i i i ,总体中有A 个单元具有这个特征,即∑==Ni i Y 1A ,总体中具有某种特征的单元在总体中所占的比例P 即是Y 的均值:Y Y Ni i ===∑=1N 1N A Y ;总体方差为:()⎪⎭⎫ ⎝⎛--=--=∑∑==N i i N i i Y N Y N Y Y N S 1222121111,由于i Y 的取值为0或1 ,所以∑∑===Ni i Ni i Y Y 112,即()P QPQ N N NP NP N S -=-=--=1ˆ11122,其中. 相应地,样本比例为y nynap ni i===∑=1,样本方差为()())1(11111122p q pq n n p p n n y y n s ni i -=-=--=--=∑=其中 p 为P 的简单估计,且为无偏估计,即()P p =E p 的方差为()()PQ N n nN PQ N N n f p V 111--=--=()())1(1112p q pq n fs n f p v p V -=--=-=其中的无偏估计为: 在大样本条件下,利用正态分布可得P 的置信度为1-α的近似置信区间为⎥⎦⎤⎢⎣⎡--+-----pq n fu p pq n f u p 11112121αα, (六)样本量的确定费用函数:Cn +=0T C C ,其中T C 为总费用,0C 为固定费用,C 为每调查一个样本单元所需的费用。

绝对误差限:()()θθααˆˆ2121S u V ud --== 相对误差限:()()()θθθθθαααˆˆˆ212121Cv uS uV ur ---=== 其中()()()==θθθˆˆˆE S Cv ()θθˆS (七)简单随机抽样估计总体均值或总体总量时样本量的确定: (1)精度要求:估计量y 的方差上限为VNn n n N n n n VS n 00002011+=+≥=,因此取,则设,如果05.000<N n N n 时,即《,则 样本量直接取0n ,否则对0n 进行修正,取n 。

(2)精度要求:估计量y 的绝对误差为d ,则22120⎪⎪⎪⎭⎫ ⎝⎛==-d S u V S n α, N n n n 01+= (3)精度要求:估计量y 的相对误差为r,则2212210⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛=--Y r S u d S u n αα,(4)精度要求:估计量y 的变异系数上限为C ,则()222220Y S C 1Y C S ⎪⎭⎫ ⎝⎛===V S n(5)估计总体比例时样本量的确定:设PC QV PQ Pr Q ud PQun 2222122210====--αα,则Nn n n 1100-+=三.分层随机抽样(一)定义:如果抽样在每个层中独立进行,总的样本由各层样本构成,这种抽样方法称为分层抽样。

若在每层中的抽样采用SRS ,这样的分层抽样称为分层随机抽样。

(二)原则:同一层内差异小,不同层间差异大。

(三)分层原因:当总体各单元差异比较大时,对参数估计误差比较大。

将总体分层,同一层中各单位差异小,从每一层中抽取构成样本,这样样本就有代表性,可以提高估计的精度;可以同时对子总体进行参数估计;便于依托各级管理机构进行组织和实施。

(四)优点:分层样本代表性好;可总体参数估计,也可对层参数估计;实施灵活方便;提高估计精度。

(五)分层随机抽样总体均值:无偏估计:(六)分层随机抽样总体总值:∑∑=====Lh hhLh h h st st y NN y W y Y 111ˆˆYY W y E W y E Lh h h L h h h st ===∑∑==11)()(∑=-=Lh hhh hS n f W 1221∑∑====Lh h hL h h h st y V W y W V y V 121)()()(stst y N Y =ˆ(七)分层随机抽样总体比例:(八)分别比估计(对每层样本分别考虑比估计量,然后对各层的比估计量进行加权平均)(九)联合比估计(先对两个指标先分别计算出分层估计,然后再构造比估计)∑==Lh hh st p W p 1(十)分别比估计与联合比估计的比较1.当各层n h 的都比较大时,各层比率R h 之间差异比较大,此时分别比估计要优于联合比估计;2.当某些层n h 的不够大时,或者各层的比率R h 差异较小,还是采用联合比估计更有效些。

3.分别比估计需要知道各层的子总体辅助变量信息,而联合比估计只需要知道总体辅助变量的信息。

(十一)样本量在各层的分配1.层大小差不多,且没有任何关于层的其他信息 2.层大小有差异,且每层的方差不大3.每层估计量达到相同精度4.最优分配:∑∑∑===-=-==L h Lh hh h h h Lh h h h hst N S W n S W S n f W y V 112221221)(h n n L =常数分配:即h hn nW =比例分配:即,h h h h h h h hW S Neyman n W S n nW S =∑分配:使与成正比即h S 当相等时,最优分配就是比例分配h n ==01L T h hh C c c n ==+∑考虑简单的线性费用函数:(十二)总样本量的确定 1. 调查目标是估计总体均值st V y 若是给定的估计量方差的上限,则有22211LLh h h hh h h W S W S V n N ===-∑∑,1,2,...,h h n n w h L =⋅=对某种分配22211L Lh h h h h h h W S W S V n N ===-∑∑2221111L L h h h hh h h W S W S n w N ===-∑∑ 22121(/)/Lh h h h Lh h h WS w n V W S N ===⎛⎫+ ⎪⎝⎭∑∑0.T h C c c h 式中是总费用,是与样本量无关的固定费用,而是在第层中抽取一个单元的平均费用()∆在给定置信度下22/2/)N z α∆置换前面各结果 ()st y γ若精度是对的相对误差限在给定置信度下形式给出,即2/2)Yz αγ置换前面各结果2. 调查目标是总体比例P 将S h 2=P h Q h 置换前面估计总体均值结果3.opt prop srsV V V ≤≤四.整群抽样(一)定义:整群抽样是将总体划分为若干群,然后以群为抽样单元,从样本中随机抽取一部分群,对选中的群的所有基本单元进行调查的一种抽样技术。

相关文档
最新文档