《抽样技术》练习题及标准答案

《抽样技术》练习题及标准答案
《抽样技术》练习题及标准答案

《抽样技术》练习题及答案

————————————————————————————————作者:————————————————————————————————日期:

习题一

1.请列举一些你所了解的以及被接受的抽样调查。

2.抽样调查基础理论及其意义;

3.抽样调查的特点。

4.样本可能数目及其意义;

5.影响抽样误差的因素;

6.某个总体抽取一个n=50的独立同分布样本,样本数据如下:

567 601 665 732 366 937 462 619 279 287

690 520 502 312 452 562 557 574 350 875

834 203 593 980 172 287 753 259 276 876

692 371 887 641 399 442 927 442 918 11

178 416 405 210 58 797 746 153 644 476

1)计算样本均值y与样本方差s2;

2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式;

3)根据上述样本数据,如何估计v(y)?

4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。

习题二

一判断题

1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。

2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。

3 抽样单元与总体单元是一致的。

4 偏倚是由于系统性因素产生的。

5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。

6 偏倚与抽样误差一样都是由于抽样的随机性产生的。

7 偏倚与抽样误差一样都随样本量的增大而减小。

8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。

9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。

10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。

11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。

12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。

13 抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。

14 样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。

15 精度和费用也是评价抽样设计方案优劣的两条准则。

16 简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。

17 当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。

18 设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:128 157 506 455 127 789 867 954 938 622

19 设N=678 n=5 利用随机数字表抽取一个简单随机样本如下:556 485 098 260 485

20 在实际工作中,如果抽样比接近于1时,人们会采用全面调查

二填空题

1 抽样比是指( ),用( )表示。

2 偏倚为零的估计量,满足( ),称为( )。

3 简单随机抽样的抽样误差等于( )。

4 简单随机抽样时重复抽样的抽样误差等于( )

5 抽样时某一总体单元在第m次被选入样本的概率是( )

6 简单随机抽样时总体单元被选入样本的概率是( )

7 某一样本被选中概率是( )。

8 大数定理是指( )的规律性总是在大量( )的观察中才能显现出来,随着观察次数( )的增大,( )影响将互相抵消而使规律性有稳定的性质。

9 中心极限定理证明了当( )增大时,观察值的均值将趋向于服从( ),即不论( )服从什么分布,在观察值足够多时其均值就趋向( )分布。

10 抽样调查的核心是估计问题,选择估计量的标准是( ) ( ) ( )。

三简答题

1 概率抽样与非概率抽样的区别

2 普查与抽样调查的区别

3何谓抽样效率,如何评价设计效果?

4 何谓三种性质的分布?它们之间的关系怎样?

5 简述抽样估计的原理。

四计算题

1 已知总体N={5,6, 7,8,9 ,10,11},n=5 试求:

(1)重复抽样与不重复抽样的所有可能样本数。

(2)第一个单位在第m次被选入样本的概率

(3)第一个单位被选入样本的概率

(4)抽到{5,6,7,8,9}的概率

(5)不放回简单随机抽样的所有可能样本

2某调查公司受一消费品生产公司的委托,想在某一地区进行一项民意测验,了解消费者中喜欢该公司消费品的人占多大比例,要求允许绝对误差不超过0.1,调查估计值的置信水平为95%,预计的回答率为65%,试问此次调查的样本量应取多少才能满足需要?

3.欲调查我校大一学生平均每月生活费支出情况,采用简单随机抽样抽出35名学生,他们每月的生活费支出平均为285元,计算得到的样本方差为73,试计算我校一年级学生平均每月生活费的支出额标准差、变异系数、置信区间(置信水平为95%)。

4 .某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。根据以往资料

其变量的变异系数为

名称粮食棉花大豆

变异系数 0.38 0.39 0.44

若要求以上各个项目的置信度为95%,相对误差不超过4%,需要抽取多少户?若用这一样本估计粮食的播种面积,其精度是多少?

五设计题

为了了解北京市民对目前北京市公共环境卫生以及绿色建设方方面的满意程度和期望程度,计划组织一次关于“北京市公共环境卫生状况的调查”,从而为绿色北京的建设提供指导性建议和意见,为2008年奥运会尽一份力量。

请针对这一调查目的,设计一份调查问卷。要求问卷能真正反映调查目的,并对相关部门的实际工作起到指导性的作用。同时还要充分考虑数据处理的难易程度。

习题三

一、单选题

1、分层抽样设计效应满足()

A 、1deff =

B 、1deff <

C 、1deff ≈

D 、1deff > 2、分抽样的特点是()

A 、层内差异小,层间差异大

B 、层间差异小,层内差异大

C 、层间差异小

D 、层内差异大

3、下面的表达式中错误的是() A 、

∑=1h

f

B 、∑=n n h

C 、∑=1h W

D 、∑=1h N

4、在给定费用下估计量的方差)(st y V 达到最小,或者对于给定的估计量方差V 使得总费用达到最小的样本量分配称为()

A 、常数分配

B 、比例分配

C 、最有分配

D 、奈曼分配

5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随机抽样(srs V )的精度之间的关系式为()

A 、srs prop opt V V V ≤≤

B 、srs opt prop V V V ≤≤

C 、srs opt prop V V V ≥≥

D 、opt prop srs V V V ≤≤ 6、下面哪种样本量分配方式属于比例分配?

A 、

N n

N n h h = B 、h

L

h h

h

h h h h c S N

c S N n

n ∑==1

C 、

∑==L h h h h h h S N S N n n 1

D 、∑==L h h

h h h h S W S W n

n 1

7、下面哪种样本量分配属于一般最优分配?

A 、N n

N n h h = B 、h

L

h h

h

h h h h c S N

c S N n

n ∑==

1

C 、

∑==L h h h h h h S N S N n n 1

D 、∑==L h h

h h h h S W S W n

n 1

二、多选题

1.分层抽样又被称为( )

A. 整群抽样

B. 类型抽样

C. 分类抽样

D. 系统抽样

E. 逆抽样 2.在分层随机抽样中,当存在可利用的辅助变量时,为了提高估计精度,可以采用( ) A. 分层比估计 B. 联合比估计 C. 分别回归估计 D.联合回归估计 E. 分别简单估计 3.样本量在各层的分配方式有( )

A. 常数分配

B. 比例分配

C. 最优分配

D. 奈曼分配

E. 等比分配 4.分层抽样的优点有( )

A. 在调查中可以对各个子总体进行参数估计

B. 易于分工组织及逐级汇总

C. 可以提高估计量的精度

D. 实施方便

E. 保证样本更具有代表性 5.关于分层数的确定,下面说法正确的有( )

A. 层数多一些比较好

B. 层数少一些比较好

C. 层数一般以不超过6为宜

D. 层数一般以4 层为最好

E. 应该充分考虑费用和精度要求等因素来确定层数 6.下面哪种样本量分配方式属于奈曼分配? ( ) A.

h h n n

N N = B. 1

//h h h h L h h h

h N S c n n

N S c ==∑ C. 1

k h h L h h h n N S n N S ==∑ D.

1

h h h L h h h n W S n W S ==∑ E. 1

//h h h h L h h h

h W S c n

n

W S c ==∑ 7.事后分层的适用场合有( )

A. 各层的抽样框无法得到

B. 几个变量都适宜于分层,而要进行事先的多重交叉分层存在一定困难

C. 一个单位到底属于哪一层要等到样本数据收集到以后才知道

D. 总体规模太大,事先分层太费事

E. 一般场合都可以适用

三、判断题

1 分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。

2 分层的基本原则是尽可能地扩大层内方差,缩小层间方差。

3 分层抽样的效率较简单随机抽样高,但并不意味着分层抽样的精度也比简单随机抽样高。

4 分层抽样克服了简单随机抽样可能出现极端的情况。

5 分层抽样的样本在总体中分布比简单随机抽样均匀。

6 分层后各层要进行简单随机抽样。

7 分层抽样的主要作用是为了提高抽样调查结果的精确度,或者在一定的精确度的减少样本的单位数以节约调查费用。

8分层后总体各层的方差是不同的,为了提高估计的精度,通常的做法是在方差较大的层多抽一些样本。

9 在不同的层中每个单位的抽样费用可能是不等的。

10 在分层抽样的条件下,样本容量的确定与简单随机抽样的共同点都是取决于总体的方差。 11 多主题抽样中,不同的主题对样本量大小的要求不同。在费用允许的情况下,应尽可能地选择较大的样本量。

12 有时在抽样时无法确定抽样单位分别属于哪一层,只有在抽取样本之后才能区分。 13 比例分配指的是按各层的单元数占样本单元数的比例进行分配。 14 等容量分配时各层的样本单元数与各层的层权是相同的。 15 所谓最优分配是指给定估计量方差的条件下,使总费用最小。

16 在奈曼分配时,如果某一层单元数较多,内部差异较大,费用比较省,则对这一层的样本量要多分配一些。

17 在实际工作中如果第k 层出现k n 超过k N ,最优分配是对这个层进行100%的抽样。

18 在实际工作中,如果要给出估计量方差的无偏估计,则每层至少2个样本单元,层数不能超过n/2。

19 无论层的划分与样本量的分配是否合理,分层抽样总是比简单随机抽样的精度要高。 20 即使层权与实际情况相近,利用事后分层技术也难以达到提高估计精度的目的。

四 填空题

1 分层抽样又称为类型抽样,它是将包含N 个单位的总体分成各包含N 1,N 2,…,N L 个单位的( ),这些( )互不重复,合起来就是整个的总体,因此N=( )。

2 分层抽样的基本原则是( )

3 分层抽样中层权是( ),抽样比是( )。 4分层抽样中的样本均值是( ),样本方差是( )。

5 分层抽样中,对总体的均值进行估计时,其抽样误差是( ),对总体的总量进行估计时,其抽样误差是( )。

6 分层抽样在对各层分配样本量时,可以采用不同的分配方法,各种方法所考虑的因素不同。最优分配时主要考虑的因素是( ) 、( )、( )。

7在实际工作中,通常分层抽样比简单随机抽样的精度要高。 但如果出现不合理地划分( )或分配( )的情况,可能使分层抽样的更( )的结果发生。 8 事后分层的层权与实际情况相差很大,则不能利用其提高( )。 9 分层抽样要求在抽取样本之前( )对( )。 10 如果要给出估计量方差的无偏估计,则层数不能超过( )。

五 简答题

1 何谓分层抽样?简述分层抽样的意义?

2 试举一例说明分层抽样的抽样效率比简单随机的抽样要好。

3分层抽样的分层的原则及其意义。

4 简述分层抽样的局限性。

5 简述分层抽样中总样本量的分配方法。

6 怎样分层能提高精度?

六 计算题

1 一个由N=1000个人构成的总体被划分为两层:第一层由4001=N 名男性组成,第二层由

6002=N 名女性组成。从中抽取一个样本量为n=250的样本,将样本等比例地分配给各层,使

得两层的抽样比都等于n/N=1/4。求各层的样本量分别是多少?

2 一公司希望估计某一个月肭由于事故引起的工时损失。因工人、技术人员及行政管理人员的事故率不同,因而采用分层抽样。已知下列资料:

工人

技术人员 行政管理人员

1321=N

36

2

1=s

922=N 2522=s

273=N

92

3=s

若样本量n=30,试用奈曼分配确定各层的样本量。

3 某工厂生产的新产品供应国内市场的300家用户,试销售滿一年后,现欲请用户对该厂的新产品进行评价。现把这些用户分成本地区、本省外地区、外省三层。现有资料如下:

本地区

本省外地区

外省

1541=N 932=N 533=N 25.221=S 24.32

2=S

24.323=S

91=C 252=C 363=C

若要求估计评价成绩均值的方差1.0)(=st y V ,并且费用最省(假定费用为线性形式),求样本量n 在各层的分配。

4 某林业局欲估计植树面积,该局共辖240个林场,按面积大小分为四层,用等比例抽取40个林场,取得下列资料(单位:公顷) 第一层

第二层

第三层

第四层

861=N 141=n 722=N 122=n

523=N 93=n

304=N 54=n i y 1

97 67 42 25 92 105 86 27 45 59 53 52 125 43

i y 2

125 155 67 96 256

47 310 236 220 352 142 190 i y 3

142 256 310 440 495 510 320 396 196 i y 4

167 655 220 540 780

试估计该林业局总的植树面积及95%的置信区间。

5. 一个样本为1000的简单随机样本,其结果可分为三层,相应的

h y =10.2,12.6,17.1,2

h s =10.82(各层相同),2s =17.66,估计的层权是h w =0.5,0.3,0.2,已

知这些权数有误差,但误差在5%以内,最不好的情况是h W =0.525,0.285,0.190或h W =0.475,0.315,0.210,你认为是否需要分层?

习题四

1 所谓比率估计就是通过样本中的变量的来推断总体的比率。

2 比率估计是一种估计的方法而不是抽样的方式。

3 比率和比例是区别的在于它们的比值总是小于1或大于1。

4 在估计比率问题时,只有分子是随机变量。

5 采用比率估计的原因之一是在估计总体均值或总体总量时可以通过一个辅助变量来提高抽样效率。

6 比率估计是个有偏的估计量,只有样本比较大时其偏误可以忽略不计。

7 当辅助变量与调查变量呈现正相关关系时用比估计,呈现负相关关系时用乘积估计。

8 若研究变量对辅助变量的回归直线通过原点即研究变量与辅助变量成正比例关系,则用比估计,否则用回归估计。

9 对于分别估计要求每层的样本量都较大。

10 由于回归估计在小样本时偏倚有可能更大,因此采用比估计更保险些。 11 差值估计量与回归估计量一样都是无偏估计量。

12 不等概率抽样时,总体中某些单元比其它单元出现在样本中的机会大,就会使我们所推算的总体指标偏向于这些单元的标志值。

13 即使抽样单元是区域本身也不能直接进行抽样。

14 PPS 抽样是放回的简单随机抽样,由于抽样是放回的,就使某个单元可能在样本中出现多次。 15 放回抽样与不放回抽样所得到的样本代表性有差别,在样本量一样时,放回抽样的估计精度高

一些。

16 推算总体总量时,此时若总体单元的差异较大,则进行简单随机抽样的效率比不等概率抽样要低。

17 使用不等概率抽样,其入样概率是由说明总体单元大小的辅助变量不确定的,即辅助变量确定每一个总体单元的入样概率 。

18 使用不等概率抽样的必要条件是每一个总体单元都要有一个已知的辅助变量,用以确定单元的入样概率。

19 不等概率抽样可以改善估计量,提高抽样效率。

20 在PPS 抽样时,若用代码法,则单元愈大被赋予的代码数就愈多,使每个单元入样的概率与单元大小成比例。

二 填空题

1 利用比率估计提高抽样效率要求推断的变量与辅助变量之间存在( )关系。

2 样本相关系数为( ),其中:xy s 是( ),y s 是( ),

x s 是( )。

3 用样本的比率估计总体比率,在大样本时对总体比率R的估计可用( )表示,对抽样误差的计算可用( )用表示。

4对于分层随机抽样,如果采用比率估计量,各层的样本量都比较大时可采用( ),否则采用( )。

5 比率估计量优于简单估计量的条件是( )、( )。

6 当回归系数β为事先给定的( )时,回归估计量是( )估计量;β为样本回归系数时,则回归估计量是( )估计量。

7 分层抽样时如果采用回归估计,则当各层样本量( )时,采用( ),否则采用

( )。

8 在PPS 抽样中每个单元有说明其大小或规模的的度量i M ,则可取i Z 等于( )。 9 严格的PS π抽样实施起来非常复杂,在实际工作中可以通过分层,在每层中进行严格的( )的PS π抽样。

10 不等概率抽样主要用于总体单元差异非常大,而推算目标量是( )的情形。

三 简答题

1 简述比率估计提高抽样效率的条件。

2 简述比率估计的应用条件。

3 从等概率抽样与不等概率的区别来分析进行简单抽样的有效性。

4 简述不等概率抽样的主要优点。

5 试举一个利用区域可以直接进行抽样的例子。

6.分析PPS 抽样与PS π的抽样效率。

7.回归估计、比估计与简单估计间的区别;

8.辅助变量的选择原则;

9.回归系数的选择与确定。

四 计算题

1 某单位欲估计今年第一季度职工的医疗费支出,但这一费用要等到合同医院送来帐单才能知道,因此从1000个工人中随机抽取了100人作调查,这100人的总支出为1750元,若已知去年同期这100个工人的费用支出是1200元,全单位去年第一季度总支出为12500元。若根据样本计算

316500100

1

2=∑=i i

y

,156201001

2=∑=i i x ,35.22059100

1

=∑=i i i y x ,试用比率估计的方法估计该单位第

一季度平均每人医药费支出的95%的置信区间。

2.一家大公司欲估计上一季度每个工人的平均病假天数。该厂共有8个车间,人数分别为1200人,450人,2100人,860人,2840人,1910人,290 人,3200人。现拟抽取三个车间作样本,若采用与车间工人数成比例抽样,抽中第三个车间2100人,病假为4320天;第六车间1910人,病假共4160天;第八车间3200人,病假共5790天,试估计全工厂的平均每人病假天数,以及全工厂因工人病假而损失的人日数。

3. 某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分平原和山区两层采用分层抽样。同时当年产量与去年产量之间有相关关系,故还计划采用比估计方法。已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产为21200(百斤)。现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料如下: 平原 山区

样本 去年产量 (百斤) 当年产量 (百斤) 1 2 3 4 5

204 143 82 256 275

210 160 75 280 300

试用分别比估计与联合比估计分别估计当年的总产量,给出估计量的标准误差,并对上述两种结果进行比较和分析。

习题五

一、 单选题

1.整群抽样中的群的划分标准为( )。

A.群的划分尽可能使群间的差异小,群内的差异大

B.群的划分尽可能使群间的差异大,群内的差异小

C.群的划分尽可能使群间的差异大,群内的差异大

D.群的划分尽可能使群间的差异小,群内的差异小 2.整群抽样的一个主要特点是( )。

A.方便

B.经济

C.可以使用简单的抽样框

D.特定场合中具有较高的精度 3.群规模大小相等时,总体均值Y 的简单估计量为( )。

A.∑∑===

n i M

j ij

y

nM Y 11

1

?

B.()∑∑==-=

n i M

j ij y M n Y 11

11

?

C.∑∑===n i M

j ij y n Y 11

1?

6 198 190 样本 去年产量 (百斤) 当年产量 (百斤) 1 2 3 4 5 6

7

8 9

137 189 119 63 103 107 159 63 87

150 200 125 60 110 100 180 75 90

D.∑∑===

n i M

j ij

y

N

Y 11

1?

4.群规模大小相等时,关于总体方差2

S 的说法正确的是( )。 A.总体方差的一个无偏估计为:

2

22

1[(1)(1)]1

?b M N N M NM S S S

ω-=

-+--

B.总体方差的一个无偏估计为:

2

22

[(1)(1)]1

?b M N N M NM S S S

ω=

-+--

C.总体方差的一个无偏估计为:

2

22

1[(1)(1)](1)

?b N N M N M S S S

ω=

-+--

D.总体方差的一个无偏估计为:

2

22

1[(1)(1)]1

?b N N M NM S S S

ω=

-+--

5.下面关于群内相关系数的取值说法错误的是( )。 A.若群内次级或基本单元变得值都相等则2

0S ω=,此时c

P 取最大值1

B.若群内方差与总体方差相等,则0c

P ≈,此时表示分群是完全随机的

C.若群内方差大于总体方差时,则c

P

取负值

D.若

2

0b S =时,c P 达到极小值,此时1

1

c M P =

-

6.整群抽样中,对比例估计说法正确的是( )。 A.群规模相等时,总体比例P 的估计可以为:

1

1n

i i p n A ==∑

B.群规模不等时,总体比例P 的估计可以为: 1

1

(

)/()n n

i

i

i i p A M

===∑∑

C.群规模相等时,总体比例P 的方差估计为:

211

()(1)()n i v p i

n n p P ==--∑

D.群规模不等时,总体比例P 的方差估计为:

2

1

2

1()1

()

n

i i i v p n n p A M M

==

?

--∑

二、多选题

1.下面关于整群抽样的说法,有哪些是正确的?( ) A.通常情况下抽样误差比较大

B.整群抽样可以看作为多阶段抽样的特殊情形,即最后一阶抽样是100%的抽样

C.调查相对比较集中,实施便利,节省费用

D.整群抽样的方差约为简单随机抽样的方差的1(1)

c

M ρ

+-倍

E.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)c

M ρ

+-倍

2.关于整群抽样(群规模相等)的设计效应,下面说法正确的有( ) A.()

1(1)()c srs

V y deff M y V ρ=

≈+-

B.为了获得同样的精度,整群抽样的样本量是简单随机抽样的1(1)

c

M ρ

+-倍

C.群内相关系数的估计值为

22

22

(1)?b c

b

M s s s

s ω

ω

ρ

-=

+-

D.要提高整群抽样估计效率,可通过增大群内单元的差异实现

E.整群抽样的精度取决于群内相关系数,群内相关系数越大,则估计量的精度越高 3.关于群规模不等时,可以采用的估计量形式有( )。

A.11111(/)i

n n i i ij i i j M y n n y y M =====∑∑∑

B.0

1

1

1n

n

i

i i i i

i

y n n y y M z M

====∑

C.1

1

?n

i

i n R

i

i y

Y

M

==∑∑

D.1

0??1n

i

i Y Y Mn y M ===∑ E.11n

i

i y n y ==∑

4.关于群规模大小不等时,下列说法正确的是( )。

A.若

i

M

相差不多,则一般以平均群大小M 代替M ,依照群规模

i

M

大小相等的情

形处理 B.如果

i

M

相差较大,可将群按大小分层,使每一层内群的规模

i

M

大小基本相等,从

而仍可使用群规模

i

M

大小相等时的处理方法

C.对群仍用简单随机抽样,采用简单估计的形式

D.对群仍用简单随机抽样,采用比例估计的形式

E.对群仍用简单随机抽样,采用加权估计的形式

三 判断题

1 整群抽样对中选的群中的所有总体单元进行调查。

2 构造群的抽样框同构造简单随机抽样的抽样框一样都很容易。

3 在总体单元分布较广的情形下,进行简单随机抽样可以节省费用。

4 在群是以行政单位划分时,将有助于调查的实施。

5 整群抽样的抽样单元不一定基本单元的集合。

6 如果群内的差异较大,群内各单位的分布与总体分布一致,那么任意抽出一个群来进行观察就可以对总体进行准确的推断。

7 整群抽样抽取样本效率同简单随机抽样一样高。 8 整群抽样时可以在抽样前知道调查总体的样本量。

9 若群内各单元之间的差异较大这时进行整群抽样的效率就会较高。

10 为提高抽样效率,应使群内的方差尽可能地小,从而使群间方差尽可能地大。

11 进行整群抽样的目的就是节约人力、物力。而为了达到规定的精度要求,往往需要多抽一些群。

12 整群抽样有构造抽样框相对简单,样本量相对集中、调查费用节约的特点。 13 在整群抽样中,比率估计可以有效地提高抽样的估计精度。

14 以家庭户为整群抽样的抽样单元,并不能很好地做到群间结构的相近,使群间方差较小。 15 可以这样看,整群抽样适应于总体的抽样单元差异较大的情形,而分层抽样则适应于抽样单元具有趋同性的总体。

16 考虑划分群,就是考虑在相同调查费用时,抽样误差最小的情形。 17 在群的规模相等时,对总体的估计量是无偏估计量。

18 当各群的规模差异很大,并且总体估计量与群的规模高度相关时,估计量的偏差会很大。 19在群的规模不等时,对总体的估计量是有偏的估计量。 20 对于自然形成的群,无法通过调整群内单元而控制,这时要提高抽样效率就只能增大样本量。

四、填空题

1 整群抽样的抽样比是( ), 其中n 为( ),N 为( )。

2 整群抽样时样本的群间方差为( ),均值估计量的方差为( ),总量估计量的方差为( )

3 整群抽样的估计精度与( )有关,当群内相关系数为( )时,其抽样效率( )简单随机抽样。

4 对自然形成的群,无法人为地控制( ),因此,要控制抽样误差,就只好控制( )。

5 整群抽样时总体参数的无偏估计适用条件是( ),( )。

6 在群规模不等的整群抽样中,把( )作为抽取样本的辅助信息,其目的是(

)。

7 比率估计是( )的估计,当( )其抽样效率高于(

)。

y的取值为

8 比例是( )的一个特例,即均值等于( ),其中

i ( )和( )。

9 群与群之间的结构( ),就意味着( ),这时群内相关系数为( )。

五、简答题

1 简述整群抽样的分群原则。

2 您如何认识影响整群抽样抽样误差的主要因素是群间方差?

3 整群抽样时,采用无偏估计的方法与比率估计的方法来估计总体总量有何不同?

4 简述整群抽样的优点。

5整群抽样时,比率估计的方法估计总体总量与比估计量中的辅助变量有什么不同?

6 简述使用整群抽样的原因。

7.整群抽样与分层抽样的区别;

8.整群抽样群大小的计量方法;

9. 整群抽样的设计效应。

六 计算题

1.在某城市一次对居民小区的食品消费量的调查中,以楼层为群进行进行整群抽样,每个楼层有8家住户。用简单随机抽样在全部N=600个楼层中抽取n=12个楼层,其户人均月食品消费额(按楼层计算)如下:

要求:

(1) 试估计该次调查中居民小区的人均食品消费额的95%的置信区间。 (2 )对居民小区的食品消费总额进行区间估计。

(3 )若规定允许误差不超过10000,应抽多少群来估计小区的食品消费总额?

2已知某运输公司在抽样检查所使用的车辆中安全轮胎所占的比例,在200辆车中抽了30辆,其资料如下:

i

i y

i s 1 188.00 27.19 2 180.50 17.98 3 149.75 17.32 4 207.875 29.17 5 244.25 45.20 6 278.50 63.87 7 182.75 38.77 8 211.50 27.48 9 253.125 44.52 10 191.125 28.29 11 274.75 43.70 12 258.375 43.52

安全轮胎数

i x

汽车数 f xf a i = M f M i =

23M f M i = i i a M f x a i 22=

0 4 0 4*0 0 1 3 3 4*3 1*3 2 8 16 4*16 4*8 3 9 27 4*27 9*9 4 6 24

4*24

16*6

合计

30

70

30*4=120

16*30=480

4*70=280 212

要求:

(1) 估计该运输公司的汽车安全轮胎的比例及其估计量的方差。 (2) 以95%的把握对安全轮胎的比例作出区间估计。

习题六

一 判断题

1 系统抽样中最简单也是最常用的规则是等间隔抽取,所以又称系统抽样为等距抽样。

2 第一个样本抽取后,其它所有的样本就都确定了,这种抽样看来似乎很机械,所以系统抽样又被称为机械抽样。

3 在直线等距抽样中,总体容量是样本容量的整数倍。

4 循环等距抽样中总体单元数同样也是n 的整数倍。

5 总体单元按有关标志排队就是指各单元的排列顺序与所研究的内容无关,但与总体单元的规模大小有关。

6 如果系统抽样时总体单元的排列有周期性的变化,就可能抽出代表性很差的样本。 7如果按总体单元的有关标志排列,则系统抽样时样本单元在总体中分布较均匀。 8 系统抽样可以看成是分层抽样的一个特例,但样本单元在各层的位置相同。 9 系统抽样可以看成整群抽样的一个特例,从k 群中随机抽取1个群的整群抽样。 10 当N=nk 时有k 个可能样本,其样本均值是总体均值的无偏估计量。

11 当N ≠nk 时采用直线等距抽样得到k 个可能样本,其样本均值是总体均值的无偏估计量。 12当N ≠nk 时采用循环等距抽样得到k 个可能样本,其样本均值是总体均值的有偏估计量。 13 有效地应用系统抽样,必须了解总体的特征。

14 按无关标志排列的总体单元可以看成是随机排列的,当为有限总体时其系统抽样方差与简单随机抽样的方差相等。

15 当总体单元有趋势顺序排列时,其方差估计有一些近似的公式,不论n 为何值,都可用合并层和连续差的方法来估计总体方差。

16 中心位置抽样法起始单元的抽选是在第一段的k 个单元中在(1---k)之间随机抽取。 17 Sethi 的方法和Singn 的方法在抽取样本单元时起始单元有两个,因此这就被称为对称系统抽样。

18 对称系统抽样与一般系统抽样的主要区别在于此时起始单元不是一个而是两个,它们的位置对称,数值大小相低,因而改进了估计量的精度。

19 交叉子样本的方法又称为随机组法,它是解决周期性波动总体的系统抽样的有效方法之一。 20 当系统抽样的间隔恰好与循环周期的整数倍相一致时,系统抽样的误差将会很大。

抽样技术期中试卷

注:至少保留小数点后两位有效数字;计算需过程、结果要有据可依。 一、(20分)某小商店有45个货架,经常需清点架上货物的价值,为探索用抽样的方法来节省盘货的工作量。某日将45个货架上的货物的价值清点列出一张清单如下(单位:元): 297,569,618,691,545,606,681,382,566,619,711,679,354,426,561,613,745,601,676,538,443,583,623,771,701,663,534,632,600,531,594,826,641,581,453,449,850,651,593,477,486,524,519,603,659, 希望从样本作出的总的货物总价值的估计量的误差,有95%的把握不超过2000元。问在此情况下,用一个含10个货架的简单随机样本是否可以达到要求?你认为最适宜的样本量应是多少? 二、(20分)某学院共有1200名学生,现欲调查学生平均每月的伙食费支出,采用简单随机抽样的方法抽选了65名学生做调查,得到的数据如下: 65 1 17550 i i y ==∑ ,480242665 1 2=∑=i i y (1)试求该学院学生平均每月伙食费支出的95%的置信区间; (2)依据上列数据,试问样本容量n 应约取多少才能保证在置信度95%下该估计 的相对误差不超过10%? 三、(20分)某市共有3000个个体商业户,要对其上月的零售额进行抽样调查。由于个体商业户的大小差别比较大,现采用分层抽样的方法,根据其在工商局登记资金分为大、中、小三层,共抽取了300户,调查结果的数据如下(单位:万元), 24 ,20,50,2002 1111====s y n N 大型: 6,9,100,100022222====s y n N 中型: 1,2,150,18002 3333====s y n N 小型: (1)试估计全市个体工商户每月平均销售量,并求其95%的置信区间; (2)若要求平均销售量估计量的最大标准差不超过0.1,试根据上述数据用Neyman 分配法估计总样本容量n 和大中小型各层样本容量h n 。 四、(20分)一个大总体分为三层,各层所占比例分别为2.0,3.0,5.0321===W W W 。 需要调查的指标是某特征单元所占比例,对三个层粗估该比例分别为 6 .0,4.0,52.0321===p p p 。计算当采用按比例分配样本分层抽样时,需要多大的 样本量即可达到简单随机抽样600=n 时的相同精度。 五、(20分)在一次针对某城市大学生月生活费支出的调查中,以小组为群进行整群抽样。每个小组都有8=M 个大学生。采用简单随机抽样在全部510=N 个组中抽取 12 =n 个小组。全部96个样本大学生人均月消费额ij y 及按小组计算的平均数i y 与标准 差i s 如下表所示。试估计该城市大学生人均月生活费支出的平均值Y ,并给出其%95的置信区间。并计算大学生月消费支出调查以小组为群的群内相关系数与设计效应。

抽样技术课后习题参考答案金勇进

第二章习题 2.1判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少? 解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±1.96*41308.19] 即为(394035.95,555964.05) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1*96.1≤- 即n ≥862

欲使相对误差限不超过10%,则样本量至少应为862 2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0==N n f 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2 ∧ ∧ ±P V Z P E α 代入数据计算得:该区间为[0.2843,0.4157] 2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10 240 20 120 估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n 根据表中数据计算得:5.14420120 1 ==∑=i i y y ∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2 y V z α ±即是:[132.544 ,156.456] 故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。 2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到 y =1120(吨),225600S =,据此估计该地区今年的粮食总产量,并给出置信水平95%的 置信区间。 解析:由题意知:y =1120 1429.0350 50 n === N f 225600S =?160=s

抽样技术期末试卷

抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是() A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差

性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C.x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B. )?(θ tSE =? C. θ θ )?(tSE = ? D. t SE )?(θ = ? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成

抽样技术简答题及答案

抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响 抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某 些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度 的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法, 如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误 差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以 控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。 3何谓抽样效率,如何评价设计效果? 答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比

抽样技术习题.doc

1.请列举一些你所了解的以及被接受的抽样调查。 2.抽样调查基础理论及其意义; 3.抽样调查的特点。 4.样本可能数目及其意义; 5.影响抽样误差的因素; 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 1)计算样本均值y与样本方差s2; 2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式; 3)根据上述样本数据,如何估计v(y)? 4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。

一判断题 1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。 2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。 3 抽样单元与总体单元是一致的。 4 偏倚是由于系统性因素产生的。 5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。 6 偏倚与抽样误差一样都是由于抽样的随机性产生的。 7 偏倚与抽样误差一样都随样本量的增大而减小。 8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。 9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。 10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。 11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。 12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。 13 抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。 14 样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。 15 精度和费用也是评价抽样设计方案优劣的两条准则。 16 简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。 17 当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。 18 设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:128 157 506 455 127 789 867 954 938 622 19 设N=678 n=5 利用随机数字表抽取一个简单随机样本如下:556 485 098 260 485 20 在实际工作中,如果抽样比接近于1时,人们会采用全面调查 二填空题 1 抽样比是指( ),用( )表示。 2 偏倚为零的估计量,满足( ),称为( )。 3 简单随机抽样的抽样误差等于( )。 4 简单随机抽样时重复抽样的抽样误差等于( ) 5 抽样时某一总体单元在第m次被选入样本的概率是( ) 6 简单随机抽样时总体单元被选入样本的概率是( ) 7 某一样本被选中概率是( )。 8 大数定理是指( )的规律性总是在大量( )的观察中才能显现出来,随着观察次数( )的增大,( )影响将互相抵消而使规律性有稳定的性质。 9 中心极限定理证明了当( )增大时,观察值的均值将趋向于服从( ),即不论( )服从什么分布,在观察值足够多时其均值就趋向( )分布。 10 抽样调查的核心是估计问题,选择估计量的标准是( ) ( ) ( )。 三简答题

2020年见证取样员考试题及答案

精选考试类文档,如果需要,请下载,希望能帮助到你们! 2020年见证取样员考试题与答案 一、选择题: 1、在办理样品接收手续时,若发现见证人与授权书所授权的人不一致,则该检测将被视作____________处理。 A见证检测 B委托检测 C抽样检测 (B) 2、建筑楼、地面砂浆则是每一层楼、地面取一组,不足按计算。 A:1000m2 、1000 m2 B:2000 m2、2000 m2 C: 3000 m23000 m2 (A) 3、砂浆试块在脱模前应在20±5℃温度下停置一昼夜,然后拆模养护,养护温度为℃。A20±5℃ B20±3℃ C20±1℃(B) 4、当砂浆试块评定不合格或留置组数不足时,可以用等方法检测评定后,作相应处理。 A:非破损或截墙体检验 B:回弹法检测 C:轴压法检测砌体抗压强 度(A) 5、砂的验收批,用大型运输工具的以或为一验收批。 A400m3600t B500m3600t C600m3600t (A) 6、石的验收批,用小型运输工具的,以为一验收批。 A:400m3600t B200m3300t C400m3400t (A) 7、砂浆立方体抗压强度的取样数量,砌筑砂浆每个台班、同一配合比、同一层砌体或砌体为一取样单位取一组试块。 A300 m3 B500 m3 C250 m3 (C)

8、见证人员应是本工程____________人员。(C) A监理单位或施工单位 B建设单位或施工单位 C建设单位或监理单位 9、送样员在送被检样品时,必须向检测单位出示____________。(A) A送样证和建设单位书面授权书 B见证证书 C送样证 10、检测单位在接受委托检验任务时,须由送检单位填写委托单,____________应在检验委托单上签名。(B) A管理人员 B见证人员 C检验人员 二、填空题 1、对于建筑结构的安全等级为一级或设计使用年限为50年及以上的房屋,同一验收批砂浆试块的数量不得少于3 组。 2、国标GB 50325规定,民用建筑工程室内环境污染物浓度限量的验收项目包括甲醛、氡、苯、氨、总挥发性有机物TVOC。 3、当水泥中的化学指标和物理指标中凝结时间、安定性、强度的检验结果符合GB175-2007技术要求标准规定时为合格品。 4、砂石的验收按《普通混凝土用砂、石质量及检验方法标准》(JGJ52-2006)中的规定进行,使用单位应按同产地、同规格分批验收。用大型工具(如火车、货船或汽车)运输的,以400立方或600吨为一验收批。 5、纤维增强低碱度水泥建筑平板出厂检验检验批量:每批平板应以同一等级、 同一规格的产品,以(1000 )张为一个批量。 6、骨料在料堆上取样时,取样部位应均匀分布,取样前先将取样部位表层铲除,然后由各部位抽取大致相等的砂8 份,石16 份,组成各自一组样品。 7、混凝土拌合物主要性能为和易性,主要包括流动性、粘聚性、保水性三方面,采用坍落度试验进行测定。

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量 之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(2 22YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

抽样技术 概念

目录第一章预备知识 第二章基本概念 第三章简单随机抽样 第四章分层随机抽样 第五章不等概率抽样 第六章多阶段抽样 第七章整群抽样 第八章系统抽样 第九章非概率抽样

第一章预备知识 作为抽样技术的基础知识或预备知识,本章简要地介绍调查原理、排列组合、概率统计等方面的有关知识。 一、调查概论 调查的重要性:有利于制定政策、投资决策、科学研究、机构管理以及司法实践等;与此同时,许多学科的进步和发展也同样离不开调查。 (一)(一)调查本质上是一种测量活动 测量活动具有6个要素:测量主体、测量客体、测量对象、测量法则、测量工具、测量结果(数字/符号)。 测量得到的数据大体分为三种类型:分类型数据、顺序型数据以及数值型数据。 测量的方法分为:直接测量和间接测量。 (二)(二)真值、测量值与误差 误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中 。根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。 误差公理:任何调查结果都可能具有误差,而且误差始终存在于一切科学试验和调查过程中。 根据误差的来源分类:调查主体误差、调查客体误差、调查工具误差、调查法则误差、调查环境误差。 根据误差的性质分类:系统误差、随机误差和粗大误差。 根据误差的计量尺度分类:绝对误差和相对误差。 绝对误差δ、(调查)估计值x以及真实值μ之间的关系:δ=x-μ。 相对误差r、绝对误差δ以及真实值μ之间的关系:r=δ/μ。 实际常用的真值分类:理论真值、约定真值以及相对真值。 实际常用的测量值分类:单次测量值、算术平均值、加权平均值、中位数和众数。 (三)(三)信度、效度与精度 信度表示测量结果中的随机误差大小的程度。 信度的表示方法:测量值的方差(或标准差)或者样本平均数的方差(或标准差)。 衡量信度的三种方法:再测信度、复本信度和折半信度。 衡量信度的三种方法;再测信度、复本信度和折半信度。 效度表示测量结果中的系统误差大小的程度,是测量结果的“有效性” 的反映。 效度分类:内容效度、准则效度和结构效度。 效度含义:(1)测量的特征即为研究的目标特征;(2)该特征被准确地测量。 效度的表示方法:B(x)=|x-μ|或者B(E x)=|E x-μ|。 精度是信度与效度的综合,但它还与信度与效度之外的因素有关。 精度的表示方法:均方误差MSE(x)=V(x)+ () 2 B Ex u - 效度的表示方法: μ - =x x B) (或者μ - =x E x E B) (。 精度表示信度与效度的综合,但它还与信度与效度之外的因素有关。 精度的表示方法:均方误差 2 ()()() MSE x V x B Ex =+ 信度、效度与精度之间的关系:对于测量或调查来说,信度高的效度未必高,反过来效度高的信度未必高,但精度高的信度和效度肯定高。 二、排列组合 (一)(一)两条基本原理 加法原理和乘法原理。

应用抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=?

抽样技术与应用期末复习题

1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是()

A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点 11、下面哪种样本量分配方式属于比例分配?() A 、N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑==1 C 、∑==L h h h h h h S N S N n n 1 D 、∑==L h h h h h h S W S W n n 1 12、整群抽样中的群的划分标准为() A 、群的划分尽可能使群间的差异小,群内的差异大 B 、群的划分尽可能使群间的差异大,群内的差异小 C 、群的划分尽可能使群间的差异大,群内的差异大 D 、群的划分尽可能使群间的差异小,群内的差异小 13、群规模大小相等时,总体均值 的简单估计量为() A.∑∑===n i M j ij y nM Y 111?

《抽样技术》第四版习题答案

第2章 2.1 解:()1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号 为1~64的这些单元中每一个单元被抽到的概率都是 1100 。 ()2这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中 的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2 100 ,而尚未被抽中的编号为36~63的每个单元的入样概率都是 1100 。 ()3这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~ 21 000中的每个单元的入样概率都是 1 1000 ,所以这种抽样是等概率的。 2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大 _ y E y y -= 近似服从标准正态分布, _ Y 的195%α-=的置信区 间为y z y z y y α α??-+=-+? ?。

而()2 1f V y S n -= 中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间 为,y y ?? -+???? 。 由题意知道,_ 2 9.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _ 21130050000 ()2060.6825300 f v y s n --= =?=。将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192????。 下一步计算样本量。绝对误差限d 和相对误差限r 的关系为_ d rY =。 根据置信区间的求解方法可知 _ ___ 11P y Y r Y P αα? ???-≤≥-?≤≥-???? 根据正态分布的分位数可以知道1P Z αα??? ≤≥-???? ,所以()2_2rY V y z α?? ?= ??? 。也就是2 _2 _2 22 /221111r Y r Y S n N z S n N z αα?? ?????? ????? ???-=?=+ ? ????? ?? ???? 。 把_ 2 9.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。所以样本量至少为862。 2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f N V p P P n N -= --, 在大样本的条件下近 似服从标准正态分布。在本题中,样本量足够大,从而可得P 的195%α- =的置信区间为 2p z p z αα?-+?。 而这里的()V p 是未知的,我们使用它的估计值

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θθ )?(SE =? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(222YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

中国人民大学题库答案详解-抽样技术

中国人民大学 同等学力申请硕士学位课程考试试题 课程代码:123105 课程名称:抽样技术与方法 试题卷号: 1 名词解释 非概率抽样 非概率抽样又称为非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法,其最主要的特征是抽取样本时并不依据随机原则。包含有判断选样、方便抽样、自愿样本、配额抽样等。 最优分配 在分层随机抽样中,对于给定的费用,使估计量的方差V(y_st)达到最小,或者对于给定的估计量方差V,使总费用达到最小的各层样本量的分配,称为最优分配。 PPS抽样 是有放回的按规模大小成比例的概率抽样。其抽选样本的方法有代码法、拉希里方法等。 PPS 抽样是按概率比例抽样,属于概率抽样中的一种。是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。

自加权样本 指调查中每个样本单元的设计权数是相同的,也就是说每个单元最终入样的概率是相等的。在不考虑非抽样误差的情况下,可以认为自加权样本完全代表总体,因为每个样本单元都代表了总体中相同数目的单元。(此时可以使用标准统计方法来进行点估计。此外,自加权样本往往方差较小,样本统计量更稳健) 简述题 有人认为“抽样调查除了调查误差以外,还有抽样误差,因此抽样调查不如全面调查准确”,请对此加以评价。 一项调查的误差来自多个方面,抽样调查因为只调查总体中的一小部分,用部分的调查结果推断总体,所以存在着抽样误差,但这只是所有误差中的一部分。对于抽样调查,误差包括抽样误差和非抽样误差。有些情况下,全面调查由于参与的人员众多、涉及范围大,因此虽然没有抽样误差,但在数据采集和数据汇总整理的过程中却有产生其他误差的更大可能性,所以调查规模并不是越大越好。与全面调查相比,抽样调查的工作量小,这就为使用素质较高的工作人员并对他们进行深入的培训创造了条件。此外,如果能对调查过程实施更为细致的监督、检查和指导,可以使抽样调查所得到的数据质量比同样的全面调查数据质量更高,从而使调查的总误差更小。 试对分层抽样中的联合比率估计和分别比率估计方法进行比较。 如果每一层都满足比率估计量有效的条件,则除非R h=R,都有分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。 实际使用时,如果各层的样本量都较大,且有理由认为各层的比率R h差异较大,则分别比率估计优于联合比率估计。当各层的样本量不大,或各层比率R h差异很小,则联合比率估计更好些。此外,联合比估计不像分别比那样需要已知每层的辅助信息X h。

抽样技术重点复习概念

调查:通过使用明确的概念、方法和程序,依据专门设计的调查方案知道的方式,从一个总体全部或部分单元中搜集感兴趣的指标信息,并将这些信息综合整理成数据系列的有关活动。 抽样调查:是调查应用最常见的模式,是一种非全面的调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。这是广义的抽样调查的概念 抽样调查步骤:调查目标确定、抽样框选择、抽样方案设计、问卷设计、数据收集、数据编码和录入、审核与插补、参数估计、数据分析和调查结果的表述、数据分布、撰写调查报告 简单随机抽样:也称纯随机抽样,是从抽样框内的N个抽样单元中随机的、一个一个的抽取n个单元作为样本,在每次抽选中,所有未入样的待选单元入选样本的概率都想等,这n个被抽中的单元就构成了简单随机样本。简单随机样本也可以一次从总体(抽样框)中同时抽出,这时全部可能样本中的每一个样本被抽中的概率也需要相等。 分层抽样:是将抽样单元按某种特征或某种规划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。 分层随机抽样:如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随即抽样,所得的样本称为分层随即样本。 整群抽样:将总体中的若干个基本单元合并为组,这样的组称为群。抽样时直接抽取群,然后对中选群中的所有基本单元全部实施调查,这样的抽样方法称为整群抽样。 多阶段抽样:采用类似整群抽样的方法,首先抽取群,但不是调查群内的所有基本单元,而是再进一步抽样,从选中的群中抽取出若干个基本单元进行调查,因为取得这些接受调查的基本单元需要两个步骤,所以将这种抽样方式成为两阶段抽样。这里,群是初级抽样单元,第二阶段抽取的是基本抽样单元。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。 系统抽样:将总体中的所有单元(抽样单元)按一定顺序排列,在规定的范围内随机抽取一个单元作为初始单元,然后按事先规定好的规则确定其他样本单元,这种抽样方法称为系统抽样。 简单估计:在没有总体其他相关辅助变量信息可以利用的情况下,用样本特征直接估计总体特征,且样本特征与预估的总体特征除了写法之分外,完全同形同构,简单易记,因此有简单线性估计的名称,简称为简单估计。 比率估计:设对有两个调查变量Y 和X 的总体进行简单随机抽样,分别以y,x表示样本总值,以y,x表示样本均值,以μ// R y x y x ==为样本比率,用 μR作为总体比率R的估计称为的比率估计 回归估计:在简单随机抽样下,总体均值和总体总值Y的回归估计量定义为: ()() tr y y X x y x X ββ =+-=-- μ lr lr Y N y =其中Y,X分别为调查变量、辅助变量的样本均值,X是辅助变量的总体均值,β称为回归系数。 不等概抽样:如果总体中每个单元进入样本的可能性是不相等的,则这种随机抽样方式就称为不等概率随机抽样,简称不等概率抽样。 非抽样误差:除抽样误差以外的,由于各种原因引起的误差。 非抽样误差的分类:抽样框误差(由不完善的抽样框引起的误差);无回答误差(由于种种原因没有从被调查单元获得调查结果,造成调查数据的缺失);计量误差(所获得的调查数据与其真值之间不一致造成的误差)

抽样技术试题

第四章抽样技术概述 班级:姓名:成绩 一、填空题:(21分) 1、抽样调查是一种()调查,它是从所研究客观现象的总体中,按照()抽取()进行调查,以从这一部分单位调查的结果,来()所研究总体的相应数据。 2、随机原则是指在总体中抽取样本单位时,完全排除()意识,保证总体中()单位都有被抽中的同等可能性原则。 3、抽样调查是以()数据推断的()数据。 4、抽样调查产生的(),可以计算并控制, 5、从全及总体中抽取样本单位有()和()两种方法。 6、一般说,不重复抽样的抽样误差()重复抽样的抽样误差。 7、抽样平均误差就是抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。 8、影响抽样误差的主要因素有()、()、()、()。 9、利用样本统计量估计总体参数,通常运用()和()两种方法。 10、点估计是直接用()估计总体参数的推断方法。点

估计不考虑()及()。 11、置信区间反映了参数估计的精确程度,区间愈小,估计就愈();而置信度则反映了总体参数落在置信区间内的( ),置信度愈高,则估计的把握程度就()。 12、影响样本容量大小的因素主要有五种:()、()、()、()、()。 13、区间估计是用样本统计量估计总体参数时,用一个区间范围的值作为总体参数的估计值,并注明总体参数落在这们一个区间的可能性,或称()。我们称这一区间为()。 14、对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,抽样单位数必须()倍。若误差范围扩大一倍,则抽样单位数为原来的()。 二、单项选择题:(14分) 1、随机抽样的基本要求是严格遵守() A.、准确性原则B、随机性原则C、代表性原则D、可靠性原则。 2、抽样调查的主要目的是() A.、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数。 3、在抽样调查中() A.、既有登记性误差,也有代表性误差B、既没有登记性误差,也没有代表性误差C、只有登记性误差,没有代表性误差D、、

社会调查研究方法题库_抽样调查考试参考(1)

开元捷问分享社会调查研究方法——抽样调查考试如下: 一、单项选择题 1、以下抽样方法中可用于对总体进行推断的是()。 A、随意抽样 B、志愿者抽样 C、判断抽样 D、简单随机抽样 2、随意抽样假定总体是()。 A、同质的 B、异质的 C、足够大的 D、很小的 3、由专家有目的地抽选他认为有代表性的样本进行调查,这种方法是()。 A、判断抽样 B、志愿者抽样 C、简单随机抽样 D、随意抽样 4、如果要对子总体进行推断,则应该采用()。 A、简单随机抽样 B、系统抽样 C、整群抽样 D、分层抽样 5、以下抽样方法中,抽取的每个单元都有相同的入样概率的是()。 A、简单随机抽样 B、整群抽样 C、多阶抽样 D、多相抽样 6、以下可以被用作评价其他抽样方案效率基准的是()。 A、简单随机抽样 B、系统抽样 C、分层抽样 D、整群抽样 7、等概率抽样方法有()。 A、圆形系统抽样 B、与大小成比例的概率抽样 C、整群抽样 D、多阶抽样

8、以下抽样方式中,抽样效率最高的是()。 A、整群抽样 B、简单随机抽样 C、系统抽样 D、分层抽样 9、非概率抽样()。 A、可假定样本对总体具有代表性 B、是用随机的方法从总体中抽选样本单元 C、是用主观方法从总体中抽选样本单元 D、可避免调查结果出现偏差 10、对于概率抽样来说,假设入样概率是1/50,则设计权数是()。 A、1/50 B、1 C、50 D、100 11、自加权抽样设计要求从总体中抽取单元的入样概率()。 A、相同 B、不同 C、接近于最大 D、不能太大 12、抽样比f 是指()。 A、n/N B、N/n C、1-( n/N ) D、(n/N) –1 13、测量抽样误差最常用的指标是()。 A、标准差 B、抽样方差 C、变异系数 D、置信区间 14、抽样设计A 比抽样设计B 有效是因为()。 A、A的抽样方差较大 B、B的抽样方差较大

相关文档
最新文档