抽样技术课后习题答案

抽样技术课后习题答案
抽样技术课后习题答案

第二章习题

2.1判断下列抽样方法是否是等概的:

(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。

(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.

(3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。

2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 解析:抽样理论和数理统计中关于样本均值的定义和性质的不同 抽样理论

概率统计

定义

∑==n

i i y n y 1

1

∑==n

i i

y n y 1

1

性质

1.期望()

()()()Y C P E N

N C N C ===∑∑==n n

1

i n i 1i i i 1

y y y

2.方差()()()[]()i

C i i

i

P y E y y V n N

2

1

∑=-=

=()()

[]n N

C i i

i

C

y E y n N

1

2

1

∑=-

()21S n

f -=

1.期望()

??? ??=∑=n i i y n E y E 11()∑==n

i y E 1

i n 1

[]μμ==

n n

1

2.方差()[]

2

μ-=i y E y V

2

11???

???-=∑=n i i y n E μ

()n

y n 122

i σμ=-=E

2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2

s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?

解:由已知可得,N=50000,n=300,5.9y =,2062=s

1706366666206*300

50000300

1500001)()?(22

2

=-

=-==s n

f N y N v Y

V

19.413081706366666(==)y v

该市居民用电量的95%置信区间为

[])(y [2

y V z N α±=[475000±1.96*41308.19]

即为(394035.95,555964.05) 由相对误差公式

y

)

(v u 2y α≤10%

可得%10*5.9206*n

50000

n 1*

96.1≤-

即n ≥862

欲使相对误差限不超过10%,则样本量至少应为862

2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。

解析:由已知得:10000=N 200=n 35.0=p 02.0==

N

n

f 又有:35.0)()(===∧p p E p E 0012

.0)1(1

1)(=---=∧p p n f

p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2

±P V Z P E α

代入数据计算得:该区间为[0.2843,0.4157]

2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:

编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10

240

20

120

估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n

根据表中数据计算得:5.14420120

1

==∑=i i y y ()

06842.827120120

1

22

=--=∑=i i

y y s 21808.37)1(1)(2=-=

s N

n

n y V 10015

.6)(=y V

∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2

y V z

α

±即是:[132.544 ,156.456]

故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。

2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到

y =1120(吨)

,25602

=S ,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。

解析:由题意知:y =1120 1429.0350

50

n ===

N f 25602=S ?160=s 置信水平95%的置信区间为:]1y [2

s n

f

z -±α

代入数据得: 置信水平95%的置信区间为:[1079.872,1160.872]

2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差682

=S ,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多少?

解析:简单随机抽样所需的样本量2

2

22

2

12

2

S Z Nd S NZ n αα+=

%

701

2n n =

由题意知:1000=N 2=d 682

=S 96

.12

=αZ

代入并计算得:613036.611≈=n

87142.87%701

2≈==

n n

故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87

2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。试估计今年该地区化肥总产量。

解析:由题可知22x =,

35.211002135===

N X X ,25y =

则,该地区化肥产量均值Y 的比率估计量为

26

.242425

35.21===∧

x y X

Y

该地区化肥产量总值Y 的比率估计量为 242626.24*100??===R Y N Y

所以,今年该地区化肥总产量的估计值为2426吨。

2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表: 单位:元 编号 文化支出 总支出 编号 文化支出 总支出 1 200 2300 11 150 1600 2 150 1700 12 160 1700 3 170 2000 13 180 2000 4 150 1500 14 130 1400 5 160 1700 15 150 1600 6 130 1400 16 100 1200 7 140 1500 17 180 1900 8 100 1200 18 100 1100 9 110 1200 19 170 1800 10

140

1500

20

120

1300

全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。

解析:由题可知1580

130017002300201

x n 1x n 1i i =+++==∑=)(

5.144y =

091.015805.144?=≈===x y r R

又329

.14615805

.144*1600x y y ===X R

053.826)(111

22

=--=∑=n

i i y y n S

158.3463))((111

=---=∑=n

i i i xy

x x y y n S

579.8831)(111

22

=--=∑=n i i x

x x n S

故平均文化支出的95%的置信区间为

,)??2(1[2222

x yx R S R S R S n f Z y +---α])??2(1222

2x

yx R S R S R S n f Z y +--+α

代入数据得(146.329±1.96*1.892)

即为[142.621,150.037]

2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个月后再次测量,结果如下:

单位:千克 编号 原重量 现重量 1 95 150 2 97 155 3 87 140 4 120 180 5 110 175 6 115 185 7 103 165 8 102 160 9 92 150 10

105

170

用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。

解:由题可知,6.10210595101

x n 1x n 1i i =++==∑=)

( 16317015010

1

y n 1y n 1i i =+==∑=)(

222.2121910*9

1)(1112

2

==--=∑=n i i

y y n S 333.1461317*91))((111==---=∑=n i i

i xy

x x y y n S 933.1064.926*9

1)(11122

==--=∑=n i i x

x x n S 故有368.1933

.106333

.1462

0==

=

x

xy S S β

所以总体均值Y 的回归估计量为

443.159)6.102100(*368.1163)(0=-+=-+=x X y y lr β 其方差估计为:

)2(1)(?02202xy

x lr S S S n f y V ββ-+-=

=

)333.146*368.1*2933.106*368.1222.212(10

1201012-+-

=1.097

而2

1y (?S n

f V -=

) =

222.212*10

12010

1- =19.454

显然)(?)(?y V y V lr

< 所以,回归估计的结果要优于简单估

第三单元习题答案(仅供参考)

1解:(1)不合适

(2)不合适

(3)合适

(4)不合适

2.将800名同学平均分成8组,在每一级中抽取一名“幸运星”。

3.根据表中调查数据,经计算,可得下表:

h

1 10 256 0.3033 0.0391 11.

2 2867.2 94.4

2 10 420 0.4976 0.0238 25.5 10710 302.5

3 10 168 0.1991 0.0595 20 3360 355.6

总计30 844 1 16937.2

==20.1

V()=-

=9.7681-0.2962

=9.4719

=3.0777

(2)置信区间为95%相对误差为10%,则有

按比例分配的总量:n==185.4407185

=n=56,=92,=37

按内曼分配:n==175

=33,=99,=43

4.根据调查数据可知:

h

1 0.18 0.9

2 0.21 0.933

3 0.1

4 0.9

4 0.08 0.867

5 0.1

6 0.933

6 0.22 0.967

==0.924

根据各层层权及抽样比的结果,可得

()==0.000396981

=1.99%

估计量的标准差为1.99%,比例为9.24%

按比例分配:n=2663

=479,=559,=373,=240,=426,=586

内曼分配:n=2565

=536,=520,=417,=304,=396,=392 5.解:由题意,有

==75.79

购买冷冻食品的平均支出为75.79元

又由V()=+

又n=

V()=53.8086

=7.3354

95%的置信区间为[60.63,90.95]。

7.解:(1)对

(2)错

(3)错

(4)错

(5)对

8.解:(1)差错率的估计值=70%+30%=0.027

估计的方差v()==3.1967

标准差为S()=0.0179。

(2)用事后分层的公式计算差错率为==0.03

估计的方差为;v()=-=2.5726

9.解:(1)所有可能的样本为:

第一层第二层

3,5 0,3 8,15 6,9 3,10 0,6 8,25 6,15 5,10 3,6 15,25 9,15

(2)用分别比估计,有=0.4,=0.65,所以用分别比估计可计算得=6.4。用联合比估计,有=0.5,=0.625,所以用联合比估计可计算得=6.5。

第四章习题

4.1 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群

10户,现随机抽取4个群,取得资料如下表所示:

群 各户订报数ij y

i y

1 1,2,1,3,3,2,1,4,1,1 19

2 1,3,2,2,3,1,4,1,1,2 20

3 2,1,1,1,1,3,2,1,3,1 16 4

1,1,3,2,1,5,1,2,3,1

20

试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。 解:由题意得到400=N ,4=n ,10=M ,01.0400

4===

N n f 故875.14

1020

1620191?1

=?+++=

=

=∑

=n

i i y Mn

y Y (份)

75.18875.110=?=?=y M y (份) 750040010?=?=??=y N M Y

(份) ∑=--=

n

i i

b

y y

n M s 1

22)(1

∑=---=

-=n

i i

b y y

n nM f s nM f y v 1

222)(1

111)(

14)75.1820()75.1819(10401.01222

--++-??-=

00391875.0=

6270000391875.010400)()?(2222=??==y v M N Y

v 于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。

该辖区总的订阅份数为7500,估计量方差为62700。

4.2 某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单

随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:

单位 总人数 赞成人数 1 51 42 2 62 53 3 49 40 4 73 45 5 101 63 6 48 31 7 65 38 8 49 30 9 73 54 10 61 45 11 58 51 12 52 29 13 65 46 14 49 37 15

55

42

(1) 估计该系统同意这一改革人数的比例,并计算估计标准误差。

(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不

超过8%,则应抽取多少个单位做样本?

解:题目已知87=N ,15=n ,87

15

=

=N n f 1)由已知估计同意改革的比例

709.0911

646

?1

1

≈=

=∑∑==n i i

n

i i

M

y

p

733.6011

==

∑=n i i

M

n

M

008687.0)?(1111)?(1

22=---=∑=n

i i i

M p

y

n n f M

p

v 此估计量的标准差为

9321.0008687.0)?()?(===p v p

s

4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员欲估计办公

费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费用的票据,得到下表资料:

抽屉编号 票据数i M

费用额(i y ,百元)

1 4

2 8

3 2 27 62 3 38 45

4 63 112

5 72 9

6 6 12 58

7 24 75

8 14 58

9 32 67 10

41

80

要求以95%的置信度估计该集团办公费用总支出额度置信区间(α=0.05)。

解:已知N=48, n=10, f=4810

=

N n , 由题意得7361

=∑=n

i i y ,3651=∑=n i i M , 则办公费用的总支出的估计为8.353273610

48

?1

=?=

=∑=n

i i

y

n

N Y

(元) 群总和均值6.7373610

1

11=?=

=∑=n i i y n y (元) 1

)()1()?(1

2

2

--?-=∑=n y y

n

f N Y

v n

i i

=9)6.7380(...)6.7362()6.7383(10)

48101(482222-++-+-?

-

? = 182.4?91

?3590.4

= 72765.44

)?(Y

v =269.7507 则Y

?的置信度为95%的置信区间为3532.8±1.96?269.7507,即[3004.089,4061.511].

4.4 为了便于管理,将某林区划分为386个小区域。现采用简单随机抽样方法,从中抽出

20个小区域,测量树的高度,得到如下资料:

区域编号 数目株数

i M

平均高度i

y (尺) 区域编号

数目株数

i M

平均高度i

y (尺) 1 42 6.2 11 60 6.3 2 51 5.8 12 52 6.7 3 49 6.7 13 61 5.9 4 55 4.9 14 49 6.1 5 47 5.2 15 57 6.0 6 58 6.9 16 63 4.9 7 43 4.3 17 45 5.3 8 59 5.2 18 46 6.7 9 48 5.7 19 62 6.1 10

41

6.1

20

58

7.0

估计整个林区树的平均高度及95%的置信区间。

解:由已知得386=N ,20=n ,0518.038620===

N n f 整体的平均高度909.51046

8

.6180y Y ?

1

-i n

1i ==

=

=∑∑=n i

i

i

M

y M

3.5211

==

∑=n

i i

M

n

M

方差估计值1

)(1)()?(1

2

2

---=

=∑=n y M y

M n f

y v Y v n

i i i

02706.0=

标准方差1644.002706.0)?

()?(===Y v Y s

在置信度95%下,该林区的树木的平均高度的置信区间为

)2312.6,5868.5()1644.096.1909.5()Y ?(t Y ?/2=?±=?±)(s α

4.5 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200

间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是简单随机抽样,调查结果如下表:

样本宿舍

拍照人数

样本宿舍 拍照人数

1 2 6 1 2 0 7 0 3 1 8 1 4 2 9 1 5

1

10

试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。 解:题目已知200=N ,10=n ,6M =,3=m ,05.0200101===

N n f ,5.02==M

m f 3.03

109

?1

=?=

=∑=nm

y

p

n

i i

005747.0)(1111)?(1

2=?--?

-?=∑=n

i i

m p y

n n f m

p v

0758.0005747.0)?()?(===p v p

s 在置信度95%下,p 的置信区间为

))?(?(2/p v t p

α±=)0.448568,0.151432()0758.096.13.0(=?±

4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的调查,宿

舍间的标准差为1S =326元,宿舍内同学之间的标准差为2S =188元。以一位同学进行调查来计算,调查每个宿舍的时间1c 为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的时间为0c 是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生是多少?

解:由已知条件得到以下信息:

326S 1=(元)188S 2=(元)10c 1=(分钟)1c 2=(分钟)240604c 0=?=(分

钟) 由此得到

106276

S 21

=,35344

S 22

=,33.1003856

35344106276S 2

212u

=-=-=M S S

82.11

10

326188m 2112opt ≈?=?=

c c S S 因而取最优的2m =,进一步计算opt n 由于总时间的限制480C =,由关系式

nm c n c c C 210++=得到opt opt 2n 10n 240480++=

计算方程得到20n opt =,因而取20n =

则最优的样本宿舍数为20间,最优样本学生数为2。

4.7 某居委会欲了解居民健身活动情况,如果一直该居委会有500名居民,居住在10个单

元中。现先抽取4个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽样都是简单随机抽样,调查了样本居民每天用于健身锻炼的时间结果如下(以10分钟为1个单位):

单元i 居民人数i M

样本量i

m

健身锻炼时间ij y 1

32 4 4,2,3,6 2 45 5 2,2,4,3,6 3 36 4 3,2,5,8 4

54

6

4,3,6,2,4,6

试估计居民平均每天用于锻炼的时间,并给出估计的标准差。 (1) 简单估计量 (2) 比率估计量

(3) 对两种估计方法及结果进行评价。 解:(1)简单估计

∑∑====n

i i i n

i i u

Y n N

y M n

N Y 1

1

??

=

)17.4545.4364.34575.332(4

10

?+?+?+?? =1650,

则3.3500

1650

?Y ?0u ===M Y u ,

又1656604

1?1Y ?1u =?==∑=n i i Y n , 所以∑∑==-+---=n

i i

i

i i n

i u

i

m s f M n

N

n Y Y f 12

2221

2

1

2

u

)1(1

)??(n 1(N )Y ?v()

分别计算

1926

3

5778]

)165225()165162()165153()165120[(3

1

1

)

??(22221

2

==-+-+-+-?=--∑=n Y Y n

i u

i

48.46286

2.2)546

1(544

7)364

1(3658.2)4551(45492.2)3241(32)1(222212

222=?-?+

?-?+?-?+?-

?=-∑=n

i i

i

i i m s f M

所以,162

.0046285.011556.0)1(1)??(n 1(N 1)?(1

222212120≈+=????

?

?

?????

?-+

---=∑∑==n

i i i i i n

i u i u m s f M n

N n Y Y f M Y v ) 所以标准差402.0)?

()?

(==u u Y v Y s

(2) 比率估计

9532.354

36453217

.4545.4364.34575.332?1

1

=+++?+?+?+?=

=∑∑==n i i

i

n

i i

R M

y M

y

∑==-+---=n i i

i

i i n

i u

i

R m s f M n N n Y Y f y

v 12

2221

2

1

2

)1(1

)??(n 1(N

)?()

其中∑∑===

=n i i

i

n

i i

R R M

y M

M Y Y 1

1

??

0715.0)?()?(2

==M Y v y

v R R

2647.00715.0)?()?(===R R y v y

s (3) 简单估计标准差402.0)?

(=u Y s ,比率估计标准差2647.0)?(=R y

s ∴比率估计更好

第五章不等概抽样习题答案

5.1解:

分析题目可知“代码法”与“拉希里法”都是PPS 抽样(放回的与规模大小成比例的不等概抽样)的实施方法,而此题需要用此两种方法进行不放回抽样,故需进一步进行改进:即采用重抽法抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽到规定的样本量且所有样本党员不重复: (1) 代码法:由i Z =

∑==N 1

i i

i 0

i M M

M M 可假设0M =1000000,则M i =i Z M 0列成数据表为: PSU M i 累计M i 代码 1 110 110 1~110 2 18556 18666 111~18666 3 62999 81665 18667~81665 4 78216 159881 81666~159881 5 75245 235126 159982~235126 6 73983 309109 235127~309109 7 76580 385689 309110~385689 8 38981 424670 385690~424670 9 40772 465442 424671~465442 10 22876 488318 465443~488318 11 3721 492039 488319~492039 12 24971 517010 492040~517010 13 40654 557664 517011~557664 14 14804 572468 557665~572468 15 5577 578045 572469~578045 16 70784 648829 578046~648829 17 69635 718464 648830~718464 18 34650 753114 718465~753114 19 69492 822606 753115~822606 20 36590 859296 822607~859296 21 33853 893049 859297~893049 22 16959 910008 893050~910008 23 9066 919074 910009~919074 24 21795 940869 919075~940869 25

59185

1000054

940870~1000054

我们看到抽取的范围比较大,所以我们利用计算机中的随机数表来抽取,第一个随机数为444703, 615432, 791937, 921813 , 738207, 176266, 405706 935470, 916904, 57891按照范围我们可以知道抽取的PSU9, PSU16, PSU19, PSU24, PSU18, PSU2, PSU8 PSU24 PSU23 PSU2,我们看到第2组和24组重复抽取了,故进行重新抽取,抽到4组和6组;

综上所述,抽取的样本为2,4,6,8,9,16,18,19,23,24组

(2)拉希里法:M ?

=78216,N=25,在[1, 25]和[1, 78216]中分别产生(n,m ): (13,38678),M 13=40654≥38678,入样; (8, 57764),M 8=38981<57764,舍弃,重抽; (23,13365),M 23=9066<13365,舍弃,重抽; (19,38734),M 19=69492≥38734,入样;

以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为: 2,3,5,6,7,12 ,13,16, 19,24组 5.2解:

由数据可得: t 1=

∑=i

M j j

y

1

1=20, t ∑===

2

1

2225M j j

y

,t 3=38, t 4=24, t 5=21;

结合t 值数据,我们可以推得Z 的值 Z 1=

2.025

5

01==M M ,Z 2=0.16,Z 3=0.32,Z 4=0.2,Z 5=0.12, 由公式()

()()???

?

?

?-+----=

∑=N

i i i

j i j i j i ij Z

Z Z Z Z Z Z Z 1211212114π

样本 ij π

1,2 0.273769 1,3 0.217405 1,4 0.283079 1,5 0.243826 2,3 0.166251 2,4 0.213142 2,5 0.243826 3,4 0.603903 3,5 0.53546 4,5

0.243826

5.3 解:

设:0M =1,则有:i i Z M =,得到下表: i i M

1000?i M

累计1000?i M 代码 1

0.104

104

104

1—104

2 0.192 192 296 105—296

3 0.138 138 43

4 297—434 4 0.062 62 496 435—496

5 0.052 52 548 497—548

6 0.14

7 147 695 549—695 7 0.089 89 784 696—784

8 0.038 38 822 785—822

9 0.057 57 879 823—879 10

0.121

121 1000 880—1000 ∑

1

1000

先在[1,1000]中产生第一个随机数为731,再在[1,1000]里面产生第二个随机数为103,最后在[1,1000]中产生第三个随机数为982,则它们所对应的第7、1、10号单元被抽中。 5.4 解:

利用汉森-赫维茨估计量对总体总值进行估计:

()

9.322877.792543.1037061]006.2217121.0290006.2217062.0120006.2217138.0320[61111006.2217]121

.0290062.0120138.0320[3112

2

2

2

11++?=??

?

??-+??? ??-+??? ??-?=???

? ??--=??? ??=++?==∑∑=∧∧=∧

n i HH i i HH n i i i HH

Y Z y n n Y v Z y n Y =20318.8

5.142=??

?

??=??? ??∴

∧∧HH HH Y v Y s

5.5解:由题可知

∑∑====6

1

1

0i i N i i X X X =2+9+3+2+1+6=23

由0

X X n

i

i =π得下表: i

指标值i X 包含概率i π i Z

1 2 0.1739 0.087 2 9 0.7826 0.3913 3 3 0.2609 0.1304 4 2 0.1739 0.087 5 1 0.087 0.0435 6

6

0.5217

0.2609

抽样技术期中试卷

注:至少保留小数点后两位有效数字;计算需过程、结果要有据可依。 一、(20分)某小商店有45个货架,经常需清点架上货物的价值,为探索用抽样的方法来节省盘货的工作量。某日将45个货架上的货物的价值清点列出一张清单如下(单位:元): 297,569,618,691,545,606,681,382,566,619,711,679,354,426,561,613,745,601,676,538,443,583,623,771,701,663,534,632,600,531,594,826,641,581,453,449,850,651,593,477,486,524,519,603,659, 希望从样本作出的总的货物总价值的估计量的误差,有95%的把握不超过2000元。问在此情况下,用一个含10个货架的简单随机样本是否可以达到要求?你认为最适宜的样本量应是多少? 二、(20分)某学院共有1200名学生,现欲调查学生平均每月的伙食费支出,采用简单随机抽样的方法抽选了65名学生做调查,得到的数据如下: 65 1 17550 i i y ==∑ ,480242665 1 2=∑=i i y (1)试求该学院学生平均每月伙食费支出的95%的置信区间; (2)依据上列数据,试问样本容量n 应约取多少才能保证在置信度95%下该估计 的相对误差不超过10%? 三、(20分)某市共有3000个个体商业户,要对其上月的零售额进行抽样调查。由于个体商业户的大小差别比较大,现采用分层抽样的方法,根据其在工商局登记资金分为大、中、小三层,共抽取了300户,调查结果的数据如下(单位:万元), 24 ,20,50,2002 1111====s y n N 大型: 6,9,100,100022222====s y n N 中型: 1,2,150,18002 3333====s y n N 小型: (1)试估计全市个体工商户每月平均销售量,并求其95%的置信区间; (2)若要求平均销售量估计量的最大标准差不超过0.1,试根据上述数据用Neyman 分配法估计总样本容量n 和大中小型各层样本容量h n 。 四、(20分)一个大总体分为三层,各层所占比例分别为2.0,3.0,5.0321===W W W 。 需要调查的指标是某特征单元所占比例,对三个层粗估该比例分别为 6 .0,4.0,52.0321===p p p 。计算当采用按比例分配样本分层抽样时,需要多大的 样本量即可达到简单随机抽样600=n 时的相同精度。 五、(20分)在一次针对某城市大学生月生活费支出的调查中,以小组为群进行整群抽样。每个小组都有8=M 个大学生。采用简单随机抽样在全部510=N 个组中抽取 12 =n 个小组。全部96个样本大学生人均月消费额ij y 及按小组计算的平均数i y 与标准 差i s 如下表所示。试估计该城市大学生人均月生活费支出的平均值Y ,并给出其%95的置信区间。并计算大学生月消费支出调查以小组为群的群内相关系数与设计效应。

《抽样技术》第四版习题答案

第2章 2.1 解:()1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号 为1~64的这些单元中每一个单元被抽到的概率都是 1 100 。 ()2这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中 的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2 100 ,而尚未被抽中的编号为36~63的每个单元的入样概率都是 1100 。 ()3这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~ 21 000中的每个单元的入样概率都是 1 1000 ,所以这种抽样是等概率的。 2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大 _ y E y y -= 近似服从标准正态分布, _ Y 的195%α-=的置信区 间为y z y z y y α α??-+=-+? ?。

而()2 1f V y S n -= 中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间 为,y y ?? -+??? ? 。 由题意知道,_ 2 9.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _ 21130050000 ()2060.6825300 f v y s n --= =?=。将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192????。 下一步计算样本量。绝对误差限d 和相对误差限r 的关系为_ d r Y =。 根据置信区间的求解方法可知 _ ___ 11P y Y r Y P αα? ???-≤≥-?≤≥-???? 根据正态分布的分位数可以知道 1P Z αα??? ≤≥-???? ,所以()2_2r Y V y z α?? ?= ??? 。也就是2 _2 _222 /221111 rY rY S n N z S n N z αα???????? ??? ?? ???-=?=+ ? ????? ?? ???? 。 把_ 2 9.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。所以样本量至少为862。 2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f N V p P P n N -= --, 在大样本的条件下近 似服从标准正态分布。在本题中,样本量足够大,从而可得P 的195%α-= 的置信区间为 p z p z αα?-+?。 而这里的() V p 是未知的,我们使用它的估计值

抽样专业技术简答题及答案

抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2.抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5.影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影 响抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在 某些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程 度的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法, 如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误 差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。 3何谓抽样效率,如何评价设计效果? 答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比较

抽样技术课后习题参考答案金勇进

第二章习题 2.1判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少? 解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±1.96*41308.19] 即为(394035.95,555964.05) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1*96.1≤- 即n ≥862

欲使相对误差限不超过10%,则样本量至少应为862 2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0==N n f 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2 ∧ ∧ ±P V Z P E α 代入数据计算得:该区间为[0.2843,0.4157] 2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10 240 20 120 估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n 根据表中数据计算得:5.14420120 1 ==∑=i i y y ∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2 y V z α ±即是:[132.544 ,156.456] 故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。 2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到 y =1120(吨),225600S =,据此估计该地区今年的粮食总产量,并给出置信水平95%的 置信区间。 解析:由题意知:y =1120 1429.0350 50 n === N f 225600S =?160=s

抽样技术期末试卷

抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是() A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差

性、无偏性和有效性 4.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C.x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B. )?(θ tSE =? C. θ θ )?(tSE = ? D. t SE )?(θ = ? 9.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量之间大致成

审计技术和方法 2014 最新习题与答案

审计技术和方法习题 一、判断题(正确的划“√”,错误的划“X”) 1.审计导向审计模式发展规律的三个阶段存在者截然的划分,各阶段所采用的审计技术、程序和方法不能相互利用。( X )2.账项导向审计模式是以查错防弊为审计目标对所有会计事项进行审查的传统审计。( √ ) 3.账项导向审计模式中资产负债表审计和财务报表审计是同一种形式。( √ ) 4.账项导向审计模式是以对所有会计事项进行审查为主线。(√) 5.账项导向审计模式阶段所采用的审计方法不能适用于系统导向审计模式和风险导向审计局模式阶段。( X ) 6.资产负债表审计阶段广泛采用符合性测试和统计抽样审计方法。( X ) 7.在会计报表审计的初期,由于以抽查测试为主的审计方法还没有成熟,仍然大量采用详细审计的方法。 ( √ ) 8.账项导向审计模式没有区分阶段、步骤,无所谓审计准备阶段。 (√ ) 9.对被审计单位进行报送财务审计时,同样应采用盘点法、观察法。( X ) 10.审阅法和核对法在经济效益审计中运用最为广泛。( X ) 11.函询是通过向有关单位发函了解情况取得证据的方法,这种方法一般用于往来款项的查证。( √) 12.顺查法一般适用于规模较大、业务较多的大中型企业和凭证较多的行政事业单位。( X ) 13.详查法的主要缺点是工作量太大,消耗人力和时间过多,审查成本高,故难于普遍采用。( √ ) 14.审计抽样是指注册会计师在实施审计程序时,从总体中选取一定数量的样本进行测试,并对所选项目发表审计意见的方法。 (X ) 15.对于容易出现舞弊行为的现金、银行存款和贵重的原材料,应采用监督盘点。(X ) 16.系统导向审计模式是以证实财务报表的公允性,以内部控制制度的评价为导向的审计模式。( √ ) 17.风险导向审计能够满足审计人员降低审计成本与审计风险的需要。( √ ) 18.风险导向审计不对内部控制系统进行评审,而是评价企业的生产经营等外部环境。( X ) 19.风险导向审计模式是以审计风险的评价做为一切审计工作出发点并贯穿于审计全过程的审计模式。( √ )

2020年见证取样员考试题及答案

精选考试类文档,如果需要,请下载,希望能帮助到你们! 2020年见证取样员考试题与答案 一、选择题: 1、在办理样品接收手续时,若发现见证人与授权书所授权的人不一致,则该检测将被视作____________处理。 A见证检测 B委托检测 C抽样检测 (B) 2、建筑楼、地面砂浆则是每一层楼、地面取一组,不足按计算。 A:1000m2 、1000 m2 B:2000 m2、2000 m2 C: 3000 m23000 m2 (A) 3、砂浆试块在脱模前应在20±5℃温度下停置一昼夜,然后拆模养护,养护温度为℃。A20±5℃ B20±3℃ C20±1℃(B) 4、当砂浆试块评定不合格或留置组数不足时,可以用等方法检测评定后,作相应处理。 A:非破损或截墙体检验 B:回弹法检测 C:轴压法检测砌体抗压强 度(A) 5、砂的验收批,用大型运输工具的以或为一验收批。 A400m3600t B500m3600t C600m3600t (A) 6、石的验收批,用小型运输工具的,以为一验收批。 A:400m3600t B200m3300t C400m3400t (A) 7、砂浆立方体抗压强度的取样数量,砌筑砂浆每个台班、同一配合比、同一层砌体或砌体为一取样单位取一组试块。 A300 m3 B500 m3 C250 m3 (C)

8、见证人员应是本工程____________人员。(C) A监理单位或施工单位 B建设单位或施工单位 C建设单位或监理单位 9、送样员在送被检样品时,必须向检测单位出示____________。(A) A送样证和建设单位书面授权书 B见证证书 C送样证 10、检测单位在接受委托检验任务时,须由送检单位填写委托单,____________应在检验委托单上签名。(B) A管理人员 B见证人员 C检验人员 二、填空题 1、对于建筑结构的安全等级为一级或设计使用年限为50年及以上的房屋,同一验收批砂浆试块的数量不得少于3 组。 2、国标GB 50325规定,民用建筑工程室内环境污染物浓度限量的验收项目包括甲醛、氡、苯、氨、总挥发性有机物TVOC。 3、当水泥中的化学指标和物理指标中凝结时间、安定性、强度的检验结果符合GB175-2007技术要求标准规定时为合格品。 4、砂石的验收按《普通混凝土用砂、石质量及检验方法标准》(JGJ52-2006)中的规定进行,使用单位应按同产地、同规格分批验收。用大型工具(如火车、货船或汽车)运输的,以400立方或600吨为一验收批。 5、纤维增强低碱度水泥建筑平板出厂检验检验批量:每批平板应以同一等级、 同一规格的产品,以(1000 )张为一个批量。 6、骨料在料堆上取样时,取样部位应均匀分布,取样前先将取样部位表层铲除,然后由各部位抽取大致相等的砂8 份,石16 份,组成各自一组样品。 7、混凝土拌合物主要性能为和易性,主要包括流动性、粘聚性、保水性三方面,采用坍落度试验进行测定。

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量 之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(2 22YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

抽样技术与应用期末复习题

1、 分层抽样的特点是() A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 2、下面的表达式中错误的是() A 、∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 3、各省电脑体育彩票中奖号码的产生属于() A 、随意抽样 B 、判断抽样 C 、随机抽样 D 、定额抽样 4、抽样调查的根本功能是() A 、获取样本资料 B 、计算样本指标 C 、推断总体数量特征 D 、节约费用 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随 机抽样(srs V )的精度之间的关系式为() A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、我们想了解学生的视力状况,准备抽取若干学校若干班级的学生进行测试, 则() A 、抽样单位是每一名学生 B 、调查单位一定是每一名学生 C 、调查单位可以是班级 D 、调查单位是学校 7、在分层抽样中,当样本容量n 固定时,能够使得估计量的方差)(st y V 达到最 小的分配方式是() A 、比例分配 B 、等额分配 C 、随机分配 D 、Neyman 分配 8、概率抽样与非概率抽样的根本区别是()

A 、是否能确保总体中的每个单位都有完全相同的概率被抽中 B 、是否能确保总体中的每个单位都有事先已知或可以计算的非零概率被抽中 C 、是否能减少调查性误差 D 、是否能计算和控制抽样误差 9、在抽样的总误差中,属于一致性的误差有() A 、变量误差与估计量偏差 B 、估计量偏差与抽样误差 C 、变量误差与抽样误差 D 、非抽样误差与估计量偏差 10、简单随机抽样、系统抽样、按比例分配的分层抽样三者之间的共同点是() A 、将总体分成几部分,然后按事先确定的规则在各部分抽取 B 、每个个体单元被抽到的可能性都相等 C 、一旦选定了第一个样本单元,则其余所有样本单元即可完全确定 D 、三者没有共同点 11、下面哪种样本量分配方式属于比例分配?() A 、N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑==1 C 、∑==L h h h h h h S N S N n n 1 D 、∑==L h h h h h h S W S W n n 1 12、整群抽样中的群的划分标准为() A 、群的划分尽可能使群间的差异小,群内的差异大 B 、群的划分尽可能使群间的差异大,群内的差异小 C 、群的划分尽可能使群间的差异大,群内的差异大 D 、群的划分尽可能使群间的差异小,群内的差异小 13、群规模大小相等时,总体均值 的简单估计量为() A.∑∑===n i M j ij y nM Y 111?

路用材料取样方法与管理要求试题及答案

路用材料取样方法与管理要求试题及答案第1题 评价无机结合料施工离散性时,宜在()地方取料。 A. 拌合机 B. 施工现场 C. 实验室 D. 料仓 E. 以上都对 答案:B 您的答案:B 题目分数:3 此题得分: 3.0 批注: 第2题 沥青拌和楼的热料仓取集料样时,应在()位置取样 A. 放料口的全断面上 B. 任一位置 C. 在表面取样 D. 上部取样 E. 以上都对 答案:A 您的答案:A 题目分数:3 此题得分: 3.0 批注: 第3题 粉煤灰散装()吨为一编号。 A. 200 吨 B. 300 吨 C. 400吨 D. 500 吨 E. 600吨 答案:D 您的答案: D 题目分数: 3 此题得分: 3.0 批注:第4题 散装水泥()吨为一取样批 A. 200 吨 B. 300 吨 C. 400吨

E. 600吨 答案:D 您的答案:D 题目分数:3 此题得分: 3.0 批注: 第5题 采用取样铲取份样,从一批流动的生石灰中,有规律地间隔取()份样,每份样不少于2kg。 A. 6 B. 8 C. 10 D. 12 E. 13 答案:D 您的答案:D 题目分数:3 此题得分: 3.0 批注: 第6题 所取份样均匀混合好后,采用四分法将其缩分到生石灰不少于()kg A. 1 B. 2 C. 5 D. 10 E. 12 答案:A 您的答案:A 题目分数:3 此题得分: 3.0 批注: 第7题 用取样器取沥青时,应按液面上、中、下位置(液面高各为1/3 等分处,但距罐底不得低于总液面高度的1/6)各取()样品。 A. 1~4L B. 3-5L C. 5-8L D. 8-10L

中国人民大学题库答案详解-抽样技术

中国人民大学 同等学力申请硕士学位课程考试试题 课程代码:123105 课程名称:抽样技术与方法 试题卷号: 1 名词解释 非概率抽样 非概率抽样又称为非随机抽样,是调查者根据自己的方便或主观判断抽取样本的方法,其最主要的特征是抽取样本时并不依据随机原则。包含有判断选样、方便抽样、自愿样本、配额抽样等。 最优分配 在分层随机抽样中,对于给定的费用,使估计量的方差V(y_st)达到最小,或者对于给定的估计量方差V,使总费用达到最小的各层样本量的分配,称为最优分配。 PPS抽样 是有放回的按规模大小成比例的概率抽样。其抽选样本的方法有代码法、拉希里方法等。 PPS 抽样是按概率比例抽样,属于概率抽样中的一种。是指在多阶段抽样中,尤其是二阶段抽样中,初级抽样单位被抽中的机率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机会就越大,初级抽样单位规模越小,被抽中的机率就越小。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。

自加权样本 指调查中每个样本单元的设计权数是相同的,也就是说每个单元最终入样的概率是相等的。在不考虑非抽样误差的情况下,可以认为自加权样本完全代表总体,因为每个样本单元都代表了总体中相同数目的单元。(此时可以使用标准统计方法来进行点估计。此外,自加权样本往往方差较小,样本统计量更稳健) 简述题 有人认为“抽样调查除了调查误差以外,还有抽样误差,因此抽样调查不如全面调查准确”,请对此加以评价。 一项调查的误差来自多个方面,抽样调查因为只调查总体中的一小部分,用部分的调查结果推断总体,所以存在着抽样误差,但这只是所有误差中的一部分。对于抽样调查,误差包括抽样误差和非抽样误差。有些情况下,全面调查由于参与的人员众多、涉及范围大,因此虽然没有抽样误差,但在数据采集和数据汇总整理的过程中却有产生其他误差的更大可能性,所以调查规模并不是越大越好。与全面调查相比,抽样调查的工作量小,这就为使用素质较高的工作人员并对他们进行深入的培训创造了条件。此外,如果能对调查过程实施更为细致的监督、检查和指导,可以使抽样调查所得到的数据质量比同样的全面调查数据质量更高,从而使调查的总误差更小。 试对分层抽样中的联合比率估计和分别比率估计方法进行比较。 如果每一层都满足比率估计量有效的条件,则除非R h=R,都有分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。 实际使用时,如果各层的样本量都较大,且有理由认为各层的比率R h差异较大,则分别比率估计优于联合比率估计。当各层的样本量不大,或各层比率R h差异很小,则联合比率估计更好些。此外,联合比估计不像分别比那样需要已知每层的辅助信息X h。

《抽样技术》练习题5及答案

习题一 1.请列举一些你所了解的以及被接受的抽样调查。 2.抽样调查基础理论及其意义; 3.抽样调查的特点。 4.样本可能数目及其意义; 5.影响抽样误差的因素; 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 1)计算样本均值y与样本方差s2; 2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式; 3)根据上述样本数据,如何估计v(y)? 4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。 习题二 一判断题 1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。 2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。 3 抽样单元与总体单元是一致的。 4 偏倚是由于系统性因素产生的。 5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。 6 偏倚与抽样误差一样都是由于抽样的随机性产生的。 7 偏倚与抽样误差一样都随样本量的增大而减小。 8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。 9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。 10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。

社会调查研究方法题库_抽样调查考试参考(1)

开元捷问分享社会调查研究方法——抽样调查考试如下: 一、单项选择题 1、以下抽样方法中可用于对总体进行推断的是()。 A、随意抽样 B、志愿者抽样 C、判断抽样 D、简单随机抽样 2、随意抽样假定总体是()。 A、同质的 B、异质的 C、足够大的 D、很小的 3、由专家有目的地抽选他认为有代表性的样本进行调查,这种方法是()。 A、判断抽样 B、志愿者抽样 C、简单随机抽样 D、随意抽样 4、如果要对子总体进行推断,则应该采用()。 A、简单随机抽样 B、系统抽样 C、整群抽样 D、分层抽样 5、以下抽样方法中,抽取的每个单元都有相同的入样概率的是()。 A、简单随机抽样 B、整群抽样 C、多阶抽样 D、多相抽样 6、以下可以被用作评价其他抽样方案效率基准的是()。 A、简单随机抽样 B、系统抽样 C、分层抽样 D、整群抽样 7、等概率抽样方法有()。 A、圆形系统抽样 B、与大小成比例的概率抽样 C、整群抽样 D、多阶抽样

8、以下抽样方式中,抽样效率最高的是()。 A、整群抽样 B、简单随机抽样 C、系统抽样 D、分层抽样 9、非概率抽样()。 A、可假定样本对总体具有代表性 B、是用随机的方法从总体中抽选样本单元 C、是用主观方法从总体中抽选样本单元 D、可避免调查结果出现偏差 10、对于概率抽样来说,假设入样概率是1/50,则设计权数是()。 A、1/50 B、1 C、50 D、100 11、自加权抽样设计要求从总体中抽取单元的入样概率()。 A、相同 B、不同 C、接近于最大 D、不能太大 12、抽样比f 是指()。 A、n/N B、N/n C、1-( n/N ) D、(n/N) –1 13、测量抽样误差最常用的指标是()。 A、标准差 B、抽样方差 C、变异系数 D、置信区间 14、抽样设计A 比抽样设计B 有效是因为()。 A、A的抽样方差较大 B、B的抽样方差较大

《抽样技术》第四版习题答案

第2章 解:这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是。 这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是,而尚未被抽中的编号为36~63的每个单元的入样概率都是。 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。 解: 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大样本的条件下,近似服从标准正态分布,的的置信区间为。 而中总体的方差是未知的,用样本方差来代替,置信区间为。 由题意知道,,而且样本量为,代入可以求得 。将它们代入上面的式子可得该市居民日用电量的95%置信区间为。 下一步计算样本量。绝对误差限和相对误差限的关系为。 根据置信区间的求解方法可知 根据正态分布的分位数可以知道,所以。也就是。 把代入上式可得,。所以样本量至少为862。 解:总体中参加培训班的比例为,那么这次简单随机抽样得到的的估计值的方差,利用中心极限定理可得在大样本的条件下近似服从标准正态分布。在本题中,样本量足够大,从而可得的的置信区间为。

而这里的是未知的,我们使用它的估计值。所以总体比例的的置信区间可以写为,将代入可得置信区间为。 解:利用得到的样本,计算得到样本均值为,从而估计小区的平均文化支出为144.5元。总体均值的的置信区间为,用来估计样本均值的方差。 计算得到,则,,代入数值后计算可得总体均值的95%的置信区间为。 解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量的估计值为(吨)。 总体总值估计值的方差为,总体总值的的置信区间为,把 代入,可得粮食总产量的的置信区间为。 解:首先计算简单随机抽样条件下所需要的样本量,把带入公式,最后可得。 如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为。 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为。利用去年的化肥总产量,今年的化肥总产量的估计值为吨。 解:本题中,简单估计量的方差的估计值为=37.17。 利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为。文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。 文化支出的比率估计量为,通过计算得到,而,则,文化支出的比率估计量的值为(元)。 现在考虑比率估计量的方差,在样本量较大的条件下,,通过计算可以得到两个变量的样本方差为,之间的相关系数的估计值为,代入上面的公式,可以得到比率估计量的方差的估计值为。这个数值比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的的置信区间为,把具体的数值代入可得置信区间为。 接下来比较比估计和简单估计的效率,,这是比估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。 解:利用简单估计量可得,样本方差为,,样本均值的方差估计值为。 利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。 回归估计量的精度最高的回归系数的估计值为。现在可以得到肉牛现重量的回归估计量为,代入数值可以得到。 回归估计量的方差为,方差的估计值为,代入相应的数值,,显然有。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简单估计量。 第3章 3.1 解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对

抽样技术练习题及答案

1.请列举一些你所了解的以及被接受的抽样调查。 2.抽样调查基础理论及其意义; 3.抽样调查的特点。 4.样本可能数目及其意义; 5.影响抽样误差的因素; 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 1)计算样本均值y与样本方差s2; 2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式; 3)根据上述样本数据,如何估计v(y)? 4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。

一判断题 1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。 2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。 3 抽样单元与总体单元是一致的。 4 偏倚是由于系统性因素产生的。 5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。 6 偏倚与抽样误差一样都是由于抽样的随机性产生的。 7 偏倚与抽样误差一样都随样本量的增大而减小。 8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。 9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。 10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。 11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。 12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。 13 抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。 14 样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。 15 精度和费用也是评价抽样设计方案优劣的两条准则。 16 简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。 17 当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。 18 设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:128 157 506 455 127 789 867 954 938 622 19 设N=678 n=5 利用随机数字表抽取一个简单随机样本如下:556 485 098 260 485 20 在实际工作中,如果抽样比接近于1时,人们会采用全面调查 二填空题 1 抽样比是指( ),用( )表示。 2 偏倚为零的估计量,满足( ),称为( )。 3 简单随机抽样的抽样误差等于( )。 4 简单随机抽样时重复抽样的抽样误差等于( ) 5 抽样时某一总体单元在第m次被选入样本的概率是( ) 6 简单随机抽样时总体单元被选入样本的概率是( ) 7 某一样本被选中概率是( )。 8 大数定理是指( )的规律性总是在大量( )的观察中才能显现出来,随着观察次数( )的增大,( )影响将互相抵消而使规律性有稳定的性质。 9 中心极限定理证明了当( )增大时,观察值的均值将趋向于服从( ),即不论( )服从什么分布,在观察值足够多时其均值就趋向( )分布。 10 抽样调查的核心是估计问题,选择估计量的标准是( ) ( ) ( )。 三简答题

应用抽样技术期末试卷

一、选择题(每题2分,共20分) 1.抽样调查的根本功能是( ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.当β为某一特定常数时,比率估计量可看成是比率估计量的特例,此时该常数值为( ) A.1 B.0 C. x y D.x 8.抽样标准误差与抽样极限误差之间的关系是( ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=?

抽样技术试题

第四章抽样技术概述 班级:姓名:成绩 一、填空题:(21分) 1、抽样调查是一种()调查,它是从所研究客观现象的总体中,按照()抽取()进行调查,以从这一部分单位调查的结果,来()所研究总体的相应数据。 2、随机原则是指在总体中抽取样本单位时,完全排除()意识,保证总体中()单位都有被抽中的同等可能性原则。 3、抽样调查是以()数据推断的()数据。 4、抽样调查产生的(),可以计算并控制, 5、从全及总体中抽取样本单位有()和()两种方法。 6、一般说,不重复抽样的抽样误差()重复抽样的抽样误差。 7、抽样平均误差就是抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的()。 8、影响抽样误差的主要因素有()、()、()、()。 9、利用样本统计量估计总体参数,通常运用()和()两种方法。 10、点估计是直接用()估计总体参数的推断方法。点

估计不考虑()及()。 11、置信区间反映了参数估计的精确程度,区间愈小,估计就愈();而置信度则反映了总体参数落在置信区间内的( ),置信度愈高,则估计的把握程度就()。 12、影响样本容量大小的因素主要有五种:()、()、()、()、()。 13、区间估计是用样本统计量估计总体参数时,用一个区间范围的值作为总体参数的估计值,并注明总体参数落在这们一个区间的可能性,或称()。我们称这一区间为()。 14、对于简单随机重复抽样,若其他条件不变,则当误差范围缩小一半,抽样单位数必须()倍。若误差范围扩大一倍,则抽样单位数为原来的()。 二、单项选择题:(14分) 1、随机抽样的基本要求是严格遵守() A.、准确性原则B、随机性原则C、代表性原则D、可靠性原则。 2、抽样调查的主要目的是() A.、广泛运用数学的方法B、计算和控制抽样误差C、修正普查的资料D、用样本统计量推算总体参数。 3、在抽样调查中() A.、既有登记性误差,也有代表性误差B、既没有登记性误差,也没有代表性误差C、只有登记性误差,没有代表性误差D、、

相关文档
最新文档