抽样技术题目

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、 简单随机抽样

1、在简单随机抽样中,试证明比估计R y 是总体均值Y 的渐近无偏估计,并求其方差。

证明:X R Y = X x

y

X R Y y R =

==∧

()

⎪⎭

⎪⎬⎫

⎪⎩⎪⎨

⎧⎥⎥⎦⎤⎢⎢⎣⎡

⎪⎪⎭⎫ ⎝⎛⎪⎪⎭

⎛-+⎪⎪⎭⎫

⎛-+⎪⎪⎭⎫ ⎝⎛--=⎥⎥⎥⎥⎥⎦

⎤⎢⎢⎢⎢⎢

⎣⎡

⎪⎪⎭⎫ ⎝

⎛-+=⎪⎪⎭⎫ ⎝⎛=2

2

11X X x o X X x X X x X y E X X X x X y

E X X x y E y E R

由于0−→−-P

X x 即0→-X X

x 所以()()

Y y E X y E X y E R ==⎪⎪⎭

⎫ ⎝⎛= 得证。 由于0−→−

-P

X x 即0→-X

X

x 所以()

()()

2

22

2

1Z R

S n f x R y Var x R y E X x R y E X y Var -=-=-=⎪⎪⎭

⎫ ⎝⎛-= 其中:RX Y Z -=故()

()()(

)[]()

2

222

1

2111X

XY Y N i i i R

S R RS S

n

f

X R Y RX Y N n f y Var +--=-----=∑= 2、对于简单随机抽样,总体均值Y 的回归估计量定义为:()lr y y X x β=+-,如β为常数(记为

β),证明

证明:

3、在简单随机抽样中,已知变量总体均值Y 的回归估计量定义为)(x X y y lr -+=β,若β为常数(记为0β),且有Y y E lr =)(, 求证:(1))2(1)(02

202xy x y lr S S S n

f y V ββ-+-=

(2)使)(lr y V 最小的0β为x

y x

xy S S S

S ρ

β==

20;其中y

x xy S S S =

ρ.

证明:(1)[]∑=--+--=N i i

i lr Y X X Y N n f y V 1

2

0)(111)(β (2)求)(lr y V 对0β的偏导数:

将0β的值代入)(lr y V ,验证其最小值存在,此时

4、研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:

编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10

240

20

120

估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n

根据表中数据计算得:5.14420120

1

==∑=i i y y 因此该小区平均文化支出Y 的95%置信区间为:])(y [2

y V z α±即是:[ ,],故估计该小区平

均的文化支出Y =,置信水平95%的置信区间为[ ,]。

5、某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。试估计今年该地区化肥总产量。

解析:由题可知22x =,

35.211002135

===

N X X ,25y =

则,该地区化肥产量均值Y 的比率估计量为

26

.242425

35.21===∧

x y X

Y

该地区化肥产量总值Y 的比率估计量为 242626.24*100ˆˆ===R Y N Y 所以,今年该地区化肥总产量的估计值为2426吨。

二、 分层随机抽样

6、在分层随机抽样的分别比估计中:(1)试证明Y y E RS =)(;(2)求出其方差。

(1) 证明:根据题意: ∑∑∑======L

h h

h h L h h h h L

h h h h

h RS R E X W X R W E X x y W E y E 1

11)ˆ()ˆ()()(Θ

又h h h X Y R E =

)ˆ(ΘY Y W X Y E X W h L

h h L h h h

h h ===∴∑∑==1

1)(上式 综上可得:Y y E RS =)( (2) 解:由第一问可知)ˆ()ˆ()(1

21

h

h L

h h L h h h h RS X R V W X R W V y V ∑∑==== 而)2(1)()ˆ(222x yx y S R RS S n

f y V X R V +--==)2(1)(22212xh h yxh h yh h h L

h h RS S R S R S n f W y V +--⋅=∴∑= 8、调查某地区居民的奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查后各层样本户的奶制品年消费支出的中间结果如下表所示:

请估计该地区居民奶制品的年消费总支出及其95%的置信区间。 解析:根据表中的数据可得4

_

^

1

209650()st h h h Y N y ===∑元;

估计量方差^()st V Y 的无偏估计为^

281

()()/ 5.38610L

st h h h h h h v Y N N n s n ==-≈⨯∑,

进而有23207.6()≈≈元。

^

st Y 的95%的置信区间为^0.025st Y z ±0.025z =,经计算可得

因此,可以有95%的把握认为该地区居民奶制品的年消费总支出在164163~255137元之间。 7、试述分别比估计和联合比估计的比较。

答:如果每一层都满足比率估计量有效的条件,则除非hRR ,都有分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。

实际使用时,如果各层的样本量都较大,且有理由认为各层的比率hR 差异较大,则分别比率佑计优于联合比率估计。当各层的样本量不大,或各层比率hR 差异很小,则联合比率估计更好些。

三、 等概率整群抽样和多阶段抽样

相关文档
最新文档