抽样调查实验考试题2013-2014(1)

实验（实训）考试

项目名称浙江财经大学2013-2014学年第一学期

《抽样调查》实验课程期末综合测试

所属课程名称抽样调查

适用专业、班级11统计1，统计2

实验(实训)日期2013年12月4日

班级11统计2

学号110112100237

姓名张舒婕

浙江财经大学教务处制

要求：编写R 程序完成以下题目，请在第2页开始答题，在答案中列出程序与结果。

1. R 软件基本操作 (30分)

(1) 读取student.txt 中数据，计算全部30名学生的数学、物理的平均成绩；抽取一个样本容量为8的样本，求总体中数学、物理的平均成绩的估计；●计算该估计的误差。

(2) 用函数rep()构造一个向量x ，它由3个4，4个3，5个1构成；

用1-12产生一个3*4的矩阵；

● 产生一个数据表(list)，第一层为(1)题中student 数据集，第二层为R 内嵌的mtcars 数据集。

(3) 产生来自正态分布N(5,1)的100个随机数；

计算其概率密度在x=3处的函数值；

● 画出其分布函数的图像。

2．简单随机抽样 (25分)

设总体N=10，其指标值为{3，3，4，5，5，5，6，7，7，9}

(1) 计算总体方差S 2；

(2) 从中抽取n=3的随机样本，计算不放回抽样的方差)(y V ；

(3) 按不放回抽样，验证)(y E =Y 。

3．分层抽样 (30分)

调查某个地区的养牛头数，以村作为抽样单元。根据村的海拔高度和人口密度划分成四层，每层取10个村作为样本单元，经过调查获得下列数据

(1) 估计该地区养牛总头数Y 及其估计量的相对标准误差Y Y

s ?)?(； (2) 计算分层抽样简单估计的设计效应；

(3) 若样本量不变采用Neyman 分配可以减少方差多少？

4. SPSS 软件在抽样调查中的应用 (15分)

在test.xls 中采取分层抽样方法，以语言为层，从每层抽取20人，对变量Total 进行估计和分析，得出Total 的平均成绩，95％的置信区间以及标准误。

答题纸1

（1）

student=read.table("D:/student.txt",head=T) MATH<-student[,2]

PHYSICS<-student[,3]

MATHbar=mean(MATH)

PHYSICSbar=mean(PHYSICS)

math<-sample(MATH,8)

mathbar<-mean(math)

physics<-sample(PHYSICS,8)

physicsbar<-mean(physics)

errormath<-mathbar-MATHbar errorphysics<-physicsbar-PHYSICSbar

> MATHbar

[1] 75.8

> PHYSICSbar

[1] 75.66667

> mathbar

[1] 77.25

> physicsbar

[1] 83.375

> errormath

[1] 1.45

> errorphysics

[1] 7.708333

（2）

rep(c(4,3,1),c(3,4,5))

> rep(c(4,3,1),c(3,4,5))

[1] 4 4 4 3 3 3 3 1 1 1 1 1

A<-array(1:12,c(3,4))

> A

[,1] [,2] [,3] [,4]

[1,] 1 4 7 10

[2,] 2 5 8 11

[3,] 3 6 9 12

L1<-list(student,mtcars)

> L1

[[1]]

name math physics chem literat english

1 Katty 65 61 7

2 84 79

2 Leo 77 77 76 64 55

3 Ricky 67 63 49 65 57

4 Marry 80 69 7

5 74 63

5 Mark 74 70 80 84 74

6 Steven 78 84 75 62 64

7 Simon 66 71 67 52 57

8 Angel 77 71 57 72 71

9 Jed 83 100 79 41 50

10 Jack 86 94 97 51 55

11 Mike 74 80 88 64 66

12 Jetty 67 84 53 58 56

13 Corner 81 62 69 56 52

14 Osten 71 64 94 52 52

15 Liggle 78 96 81 80 76

16 Over 69 56 67 75 80

17 Charlie 77 90 80 68 60

18 Ellin 84 67 75 60 63

19 Ellen 62 67 83 71 77

20 Simke 74 65 75 72 73

21 Peter 91 74 97 62 66

22 Joke 72 87 72 79 76

23 Joe 82 70 83 68 85

24 Kanto 63 70 60 91 82

25 Amon 74 79 95 59 59

26 Aril 66 61 77 62 64

27 Bob 90 82 98 47 60

28 Joseph 77 90 85 68 76

29 Linda 91 82 84 54 60

30 Mirra 78 84 100 51 60

[[2]]

mpg cyl disp hp drat wt qsec vs am gear carb

Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1 Duster 360 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4 Merc 240D 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2 Merc 230 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2 Merc 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4 Merc 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4 Merc 450SE 16.4 8 275.8 180 3.07 4.070 17.40 0 0 3 3 Merc 450SL 17.3 8 275.8 180 3.07 3.730 17.60 0 0 3 3 Merc 450SLC 15.2 8 275.8 180 3.07 3.780 18.00 0 0 3 3 Cadillac Fleetwood 10.4 8 472.0 205 2.93 5.250 17.98 0 0 3 4 Lincoln Continental 10.4 8 460.0 215 3.00 5.424 17.82 0 0 3 4 Chrysler Imperial 14.7 8 440.0 230 3.23 5.345 17.42 0 0 3 4 Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1 Honda Civic 30.4 4 75.7 52 4.93 1.615 18.52 1 1 4 2 Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1 Toyota Corona 21.5 4 120.1 97 3.70 2.465 20.01 1 0 3 1 Dodge Challenger 15.5 8 318.0 150 2.76 3.520 16.87 0 0 3 2 AMC Javelin 15.2 8 304.0 150 3.15 3.435 17.30 0 0 3 2 Camaro Z28 13.3 8 350.0 245 3.73 3.840 15.41 0 0 3 4 Pontiac Firebird 19.2 8 400.0 175 3.08 3.845 17.05 0 0 3 2 Fiat X1-9 27.3 4 79.0 66 4.08 1.935 18.90 1 1 4 1 Porsche 914-2 26.0 4 120.3 91 4.43 2.140 16.70 0 1 5 2 Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2 Ford Pantera L 15.8 8 351.0 264 4.22 3.170 14.50 0 1 5 4 Ferrari Dino 19.7 6 145.0 175 3.62 2.770 15.50 0 1 5 6 Maserati Bora 15.0 8 301.0 335 3.54 3.570 14.60 0 1 5 8 Volvo 142E 21.4 4 121.0 109 4.11 2.780 18.60 1 1 4 2

（3）

t3<-rnorm(100,5,1)

> t3

[1] 5.953077 4.959017 5.689704 5.068329 4.692593 5.274664 6.525339 5.910423 [9] 6.272918 3.827202 5.168024 4.281271 6.240866 5.336448 5.099403 4.895205

[17] 4.957410 4.816335 6.538315 5.201177 4.876169 4.074963 5.137676 4.546700 [25] 4.749302 6.730578 4.706235 3.686105 4.650488 2.720799 2.668071 6.527311 [33] 5.590950 5.613246 5.831065 5.310059 4.132391 3.427109 5.411178 5.406784 [41] 6.349528 4.403036 5.794842 5.301420 7.381394 5.726573 5.169707 3.458096 [49] 4.928585 5.846426 4.507062 4.464090 3.123067 5.180168 7.438835 3.018410 [57] 4.655002 3.908018 4.572243 4.987395 6.064749 4.506512 4.492135 6.515194 [65] 5.042278 5.625063 6.206204 4.221909 4.733240 5.545970 5.031514 3.235411 [73] 4.372942 5.379107 3.669377 4.114216 3.870707 4.410980 5.014450 4.139538 [81] 5.725638 5.463456 4.298852 4.360008 4.395778 5.820750 5.665403 5.848363 [89] 3.020288 5.355182 4.420641 4.571820 3.586872 5.278463 5.842702 4.663464 [97] 5.829202 4.603738 5.399471 4.356240

dnorm(3,5,1)

> dnorm(3,5,1)

[1] 0.05399097

●

curve(pnorm(x,5,1),xlim=c(-15,15),ylim=c(0,1.2),col='red')

-15-10-50

51015

0.00.20.40.60.81.01.

x p n o r m (x , 5, 1)

（1）

N<-10

Y<-c(3,3,4,5,5,5,6,7,7,9)

var<-sd(Y)^2

> var

[1] 3.6

（2）

N<-10

n<-3

Y<-c(3,3,4,5,5,5,6,7,7,9)

y<-sample(Y,n)

vary<-sd(y)^2

> vary

[1] 1

（3）

N<-10

n<-3

Y<-c(3,3,4,5,5,5,6,7,7,9)

Ybar<-mean(Y)

Ite<-100000

ybar<-rep(0,Ite)

for(i in 1:Ite){

y<-sample(Y,n)

ybar[i]<-mean(y)

}

Eybar<-mean(ybar)

error<-Eybar-Ybar

> error

[1] -0.0001966667

（1）

y1<-c(43,84,98,0,10,44,0,124,13,0)

y2<-c(50,147,62,87,84,158,170,104,56,160)

y3<-c(228,262,110,232,139,178,334,0,63,220)

y4<-c(17,34,25,34,36,0,25,7,15,31)

N1<-1411

N2<-4705

N3<-2558

N4<-14997

N<-N1+N2+N3+N4

w1<-N1/N

w2<-N2/N

w3<-N3/N

w4<-N4/N

n<-10

y1bar<-mean(y1)

y2bar<-mean(y2)

y3bar<-mean(y3)

y4bar<-mean(y4)

ybar<-w1*y1bar+w2*y2bar+w3*y3bar+w4*y4bar Y<-N*ybar

vary<-(1/n)*(N1*(N1-n)*var(y1)+N2*(N2-n)*var(y2)+N3*(N3-n)*var(y3)+N4*(N 4-n)*var(y4))

SYY<-sqrt(vary)/Y

> Y

[1] 1353572

> SYY

[1] 0.09098019

养牛总头数为Y= 1353572相对标准误差Y Y s ?)?(=sqrt （vary ）/Y= 0.09098019

（2）

分层抽样

y1<-c(43,84,98,0,10,44,0,124,13,0)

y2<-c(50,147,62,87,84,158,170,104,56,160)

y3<-c(228,262,110,232,139,178,334,0,63,220)

y4<-c(17,34,25,34,36,0,25,7,15,31)

N1<-1411

N2<-4705

N3<-2558

N4<-14997

N<-N1+N2+N3+N4

w1<-N1/N

w2<-N2/N

w3<-N3/N

w4<-N4/N

n<-10

y1bar<-mean(y1)

y2bar<-mean(y2)

y3bar<-mean(y3)

y4bar<-mean(y4)

ybar<-w1*y1bar+w2*y2bar+w3*y3bar+w4*y4bar

Y<-N*ybar

vary<-(1/n)*(N1*(N1-n)*var(y1)+N2*(N2-n)*var(y2)+N3*(N3-n)*var(y3)+N4*(N 4-n)*var(y4))

deff<-sqrt(vary)/Y

> vary

[1] 151********

> deff

[1] 0.09098019

(3)

y1<-c(43,84,98,0,10,44,0,124,13,0)

y2<-c(50,147,62,87,84,158,170,104,56,160)

y3<-c(228,262,110,232,139,178,334,0,63,220)

y4<-c(17,34,25,34,36,0,25,7,15,31)

N1<-1411

N2<-4705

N3<-2558

N4<-14997

N<-N1+N2+N3+N4

n<-40

n1<-n*N1*sd(y1)/(N1*sd(y1)+N2*sd(y2)+N3*sd(y3)+N4*sd(y4))

n2<-n*N2*sd(y2)/(N1*sd(y1)+N2*sd(y2)+N3*sd(y3)+N4*sd(y4))

n3<-n*N3*sd(y3)/(N1*sd(y1)+N2*sd(y2)+N3*sd(y3)+N4*sd(y4))

n4<-n*N4*sd(y4)/(N1*sd(y1)+N2*sd(y2)+N3*sd(y3)+N4*sd(y4))

w1<-N1/N

w2<-N2/N

w3<-N3/N

w4<-N4/N

y1bar<-mean(y1)

y2bar<-mean(y2)

y3bar<-mean(y3)

y4bar<-mean(y4)

ybar<-w1*y1bar+w2*y2bar+w3*y3bar+w4*y4bar

Y<-N*ybar

vary<-(w1^2*var(y1)/4+w2^2*var(y2)/12+w3^2*var(y3)/14+w4^2*var(y4)/10)-( 1/N)*(w1*var(y1)+w2*var(y2)+w3*var(y3)+w4*var(y4))

> vary

[1] 23.40882

方差可减少27.06595- 23.40882=3.65713