课程实验报告(2016抽样技术)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验项目 名称
实验 目的及要 求
实验 内容
一、R 的基本功能和在描述统计学中的应用 二、简单随机抽样的抽选方法 三、分层抽样中的估计及样本量的分配 四、用 R 编程来进行比率估计,回归估计 五、设计一份问卷调查 六、设计一份问卷调查(作分析) 一、要求学生掌握 R 的基本功能和在描述统计学中的应用. 二、要求学生利用 R 软件编程来确定简单随机抽样的抽选方法. 三、要求学生利用 R 来计算分层抽样中的估计及样本量的分配 四、提升同学们用 R 编程的能力. 五、要求:每个同学思考一个现实问题,设计一份问卷调查. 六、要求:每个同学根据自己的问卷调查得到的数据,进行统计分析。 一、(1)数据的输入、复制、移动、删除等; (2)利用 R 进行计算平均值、方差、协方差、标准误差、中值、众数、最 大/最小值、相关系数、相关性检验值、极差、样本总和、样本个数、置信 区间、百分比排位、四分位数的方法; 二、简单随机抽样的抽选方法 三、分层抽样中的估计及样本量的分配 四、用 R 编程来进行比率估计,回归估计 五、设计一份问卷调查 六、设计一份问卷调查(作分析)
(2)利用拉希里法进行 PPS 抽样
i 1 2 3 4 5 6 7 8 9 10
Mi
88 34 69 15 24 47 36 56 260 51 680
累计 M i 88 122 191 206 230 277 313 369 629 680
代码 1~88 89~122 123~191 192~206 207~230 231~277 278~313 314~369 370~629 630~680
计算 R 语言命令如下: N1<-200;N2<-400;N3<-750;N4<-1500;N<-2850 n1<-10;n2<-10;n3<-10;n4<-10;n<-40 W1<-N1/N;W1
W2<-N2/N;W2 W3<-N3/N;W3 W4<-N4/N;W4 f1<-n1/N1;f1 f2<-n2/N2;f2 f3<-n3/N3;f3 f4<-n4/N4;f4 y1<-c(10,40,40,110,15,10,40,80,90,0);y1 y2<-c(50,130,130,80,100,55,160,85,160,170);y2 y3<-c(180,260,260,0,140,60,200,180,300,220);y3 y4<-c(50,35,15,0,20,30,25,10,30,25);y4 y1bar<-mean(y1);y1bar y2bar<-mean(y2);y2bar y3bar<-mean(y3);y3bar y4bar<-mean(y4);y4bar v1<-var(y1);v1 v2<-var(y2);v2 v3<-var(y3);v3 v4<-var(y4);v4 ystbar<-sum(W1*y1bar,W2*y2bar,W3*y3bar,W4*y4bar);ystbar n1=W1*n;n1 n2=W2*n;n2 n3=W3*n;n3 n4=W4*n;n4 W1s1<-W1*sqrt(v1);W1s1 W2s2<-W2*sqrt(v2);W2s2 W3s3<-W3*sqrt(v3);W3s3 W4s4<-W4*sqrt(v4);W4s4 sumWhsh<-sum(W1s1,W2s2,W3s3,W4s4);sumWhsh n1<-n*(W1s1/sumWhsh);n1 n2<-n*(W2s2/sumWhsh);n2 n3<-n*(W3s3/sumWhsh);n3 n4<-n*(W4s4/sumWhsh);n4
h 1
按比例分配时,各层的样本量为:
n1 W1n 0.07018 40 2.81 n2 W2 n 0.14035 40 5.61 n3 W3n 0.26316 40 10.53 n4 W4 n 0.52632 40 21.05
即各层的样本量分别为 3,6,10,21 对于尼曼分配,根据前面对 W1 及 sh 的计算结果,得到
W1s1 0.07018 1433.611 2.6571 W2 s2 0.14035 1956.667 6.2083 W1s1 0.26316 8622.222 24.4358 W4 s4 0.52632 193.333 7.3181
W s
h 1
实验步骤
实验 1、下面列出了 30 个美国 NBA 球员的体重(以磅计,1 磅=0.454KG)数 据,这些数据是从美国 NBA 球队 1990-1991 赛季的花名册中抽样得到的。 225 232 232 245 235 245 270 225 240 240 217 195 225 185 200 220 200 210 271 240 220 230 215 252 225 220 206 185 227 236 求这组数据的样本均值和样本方差。 利用 R 软件求得样本均值和样本方差,R 命令语句如下: x<-c(225,232,232,245,235,245,270,225,240,240,217,195,225,185,200, 220,200,210,271,240,220,230,215,252,225,220,206,185,227,236) xbar<-mean(x) xbar var(x) 实验 2、 设总体有 N=10 个单位,相应的单位大小的指标值及其代码数见下 表,要求从中抽取一个 n=4 的 PPS 样本。 (1)利用代码法进行 PPS 抽样
4
h h
2.6571 6.2083 24.4358 7.3181 40.6193
因此,按尼曼分配时,各层应分配的样本量为:
n1 n
W s
h 1
4
W1s1
h h
40
2.6571 2.62 40.6193
n2 6.11 n3 24.06 n4 7.21
实验 4: 《应用抽样技术》p.110,习题 5.1(要抄题) 某县有 200 个村,共播种小麦 77000 亩,采用抽样调查估计全县小麦总 产量。随机抽取 10 个村对其小麦产量及播种面积进行调查,资料见表 5.6。 表 5.6 小麦产量及播种面积 产量/万斤 面积/亩 产量/万斤 面积/亩 12.5 220 24.6 417 12 230 18.2 336 10.5 210 9.3 176 18.1 377 12.6 247 5.5 123 18.9 370
实验结果 与 分析Fra Baidu bibliotek
因为 M 9 260 > m 157 ,所以第 9 个单位入样;同理,抽出 i 9 , m 205 , 由于 M 9 260 > m 205 ,则第 9 个单位再次入样;再抽样抽出 i 1 ,m 5 , 由于 M 1 88 > m 5 ,则第 1 个单位再次入样,再抽样抽出 i 7 , m 35 , 由于 M 7 36 > m 35 ,则第 7 个单位再次入样。抽取一个 n=4 的 PPS 样本 为:260、260、88、36。
3、 由上表中数据可知,N1 200 ,N 2 400 ,N 3 750 ,N 4 1500 ,N 2850
n1 n2 n3 n4 10
各层的层权及抽样比为
W1 W2 W3 W4 n N1 200 10 0.05 0.07018 , f1 1 N1 200 N 2850 n N2 10 400 0.025 0.14035 , f 2 2 N 2 400 N 2850 n N3 10 750 0.0133 0.26316 , f 3 3 N 3 750 N 2850 n N 4 1500 10 0.0067 0.52632 , f 4 4 N 4 1500 N 2850 1 n1 y1i 43.5 n1 i 1
各层样本均值及方差为:
y1 s12
1 n1 ( y1i y1 ) 1433.611 n1 1 i 1 y3 180 , y4 24
同理可得:
y2 112 ,
2 2 2 s2 1956.667 , s3 8622.222 , s4 193.333
4
yst Wh yh 78.77193
2.2 (2)利用拉希里法进行 PPS 抽样 R 命令为:
i<-sample(1:10,1);i m<-sample(1:260,1);m
实验 3、对某地区的 2850 户居民豆制品年消费支出进行调查,以居民户为 抽样单位,根据收入水平将居民户划分为 4 层,每层按简单随机抽样抽取 10,调查获得一些数据,如下表所示。样本量为 n=40,按比例分配和尼曼 分配时,各层的样本量分别应为多少?
实验环境
R 软件 1、利用 R 软件求得样本均值为 y 225.6 ,样本方差为 s 2 443.3517 。 2.1 利用代码法进行 PPS 抽样, 在 1~680 随机抽取 4 个整数为 294、 679、 565、 487,则第 7、10、9 单位入样,第 7、10 个单位各入样一次,第 9 个单位出 现了 2 次,在计算时该单位参加两次运算。抽取一个 n=4 的 PPS 样本为:36、 51、260、260。 2.2 利用拉希里法进行 PPS 抽样, 在 1~10 抽出 i 9 , 在 1~260 中抽出 m 157 ,
层 1 2 3 4 居民户总 数/户 200 400 750 1500 样本户豆制品消费支出/元 1 10 50 180 50 2 40 130 260 35 3 40 130 260 15 4 110 80 0 0 5 15 100 140 20 6 10 55 60 30 7 40 160 200 25 8 80 85 180 10 9 90 160 300 30 10 0 170 220 25
R 命令语句如下: 2.1 (1)利用代码法进行 PPS 抽样 R 命令为 sample(1:680,1) 运行 4 次结果如下:
> sample(1:680,1) [1] 294 > sample(1:680,1) [1] 679 > sample(1:680,1) [1] 565 > sample(1:680,1) [1] 487
即各层的样本量分别为 3,6,24,7 4、 (1)以播种面积为辅助变量用比率估计量估计全县小麦总产量。 计算:x
f 1 10 1 10 ˆ y 14.22 0.05254989 ; x 270.6 y yi 14.22 ,R , i 10 i 1 10 i 1 x 270.6
1 斤=500g 1 亩≈666.7
试以播种面积为辅助变量用比率估计量估计全县小麦总产量, 并与简单 估计量就效果进行比较。 计算 R 命令如下表:
x<-c(220,230,210,377,123,417,336,176,247,370);x y<-c(12.5,12,10.5,18.1,5.5,24.6,18.2,9.3,12.6,18.9);y xbar<-mean(x);xbar ybar<-mean(y);ybar R<-ybar/xbar;R N<-200;n=10 f<-n/N;f X<-77000 Y<-R*X;Y VYR<-((N^2)*(1-f)*sum((y-R*x)^2))/(n*(n-1));VYR seYR<-sqrt(VYR);seYR ybar<-mean(y);ybar Vy<-var(y);Vy Y<-N*ybar;Y VY<-N^2*(1-f)*Vy/n;VY seY<-sqrt(VY);seY
n 10 0.05 N 200
ˆ RX ˆ 4046.341 (万斤) 小麦总产量为: Y R
相关文档
最新文档