统计学R语言实验

统计学R语言实验
统计学R语言实验

实验5 R绘图(二)

一、实验目的:

1.熟练掌握描述性统计分析中常用的统计量;

2.掌握R语言的高水平作图命令;

3.掌握R语言的低水平作图命令;

4.掌握多元数据的三个数据特征:均值向量、协方差矩阵、相关系数矩阵。

二、实验容:

练习:

要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。④修改本文档名为“本人完整学号1”,其中1表示第1次实验,以后更改为2,3,...。如文件名为“1305543109立1”,表示学号为1305543109的立同学的第1次实验,注意文件名中没有空格及任何其它字符。最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。

截图方法:

法1:调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“Pr Scrn”等字符),即完成截图。再粘贴到word文档的相应位置即可。

法2:利用QQ输入法的截屏工具。点击QQ输入法工具条最右边的“扳手”图标,选择其中的“截屏”工具。)

1.自行完成教材P130页开始的3.3-3.4节中的例题。

2.(习题

3.5)小白鼠在接种了3种不同菌型的伤寒杆菌后的存活天数如下表所示,

试绘出数据的箱线图(采用两种方法,一种是plot语句,另一种是boxplot语句)

来判断小白鼠被注射3种菌型后的平均存活天数有无显著性差异?

白鼠试验数据

菌型存活天数

1 2 4 3 2 4 7 7 2 2 5 4

2 5 6 8 5 10 7 12 12 6 6

3 7 11 6 6 7 9 5 5 10 6 3 10

因此,这里考虑用箱线图中的中位数来进行比较。

解:源代码:

y<-c(2,4,3,2,4,7,7,2,2,5,4,

5,6,8,5,10,7,12,12,6,6,

7,11,6,6,7,9,5,5,10,6,3,10)

f<-factor(c(rep(1,11),rep(2,10),rep(3,12)))

plot(f,y)

A<-c(2,4,3,2,4,7,7,2,2,5,4)

B<-c(5,6,8,5,10,7,12,12,6,6)

C<-c(7,11,6,6,7,9,5,5,10,6,3,10)

boxplot(A,B,C)

运行截图:

结论:

从箱线图中可以看到,菌型2和3的平均存活天数无显著差异,但是与菌型1的有显著差异

3.(习题3.6)绘出习题3.16关于3项指标的离散图,从图中分析例3.16的结论的

合理性。

序号硬度X1 变形X2 弹性X3

1 65 45 27.6

2 70 45 30.7

3 70 48 31.8

4 69 46 32.6

5 6

6 50 31.0

6 6

7 46 31.3

7 68 47 37.0

8 72 43 33.6

9 66 47 33.1

10 68 48 34.2

注:1.

2. 把上述表格分复制到记事本中即可实现表格转化为文本,再用read.table()函数

存入到数据框中即可,避免输入麻烦。

解:源代码:

> df<-read.table("例3.6_data", header=T)

> df

> pairs(df)

运行截图:

结论:

具有相关关系的两个变量的散点图要么是从左下角到右上角(即正相关关系),要么是从左上角到右下角(即负相关关系)。但从上图可知所有的图中都没有这样的趋势,故均不相关。

4.(习题3.7)某校测得19名学生的四项指标,性别、年龄、身高(cm)和体重(lb),

具体数据如下表所示。

(1)试绘出体重对于身高的散点图;

(2)绘出不同性别情况下,体重与身高的散点图;(coplot(a~b|c))

(3)绘出不同年龄段的体重与身高的散点图;

(4)绘出不同性别和不同年龄段的体重与身高的散点图。(coplot(a~b|c+d))

解:源代码:

> ef<-read.table(file.choose(),header=T);ef

> attach(ef)

> plot(体重~身高)

> coplot(体重~身高|性别)

> coplot(体重~身高|年龄)

> coplot(体重~身高|年龄+性别)

运行截图:

5.(习题3.8)画出函数z = x4?2x2y + x2?2xy + 2y2 + 9x/2?4y + 4 在区域?2 ≤

x ≤3,?1 ≤ y ≤7上的三维网格曲面和二维等值线,其中x与y各点之间的间隔为0.05,等值线的值分别为0, 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 80, 100,共15条。(注:在三维图形中选择合适的角度)

解:源代码:

x<-seq(-2,3,0.05)

y<-seq(-1,7,0.05)

f<-function(x,y) x^4-2*x^2*y+x^2-2*x*y+2*y^2+9*x/2-4*y+4

z<-outer(x,y,f)

contour(x,y,z,levels=c(0, 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 80, 100),col="black")

> persp(x,y,z,theta=30,phi=30,expand=0.7,col="lightblue")

运行截图:

6.(习题3.9)用Pearson相关检验法检验习题3.7中的身高与体重是否相关。

解:源代码:

cor.test(身高,体重)

运行截图:

结论:

其P值为7.887e-07<0.05,拒绝原假设,认为变量身高与体重相关。

7.(习题3.10)绘出例3.17中48号求职者数据的星图。(数据见文档最后)

(1)以15项自变量FL,APP,…,SUIT为星图的轴;

(2)以G1,G2,…,G5为星图的轴。(提示:先)

通过这些星图,能否说明应选哪6名应聘者。为使星图能够充分反映应聘者的情况,在作图中可适当调整各种参数。

提示:第(2)小题,先利用教材P153页的公式,计算出48个求职者这5个变量的值,公式如下:

G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7

相关主题
相关文档
最新文档