统计学R语言实验
实验5 R绘图(二)
一、实验目的:
1.熟练掌握描述性统计分析中常用的统计量;
2.掌握R语言的高水平作图命令;
3.掌握R语言的低水平作图命令;
4.掌握多元数据的三个数据特征:均值向量、协方差矩阵、相关系数矩阵。
二、实验容:
练习:
要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。④修改本文档名为“本人完整学号1”,其中1表示第1次实验,以后更改为2,3,...。如文件名为“1305543109立1”,表示学号为1305543109的立同学的第1次实验,注意文件名中没有空格及任何其它字符。最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。
截图方法:
法1:调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“Pr Scrn”等字符),即完成截图。再粘贴到word文档的相应位置即可。
法2:利用QQ输入法的截屏工具。点击QQ输入法工具条最右边的“扳手”图标,选择其中的“截屏”工具。)
1.自行完成教材P130页开始的3.3-3.4节中的例题。
2.(习题
3.5)小白鼠在接种了3种不同菌型的伤寒杆菌后的存活天数如下表所示,
试绘出数据的箱线图(采用两种方法,一种是plot语句,另一种是boxplot语句)
来判断小白鼠被注射3种菌型后的平均存活天数有无显著性差异?
白鼠试验数据
菌型存活天数
1 2 4 3 2 4 7 7 2 2 5 4
2 5 6 8 5 10 7 12 12 6 6
3 7 11 6 6 7 9 5 5 10 6 3 10
因此,这里考虑用箱线图中的中位数来进行比较。
解:源代码:
y<-c(2,4,3,2,4,7,7,2,2,5,4,
5,6,8,5,10,7,12,12,6,6,
7,11,6,6,7,9,5,5,10,6,3,10)
f<-factor(c(rep(1,11),rep(2,10),rep(3,12)))
plot(f,y)
A<-c(2,4,3,2,4,7,7,2,2,5,4)
B<-c(5,6,8,5,10,7,12,12,6,6)
C<-c(7,11,6,6,7,9,5,5,10,6,3,10)
boxplot(A,B,C)
运行截图:
结论:
从箱线图中可以看到,菌型2和3的平均存活天数无显著差异,但是与菌型1的有显著差异
3.(习题3.6)绘出习题3.16关于3项指标的离散图,从图中分析例3.16的结论的
合理性。
序号硬度X1 变形X2 弹性X3
1 65 45 27.6
2 70 45 30.7
3 70 48 31.8
4 69 46 32.6
5 6
6 50 31.0
6 6
7 46 31.3
7 68 47 37.0
8 72 43 33.6
9 66 47 33.1
10 68 48 34.2
注:1.
2. 把上述表格分复制到记事本中即可实现表格转化为文本,再用read.table()函数
存入到数据框中即可,避免输入麻烦。
解:源代码:
> df<-read.table("例3.6_data", header=T)
> df
> pairs(df)
运行截图:
结论:
具有相关关系的两个变量的散点图要么是从左下角到右上角(即正相关关系),要么是从左上角到右下角(即负相关关系)。但从上图可知所有的图中都没有这样的趋势,故均不相关。
4.(习题3.7)某校测得19名学生的四项指标,性别、年龄、身高(cm)和体重(lb),
具体数据如下表所示。
(1)试绘出体重对于身高的散点图;
(2)绘出不同性别情况下,体重与身高的散点图;(coplot(a~b|c))
(3)绘出不同年龄段的体重与身高的散点图;
(4)绘出不同性别和不同年龄段的体重与身高的散点图。(coplot(a~b|c+d))
解:源代码:
> ef<-read.table(file.choose(),header=T);ef
> attach(ef)
> plot(体重~身高)
> coplot(体重~身高|性别)
> coplot(体重~身高|年龄)
> coplot(体重~身高|年龄+性别)
运行截图:
5.(习题3.8)画出函数z = x4?2x2y + x2?2xy + 2y2 + 9x/2?4y + 4 在区域?2 ≤
x ≤3,?1 ≤ y ≤7上的三维网格曲面和二维等值线,其中x与y各点之间的间隔为0.05,等值线的值分别为0, 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 80, 100,共15条。(注:在三维图形中选择合适的角度)
解:源代码:
x<-seq(-2,3,0.05)
y<-seq(-1,7,0.05)
f<-function(x,y) x^4-2*x^2*y+x^2-2*x*y+2*y^2+9*x/2-4*y+4
z<-outer(x,y,f)
contour(x,y,z,levels=c(0, 1, 2, 3, 4, 5, 10, 15, 20, 30, 40, 50, 60, 80, 100),col="black")
> persp(x,y,z,theta=30,phi=30,expand=0.7,col="lightblue")
运行截图:
6.(习题3.9)用Pearson相关检验法检验习题3.7中的身高与体重是否相关。
解:源代码:
cor.test(身高,体重)
运行截图:
结论:
其P值为7.887e-07<0.05,拒绝原假设,认为变量身高与体重相关。
7.(习题3.10)绘出例3.17中48号求职者数据的星图。(数据见文档最后)
(1)以15项自变量FL,APP,…,SUIT为星图的轴;
(2)以G1,G2,…,G5为星图的轴。(提示:先)
通过这些星图,能否说明应选哪6名应聘者。为使星图能够充分反映应聘者的情况,在作图中可适当调整各种参数。
提示:第(2)小题,先利用教材P153页的公式,计算出48个求职者这5个变量的值,公式如下:
G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7