第一章_R__基础_01_(非参数统计_2015)
合集下载
第一章_R__基础_02(非参数统计_2015)

apply(data,dim,function,..) x<-matrix(c(1,2,3,4),2) apply(x,2,max) apply(x,2,min)
x=matrix(1:30,5,6);y=matrix(rnorm(20),4,5) apply(x,1,mean) [1] 13.5 14.5 15.5 16.5 17.5 apply(x,2,sum) [1] 15 40 65 90 115 140 apply(x,2,prod) [1] 120 30240 360360 1860480 6375600 17100720
[,1] [,2] [,3] [,4] [,5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4,] 16 17 18 19 20
赋予列名
dimnames(x.matrix)=list(NULL,c(“a”, “b”)
atrix#NULL,取消相应名称,
如果一个列表的各个成分满足数据框成分的要求,它 可以用as.data.frame()函数强制转换为数据框,比如,
lst<-list( Name=c("Alice","Becka","James","Jeffrey","John"), Sex=c("F","F","M","M","M"), Age=c(13,13,12,13,12), Height=c(56.5,65.3,57.3,62.5,59.0), Weight=c(84.0,98.0,83.0,84.0,99.5) );lst #则as.data.frame(lst)是与df相同的数据框 as.data.frame(lst)
非参数统计1

(1)设置零假设和备选假设; (2)构造检验统计量T(X1,X2,…Xn); (3)数值实现t= T(x1,x2,…xn); (4)计算零假设下,r.v.T落入某区间的精确概率
或近似概率
P值
零假设下,P(T>t)的值称为p值。
若p值很小,说明观测值的实现在零假设下为小概率 事件,故拒绝零假设。犯第一类错误的概率为p。
比如: (1)研究保险公司的索赔请求数时,可能假定索赔请求
数来自泊松分布P(a);
(2)研究化肥对农作物产量的影响效果时,平均意义 之下,每测量单元(可能是)产量服从正态分布
N(a,b).
一个典型的参数检验过程
1. 总体参数
Example: Population Mean
2. 假定数据的形态为
Whole Numbers or Fractions
Pitman于1948年回答了非参数统计方法相对于 参数方法来说的相对效率方面的问题;
非参数统计的历史(续)
60年代中后期,Cox和Ferguson最早将非参数方法 应用于生存分析。
70年代到80年代,非参数统计借助计算机技术和 大量计算获得更稳健的估计和预测,以P.J.Huber 以及 F.Hampel为代表的统计学家从计算技术的实 现角度,为衡量估计量的稳定性提出了新准则。
这里,j为求均值前删掉的最小或最大观测值的数目。
顺序统计量的分布:
设总体的分布函数F(x),则第r个顺序统计量的分布 函数为:
Fr (x)
P(X (r)
x)
P(至少
r个X
小于或等于
i
x)
n
P( X1, X 2 ,L , X n中恰好有j个小于x)
jr
n
C
或近似概率
P值
零假设下,P(T>t)的值称为p值。
若p值很小,说明观测值的实现在零假设下为小概率 事件,故拒绝零假设。犯第一类错误的概率为p。
比如: (1)研究保险公司的索赔请求数时,可能假定索赔请求
数来自泊松分布P(a);
(2)研究化肥对农作物产量的影响效果时,平均意义 之下,每测量单元(可能是)产量服从正态分布
N(a,b).
一个典型的参数检验过程
1. 总体参数
Example: Population Mean
2. 假定数据的形态为
Whole Numbers or Fractions
Pitman于1948年回答了非参数统计方法相对于 参数方法来说的相对效率方面的问题;
非参数统计的历史(续)
60年代中后期,Cox和Ferguson最早将非参数方法 应用于生存分析。
70年代到80年代,非参数统计借助计算机技术和 大量计算获得更稳健的估计和预测,以P.J.Huber 以及 F.Hampel为代表的统计学家从计算技术的实 现角度,为衡量估计量的稳定性提出了新准则。
这里,j为求均值前删掉的最小或最大观测值的数目。
顺序统计量的分布:
设总体的分布函数F(x),则第r个顺序统计量的分布 函数为:
Fr (x)
P(X (r)
x)
P(至少
r个X
小于或等于
i
x)
n
P( X1, X 2 ,L , X n中恰好有j个小于x)
jr
n
C
第一章_R__基础_03_02_(非参数统计_2015)

R绘图功能
R具备卓越的绘图功能,通过参数设置对图形进 行精确控制。绘制的图形能满足出版印刷的要求, 可以输出Jpg、tiff、eps、emf、pdf、png等各种格 式。 通过与GhostScript软件的结合,可以生成600dpi, 1200dpi的等各种分辨率和尺寸的图形。 绘图是通过绘图函数结合相应的选项完成的。 绘图函数brary(np)#使用非参包
输入历史 history
输入的命令,在R中作为历史history保存,可输入函
数
history()
history(Inf)
# 查看输入历史
# 查看打开R之后所有的输入
可用向上或向下的箭头切换输入的行。
27
20
图27 在原有直方图上添加曲线
21
QQ图: 鉴别样本的分布是否近似于某种类型的分布
x=c(75.0,64.0,47.4,66.9,62.2,62.2,58.7,63.5,66.6,64.0,57.0,69.0,56. 9,50.0,72.0)
qqnorm(x,pch=21,col="red",bg="yellow",font=2,b=1.4);
在原有图形上添加元素
举例:
x <- rnorm(100) # 生成随机数
hist(x,freq=F)
# 绘制直方图
# 添加曲线
curve(dnorm(x),add=T)
h <- hist(x, plot=F)
# 绘制直方图
ylim <- range(0, h$density, dnorm(0)) #设定纵轴的取值范围 hist(x, freq=F, ylim=ylim) #绘制直方图 curve(dnorm(x),add=T,col="red") #添加曲线
R具备卓越的绘图功能,通过参数设置对图形进 行精确控制。绘制的图形能满足出版印刷的要求, 可以输出Jpg、tiff、eps、emf、pdf、png等各种格 式。 通过与GhostScript软件的结合,可以生成600dpi, 1200dpi的等各种分辨率和尺寸的图形。 绘图是通过绘图函数结合相应的选项完成的。 绘图函数brary(np)#使用非参包
输入历史 history
输入的命令,在R中作为历史history保存,可输入函
数
history()
history(Inf)
# 查看输入历史
# 查看打开R之后所有的输入
可用向上或向下的箭头切换输入的行。
27
20
图27 在原有直方图上添加曲线
21
QQ图: 鉴别样本的分布是否近似于某种类型的分布
x=c(75.0,64.0,47.4,66.9,62.2,62.2,58.7,63.5,66.6,64.0,57.0,69.0,56. 9,50.0,72.0)
qqnorm(x,pch=21,col="red",bg="yellow",font=2,b=1.4);
在原有图形上添加元素
举例:
x <- rnorm(100) # 生成随机数
hist(x,freq=F)
# 绘制直方图
# 添加曲线
curve(dnorm(x),add=T)
h <- hist(x, plot=F)
# 绘制直方图
ylim <- range(0, h$density, dnorm(0)) #设定纵轴的取值范围 hist(x, freq=F, ylim=ylim) #绘制直方图 curve(dnorm(x),add=T,col="red") #添加曲线
非参数统计讲义通用课件

假设检验方法
总结词
假设检验方法用于检验一个关于总体 参数的假设是否成立。
详细描述
假设检验方法包括提出假设、构造检 验统计量、确定临界值和做出决策等 步骤。常见的假设检验方法有t检验、 卡方检验、F检验等,用于判断样本数 据是否支持假设。
关联性分析方法
总结词
关联性分析方法用于研究变量之间的相关性。
02
非参数统计方法
描述性统计方法
总结词
描述性统计方法用于收集、整理、描述数据,并从数据中提取有意义的信息。
详细描述
描述性统计方法包括数据的收集、整理、描述和可视化,例如均值、中位数、 众数、标准差等统计量,以及直方图、箱线图等图形化表示。这些方法可以帮 助我们了解数据的分布、中心趋势和离散程度。
非数统计与机器学习算法的结 合将有助于解决复杂的数据分析 问题。
02
与大数据技术的融 合
非参数统计将借助大数据技术处 理海量数据,挖掘数据背后的规 律和模式。
03
与社会科学研究的 互动
非参数统计方法将为社会科学研 究提供更有效的研究工具和方法 。
决策树分析方法
总结词
决策树分析方法是一种基于树形结构的非参 数统计学习方法。
详细描述
决策树分析方法通过递归地将数据集划分为 更小的子集,构建出一棵决策树。决策树的 每个节点表示一个特征属性上的判断条件, 每个分支代表一个可能的属性值,每个叶子 节点表示一个分类结果。决策树分析可以帮 助我们进行分类、预测和特征选择等任务。
非参数统计的发展趋势
多元化发展
非参数统计将不断拓展其应用领域,从传统的医学、生物 、经济领域向金融、环境、社会学等领域延伸。
01
算法优化
随着计算能力的提升,非参数统计的算 法将进一步优化,提高计算效率和准确 性。
第一章 R 基础 01 (非参数统计,新)

>
>c(42,7,64,9) >
2 seq() 生成等差数列,若向量(序列)具有较为简单的规律
seq(from,to,by,length,…) >1:10 #seq(1,10)
>seq(1,10,by=0.5)
>seq(1,10,length=21)#取21个,或 =15,取15个。
据不完全统计,在欧美等发达国家的著名高等学府,
R不仅是专业学习统计的流行教学软件, 而且已成为从事统计研究的学生和统计研究人员必备
的统计计算工具。
R的主要特点归纳如下:
(1)R是自由免费的专业统计分析软件,拥有强大的面向对象的 开发环境, 可以在UNIX,Windows和MACINTOSH等多种操作系统中运行。
1.1.1 R环境(Windows下载和安装R)
CRAN: Binaries>Windows>base
R2.11.0下载页面
下载完成后,双击R-2.11.0-win32.exe 开始安装。 一直点击下一步,各选项默认,语言建议选英/中文。
22
R软件主窗口与快捷方式
菜单栏 快捷按钮
控制台 光标:等待输入
y<-factor(x) y
c(3,2)
c(2, “Zibo”)
class
向量(vector) 一系列元素的组合。 如 c(1,2,3); c("a","a","b","b","c") 因子(factor) 因子是一个分类变量,如性别,学号。无法运算。 c(“a”,“a”,“b”,“b”,“c”) c("er","sdf","dim","haha","good")
非参数统计王星版第一章课后答案

# 当随机取 10000 次的一个结果 1684 1256 743 338 96]
a=[71 321 774 1255 1637 1825
# p=[0.0071 0.0321 0.0774 0.1255 0.1637 0.1825 0.1684 0.1256 0.0743 0.0338 0.0096] #当随机取十万次数据的一个结果 #a=[795 3400 3421 7553 12521 16771 18180 16538 12553 7418
#1.6 x=seq(0,2*pi,0.2) y=sin(x)/(cos(x)+x)
#1.7
chartonum=function(x){ a=c("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRS TUVWXYZ"); b=strsplit(a,""); for(i in 1:52){ if(b[[1]][i]==x){t=i;i=i+1} else{i=i+1} } t }#将字符转化为数字,小写为前 26 位,大写为后 26 位,输入为单个字 符 f7=function(x){ y=strsplit(x,"");#将输入分为单个字符 for(i in 1:length(y[[1]])){ t=chartonum(y[[1]][i]) if(t<14){t=t+13;y[[1]][i]=LETTERS[t];} else if(t>=14&t<=26){t=t-13;y[[1]][i]=LETTERS[t];} else if(t>=27&t<=39){t=t+13-
第1章-非参数统计概述

概率
指接受了一个本来是不真实
第二类错误 的原假设,又称为“采伪”
错误或“取伪”错误
记犯第二类错误的概率为 ,即
P 接 受 H 0 /H 0 为 不 真
1- β为该检验检验不真实零假设的 检验功效,又称检验效能(power of a test)/把握度:
其意义是:当两总体确有差别, 按规定的检验水准 a 能发现该差别的 能力(概率)。
H0:m ≥ 100
H1:m < 100
拒绝域和接受域(左侧检验)
拒绝域
接受域
假设的总体 抽样分布
概率
概率( 1- )
零假设和备择假设的选 择原则
通常把研究者要证明的假设作为备择假 设;
把现状(Status Quo)作为原假设; 把不能轻易否定的假设作为原假设;
零假设和备择假设: 把研究者要证明的假设作为备择假设
)
36
m m 6 6 P ( 6 . 8 6 X 2 6 . 1 9 8 6 )6
若 m = 69,n = 36, czz0.0251.96 2
X 68
3 .6 8
1 .96
取伪的概率较大.
现增大样本容量,取 n = 64, m = 66, 则
m69P(6.172X6.88m86)9
某种汽车原来平均每加仑汽油可以行驶24英里。 研究小组提出了一种新工艺来提高每加仑汽油 的行驶里程。为了检验新的工艺是否有效需要 生产了一些产品进行测试。该测试中的零假设 和备择假设该如何选取?
要证明的结论是m>24,因此零假设和备择假设 的选择为: m24 m>24
思考题
哲学上,可以说“接受”和“拒绝”两个概 念对称的,那么,在统计实践中,零假设和备择 假设对称吗?
非参数统计讲义通用课件

案例分析
通过实际案例展示如何使用Python进行非 参数统计,包括分布拟合、假设检验和模 型选择等步骤。
SPSS实现
SPSS简介
SPSS(Statistical Package for the Social Sciences) 是一款流行的社会科学统计 软件。
操作界面
SPSS的非参数统计功能通常 在“分析”菜单下的“非参 数检验”选项中,用户可以 通过直观的界面进行操作。
聚类分析方法在数据挖掘、 市场细分等领域有广泛应用, 可以帮助我们发现数据的内 在结构和模式。
异常值检测方法
• 异常值检测方法用于识别和剔除数据中的异常值,提高数据分析的准确性和可靠性。
• 常见的异常值检测方法包括基于统计的方法、基于距离的方法、基于密度的方等。 • 基于统计的方法利用统计学原理,如z分数、IQR等,判断数据是否为异常值;基于距离的方法通过计算对象与其它对象的距离来判断是否为异常值;基于密度的方法则根据对象周围的密度变化来判断是否
解释性较差
相对于参数统计,非参数统计结果通 常较为抽象,难以直接解释其具体含 义。
假设检验能力较弱
非参数统计在假设检验方面的能力相 对较弱,对于确定性的结论和预测不 如参数统计准确。
如何克服非参数统计的局限性
01
02
03
04
利用高效计算方法
采用并行计算、分布式计算等 高效计算方法,提高非参数统
计的计算效率和准确性。
描述性统计方法在数据分析中起到基 础作用,为后续的统计推断提供数据 基础和初步分析结果。
假设检验方法
假设检验方法是一种统计推断 方法,通过提出假设并对其进
行检验,判断假设是否成立。
假设检验方法包括参数检验和 非参数检验,其中非参数检验 不依赖于总体分布的具体形式,
通过实际案例展示如何使用Python进行非 参数统计,包括分布拟合、假设检验和模 型选择等步骤。
SPSS实现
SPSS简介
SPSS(Statistical Package for the Social Sciences) 是一款流行的社会科学统计 软件。
操作界面
SPSS的非参数统计功能通常 在“分析”菜单下的“非参 数检验”选项中,用户可以 通过直观的界面进行操作。
聚类分析方法在数据挖掘、 市场细分等领域有广泛应用, 可以帮助我们发现数据的内 在结构和模式。
异常值检测方法
• 异常值检测方法用于识别和剔除数据中的异常值,提高数据分析的准确性和可靠性。
• 常见的异常值检测方法包括基于统计的方法、基于距离的方法、基于密度的方等。 • 基于统计的方法利用统计学原理,如z分数、IQR等,判断数据是否为异常值;基于距离的方法通过计算对象与其它对象的距离来判断是否为异常值;基于密度的方法则根据对象周围的密度变化来判断是否
解释性较差
相对于参数统计,非参数统计结果通 常较为抽象,难以直接解释其具体含 义。
假设检验能力较弱
非参数统计在假设检验方面的能力相 对较弱,对于确定性的结论和预测不 如参数统计准确。
如何克服非参数统计的局限性
01
02
03
04
利用高效计算方法
采用并行计算、分布式计算等 高效计算方法,提高非参数统
计的计算效率和准确性。
描述性统计方法在数据分析中起到基 础作用,为后续的统计推断提供数据 基础和初步分析结果。
假设检验方法
假设检验方法是一种统计推断 方法,通过提出假设并对其进
行检验,判断假设是否成立。
假设检验方法包括参数检验和 非参数检验,其中非参数检验 不依赖于总体分布的具体形式,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
初识R软件(续)
例1.2绘出例1.1中12名学生体重与胸围的散点图和体重的 直方图。 解: Plot(X1,X2) hist(X1) # 绘出体重的直方图 hist(X1, probability = TRUE,main = paste("Histogram of" , "weight"), xlab = "weight") lines(density(X1))
A.2 向量的生成和基本操作
A.2.1 向量的生成
A.2.2 向量的基本操作 A.2.3 向量的运算 A.2.4 向量的逻辑运算
A.2.1 向量的生成/赋值
R软件中最简单的运算是向量赋值,有三种形式:
1 c() 若向量(序列)没有什么规律
> c(10.4,5.6,3.1,6.4,21.7)
尤其是最近20年来,随着信息技术和网络技术的 快速发展, 基于大量数据计算探索数据分布特点的数据分析 方法层出不穷, 成为非参数统计发展的新主题,代表着统计学未 来的方向。 非参数统计自然成为连接统计学、信息学和计算 机科学等交叉研究的桥梁, 共同推动数据分析和信息利用整体地向前发展。
非参数统计
郭广报
序言
统计是一个面向问题解决的、系统收集数据和基于数据 做出回答的过程, 其本质是通过在随机现象中寻找分布规律回答现实问题 的科学过程。 实际问题的复杂性和人类认知的局限性, 造成反映实际问题的数据在问题表示的充分性、代表性 和分布的单一性等方面, 与传统的统计应用要求不相匹配, 于是催生了对数据分布假定宽松的非参数统计的兴起与 发展。
16
R的特点
多领域的统计资源 目前在R网站上约有2400个程序包,涵盖了基础统计学、社会学、经济学、 生态学、空间分析、系统发育分析、生物信息学等诸多方面。 跨平台 R可在多种操作系统下运行,如Windows、MacOS、多种Linux和UNIX等。 命令行驱动
R即时解释,输入命令,即可获得相应的结果。
SPSS:
复杂的用户图形界面,简单易学,但编程十分困难。
Splus:
运行S语言,具有复杂的界面,与R完全兼容,昂贵。
……
19
R的缺点
占用内存
用户需要对命令熟悉
与代码打交道,需要记住常用命令。
运行速度稍慢
20
A.1 R基本概念和操作
A.1.1 R环境
A.1.2 常量 A.1.3 算术运算 A.1.4 赋值
建议安排10课时左右用于学生上机实践。
本书备有丰富的习题,兼有理论推导、方法应用和上
机实践题目。
第1章 R基础 (P297)
R是一种专业统计分析软件, 最早于1995年由Auckland大学统计系的RobertGentleman和
Ross lhaka等研制开发, l997年开始免费公开发布1.0版本。 在短短的10几年时问里,R发展迅速,现己发展到R3.1.3系列 版本。
在这个过程中,用户不仅可能延伸R的基本功能,
而且还可能自创一些特殊问题的统计过程。 R是一种解释性语言,语法与英文的正常语法和其 他程序设计语言的语法表述相似,容易学习,编 写的程序简练,费时较短。
简 史
R语言是从S统计绘图语言演变而来,可看作S的“方言”。 S语言上世纪70年代诞生于贝尔实验室,由Rick Becker, John Chambers, Allan Wilks开发。
。
而R却克服了这些弱点。
(3)R的语言与S语言非常相似
虽实现方法不同,但兼容性很强。 作为面向对象的语言,R集数据的定义、插入、修改和
函数计算等功能于一体,语言风格统一,可以独立完成 数据分析生命周期的全部活动。 作为标准的统计语言,R几乎集中了所有程序编辑语言 的优秀特点。
用户可以在R中自由地定义各种函数,设计实验, 采集数据,分析得出结论。
矩阵(matrix) 二维的数据表,是数组的一个特例
x <- 1:12 ; dim(x) <- c(3,4)
[,1] [,2] [,3] [,4]
[1,]
[2,] [3,]
1
2 3
4
5 6
7
8 9
10
11 12
31
class
初识R软件
例1.1某学校在体检时测得12名女中学生体重X1(kg)
和胸围X2(cm)资料如下表所示,试计算体重与胸围 的均值与标准差。 表 学生体检资料
求助符
? help()
例子: >3+5 >3-5 >3/5 >3^5 >x=5 >?plot >help(plot)
x<-c(-1,0,2);y<-c(3,8,2)
v<-2*x+y+1;v x*y
x/y
x^2 y^x 5%/%3#(整数除法) 5%%3#(求余数)
y<-factor(x) y
c(3,2)
c(2, “Zibo”)
class
向量(vector) 一系列元素的组合。 如 c(1,2,3); c("a","a","b","b","c") 因子(factor) 因子是一个分类变量,如性别,学号。无法运算。 c(“a”,“a”,“b”,“b”,“c”) c("er","sdf","dim","haha","good")
包含非参数密度估计、 非参数回归 和数据挖掘与机器学习技术等内容。
本书的主要特色是结合R软件讲解非参数统计方法的原 理和应用, 我们的宗旨是塑造有独立专业思考能力, 对所学知识有比较地选择, 并能够使用恰当方法解决实际问题的统计专业人才。 据此,我们在课程设计中, 专门设计了学生在接受知识的过程中对知识的运用和鉴 别能力的训练。
本书可作为统计、经济、管理、生物等
方法的教材, 也可以用作统计研究或从事数据分析的方法的参考书。 本书的先修课程只需具备初等统计学基础。
对统计基础略感陌生的读者,
可以阅读第2章相关内容作为补充。 本书的内容可以安排在一学期54课时内完成,
A.1.1 R环境(Windows下载和安装R)
CRAN: Binaries>Windows>base
R2.11.0下载页面
下载完成后,双击R-2.11.0-win32.exe 开始安装。 一直点击下一步,各选项默认,语言建议选英/中文。
22
R软件主窗口与快捷方式
菜单栏 快捷按钮
控制台 光标:等待输入
R登陆界面(Windows版)
路径: 开始>所有程序>R 2.11.0
24
图 1 R Gui 的File菜单
25
图 2 R Gui 的Edit菜单
26
图 3 R Gui 的Packages菜单
27
图 4 R Gui 的Help菜单
28
A.1.2 常量/元素(class)的类型
对象是由各元素组成的。每个元素,都有自己的数据类型
本书大部分例题都给出R源程序解法示例, 各种理论条件的检验、讨论、分析和比较, 鼓励学生针对数据的特点, 独立编写数据分析程序。 为加强与R的结合,书中图形大部分由R生成, 我们广泛收集了很多领域数据分析实例和应用编 写成本书的例题和习题, 以扩展学生的应用领域,提高学生解决实际问题 的能力。
3 rep() 生成循环序列,若向量(序列)具有较为复杂的规律
>rep(2:5,2) >rep(2:5,rep(2,4))
例1.1 1,生成,22222 2, 1,a,1,a,1,a 3 1*10, 3*20,2*5 解: rep(2,5) rep(c(1,“a”),3)#英文 rep(c(1,3,2),c(10,20,5)) length()#控制长度 rep(c(1,4,6),length=5)
据不完全统计,在欧美等发达国家的著名高等学府,
R不仅是专业学习统计的流行教学软件, 而且已成为从事统计研究的学生和统计研究人员必备
的统计计算工具。
R的主要特点归纳如下:
(1)R是自由免费的专业统计分析软件,拥有强大的面向对象的 开发环境, 可以在UNIX,Windows和MACINTOSH等多种操作系统中运行。
本书是一本专门讲授非参数统计理论和方法的教科书。 内容主要分为两个部分: 传统的非参数统计推断和现代非参数统计方法。 传统的非参数推断内容由单一样本、
两样本及多样本非参数统计估计和假设检验、
分类数据的关联分析方法、 定量数据的相关和回归等内容构成;
现代非参数统计方法部分
学生编号 1 2 3 4 5 6 体重X1 35 40 40 42 37 45 胸围X2 60 74 64 71 72 68 学生编号 7 8 9 10 11 12 体重X1 43 37 44 42 41 39 胸围X2 78 66 70 65 73 75
初识R软件(续)
解:# 输入体重 X1<-c(35, 40, 40, 42, 37, 45, 43, 37, 44, 42, 41, 39) # 计算体重的均值和标准差 mean(X1); sd(X1) # 输入胸围 X2<-c(60, 74, 64, 71, 72, 68, 78, 66, 70, 65, 73, 75) # 计算胸围的均值和标准差 mean(X2); sd(X2); hist(X1) # 绘出体重的直方图 hist(X1, probability = TRUE,main = paste("Histogram of" , "weight"), xlab = "weight") lines(density(X1))