R语言学习笔记内附实例及代码

合集下载

R语言教程笔记

R语言教程笔记

R 编程笔记2简介1.突出特点:【多领域的统计资源】目前在R 网站上约有2400个程序包,涵盖了基础统计学、社会学、经济学、生态学、空 间分析、系统发冇分析、生物信息学等诸多方而。

【免费】2.缺点:【占用内存】所有的数据处理在内存中进行,不适于处理超大规模的数据。

【运行速度稍慢】即时编译,约相当于C 语言的1/20。

3. CRAN :全称 The Comprehensive R Archive Networks由世界几十个镜像网站组成网络.提供F 载安装程序和相向软件包。

0镜像更新频率一般为天。

推荐镜像: 中国的镜像:数学所:即时更新的CRAN 源:界而下如下(版本)4.R 程序包(R packages )什么是R 程序包R 程序包是多个函数的集合,具有详细的说明和示例。

每个程序包包含R 函数、数据、帮助文件、描述 文件等window 下是zip 形式,安装时不要解压缩,R 程序包是R 功能扩展,特定的分析功能,需要用相 应的程序包实现。

例如:系统发冇分析,常用到ape 程序包,群落生态学vegan 包等。

4.2常用R 程序包ade4 adephylo ape利用欧几里得方法进行生态学数据分析 系统进化数据挖掘与比较方法系统发育与进化分析apTreeshape boot cluster ecodist FD进化树分析Bootstrap 检验聚类分析生态学数据相异性分析 功能多样性分析geiger 物种形成速率f j 进化分析Graphics lattice 栅格图绘图maptools空间对象的读取和处理R Console7PJ2S1R version Z.L1.1 (2010-05-31)Copyrlght IC) 2010 The R FouDd^t-aon £oc C OBDU S DJTSE« 3-M0OSL-07-DD 是自由恢件,不带任何担佩・在菓些条件下你可以梓我口由散布.用'llcerwe |) *或,licenced *来希阪布的库融*件.P •是个合作tt 划,利许多入为NiS 出丁贡献・•contcibut.ora I),来石合作吉的i#细用会警诉你如何在出版樹中正礎也引用卩戒口性序包・ffi'derrcO 1来着一些示范徑序,ffl* heLp (I •M 文件,戏用'lielp.atatcd '迪过时血列觅密隶薈?ft 助gf4. 用51 ■退出R ・(處来滋存的工隹空间已圧胆】> hlflLotry(|> rate<-c(2D z 22, 2今.26, 2B, 30, 32. 3" 36, 3B Z 40, 121> tmpMrLty <-c(0.4z 9・» 11.0z 10.^f 15.3, 14・6 13 2/ X4.7Z 15.4Z 10.5r 1D.9J > ploi | impxiif Lty^6ca| >rca<-(xnpurit ?-e)ceg<-1 tn (in pur it 产 rat e) J 1 -r.u : M .;, • . •« c«r ■] 丈再施9(蔑他tfffsva 屯in-nix)rate<-c(ZD, ZZ, 2仇 ZC r Z0z 、0, 32, 3G Z 3 0z 今 impMtLCy <-C(8.4, 9・5, 11.8Z 10.13・3, L4・8, 13 plot | Uiputlty-totcl6LXlft(lornula - lrwpurlty - cate) JSecidMala:XlhiQ Ftedlan 如 Soxs\unrar7(recj) ^ve.m,gerFrVi^习筋料X 救梧井桁黃花宝典\\R 语专 hiatocycimgev mvpart nlme ouch pgirmessphangorn picante广义加性模型相关 多变量分解线性及非线性混合效应模型 系统发弃比较 生态学数据分析系统发育分析群落系统发育多样性分析raster ffi 格数据分析与处理 seqinrDNA 序列分析sp空间数据处理spatstat spla ncs stats SDMTools vegan CRAN Task Views空间点格局分析,模型拟合与检验 空间与时空点格局分析R 统计学包物种分布模型工具植物与植物群落的排序,生物多样性计算中有对程序包的分类介绍4.3 R 程序包安装1.用函数(),如果已经连接到互联网,在括号中输入要安装的程序包洛称,选择镜像后,程序将自动下载并安装程序 包。

R语言笔记

R语言笔记

Learning R from ScratchBlabla##通过在命令、变量、逗号等附近添加空格来提高R的可读性.##可使用control+tab键来在控制台console和图形设备graphic device间切换. >help.start():得到HTML 格式的帮助(等价于:帮助->html帮助)>?xxx or >help(x):得到任何特定名字的函数的帮助##对于关键字和运算符,与函数的帮助类似,但是需要加上引号,如:> ?'+' 或>?”+” #等价于help('+') help(“+”)>??xx :在help.start()启动的浏览页上,”Search Engine &Keywords”>objects() or>ls():用来显示当前保存在R 环境中的对象名字>ls(pat=“x”):只显示在名称中带有某个指定字符的对象>ls(pat=“^x”):只显示在名称中以某个指定字符开头的对象>ls()不能列出名称以点号开头的向量可使用ls(all = T)>history():看到之前保存的数据和命令。

>rm(x,y):删除对象>rm(list=ls(all=TRUE)): 删除内存中所有对象,all=TRUE可以省略>dir.create("c:/Users/Mr.Young/Desktop/R") 创建新的工作目录>getwd()和>setwd():获取/设置工作空间目录##临时修改,只针对当前文件>setwd(file="c:/users/Mr.Young/Documents")file可以省略,且该操作等价于“文件”菜单“change dir”>getwd()[1] "c:/users/Mr.Young/Documents" (目录的分隔符用“/”(slash)或“\\”)永久修改,R右键->属性->快捷方式->起始位置Windows下默认的分隔符为\ (backslash),注意更改.>example():显示函数的例子(不加引号)>list.files():查看当前目录下的文件>save(x,y,file=”d:/xy.Rdata”); #保存变量>load(”d:/xy.Rdata”); #载入变量%%:求余数%/%:整除逻辑与: &(拉丁文为et)(前后都要判断)or && ( “&&”前为F就结束,结果为F) 逻辑非: | (前后都要判断) or || (“||”前为T就结束,结果为T)##同一行中输入多条命令,用“;”隔开,否则另起一行。

R语言学习笔记-内附实例及代码

R语言学习笔记-内附实例及代码

R语言学习笔记-内附实例及代码(总18页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--R语言入门R是开源的统计绘图软件,也是一种脚本语言,有大量的程序包可以利用。

R中的向量、列表、数组、函数等都是对象,可以方便的查询和引用,并进行条件筛选。

R具有精确控制的绘图功能,生成的图可以另存为多种格式。

R编写函数无需声明变量的类型,能利用循环、条件语句,控制程序的流程。

R网络资源:R主页:R资源列表 NCEASR Graphical Manual统计之都:QuikR丁国徽的R文档:R语言中文论坛一、用函数(),[直接输入就可以联网,第一次的话之后选择镜像,然后选择包下载即可]如果已经连接到互联网,在括号中输入要安装的程序包名称,选择镜像后,程序将自动下载并安装程序包。

例如:要安装picante包,在控制台中输入("picante")已经安装了二. 安装本地zip包路径:Packages>install packages from local files选择本地磁盘上存储zip包的文件夹。

(文件,运行R的脚本,选择所在文档)三.调用程序包在控制台中输入如下命令 library(“picnate”)程序包内的函数的用法与R内置的基本函数用法一样。

四.程序包内部都有哪些函数分别有什么功能查询程序包内容最常用的方法:1 菜单帮助>Html帮助;2 查看pdf帮助文档五.查看函数的帮助文件函数的默认值是什么怎么使用使用时需要注意什么问题需要查询函数的帮助。

1 直接打开相关函数的说明和使用模板。

2 RGui>Help>Html help 同样的效果,同上3 apropos("")合理使用T 检验,五种模式的T 检验4 help("")帮助同1-25 ("")有关T 检验的一切东西都可以查出来。

R语言学习过程各种笔记

R语言学习过程各种笔记

数据挖掘与数据分析的主要区别是什么?数据分析就是为了处理原有计算方法、统计方法,着重点就是数据、算法、统计、数值。

数据挖掘是从庞大的数据库中分析出有目标数据群,筛选出利于决策的有效信息简单来说就是数据分析是针对以往取得的成绩,比如说哪方面做得好,哪方面需要改进;数据挖掘就是通过以前的成绩预测未来的发展的趋势,并且为决策者提供建议。

读excel时可以先复制再运行data <- ("clipboard", header = T, sep = '\t')在R语言中,使用“=”和“<-”到底有什么不同?就是等号和箭头号有什么区别,是完全一样还是局部不同?R里通常用符号”<-”代替其它语言里的”=”来作赋值符号。

因为前者敲起来比等号要麻烦,且大部分情况下两者是等价的,所以通常就愉懒依旧用”=”来赋值。

但要切记两者在某些时候是有区别的。

字面上的解释,可以认为”<-”是赋值,”=”是传值。

在函数调用中,func(x=1)与func(x<-1)是有区别的,前者调用完后变量x不会被保留,而后者会在工作区里保留变量x=1。

再如length(x=seq(1,10))计算完成后x不会被保留,而length(x<-seq(1,10))计算完后你会在工作区里发现x这个变量。

矩阵知识:1_矩阵的生成2_矩阵的四则运算3_矩阵的矩阵运算4_矩阵的分解1_1将向量定义成数组向量只有定义了维数向量(dim属性)后才能被看作是数组.比如:> z=1:12;> dim(z)=c(3,4);> z;[,1] [,2] [,3] [,4][1,] 1 4 7 10[2,] 2 5 8 11[3,] 3 6 9 12注意:生成矩阵是按列排列的。

1_2用array ( )函数构造多维数组用法为:array(data=NA,dim=length(data),dimnames=NULL)参数描述:data:是一个向量数据。

赖江山老师讲授R语言课程个人笔记

赖江山老师讲授R语言课程个人笔记

一、非对称分析(回归)做回归分析的前提条件:方差齐次性、独立、数据满足正态分布如果数据不正态,导致的后果平均值95%置信区间,两边不对称如果方差不等,某一边的标准差、置信区间大,有重叠回归Y定性时,整个式子叫做“分类排序”;X定性又定量时,整个方程叫“协方差分析”二、单因素方差分析(1)验证数据的正态性,零假设:均值相等,一组一组地验证:tapply(df$yield,df$Treat,shapiro.test),正态分析函数(shapiro.test),当结果P>0.05,则是一种自然分布(2)合并检验正态性:shapiro.test(resid(lm(yield~Treat,df)))(3)方差齐性检验,零假设:方差相等:bartlett.test(yield~Treat,df)(4)方差分析:fit <- aov(yield ~ Treat, df) 【“~”表示回归,aov是单因素方差分析ANOVA函数】(5)小知识:范函数:[summary.] /[plot.](6)P=1-pf(value组间方差-即组间变异幅度,Df-treat, Df-Residuals)Treat-Meansq/Treat-Value=Residuals-MeansqDf Sum Sq Mean Sq F value Pr(>F)Treat 4 301.2 75.30 11.18 0.000209 ***Residuals 15 101.0 6.73---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘’ 1(7)多重比较:安装赖老师的写的包(NEwR2),library(NEwR2),LSD多重比较:Least Significance Difference;多个t检验Install.package(‘agricolae’)(8)(9)结果P值,犯“1类错误,拒接真的原假设”的概率,正常我们说的P=0.05,就是:我们可以接受犯这个错误的概率。

R语言学习笔记2

R语言学习笔记2

R语言学习笔记2目录1.产生向量 (4)2.生成矩阵 (4)3.读数据 (5)4.round()函数 (5)5.散点图精细化设置 (6)5.1散点图 (6)5.2连线图 (6)5.3向日葵散点图 (8)5.4散点图集 (9)5.5图形窗口 (9)6.maps包的运用 (10)7.R语言的各种分布函数 (10)8.相关分析举例(以iris数据集为例) (10)9.一元线性回归分析 (11)10.多元线性回归 (13)10.1理论基础 (13)10.2逐步回归法优化模型举例 (14)10.3通过自变量与因变量关系的再编辑来优化模型 (16)11.回归诊断 (17)11.1正态分布检验 (17)11.2散点图目测检验 (18)11.3残差检验 (19)11.4多重共线性 (21)12.广义线性回归模型 (22)12.1Logistic回归:将分组变量转化为概率问题 (22) 12.2Logistic回归模型建立示例: (22)12.3对数法:y=a+b logx (23)12.4指数法:y = a e bx (24)12.5幂函数法:y=a x b (24)13.MINE方法建立回归模型 (24)14.关联规则的挖掘(以数据集Groceries为例) (25)14.1下载包arules (25)14.2函数asprior() (25)15.常见分类模型与算法 (25)15.1概述 (25)15.2线性判别法 (26)15.3距离判别法 (27)15.4贝叶斯分类器 (28)15.5决策树 (29)15.6支持向量机 (31)16.聚类 (31)16.1距离计算 (32)16.2层次/系统聚类法hclust()函数 (32)16.3动态聚类:K-means法(kmeans函数) (34)16.4 K中心聚类法 (34)16.5基于密度的方法:DBSCAN (35)17.主成分分析 (35)17.1简单主成分分析R语法示例(princomp函数) (35)17.2主成分分析与聚类的综合使用 (36)18.因子分析 (36)1.产生向量A[5]:显示A中的第5个元素;A[-5]:除了A中的第5个元素,其他元素都显示出来;A[1:5]:显示A中的第1个元素到第5个元素,共计5个数据;A[-(1:5)]:除了1-5个元素,其他元素都显示出来。

R语言示例代码

R语言示例代码

3.4 非参数回归 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.5 广义可加模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.6 Logistic 回归和分类问题 . . . . . . . . . . . . . . . . . . . . . 7
4.2 使用 SelectorGadget 和 Chrome 浏览器选择 CSS . . . . . . . 9
4.3 使用 R 处理 robots 协议 . . . . . . . . . . . . . . . . . . . . . 9
4.4 案例 Scraping a page of book selling information . . . . . . . 9
3 统计分析
5
3.1 最大似然估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.2 相关阵 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.3 回归自变量筛选 . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1
1 程序控制
2
1.1 程序控制
计算 e 的值
e0 <- 1.0 x <- 1 k <- 0 repeat{
k <- k+1 x <- x/k e0 <- e0 + x
1 程序控制

R语言学习笔记(数据的读取与保存)

R语言学习笔记(数据的读取与保存)

R语⾔学习笔记(数据的读取与保存)library(MASS)#载⼊package MASSdata(package="MASS") #查看MASS中的数据集data(SP500,package="MASS") #载⼊MASS中的SP500数据集data(SP500) #简化写法getwd() #返回当前⼯作⽬录setwd("d:/r/r-data") #将当前⼯作路径修改为data=read.table("d:/r/r-data/salary.txt",header=T)data #没有设置⼯作⽬录setwd("d:/r/r-data")data1=read.table("salary.txt",header=T)data1 #设定⼯作⽬录data2=read.csv("salary.csv",header=T)data2 #读⼊CSV⽂件data3=scan("salary.txt",skip=1,what=list(City="",Work=0,Price=0,Salary=0))data3 #不存在header参数,skip=1说明读取时跳过表⽰名称的第⼀⾏mode(data) #显⽰对象的类型names(data) #显⽰对象中的标签dim(data) #显⽰对象的维度data$Salary #通过$符号来选择字段attach(data)Salarydetach(data) #attach()可以直接通过变量名称来获取变量信息,detach()⽤来撤销data.fwf=read.fwf("d:/r/r-data/fwf.txt",widths=c(2,4,4,3),=c("w","x","y","z"))data.fwf #widths⽤来指定4个变量的宽度,s指定4个变量的名称data.excel=read.delim("clipboard") #clipboard即剪贴板data.excel #通过剪贴板的⽅式来读取excel中的内容install.packages("RODBC")library(RODBC)channel=odbcConnectExcel2007("Salary.xlsx") #通过RODBC包来连接EXCEL⽂件sqlTables(channel) #列出Excel中的表格data.excel12=sqlFetch(channel,"Sheet1") #读取sheet1data.excel12=sqlQuery(channel,"select * from[Sheet1$]") #在channel中使⽤sqlclose(channel) #关闭channel的连接mode(data.excel12);dim(data.excel12)library(RMySQL)con=dbConnect(MySQL(),user="root",password="xjs123",dbname="mysql")#打开⼀个MySQL的连接s=dbListTables(con) #将数据库中的表名存⼊ss=dbListField(con,"event")dbReadTable(con,"event") #获取全表query=dbSendQuery(con,"select *from event")fetch(query) #显⽰SQL的结果dbRemoveTable(con,"event") #删除表dbDisconnect(con) #关闭连接load("d:/r/r-data/Salary.Rdata") #读⼊R格式⽂件head(data,5) #显⽰数据集前五⾏cat(c("AB","C"),c("E","F"),"n",sep="")#cat()可以连接字符串、数字向量等i=1:5cat("i=",i,"n",sep=",") #sep=“,”是以逗号为分隔符cat(c("AB","C"),c("E","F"),file="d:/r/r-data/cat.txt",sep=".")readLines("d:/r/r-data/cat.txt") #以⾏的形式读取⽂本cat(i,file="d:/r/r-data/cat.txt",append=TRUE)readLines("d:/r/r-data/cat.txt") #append=TRUE表⽰追加内容,不覆盖之前内容a=file("d:/r/r-data/cat.txt") #通过file先打开⼀个连接cat("1 2 3 4 ","2 3 5 7","11 13 15 17", file=a, sep="\n") #\n表⽰换⾏read.table(a)data1=read.table("d:/r/r-data/salary.txt",header=T)write.table(data1,file="d:/r/r-data/salary1.txt",s=T,quote=F)#写⼊数据write.csv(data1,file="d:/r/r-data/salary1.csv",s=F,quote=F)data.csv=read.csv("d:/r/r-data/salary1.csv")dim(data.csv)#写⼊CSV⽂件save(data,file="d:/r/r-data/salary1.Rdata") #保存R⽂件load("d:/r/r-data/salary1.Rdata") #读⼊R⽂件head(data,5)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

R语言入门R是开源的统计绘图软件,也是一种脚本语言,有大量的程序包可以利用。

R中的向量、列表、数组、函数等都是对象,可以方便的查询和引用,并进行条件筛选。

R具有精确控制的绘图功能,生成的图可以另存为多种格式。

R编写函数无需声明变量的类型,能利用循环、条件语句,控制程序的流程。

R网络资源:R主页:R资源列表NCEASR Graphical Manual统计之都:QuikR丁国徽的R文档:R语言中文论坛一、用函数install.packages(),[直接输入就可以联网,第一次的话之后选择镜像,然后选择包下载即可]如果已经连接到互联网,在括号中输入要安装的程序包名称,选择镜像后,程序将自动下载并安装程序包。

例如:要安装picante包,在控制台中输入install.packages("picante")已经安装了?二. 安装本地zip包路径:Packages>install packages from local files选择本地磁盘上存储zip包的文件夹。

(文件,运行R的脚本,选择所在文档)三.调用程序包在控制台中输入如下命令library(“picnate”)程序包内的函数的用法与R内置的基本函数用法一样。

四.程序包内部都有哪些函数?分别有什么功能?查询程序包内容最常用的方法:1 菜单帮助>Html帮助;2 查看pdf帮助文档五.查看函数的帮助文件函数的默认值是什么?怎么使用?使用时需要注意什么问题?需要查询函数的帮助。

1 ?t.test 直接打开相关函数的说明和使用模板。

2 RGui>Help>Html help 同样的效果,同上3 apropos("t.test")合理使用T 检验,五种模式的T 检验4 help("t.test")帮助同1-25 help.search("t.test")有关T 检验的一切东西都可以查出来。

6 查看R 包pdf 手册六、帮助很强大• lm{stats} #函数名及所在包 • Fitting Linear Models #标题• Description #函数描述 • Usage #默认选项 • Arguments #参数 • Details #详情 • Author(s) #作者 • References #参考文献 •Examples #举例七、R 图形界面:R commander• 1安装R commander install.packages("Rcmdr")• 2 R 将自动下载并安装Rcmdr 所需的所有程序包调用R Commander图12 R commander 界面library(Rcmdr)八、R 的函数R 是一种解释性语言,输入后可直接给出结果。

功能靠函数实现。

函数形式: 函数(输入数据,参数= )如果没有指定,则参数的以默认值为准。

例如:平均值 mean(x, trim = 0, na.rm = FALSE, ...)线性模型 lm(y~x, data=test)每一个函数执行特定的功能,后面紧跟括号,例如:平均值 mean(); 求和 sum(); 绘图 plot() ;排序 sort()。

除了基本的运算之外,R的函数又分为”高级”和”低级”函数,高级函数可调用低级函数,这里的”高级”函数习惯上称为泛型函数。

如plot()就是泛型函数,可以根据数据的类型,调用底层的函数,应用相应的方法绘制相应的图形。

这就是面向对象编程的思想。

查询的方法:Help>Html help>packageslog() log10() exp() sin() cos()tan()asin()acos()binom.test()fisher.test()chisq.test()friedman.test()mean()sd()var()glm(y~x1+x2+x3, binomial)….九、赋值与注释与对象起名<- 右边的值赋值给左边的变量或者对象;# 注释注释部分不会编译R处理的所有数据、变量、函数和结果都以对象的形式保存。

1.区分大小写,注意China和china的不同。

2.不能用数字作为变量,对象也不能用数字开头,但是数字可以放在中间或结尾,如2result与result2,后者是合法的。

3.建议不要用过短的名称。

可以用”.”作为间隔,例如anova.result1。

4.不要使用保留名:NA, NaN, pi, LETTERS, letters, month.abb, 十、元素与对象的类1.对象是由各元素组成的。

每个元素,都有自己的数据类型。

2.元素种类数值型Numeric 如100, 0, -4.335 字符型Character 如“China”逻辑型Logical 如TRUE, FALSE 因子型Factor 表示不同类别复数型Complex 如:2 + 3i3.对象的类class:因子(factor) 因子是一个分类变量c("a","a","b","b","c")向量(vector)一系列元素的组合。

如c(1,2,3); c("a","a","b","b","c")矩阵(matrix)二维的数据表,是数组的一个特例:x <- 1:12 ; dim(x) <- c(3,4)[,1] [,2] [,3] [,4][1,] 1 4 7 10[2,] 2 5 8 11[3,] 3 6 9 12数组(array) 数组是k维的数据表(k in 1:n,n 为正整数)。

向量(n = 1) 矩阵(n = 2)高维数组(n >= 3)数据框(dataframe)是由一个或几个向量和(或)因子构成,它们必须是等长的,但可以是不同的数据类型。

每个数据表可以看作一个数据框(dataframe)。

每一行(row)作为一个记录(entry),每一列(column)作为一个向量(vector)。

由很多不同类型的向量组成,如字符型,因子型,数值型。

如何生成数据框?两种办法:(1)从外部数据读取;(2)各类型因子组合成数据框。

列表(list)列表可以包含任何类型的对象。

可以包含向量、矩阵、高维数组,也可以包含列表。

十一、运算符数学运算运算后给出数值结果:+, -, *, /, ^ (幂)比较运算运算后给出判别结果:(TRUE FALSE):>, <, <=, >=, ==(==是计算机编程的二元运算符。

当左边的内容与右边的内容相同时,返回1。

其余时候返回0。

==是判断两个值大小是否相同的运算符。

), !=不等于逻辑运算与、或、非:!, &, &&, |, ||十二、数据的读取1.最为常用的数据读取方式是用read.table() 函数或read.csv()函数读取外部txt或csv格式的文件。

txt文件,制表符间隔;csv文件,逗号间隔。

一些R程序包(如foreign)也提供了直接读取Excel, SAS, dbf, Matlab, spss, systat, Minitab文件的函数。

2.read.csv()的使用例:test.data<-read.csv("D:/R/test2.csv",header=T)header=T表示将数据的第一行作为标题。

read.table((),header=T)可以弹出对话框,选择文件。

3.数据量较大时用read.table函数从外部txt文件读取第1步将Excel中的数据另存为.txt格式(制表符间隔)或.csv格式。

第2步用read.table()或read.csv()函数将数据读入R工作空间,并赋值给一个对象。

4.例子:mydataframe<-read.csv("F:/KAGGLE1/train.csv",header=F)命名读取函数数据位置文件夹名称是否读取头(T/F)十三、向量、矩阵和数据框的创建有时需要对读入的数据进行操作,将某一向量转换成矩阵,如条件筛选,此时将遇到向量、矩阵和数据框的生成、条件筛选等。

1.1四种类型的向量:字符型character<-c("China", "Korea", "Japan", "UK", "USA", "France", "India", "Russia") ;数值型numeric<-c(1, 3, 6, 7, 3, 8, 6, 4);逻辑型logical<-c(T, F, T, F, T, F, F, T);复数型略。

1.2创建向量——用X<-c()函数或者c() , rep() , seq() , ”:”c(2,5,6,9)rep(2,times=4) seq(from=3, to=21, by=3 ) [1] 3 6 9 12 15 18 21“:”1:15 #意思是[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 通过与向量的组合,产生更为复杂的向量。

rep(1:2,c(10,15))1.3向量创建——产生随机数runif(10, min = 0, max= 1) rnorm(10, mean = 0, sd = 1)1.4几个随机数的相关函数概率密度dunif(x, min=0, max=1, log = FALSE)累积函数punif(q, min=0, max=1, …)分位数qunif(p, min=0, max=1, …)随机均匀分布runif(n, min=0, max=1)2.矩阵的创建生成矩阵的函数dim()和matrix()dim() 定义矩阵的行列数,例如:x <- 1:12dim(x) <- c(3,4)[,1] [,2] [,3] [,4][1,] 1 4 7 10[2,] 2 5 8 11[3,] 3 6 9 12matrix.x <- matrix(1:12,nrow=3,byrow=T)t(x)#转置为行或列添加名称:s() s()3.数据框的创建创建数据框的函数:data.frame(), as.data.frame(), cbind(), rbind()cbind() # 按列组合成数据框rbind() # 按行组合成数据框data.frame() #生成数据框head() #默认访问数据的前6行4.列表的创建列表可以是不同类型甚至不同长度的向量(数值型,逻辑型,字符型等等)、数据框甚至是列表的组合。

相关文档
最新文档