R语言常用函数参考

合集下载

r语言raster函数

Raster 函数是R 语言中用于处理栅格数据的重要函数之一。

栅格数据是一种二维数组，其中每个元素表示一个像素，每个像素具有一个特定的属性值。

Raster 函数可以用于创建、加载、操作和保存栅格数据。

在R 语言中，常用的raster 函数包括raster()、extract()、sextract()、values() 和reclassify() 等。

这些函数可以用于栅格数据的各种操作，如创建新的栅格数据集、提取像素值、重新分类像素值等。

下面将简要介绍raster 函数的基本用法和常见操作，并用一个简单的示例说明如何使用raster 函数来处理栅格数据。

基本用法----在R 中，可以使用raster() 函数创建栅格数据集。

该函数接受两个参数：栅格数据的宽度和高度，以及每个像素的属性值。

例如，下面的代码创建一个包含500x500 个像素的灰度栅格数据集，每个像素的属性值为从0 到255 的整数：```rlibrary(raster)r <- raster(nrows=500, ncols=500)values(r) <- seq(from=0, to=255, by=1)```在这个例子中，我们首先使用library() 函数加载raster 包，然后使用raster() 函数创建一个大小为500x500 的栅格数据集。

接着，使用values() 函数将每个像素的属性值设置为从0 到255 的整数序列。

常见操作----除了创建栅格数据集，raster 函数还提供了许多其他操作，如加载已有的栅格数据集、提取像素值、重新分类像素值等。

* **加载栅格数据集**：可以使用brick() 函数加载多波段栅格数据集，该函数可以将多个栅格数据集合并为一个大型的数据结构。

* **提取像素值**：可以使用extract() 或sextract() 函数提取特定区域的像素值。

这些函数可以指定一个向量或矩阵来表示要提取的区域。

r语言lm函数参数

r语言lm函数参数
R语言中的lm函数是用于拟合线性回归模型的函数，其参数包括formula, data, subset, weights, na.action, method, model 和x参数。

1. formula，这是一个公式，用来描述响应变量和预测变量之间的关系。

通常的形式是response ~ predictor1 + predictor2 + ...，其中response是因变量，predictor1、predictor2等是自变量。

2. data，这是一个数据框，包含了用于拟合模型的变量。

3. subset，这是一个逻辑向量，用于指定用于拟合模型的观测值的子集。

4. weights，这是一个可选的数值向量，用于指定每个观测值的权重。

5. na.action，这是一个函数，用于指定处理缺失值的方法。

6. method，这是一个用于指定拟合模型的方法的参数，比如最小二乘法或者岭回归等。

7. model，这是一个逻辑值，用于指定是否保存模型拟合的详细信息。

8. x，这是一个逻辑值，用于指定是否返回模型的设计矩阵。

通过合理设置这些参数，可以对lm函数进行灵活的调用，从而拟合出适合数据的线性回归模型。

希望这些信息能够帮助你更好地理解R语言中lm函数的参数。

r语言filter函数

r语言filter函数R语言中filter函数是一种常用函数，它可以根据用户提供的具体条件去过滤数据集中不满足条件的数据。

通常我们会将已经完成数据清洗（data cleaning）的数据集传递给这个函数，根据用户自定义的筛选条件，filter函数会将不满足条件的数据按照用户所提供的操作（比如编辑、删除、移动等）进行操作，从而实现数据的过滤。

R语言filter函数的使用非常简单，只需要在R环境中输入它的函数名，就可以使用它。

filter函数的主要源代码如下：filter(.data, .predicate = TRUE, .invert = FALSE) 其中，.data是指要被过滤的数据集，.predicate是指用户提供的过滤条件，.invert则是指filter函数在过滤数据时，是否按照反向逻辑，即将满足条件的数据筛掉，而保留不满足条件的数据。

一般而言，我们使用filter函数时，会配合R语言中的各类内置函数，来实现更复杂的筛选条件。

例如，对于一个由若干个数值类型的变量组成的数据集，我们可以使用filter函数加上内置的max 函数，来筛选出变量中最大值；或者使用filter函数加上内置的mean 函数，来筛选出变量中的平均值。

只要遵循filter函数所制定的规则，就可以实现自定义筛选。

R语言filter函数主要有两种应用方式：一种是按照数据集中某一变量，筛选出满足特定条件的数据，这种方式常用于数据的分组和统计分析；另一种是按照一组变量，筛选出满足一组条件的观测值，这种方式常用于更复杂的数据处理和分析。

总之，filter函数的出现，为R语言的数据处理和分析提供了更丰富的功能，是R语言在数据处理和分析方面的一大利器。

尽管R语言filter函数可以帮助用户快速筛选数据，但也存在一定的弊端。

例如，在使用filter函数进行筛选时，如果提供的数据集中存在缺失值，则需要先行补全，否则filter函数可能出现错误。

r语言apply函数

r语言apply函数R语言是一种功能强大的统计计算软件，它拥有许多内置函数，其中之一就是apply函数。

本文将概述R语言中apply函数的基本概念和如何使用它。

apply函数是R语言中的一个常用函数，它能够将某个函数应用到一组数据的每一行或每一列中。

这是一个多用途的函数，它允许用户对数据框中的每一行或列快速运行一系列操作。

它的最大优势在于，可以极大地简化数据处理的工作步骤。

apply函数的基本格式如下：apply(X, MARGIN, FUN,…X是一个数据矩阵，MARGIN表示apply函数分别应用到每行（MARGIN=1）和每列（MARGIN=2），FUN表示要应用的函数，“…”表示对FUN函数的其他参数。

具体地，apply函数可以应用到数据矩阵的不同方面，这可以使用户对数据快速汇总，计算统计量，筛选数据等操作。

下面介绍几个apply函数的常用用法：（1）计算每列的汇总统计量：apply(X, 2, FUN)可以计算数据矩阵X的每一列的汇总统计量，其中FUN可以是求和、平均值、中位数等函数。

（2）计算每行的汇总统计量：apply(X, 1, FUN)可以计算数据矩阵X的每一行的汇总统计量，其中FUN可以是求和、平均值、中位数等函数。

（3）计算每行的最大值和最小值：apply(X, 1, max)apply(X, 1, min)可以计算数据矩阵X的每一行的最大值和最小值。

（4）提取每行的前N个值：apply(X, 1, head, n)可以提取数据矩阵X的每一行的前N个值，其中n表示要提取的值的个数。

（5）提取每行的后N个值：apply(X, 1, tail, n)可以提取数据矩阵X的每一行的后N个值，其中n表示要提取的值的个数。

（6）将每行值进行分组：apply(X, 1, cut, cuts)可以将数据矩阵X的每一行值根据cuts指定的断点分组。

（7）计算每行的绝对值：apply(X, 1, abs)可以计算数据矩阵X的每一行的绝对值。

r语言中的factor函数

r语言中的factor函数factor函数是R语言中常用的数据类型转换函数之一，用于将一个向量或数据框中的字符类型变量转换为有序或无序的因子类型变量。

factor函数有三个主要参数，分别是x、levels和labels。

其中，x表示需要转换的向量或数据框；levels表示定义因子水平的向量或数组；labels表示对应于levels的标签向量或数组。

factor函数的一般语法如下：```factor(x, levels, labels)```1. 参数x：需要转换为因子的变量，可以是一个字符向量、因子向量或其他可以转换为字符向量的对象。

例如，可以使用一个字符向量作为x参数。

```Rx <- c("A", "B", "C", "A", "B", "C")factor(x)```上述代码将字符向量x转换为因子。

2. 参数levels：用于定义因子水平的向量或数组。

levels参数是可选的，如果没有提供，那么将使用数据中出现的唯一值。

当提供levels参数时，对于未在levels中出现的值，将被视为缺失值。

例如：```Rx <- c("A", "B", "C", "A", "B", "C")levels <- c("C", "B", "A")factor(x, levels)```上述代码将字符向量x转换为因子，且因子的水平按照levels 指定的顺序定义。

3. 参数labels：用于指定对应于levels的标签向量或数组。

labels参数是可选的，如果没有提供，那么将使用levels作为标签。

r语言的which函数

r语言的which函数which函数是R语言中一种非常常用的函数，它的作用是返回满足特定条件的元素的位置索引。

在本文中，我们将介绍which函数的基本用法和一些常见的应用场景。

1. 基本用法在R语言中，which函数的基本用法非常简单。

它可以接受一个逻辑向量作为参数，并返回满足条件的元素的位置索引。

例如，我们有一个向量x，我们想找出其中大于5的元素的位置，可以使用以下代码：```Rx <- c(1, 3, 7, 2, 6, 4)which(x > 5)```这段代码会返回一个向量，其中包含了x中大于5的元素的位置索引，即3和5。

2. 多条件判断除了可以使用单个条件进行判断之外，which函数还可以同时使用多个条件进行判断。

在这种情况下，我们需要使用逻辑运算符来组合多个条件。

例如，我们有一个向量x，我们想找出其中大于3且小于7的元素的位置，可以使用以下代码：```Rx <- c(1, 3, 7, 2, 6, 4)which(x > 3 & x < 7)```这段代码会返回一个向量，其中包含了x中大于3且小于7的元素的位置索引，即2、5和6。

3. 数组和矩阵中的应用除了在向量中使用which函数之外，它还可以在数组和矩阵中使用。

在这种情况下，which函数将按照某种特定的方式来返回满足条件的元素的位置索引。

例如，我们有一个二维数组arr，我们想找出其中大于10的元素的位置，可以使用以下代码：```Rarr <- array(c(1, 15, 5, 20, 3, 8), dim = c(2, 3))which(arr > 10, arr.ind = TRUE)```这段代码会返回一个矩阵，其中包含了arr中大于10的元素的行和列的位置索引。

4. 判断元素是否存在除了返回满足条件的元素的位置索引之外，which函数还可以用来判断某个元素是否存在于向量、数组或矩阵中。

r语言exp函数用法

r语言exp函数用法
R语言中的exp函数用于计算自然对数的底e的幂次方。

exp函数的语法如下：
exp(x)。

其中，x是一个数值或者包含数值的向量。

exp函数的作用是返回e的x次幂的值。

如果x是一个向量，那么exp函数会分别计算向量中每个元素的e的幂次方。

例如，如果我们执行exp(1)，那么它将返回e的1次幂，即e 的值（约等于2.718）。

如果我们执行exp(c(1, 2, 3))，那么它将返回一个包含e的1次幂、e的2次幂和e的3次幂的向量。

在实际应用中，exp函数经常用于处理概率和统计计算，特别是在处理指数分布和泊松分布时。

它也经常用于数据转换，特别是在处理偏度较大的数据时，可以通过取对数或者指数变换来使数据更加接近正态分布。

总之，exp函数在R语言中是一个非常常用的数学函数，用于
计算e的幂次方，可以在概率统计、数据分析等领域发挥重要作用。

r语言summary函数用法

r语言summary函数用法
r语言中的summary函数是一个非常常用的函数，它可以对数据集进行一些简单的统计分析，包括均值、中位数、最大值、最小值、四分位数等等。

在这篇文章中，我们将详细介绍r语言中summary函数的用法和注意事项。

首先，我们来看一下summary函数的基本用法。

假设我们有一个数据集data，我们可以使用以下命令对其进行概要统计：
summary(data)
执行这个命令后，我们可以得到如下输出：
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.00 3.25 5.50 5.84 7.00 10.00
这个输出告诉我们data数据集的最小值、第一四分位数、中位数、平均值、第三四分位数和最大值。

这些统计量能够帮助我们快速了解数据的分布情况，并且可以为后续的数据分析提供参考。

除了基本的用法之外，summary函数还有一些需要注意的地方。

首先需要注意的是，在使用summary函数时，我们需要确保数据集中不含缺失值。

如果数据集中有缺失值，那么summary函数会直接返回NA值。

因此，在使用summary函数之前，我们需要对数据集进行缺失值处理。

另外，需要注意的是，summary函数只对数值型变量进行统计分析，对于字符型变量或者因子变量，它只会返回它们的频数和唯一值个数。

如果我们需要对字符型变量或者因子变量进行统计分析，可以
使用table函数或者其他相关函数。

综上所述，summary函数是一个非常实用的函数，在数据分析过程中经常会用到。

通过掌握它的基本用法和注意事项，我们可以更加高效地进行数据分析。

r语言xlim函数

r语言xlim函数在R语言中，`某lim`函数用于设置绘图区域的水平坐标范围。

它通常与绘图函数（如`plot`、`hist`等）一起使用，以限制绘图区域的显示范围。

该函数接受两个参数：最小值和最大值，用于指定水平坐标轴上的范围。

以下是关于`某lim`函数的一些要点，以更好地理解它的使用方法：1. 语法格式：`某lim(某1, 某2)`，其中`某1`是指定的水平坐标范围的最小值，`某2`是最大值。

2.使用示例：```R#创建一个从1到10的序列某<-1:10#绘制散点图，并限制水平坐标范围为3到8plot(某, 某lim = c(3, 8))#绘制直方图，并限制水平坐标范围为4到9hist(某, 某lim = c(4, 9))```3. `某lim`函数具有两个可选参数，即`某a某s`和`log`。

其中，`某a某s`参数用于控制水平坐标轴的可视范围，可以取值为`"r"`、`"i"`、`"e"`、`"s"`，默认值为`"r"`。

`log`参数用于指定是否在坐标轴上使用对数刻度，默认为`FALSE`。

4. 通过设置参数`某lim`为`NULL`或`NA`，可以取消水平坐标轴的限制，使其自适应数据的范围。

5. 如果绘图函数中同时使用了`某lim`和`ylim`参数，可以通过`某scale`和`yscale`参数分别设置水平和垂直坐标的刻度类型。

例如，`某scale = "log"`表示使用对数刻度。

总之，`某lim`函数是R语言中一个常用的函数，用于控制绘图区域的水平坐标范围。

它可以通过设置最小值和最大值来限制坐标轴的显示范围，并在可视化数据时提供更好的观察效果。

此外，还可以通过其他参数来调整坐标轴的刻度类型和可视范围。

r语言中array函数

r语言中array函数Array函数是一种在R语言中常用的数据结构，用于存储多个相同类型的元素。

它可以是一维数组、二维数组或多维数组，具体的维度由用户定义。

在本文中，我们将重点介绍array函数的使用方法、参数设置以及一些常见的应用场景。

一、array函数的使用方法在R语言中，可以使用array函数创建一个数组。

array函数的基本语法如下：array(data, dim = NULL, dimnames = NULL)其中，data参数表示要存储在数组中的数据，可以是向量、矩阵或其他数组；dim参数表示数组的维度，可以是一个整数向量或一个表示维度的矩阵；dimnames参数用于为数组的维度指定名称。

例如，我们可以使用array函数创建一个一维数组：arr <- array(c(1, 2, 3, 4, 5), dim = c(5))二、array函数的参数设置1. data参数：可以是向量、矩阵或其他数组。

如果data是向量，则数组将按照列顺序填充；如果data是矩阵，则数组将按照行顺序填充。

2. dim参数：用于指定数组的维度。

可以是一个整数向量，也可以是一个表示维度的矩阵。

如果省略dim参数，则数组将被视为一维数组。

3. dimnames参数：用于为数组的维度指定名称。

可以是一个字符向量，也可以是一个包含字符向量的列表。

dimnames的长度必须与数组的维度相匹配。

三、array函数的应用场景1. 多维数据存储：array函数可以用于存储多维数据，例如存储多个样本的特征数据。

通过设置dim参数，可以灵活地定义数组的维度，以适应不同的数据结构。

2. 数据重塑：array函数还可以用于将数据重塑为不同的形状。

例如，可以使用array函数将一个向量重塑为一个矩阵，或将一个矩阵重塑为一个三维数组。

3. 数据分析：在数据分析过程中，array函数可以用于存储和处理多维数据。

例如，可以使用array函数创建一个三维数组，其中每个维度表示不同的变量，然后可以对数组进行统计分析、绘图等操作。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

基本
一、数据管理
vector：向量 numeric：数值型向量 logical：逻辑型向量 character；字符型向量 list：列表
data.frame：数据框 c：连接为向量或列表 length：求长度 subset：求子集 seq，from:to，sequence：等差序列
rep：重复 NA：缺失值 NULL：空对象 sort，order，unique，rev：排序 unlist：展平列表 attr，attributes：对象属性
mode，typeof：对象存储模式与类型 names：对象的名字属性
二、字符串处理
character：字符型向量 nchar：字符数 substr：取子串 format，formatC：把对象用格式转换为字符串paste，strsplit：连接或拆分
charmatch，pmatch：字符串匹配 grep，sub，gsub：模式匹配与替换
三、复数
complex，Re，Im，Mod，Arg，Conj：复数函数
四、因子
factor：因子 codes：因子的编码 levels：因子的各水平的名字 nlevels：因子的水平个数 cut：把数值型对象分区间转换为因子
table：交叉频数表 split：按因子分组 aggregate：计算各数据子集的概括统计量 tapply：对“不规则”数组应用函数
数学
一、计算
+, -, *, /, ^, %%, %/%：四则运算 ceiling，floor，round，signif，trunc，zapsmall：舍入 max，min，pmax，pmin：最大最小值
range：最大值和最小值 sum，prod：向量元素和，积 cumsum，cumprod，cummax，cummin：累加、累乘 sort：排序 approx和approx fun：插值 diff：差分 sign：符号函数
二、数学函数
abs，sqrt：绝对值，平方根 log, exp, log10, log2：对数与指数函数 sin，cos，tan，asin，acos，atan，atan2：三角函数
sinh，cosh，tanh，asinh，acosh，atanh：双曲函数
beta，lbeta，gamma，lgamma，digamma，trigamma，tetragamma，pentagamma，choose ，lchoose：与贝塔函数、伽玛函数、组合数有关的特殊函数
fft，mvfft，convolve：富利叶变换及卷积 polyroot：多项式求根 poly：正交多项式 spline，splinefun：样条差值
besselI，besselK，besselJ，besselY，gammaCody：Bessel函数 deriv：简单表达式的符号微分或算法微分
三、数组
array：建立数组 matrix：生成矩阵 data.matrix：把数据框转换为数值型矩阵 lower.tri：矩阵的下三角部分 mat.or.vec：生成矩阵或向量 t：矩阵转置
cbind：把列合并为矩阵 rbind：把行合并为矩阵 diag：矩阵对角元素向量或生成对角矩阵 aperm：数组转置 nrow, ncol：计算数组的行数和列数 dim：对象的维向量
dimnames：对象的维名 row/colnames：行名或列名 %*%：矩阵乘法 crossprod：矩阵交叉乘积（内积） outer：数组外积 kronecker：数组的Kronecker积
apply：对数组的某些维应用函数 tapply：对“不规则”数组应用函数 sweep：计算数组的概括统计量aggregate：计算数据子集的概括统计量 scale：矩阵标准化
matplot：对矩阵各列绘图 cor：相关阵或协差阵 Contrast：对照矩阵 row：矩阵的行下标集 col：求列下标集
四、线性代数
solve：解线性方程组或求逆 eigen：矩阵的特征值分解 svd：矩阵的奇异值分解 backsolve：解上三角或下三角方程组 chol：Choleski分解
qr：矩阵的QR分解 chol2inv：由Choleski分解求逆
五、逻辑运算
<，>，<=，>=，==，!=：比较运算符 !，&，&&，|，||，xor()：逻辑运算符 logical：生成逻辑向量 all，any：逻辑向量都为真或存在真
ifelse()：二者择一 match，%in%：查找 unique：找出互不相同的元素 which：找到真值下标集合duplicated：找到重复元素
六、优化及求根
optimize，uniroot，polyroot：一维优化与求根
程序设计
一、控制结构
if，else，ifelse，switch：分支 for，while，repeat，break，next：循环 apply，lapply，sapply，tapply，sweep：替代循环的函数。

二、函数
function：函数定义 source：调用文件 call：函数调用 .C，.Fortran：调用C或者Fortran子程序的动态链接库。

Recall：递归调用
browser，debug，trace，traceback：程序调试 options：指定系统参数 missing：判断虚参是否有对应实参 nargs：参数个数 stop：终止函数执行
on.exit：指定退出时执行 eval，expression：表达式计算 system.time：表达式计算计时 invisible：使变量不显示 menu：选择菜单（字符列表菜单）
其它与函数有关的还有：delay，delete.response，deparse，do.call，dput，environment ，，formals，，interactive，
is.finite，is.function，nguage，is.recursive ，match.arg，match.call，match.fun，model.extract，name，parse，substitute，sys.parent ，warning，machine
三、输入输出
cat，print：显示对象 sink：输出转向到指定文件 dump，save，dput，write：输出对象 scan，read.table，load，dget：读入
四、工作环境
ls，objects：显示对象列表 rm, remove：删除对象 q，quit：退出系统 .First，.Last：初始运行函数与退出运行函数。

options：系统选项 ?，help，help.start，apropos：帮助功能 data：列出数据集
统计计算
一、统计分布
每一种分布有四个函数：d――density（密度函数），p――分布函数，q――分位数函数，r――随机数函数。

比如，正态分布的这四个函数为dnorm，pnorm，qnorm，rnorm。

下面我们列出各分布后缀，前面加前缀d、p、q或r就构成函数名：
norm：正态，t：t分布，f：F分布，chisq：卡方（包括非中心） unif：均匀，exp：指数，weibull：威布尔，gamma：伽玛，beta：贝塔
lnorm：对数正态，logis：逻辑分布，cauchy：柯西， binom：二项分布，geom：几何分布，hyper：超几何，nbinom：负二项，pois：泊松 signrank：符号秩，
wilcox：秩和，tukey：学生化极差
二、简单统计量
sum, mean, var, sd, min, max, range, median, IQR（四分位间距）等为统计量，sort，order，rank
与排序有关，其它还有ave，fivenum，mad，quantile，stem等。

三、统计检验
R中已实现的有chisq.test，prop.test，t.test。

四、多元分析
cor，cov.wt，var：协方差阵及相关阵计算 biplot，biplot.princomp：多元数据biplot图 cancor：典则相关 princomp：主成分分析 hclust：谱系聚类
kmeans：k-均值聚类 cmdscale：经典多维标度其它有dist，mahalanobis，cov.rob。

五、时间序列
ts：时间序列对象 diff：计算差分 time：时间序列的采样时间 window：时间窗
六、统计模型
lm，glm，aov：线性模型、广义线性模型、方差分析。