R语言汇总函数

1.tapply()函数用于 向量的汇总分析
tapply(x,index,FUN=,……,simplify=)
x:在此对象上应用的函数(通常为向量)
index:因子列表,设置x中的值是如何分组交给FUN去计算的,与x的长度一样
FUN:应用到x中的函数
……:传递给FUN的可选参数
simplify:若simplify=T,且FUN返回标量,那么tapply就返回一个与标量模式一致的数组
若simplify=F,tapply函数返回列表

例子: 数据来源与nutshell包
tapply(batting.2008$HR,INDEX=list(batting.2008$teamID),FUN=sum)

此外,tapply函数可以用作多维的统计量
tapply(X=(batting.2008$HR),INDEX=list(batting.2008$lgID,batting.2008$bats),FUN=mean)

2.by()函数 用于 数据框的汇总分析
by(data, INDICES, FUN, ..., simplify = TRUE)
data:汇总的数据
INDICES:索引
FUN:公式
simplify:
例子:
by(batting.2008[,c("H","2B","3B","HR")],INDICES=list(batting.2008$lgID,batting.2008$bats),FUN=mean)

3.aggregate()函数 可以用于数据框,也可用于时间序列
aggregate(x,by,FUN,…)
x:要聚合的对象
by:分组元素列表,长度与x 一样
FUN:标量函数,用于计算总结统计量

aggregate(x,nfrequency=1,FUN=,ndeltat=1,ts.eps=getOption("ts.eps"),…)
nfrequency:每个单位时间内的观察次数
ndeltat:连续观察间的取样间隔比例
ts.eps:判断nfrequency是否是原始频次因数的容忍度

例子:数据框
aggregate(x=batting.2008[,c("AB","H","2B")],by=list(batting.2008$teamID),FUN=mean)

4.rowsum()聚合表格
根据分组变量计算对象中某个变量的总和
rowsum(x,group,reorder=T,…)

5.计数 tabulate 与table
计算某个值的观察结果数,即计算向量中每个值的个数,返回结果就是包含这些计数的向量
tabulate








相关主题
相关文档
最新文档