R语言汇总函数

1.tapply()函数用于向量的汇总分析
tapply(x,index,FUN=,……，simplify=）
x：在此对象上应用的函数（通常为向量）
index：因子列表，设置x中的值是如何分组交给FUN去计算的，与x的长度一样
FUN：应用到x中的函数
……：传递给FUN的可选参数
simplify：若simplify=T，且FUN返回标量，那么tapply就返回一个与标量模式一致的数组
若simplify=F，tapply函数返回列表

例子：数据来源与nutshell包
tapply(batting.2008$HR,INDEX=list(batting.2008$teamID),FUN=sum)

此外，tapply函数可以用作多维的统计量
tapply(X=(batting.2008$HR),INDEX=list(batting.2008$lgID,batting.2008$bats),FUN=mean)

2.by()函数用于数据框的汇总分析
by(data, INDICES, FUN, ..., simplify = TRUE)
data:汇总的数据
INDICES:索引
FUN:公式
simplify：
例子：
by(batting.2008[,c("H","2B","3B","HR")],INDICES=list(batting.2008$lgID,batting.2008$bats),FUN=mean)

3.aggregate()函数可以用于数据框，也可用于时间序列
aggregate(x,by,FUN,…)
x:要聚合的对象
by：分组元素列表，长度与x 一样
FUN：标量函数，用于计算总结统计量

aggregate(x,nfrequency=1,FUN=,ndeltat=1,ts.eps=getOption("ts.eps"),…）
nfrequency：每个单位时间内的观察次数
ndeltat：连续观察间的取样间隔比例
ts.eps:判断nfrequency是否是原始频次因数的容忍度

例子：数据框
aggregate(x=batting.2008[,c("AB","H","2B")],by=list(batting.2008$teamID),FUN=mean)

4.rowsum()聚合表格
根据分组变量计算对象中某个变量的总和
rowsum(x,group,reorder=T,…)

5.计数 tabulate 与table
计算某个值的观察结果数，即计算向量中每个值的个数，返回结果就是包含这些计数的向量
tabulate