R语言 如何按组求和一个变量
在这篇文章中,让我们讨论一下如何在R编程语言中按组查找变量的总和。
使用中的数据集
表-1
预期的输出
按类别分组
办法
- 创建数据框架
- 为所需参数设置值
- 传递给正在使用的函数
- 显示数据框架
方法1:使用聚合函数
在这个方法中,我们将借助于聚合函数,按组求和。聚合函数将数据分割成子集,计算每个子集的汇总统计,并以一种方便的形式返回结果。
语法:
aggregate(x = dataset_Name , by = group_list, FUN = any_function) # aggregate函数的基本R语法
例子
GFG <- data.frame(
Category = c ("A","B","C","B","C","A","C","A","B"),
Frequency= c(9,5,0,2,7,8,1,3,7)
)
aggregate(x= GFGFrequency,
by = list(GFGCategory),
FUN = sum)
输出
方法2:使用dplyr
dplyr是一个软件包,它提供了一套在R中有效操作数据集的工具。
dplyr包中的方法
- mutate() 添加新的变量,这些变量是现有变量的函数。
- select() 根据变量的名称来挑选变量。
- filter() 根据其数值挑选案例。
- summarise() 将多个值缩减为一个单一的摘要。
- arrange() 改变行的顺序。
在使用这个包之前,你必须先安装它
程序
library("dplyr")
GFG <- data.frame(
Category = c ("A","B","C","B","C","A","C","A","B"),
Frequency= c(9,5,0,2,7,8,1,3,7)
)
GFG%>%
group_by(Category) %>%
summarise_at(vars(Frequency),
list(name = sum))
输出