R语言 如何使用sum函数
在这篇文章中,我们将讨论如何在R编程语言中使用sum()函数。
sum()函数: 用于返回给定数据的总数/总和。
语法:
sum(data)
参数
- data可以是一个向量或一个数据帧
例1:使用sum()函数计算向量元素的总和
在这个方法中,用户只需调用参数为数字向量的sum()函数,它将在R语言中返回函数内所有整数的总和。
语法:
sum(vector_name)
其中,vector_name:用于计算总和的数字向量的名称。
例1 :
在这个例子中,我们将在R语言中找到20个元素的向量中的给定值的总和,从1到20。
# create vector
data=c(1:20)
# get the sum
sum(data)
输出
[1] 210
例2:使用sum()函数来计算数据框列的总和
在这个方法中,为了计算数据框列的总和,用户必须调用sum函数,并将数据框列的名称作为参数传递给它,然后进一步返回给定列中提到的所有整数元素的总和。
语法:
sum(dataframe$column)
其中。
- dataframe:数据框的名称
- column: 数据框架中要计算总和的列的名称
例2 :
在这个例子中,我们将计算数据框架中3列给定值的总和,我们将用R语言分别找出前三列的总和。
# create dataframe with 3 columns
data=data.frame(col1=c(1:20),col2=c(21:40),
col3=c(41:60))
# get the sum of column1
sum(datacol1)
# get the sum of column2
sum(datacol2)
# get the sum of column3
sum(data$col3)
输出
[1] 210
[1] 610
[1] 1010
例3:使用sum()函数计算多列之和
在这种计算多列之和的方法中,用户必须调用sapply()函数,将sum参数输入,并将向量中提到的所需列的名称作为该函数的参数,这将导致在R编程语言中传递给用户的所有多列之和。
语法:
sapply(dataframe[ , c('column1', 'column2',.,'column n)], sum)
例子
在这个例子中,我们将创建一个有3列的数据框架,使用sapply()函数一次找到3列的总和。
# create dataframe with 3 columns
data=data.frame(col1=c(1:20),col2=c(21:40),col3=c(41:60))
# get the sum of three columns
sapply(data[ , c('col1', 'col2','col3')], sum)
输出
col1 col2 col3
210 610 1010
例4:使用sum()函数计算有NA值的向量元素之和
在这个方法中,我们将使用sum()函数来计算给定向量中存在的NA(非数字)值。在这里,用户必须在函数中传递na.rm参数,以去除所有存在的NA值,只计算给定向量中存在的整数之和,此外,这将返回仅存在于给定向量中的所有整数之和。
语法:
sum(vector,na.rm=TRUE)
例子
在这个例子中,我们将首先创建一个有10个元素的向量,其中包括4个NA值,然后在sum()函数和na.rm参数的帮助下,我们将计算向量中的元素之和。
# create a vector
data=c(NA,NA,1,2,3,4,5,6,NA,NA)
# get the sum
sum(data,na.rm=TRUE)
输出
[1] 21
例5:使用sum()函数来计算数据框架的行间总和
在这个方法中,用户需要安装并导入dplyr包,这个包负责向用户提供其功能的访问,然后用户需要将下面给出的suntax与sum函数进行相应的愚弄,以获得行间的和,并使用R编程语言中的mutate()函数将结果存储在另一个新列中。
语法:
data%>%rowwise() %>%mutate(new_column = sum(c(columns)))
其中。
- data是输入数据框
- column是要进行求和操作的列
安装和导入dplyr软件包的语法
install.package("dplyr")
library("dplyr")
例子
在这个例子中,我们将创建一个有3列的数据框架,并使用R语言中的sum和mutate()函数添加第一和第三列。
# load the package
library(dplyr)
# create a dataframe with 3 columns
data=data.frame(col1=c(1:5),col2=c(21:25),col3=c(41:45))
# get sum of first and third column
data%>%rowwise() %>%mutate(Total_Sum = sum(c(col1,col3)))
输出
例6:使用sum()函数来计算各组的列之和
在这个方法中,为了计算数据帧中各列的总和,用户需要安装并导入dplyr包,然后从dplyr包中调用聚合函数,并在其中传递所需的参数,这里通过聚合函数将数据分组到一列,然后用sum()函数在R语言中计算分组后各列的和。
安装和导入dplyr包的语法
install.package("dplyr")
library("dplyr")
语法:
aggregate(dataframecolumn_name, by= list(dataframegroup_column), FUN=sum)
其中
- dataframe是输入的数据框架
- column_name是要获得sum的列
- group_column是要分组的列
- FUN指定sum参数,以获得sum操作
例子
在这个例子中,我们将看到R语言中使用aggregate()函数创建三个列并进行求和操作,以计算各列的组别之和。
# load the package
library(dplyr)
# create a dataframe with 3 columns
data=data.frame(col1=c("java","java","php","python","python"),
col2=c(21:25),col3=c(41:45))
# get sum of third column by group with first column
aggregate(datacol3, by= list(datacol1), FUN=sum)
输出