R语言 如何找到数据框架列的平均值
在这篇文章中,我们将讨论如何在R编程语言中计算数据框架列的平均值。
它可以通过不同的方式完成 。
- 使用 $-Operator
- 使用[[]]
- 使用列索引
- 使用dplyr包的summaryise函数
- 使用colMeans函数
方法1: 使用-Operator。
这是最简单的方法之一,因为在这种方法中,计算给定的数据框架列的平均值时,只需要调用R语言的内置函数mean函数,并将-operator与要计算平均值的列的名称作为函数的参数传入,作为回报,该函数将返回所提供的带有$-operator的列的平均值。
平均值函数: 该函数的计算方法是将数值之和除以数据系列中的数值数量。
语法: mean(x, trim = 0, na.rm = FALSE, …)
参数 。
- x是输入向量。
- trim用于从排序向量的两端删除一些观测值。
- na.rm用于去除输入向量中的缺失值。
例子 。
在这个例子中,我们将使用R语言中的mean()函数和$-操作来计算给定数据框架第三列的平均值。
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
x2 = c(8, 4, 5, 1, 2),
x3 = c(7, 9, 1, 2, 7))
mean(gfg_data$x3)
输出 。
5.2
方法2: 使用[[]]。
在这个方法中,为了计算给定的数据框架列的平均值,用户需要调用mean()函数,作为其参数,用户将使用[[]]并传递要计算平均值的数据框架列的名称,这将以r语言向用户返回提供的数据框架列的平均值。
在这个例子中,我们将使用r语言中的[[]]的mean()函数来计算给定数据框架的第三列的平均数(与前面的例子相同)。
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
x2 = c(8, 4, 5, 1, 2),
x3 = c(7, 9, 1, 2, 7))
mean(gfg_data[["x3"]])
输出 。
5.2
方法3: 使用列索引。
在这种计算方法中,用户需要调用mean函数,并将需要计算平均值的列的索引作为函数的参数传递给用户,这个过程将向用户返回作为参数的列索引的平均值。
在这个例子中,我们将使用r语言中的列索引的mean()函数来计算给定数据框架的第三列的平均值(与前面的例子相同)。
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
x2 = c(8, 4, 5, 1, 2),
x3 = c(7, 9, 1, 2, 7))
mean(gfg_data[ , 3])
输出 。
5.2
方法4: 使用dplyr包的summaryise函数。
在这个方法中,为了计算给定数据框架列的平均值,用户首先需要安装和加载dplyr包,并从该包中调用 summaryise 函数,并将所需的参数传递给该函数,这个过程将导致在函数的参数中返回所提供的列的平均值。
summarise函数: 该函数通常用于分组数据,按照指定的参数工作
语法: summarise(.data, …)
参数。
- .data:-一个tbl。所有的主动词都是S3的泛型,并为tbl_df()、dtplyr::tbl_dt()和dbplyr::tbl_dbi()提供方法。
- …:-摘要函数的名-值对。名称将是结果中变量的名称。
在这个例子中,我们将使用r语言中dplyr包的summaryise函数来计算给定数据框架的第三列的平均值(与之前的例子相同)。
library("dplyr")
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
x2 = c(8, 4, 5, 1, 2),
x3 = c(7, 9, 1, 2, 7))
summarise(gfg_data, gfg_mean = mean(x3))
输出 。
gfg_mean
1 5.2
方法5: 使用colMeans函数。
在这种计算方法中,用户只需要调用colMeans函数,这是R语言中的一个内置函数,并将数据框架作为参数传给用户,然后这将返回所提供数据框架中所有列的平均值。
colMeans()函数: 该函数有助于计算分组变量每一级的数字矩阵类对象的各列的行(加权)平均值。
语法: colmean(M, group = colnames(M), w = FALSE, record = FALSE,na_rm = FALSE, big = TRUE, …)
参数。
- M:-数字数据的矩阵、数据帧或向量。允许缺失值。
- group:-一个给出分组的向量或因子,M的每一行有一个元素。
- w:-一个向量,给出必须应用于原始对象的每个堆叠块的权重。
- record:-如果是TRUE,那么结果将按照sort(unique(group))的顺序排列,如果是FALSE(默认),将按照遇到分组的顺序排列。
- na_rm:-逻辑的(TRUE或FALSE)。NA(包括NaN)值是否应该被丢弃?
- big:-你的对象是否很大,整数可能会溢出。
- …:-其他要传递给方法或来自方法的参数。
在这个例子中,我们使用R语言中的colMeans()函数计算给定数据框架第三列的平均值(与前面的例子相同)。
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
x2 = c(8, 4, 5, 1, 2),
x3 = c(7, 9, 1, 2, 7))
colMeans(gfg_data)
输出 。
X1 3
X2 4
X3 5.2