R语言如何找到数据框架列的平均值

在这篇文章中，我们将讨论如何在R编程语言中计算数据框架列的平均值。

它可以通过不同的方式完成 。

使用 $-Operator
使用[[]]
使用列索引
使用dplyr包的summaryise函数
使用colMeans函数

方法1： 使用 $-Operator。$

这是最简单的方法之一，因为在这种方法中，计算给定的数据框架列的平均值时，只需要调用R语言的内置函数mean函数，并将-operator与要计算平均值的列的名称作为函数的参数传入，作为回报，该函数将返回所提供的带有$-operator的列的平均值。

平均值函数： 该函数的计算方法是将数值之和除以数据系列中的数值数量。

语法: mean(x, trim = 0, na.rm = FALSE, …)

参数。

x是输入向量。
trim用于从排序向量的两端删除一些观测值。
na.rm用于去除输入向量中的缺失值。

例子。

在这个例子中，我们将使用R语言中的mean()函数和$-操作来计算给定数据框架第三列的平均值。

gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
                      x2 = c(8, 4, 5, 1, 2),
                      x3 = c(7, 9, 1, 2, 7))
mean(gfg_data$x3)

输出。

5.2

方法2： 使用[[]]。

在这个方法中，为了计算给定的数据框架列的平均值，用户需要调用mean()函数，作为其参数，用户将使用[[]]并传递要计算平均值的数据框架列的名称，这将以r语言向用户返回提供的数据框架列的平均值。

在这个例子中，我们将使用r语言中的[[]]的mean()函数来计算给定数据框架的第三列的平均数（与前面的例子相同）。

gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
                      x2 = c(8, 4, 5, 1, 2),
                      x3 = c(7, 9, 1, 2, 7))
 
mean(gfg_data[["x3"]])

输出。

5.2

方法3： 使用列索引。

在这种计算方法中，用户需要调用mean函数，并将需要计算平均值的列的索引作为函数的参数传递给用户，这个过程将向用户返回作为参数的列索引的平均值。

在这个例子中，我们将使用r语言中的列索引的mean()函数来计算给定数据框架的第三列的平均值（与前面的例子相同）。

gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
                      x2 = c(8, 4, 5, 1, 2),
                      x3 = c(7, 9, 1, 2, 7))
 
mean(gfg_data[ , 3])

输出。

5.2

方法4： 使用dplyr包的summaryise函数。

在这个方法中，为了计算给定数据框架列的平均值，用户首先需要安装和加载dplyr包，并从该包中调用 summaryise 函数，并将所需的参数传递给该函数，这个过程将导致在函数的参数中返回所提供的列的平均值。

summarise函数： 该函数通常用于分组数据，按照指定的参数工作

语法： summarise(.data, …)

参数。

.data:-一个tbl。所有的主动词都是S3的泛型，并为tbl_df()、dtplyr::tbl_dt()和dbplyr::tbl_dbi()提供方法。
…:-摘要函数的名-值对。名称将是结果中变量的名称。

在这个例子中，我们将使用r语言中dplyr包的summaryise函数来计算给定数据框架的第三列的平均值（与之前的例子相同）。

library("dplyr")    
gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
                      x2 = c(8, 4, 5, 1, 2),
                      x3 = c(7, 9, 1, 2, 7))
 
summarise(gfg_data, gfg_mean = mean(x3))

输出。

  gfg_mean
1      5.2

方法5： 使用colMeans函数。

在这种计算方法中，用户只需要调用colMeans函数，这是R语言中的一个内置函数，并将数据框架作为参数传给用户，然后这将返回所提供数据框架中所有列的平均值。

colMeans()函数： 该函数有助于计算分组变量每一级的数字矩阵类对象的各列的行（加权）平均值。

语法： colmean(M, group = colnames(M), w = FALSE, record = FALSE,na_rm = FALSE, big = TRUE, …)

参数。

M:-数字数据的矩阵、数据帧或向量。允许缺失值。
group:-一个给出分组的向量或因子，M的每一行有一个元素。
w:-一个向量，给出必须应用于原始对象的每个堆叠块的权重。
record:-如果是TRUE，那么结果将按照sort(unique(group))的顺序排列，如果是FALSE（默认），将按照遇到分组的顺序排列。
na_rm:-逻辑的（TRUE或FALSE）。NA（包括NaN）值是否应该被丢弃？
big:-你的对象是否很大，整数可能会溢出。
…:-其他要传递给方法或来自方法的参数。

在这个例子中，我们使用R语言中的colMeans()函数计算给定数据框架第三列的平均值（与前面的例子相同）。

gfg_data = data.frame(x1 = c(1, 2, 3, 4, 5),
                      x2 = c(8, 4, 5, 1, 2),
                      x3 = c(7, 9, 1, 2, 7))
 
colMeans(gfg_data)

输出。