R语言 平均值、中位数和众数
在R中进行统计分析是通过使用许多内置函数来完成的。这些函数大部分都是R基本包的一部分。这些函数以R向量作为输入,并给出结果。
我们在这一章中讨论的函数是平均值、中位数和众数。
平均值
它通过将数值的总和除以数据序列中的数值个数来计算。
在R中,使用函数 mean() 来计算平均值。
语法
在R中计算平均值的基本语法为−
以下是使用的参数的描述−
- x 是输入向量。
-
trim 用于从排序向量的两端删除一些观测值。
-
na.rm 用于从输入向量中删除缺失值。
示例
当我们执行上述代码时,会产生以下结果−
应用截取选项
当提供截取参数时,向量中的值会被排序,然后从计算平均值中删除所需数量的观测值。
当截取值(trim)= 0.3 时,会从计算平均值的过程中删除每一端的3个值。
在这种情况下,排序后的向量为(−21, −5, 2, 3, 4.2, 7, 8, 12, 18, 54),从左侧删除的值为(−21,−5,2),从右侧删除的值为(12,18,54)。
当我们执行上面的代码时,会产生以下结果 –
应用NA选项
如果存在缺失值,mean函数返回NA。
要从计算中排除缺失值,请使用na.rm = TRUE,意为移除NA值。
当我们执行上面的代码时,它会产生以下结果-。
中位数
数据序列中的中间值被称为中位数。在 R 中,我们使用 median() 函数来计算中位数。
语法
R 中计算中位数的基本语法是:
以下是使用的参数的说明:
- x 是输入向量。
-
na.rm 用于从输入向量中去除缺失值。
示例
当我们执行上面的代码时,它会产生以下结果 –
模式
模式是一组数据中出现次数最多的值。与均值和中位数不同,模式可以是数值和字符数据。
R中没有内置函数来计算模式。因此,我们需要创建一个用户函数来计算R中数据集的模式。该函数将向量作为输入,并输出模式值。
示例
当我们执行以上代码时,会产生以下结果 –