R语言 计算重复数
在这篇文章中,我们将看到如何在R编程语言中找出重复的数量。
它可以用两种方法完成
- 使用 duplicated() 函数。
- 使用算法。
方法1: 使用 duplicated()
这里我们将使用R语言的Doubleicated()函数和dplyr函数。
办法是
- 在程序中插入 “library(tidyverse) “包。
- 创建一个数据框或一个矢量。
- 使用Doubleicated()函数,检查重复的数据。
语法: duplicated(x)
参数: x。数据框或向量
例1: 在向量中寻找重复的数据。
让我们首先创建一个向量,并找到x中重复元素的位置。
x <- c(1, 1, 4, 5, 4, 6)
duplicated(x)
提取x中的重复元素。
x <- c(1, 1, 4, 5, 4, 6)
duplicated(x)
x[duplicated(x)]
这里我们可以看到所有重复的元素。
例2: 在数据框架中寻找重复的内容。
现在让我们创建一个数据框。
data <- data.frame(
emp_id = c (1,1,2,4,5,6,6),
emp_name = c("Rick","Dan","Michelle",
"Ryan","Gary","x" , "y"))
display(data)
这里我们有一个数据框架,有些项目是重复的,所以我们必须找到这个数据框架中重复的元素。
我们将检查哪一列有重复的数据。
duplicated(data$emp_id)
所以现在在 emp_id 列中找出有多少个重复的元素。
data <- data.frame(
emp_id = c (1, 1, 2, 4, 5, 6, 6),
emp_name = c("Rick", "Dan", "Michelle",
"Ryan", "Gary", "x" , "y"))
duplicated[(data$emp_id), ]
我们可以看到列 emp_id 中所有重复的元素。
方法2: 使用算法。
让我们假设我们有一个带有重复数据的数据框,我们必须找出该数据框中重复的数量。
data <- data.frame(
emp_id = c (1,1,2,4,5,6,6),
emp_name = c("Rick","Dan","Michelle","Ryan","Gary","x" , "y"))
sum(table(data$emp_id)-1)
输出
我们可以清楚地看到我们已经计算出了数据框架中的重复数。