R语言 计算重复数

R语言 计算重复数

在这篇文章中,我们将看到如何在R编程语言中找出重复的数量。

它可以用两种方法完成

  • 使用 duplicated() 函数。
  • 使用算法。

方法1: 使用 duplicated()

这里我们将使用R语言的Doubleicated()函数和dplyr函数。

办法是

  • 在程序中插入 “library(tidyverse) “包。
  • 创建一个数据框或一个矢量。
  • 使用Doubleicated()函数,检查重复的数据。

语法: duplicated(x)

参数: x。数据框或向量

例1: 在向量中寻找重复的数据。

让我们首先创建一个向量,并找到x中重复元素的位置。

x <- c(1, 1, 4, 5, 4, 6)
  
duplicated(x)
R

计算R语言中的重复数

提取x中的重复元素。

x <- c(1, 1, 4, 5, 4, 6)
  
duplicated(x)
x[duplicated(x)]
R

计算R语言中的重复数

这里我们可以看到所有重复的元素。

例2: 在数据框架中寻找重复的内容。

现在让我们创建一个数据框。

data <- data.frame(
  emp_id = c (1,1,2,4,5,6,6),  
  emp_name = c("Rick","Dan","Michelle",
               "Ryan","Gary","x" , "y"))
  
display(data)
R

计算R语言中的重复数

这里我们有一个数据框架,有些项目是重复的,所以我们必须找到这个数据框架中重复的元素。

我们将检查哪一列有重复的数据。

duplicated(data$emp_id)
R

计算R语言中的重复数

所以现在在 emp_id 列中找出有多少个重复的元素。

data <- data.frame(
  emp_id = c (1, 1, 2, 4, 5, 6, 6),  
  emp_name = c("Rick", "Dan", "Michelle",
               "Ryan", "Gary", "x" , "y"))
  
duplicated[(data$emp_id), ]
R

计算R语言中的重复数

我们可以看到列 emp_id 中所有重复的元素。

方法2: 使用算法。

让我们假设我们有一个带有重复数据的数据框,我们必须找出该数据框中重复的数量。

data <- data.frame(
  emp_id = c (1,1,2,4,5,6,6),  
  emp_name = c("Rick","Dan","Michelle","Ryan","Gary","x" , "y"))
  
sum(table(data$emp_id)-1)
R

输出

计算R语言中的重复数

我们可以清楚地看到我们已经计算出了数据框架中的重复数。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册