R语言 使用Dplyr删除重复行
在这篇文章中,我们将使用Dplyr包在R编程语言中删除重复的行。
方法1: distinct()
该函数用于移除数据框中的重复行,并获得唯一的数据
语法
distinct(dataframe)
我们也可以根据数据框架中的多列/变量来移除重复的行
语法
distinct(dataframe,column1,column2,. , column n)
使用中的数据集
例1: R程序从数据框中移除重复的行
输出
例2: 基于单列删除重复的行
输出
例3: 基于多列删除重复的行
输出
方法2:使用 duplicated() 函数
duplicated()函数将返回重复的行,而!Doubleicated()函数将返回唯一的行。
语法
dataframe[! duplicated(dataframe$column_name), ]
这里,dataframe是输入的数据框架,column_name是数据框架中的列,基于该列,重复的数据被移除。
例子: R程序基于特定的列删除重复的数据
输出
方法3:使用unique()函数
unique()函数用于通过返回唯一的数据来删除重复的行。
语法
unique(dataframe)
要从列中获得唯一的数据,请将列的名称与数据框架的名称一起传递。
语法
unique(dataframe$column_name)
其中,dataframe是输入数据框架,column_name是数据框架中的列。
例1: 使用unique()函数去除重复的R程序
输出
例2: R程序删除特定列中的重复内容
输出