R语言 使用Dplyr获得数据帧的差异
在这篇文章中,我们将讨论如何使用R编程语言中的Dplyr包找到两个数据框架的差异。
集合差异是指从一个数据集中获取或提取另一个数据集中不存在的那些值。为此,Dplyr支持一个名为setdiff()的函数。setdiff()用于返回第一个数据框中存在但在第二个数据框中不存在的数据。
语法:
setdiff(dataframe1,dataframe2)
例1: R程序对第二个数据框和第一个数据框进行setdiff()操作
library(dplyr)
# create dataframe1 with college
# 1 data
data1=data.frame(id=c(1,2,3,4,5),
name=c('sravan','ojaswi','bobby',
'gnanesh','rohith'))
# create dataframe1 with college
# 2 data
data2=data.frame(id=c(1,2,3,4,5,6,7),
name=c('sravan','ojaswi','bobby',
'gnanesh','rohith',
'pinkey','dhanush'))
# set difference of second dataframe
# and first dataframe
print(setdiff(data2,data1))
输出
例2: R程序对第一个数据框架和第二个数据框架进行setdiff()操作
library(dplyr)
# create dataframe1 with college
# 1 data
data1=data.frame(id=c(1,2,3,4,5),
name=c('sravan','ojaswi','bobby',
'gnanesh','rohith'))
# create dataframe1 with college
# 2 data
data2=data.frame(id=c(1,2,3,4,5,6,7),
name=c('sravan','ojaswi','bobby',
'gnanesh','rohith',
'pinkey','dhanush'))
# set difference of first dataframe
# and second dataframe
print(setdiff(data1,data2))
输出