R语言 比较两个数据集
可能会有这样的情况:我们必须比较数据集来做数据分析,这些数据集具有相同的结构,但数据有差异。因此,要确定数据集中有什么变化,并得到一个变化程度的总结。我们可以使用R中的compare包。我们可以很容易地使用这个包来比较两个数据框,并检查出它的变化程度的总结。
函数 comparef() 用于比较R中的两个数据框架。该函数接收两个数据框架,然后检查它们进行比较。
语法: comparedf(dataset1,dataset2)
参数
- dataset1, dataset2: 这是要比较的两个数据集。
此外,我们还可以看到差异的摘要。
语法
summary(comparedf(dat,dat2)
方法
- 导入库
- 我们要简单地创建数据集。
- 将数据集作为参数传给comparef()函数。
- 它将检测出差异(如果有的话)。
- 使用summary方法来检查完整的总结。
例1 :
library(arsenal)
dat <- data.frame(
SSN = c(23,434,565,878,231),
Name=c("hamburgers","butter","cheeze","coffee","teacher"),
Age = c(7,8,6,43,56),
Gender = c(0,1,0,1,0)
)
dat2 <- data.frame(
SSN = c(210,345,456,745,245),
Name=c("fruits","cupcakes","mangoes","toffee","student"),
Number= c(3,5,5,6,77),
Different = c(0,0,1,1,0)
)
summary(comparedf(dat,dat2))
输出
例2 :
library(arsenal)
dat <- data.frame(
Rollnumber = c(1,2,3,4,5),
Name=c("Akash","John","Tina","Kakashi","Brad"),
Age = c(7,8,6,5,7),
Marks = c(78,98,76,67,89)
)
dat2 <- data.frame(
Rollnumber = c(1,2,3,4,5),
Name=c("Akash","John","Tina","Kakashi","Brad"),
Age = c(7,9,6,7,8),
Marks= c(78,98,56,87,67)
)
comparedf(dat,dat2)
输出