R语言 结合两个具有不同列的数据框架
在这篇文章中,我们将讨论如何在R编程语言中结合两个不同列的数据框架。
方法1:使用plyr包
R语言中的 “plyr “包是用来处理数据的,包括其增强和操作。它可以通过以下命令加载并安装到工作空间。
install.packages(“plyr”)
R中的rbind.fill()方法是基础R中rbind()方法的增强版,用于组合具有不同列的数据框架。在输入的数据框架中,列名和编号可能是不同的。相应的数据框架中的缺失列用NA填充。只有当某一列出现在任何一个数据框中时,输出数据框才包含该列。
语法
rbind.fill( df1, df2)
以下属性由rbind.fill()方法维护。
- 数据框是按照函数中指定的顺序附加的。
- 列的总数相当于两个数据框的列数之和。
- 行的总数相当于两个数据框的行数之和。
- 列的出现是按照函数调用时数据框架参数声明的顺序。
- 在缺少的列中会创建空单元。
例子
输出
方法2:使用dplyr包
R语言中的 “dplyr “包是用来处理数据的,包括对其进行增强和操作。它可以通过以下命令加载并安装到工作空间中。
install.packages("dplyr")
bind_rows()方法是用来组合具有不同列的数据框架。在输入的数据框架中,列的名称和数量可能是不同的。相应的数据框架中缺失的列用NA来填充。只有当某一列出现在任何一个数据框中时,输出数据框才会包含该列。
语法
bind_rows(df1, df2)
以下属性由bind_rows()方法维护。
- 数据框是按照函数中的说明顺序添加的。
- 列的总数等同于两个数据框架中列数的总和。
- 行的总数相当于两个数据框的行数之和。
例子
输出
如果任何一个列名在两个输入数据框架中都是相同的,那么就会遇到以下属性。
- 公共列的类别在两个数据框架中应该是相同的,否则会遇到一个错误。
- 在这种情况下,输出数据框中的列的总数应相当于输入列总数减去相交的列。
例子
输出