Python – 不重复地连接Pandas数据框
要连接数据框,请使用concat()方法,但要忽略重复值,请使用drop_duplicates()方法。
导入所需的库 –
import pandas as pd
创建要连接的数据框 –
# 创建DataFrame1
dataFrame1 = pd.DataFrame(
{
"Car": ['宝马', '捷豹', '奥迪', '野马'],"Units": [100, 150, 110, 80]
}
)
# 创建DataFrame2
dataFrame2 = pd.DataFrame(
{
"Car": ['特斯拉', '捷豹', '奔驰', '野马'],"Units": [120, 150, 180, 80]
}
)
现在,让我们连接DataFrame并去除重复项 –
concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()
例子
下面是代码 –
import pandas as pd
# 创建DataFrame1
dataFrame1 = pd.DataFrame(
{
"Car": ['宝马', '捷豹', '奥迪', '野马'],"Units": [100, 150, 110, 80]
}
)
print"DataFrame1 ...\n",dataFrame1
# 创建DataFrame2
dataFrame2 = pd.DataFrame(
{
"Car": ['特斯拉', '捷豹', '奔驰', '野马'],"Units": [120, 150, 180, 80]
}
)
print"\nDataFrame2 ...\n",dataFrame2
# 连接数据框并去除重复项
concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()
print"\n连接DataFrame并去除重复项...\n", concatRes
输出
这将产生以下输出 –
DataFrame1 ...
Car Units
0 宝马 100
1 捷豹 150
2 奥迪 110
3 野马 80
DataFrame2 ...
Car Units
0 特斯拉 120
1 捷豹 150
2 奔驰 180
3 野马 80
连接DataFrame并去除重复项...
Car Units
0 宝马 100
1 捷豹 150
2 奥迪 110
3 野马 80
0 特斯拉 120
2 奔驰 180
极客教程