Python – 不重复地连接Pandas数据框

Python – 不重复地连接Pandas数据框

要连接数据框,请使用concat()方法,但要忽略重复值,请使用drop_duplicates()方法。

导入所需的库 –

import pandas as pd

创建要连接的数据框 –

# 创建DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['宝马', '捷豹', '奥迪', '野马'],"Units": [100, 150, 110, 80]
   }
)

# 创建DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['特斯拉', '捷豹', '奔驰', '野马'],"Units": [120, 150, 180, 80]

   }
)

现在,让我们连接DataFrame并去除重复项 –

concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()

例子

下面是代码 –

import pandas as pd

# 创建DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['宝马', '捷豹', '奥迪', '野马'],"Units": [100, 150, 110, 80]
   }
)

print"DataFrame1 ...\n",dataFrame1

# 创建DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['特斯拉', '捷豹', '奔驰', '野马'],"Units": [120, 150, 180, 80]

   }
)

print"\nDataFrame2 ...\n",dataFrame2

# 连接数据框并去除重复项
concatRes = pd.concat([dataFrame1, dataFrame2]).drop_duplicates()
print"\n连接DataFrame并去除重复项...\n", concatRes

输出

这将产生以下输出 –

DataFrame1 ...
       Car   Units
0      宝马     100
1     捷豹     150
2      奥迪     110
3     野马      80

DataFrame2 ...
        Car   Units
0     特斯拉     120
1     捷豹     150
2    奔驰     180
3     野马      80

连接DataFrame并去除重复项...
        Car   Units
0       宝马     100
1     捷豹     150
2      奥迪     110
3     野马      80
0     特斯拉     120
2    奔驰     180

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程