使用通用列合并Pandas dataframe并为不匹配的值设置NaN

要合并两个带有通用列的Pandas DataFrame，请使用 merge() 函数并将 ON 参数设置为列名称。要将NaN设置为不匹配的值，请使用“ how ”参数并将其设置为 left 或 right 。这意味着合并左侧或右侧。

首先，让我们使用别名导入pandas库−

import pandas as pd

让我们创建DataFrame1−

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

让我们创建DataFrame2−

dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

接下来，使用通用列Car合并DataFrame。 “left” 会显示左侧DataFrame的所有值，并在2的不匹配值中设置NaN nd DataFrame−

mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")

示例

以下是代码

import pandas as pd

# 创建DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
   }
)

print("DataFrame1 ...\n",dataFrame1)

# 创建DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

print("\nDataFrame2 ...\n",dataFrame2)

# 使用通用列Car合并DataFrame，并使用“left”在第二个DataFrame中设置NaN以显示左侧DataFrame的所有值
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")
print("\n合并数据带有通用列...\n", mergedRes)

输出

以下是代码 −

DataFrame1 ...
       Car   Units
0      BMW     100
1    Lexus     150
2     Audi     110
3  Mustang      80
4  Bentley     110
5   Jaguar      90

DataFrame2 ...
        Car   Reg_Price
0       BMW        7000
1     Lexus        1500
2     Tesla        5000
3   Mustang        8000
4  Mercedes        9000
5    Jaguar        6000

合并数据带有通用列...
       Car   Units   Reg_Price
0      BMW     100      7000.0
1    Lexus     150      1500.0
2     Audi     110         NaN
3  Mustang      80      8000.0
4  Bentley     110         NaN
5   Jaguar   90      6000.0