合并Python Pandas dataframe并将不匹配的值设置为NaN

合并Python Pandas dataframe并将不匹配的值设置为NaN

要合并具有公共列的两个Pandas DataFrame,请使用 merge() 函数,并将 ON 参数设置为列名。要将不匹配的值设置为NaN,请使用“ how ”参数,并将其设置为 leftright 。这意味着合并左边或右边。

首先,让我们使用别名导入pandas库 –

import pandas as pd

让我们创建DataFrame1 –

dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],
      "Units": [100, 150, 110, 80, 110, 90]
   }
)

让我们创建DataFrame2 –

dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],
      "Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

现在,使用共同的Car列合并DataFrame。 “left” 显示左侧DataFrame的所有值,并为第二个DataFrame中不匹配的值设置NaN –

mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")

示例

以下是代码 –

import pandas as pd

# 创建DataFrame1
dataFrame1 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],
      "Units": [100, 150, 110, 80, 110, 90]
   }
)

print"DataFrame1 ...\n",dataFrame1

# 创建DataFrame2
dataFrame2 = pd.DataFrame(
   {
      "Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],
      "Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]

   }
)

print"\nDataFrame2 ...\n",dataFrame2

# 使用公共列Car合并DataFrame,并将“left”设置为第二个DataFrame中不匹配的值的NaN
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")
print"\nMerged data frame with common column...\n", mergedRes

输出

以下是代码 –

DataFrame1 ...
       Car Units
0     BMW   100
1   Lexus   150
2    Audi   110
3 Mustang    80
4 Bentley   110
5  Jaguar    90

DataFrame2 ...
       Car Reg_Price
0     BMW      7000
1   Lexus      1500
2   Tesla      5000
3 Mustang      8000
4 Mercedes     9000
5  Jaguar      6000

Merged data frame with common column...
       Car Units Reg_Price
0     BMW  100    7000.0
1   Lexus  150    1500.0
2    Audi  110    NaN
3 Mustang  80     8000.0
4 Bentley  110    NaN
5  Jaguar   90    6000.0

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程