使用通用列合并Pandas dataframe并为不匹配的值设置NaN
要合并两个带有通用列的Pandas DataFrame,请使用 merge() 函数并将 ON 参数设置为列名称。要将NaN设置为不匹配的值,请使用“ how ”参数并将其设置为 left 或 right 。这意味着合并左侧或右侧。
首先,让我们使用别名导入pandas库−
import pandas as pd
让我们创建DataFrame1−
dataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
}
)
让我们创建DataFrame2−
dataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]
}
)
接下来,使用通用列Car合并DataFrame。 “left” 会显示左侧DataFrame的所有值,并在2的不匹配值中设置NaN nd DataFrame−
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")
示例
以下是代码
import pandas as pd
# 创建DataFrame1
dataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 150, 110, 80, 110, 90]
}
)
print("DataFrame1 ...\n",dataFrame1)
# 创建DataFrame2
dataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]
}
)
print("\nDataFrame2 ...\n",dataFrame2)
# 使用通用列Car合并DataFrame,并使用“left”在第二个DataFrame中设置NaN以显示左侧DataFrame的所有值
mergedRes = pd.merge(dataFrame1, dataFrame2, on ='Car', how ="left")
print("\n合并数据带有通用列...\n", mergedRes)
输出
以下是代码 −
DataFrame1 ...
Car Units
0 BMW 100
1 Lexus 150
2 Audi 110
3 Mustang 80
4 Bentley 110
5 Jaguar 90
DataFrame2 ...
Car Reg_Price
0 BMW 7000
1 Lexus 1500
2 Tesla 5000
3 Mustang 8000
4 Mercedes 9000
5 Jaguar 6000
合并数据带有通用列...
Car Units Reg_Price
0 BMW 100 7000.0
1 Lexus 150 1500.0
2 Audi 110 NaN
3 Mustang 80 8000.0
4 Bentley 110 NaN
5 Jaguar 90 6000.0