使用Pandas将多对一的关系合并DataFrame
要合并Pandas DataFrame,请使用 merge() 函数。通过在merge()函数的“ validate ”参数下设置,可以在两个数据集上实现many-to-one关系,即−
validate = “many-to-one”
or
validate = “m:1”
many-to-one关系检查右侧数据集中合并键是否唯一。
首先,让我们创建第1个DataFrame−
dataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 110, 80, 110, 90]
}
)
现在,让我们创建第2个DataFrame−
dataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]
}
)
示例
以下是代码−
#
#使用many-to-one关系合并Pandas DataFrame
#
import pandas as pd
#创建DataFrame1
dataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],"Units": [100, 110, 80, 110, 90]
}
)
print("DataFrame1 ...\n",dataFrame1)
#创建DataFrame2
dataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]
}
)
print("\nDataFrame2 ...\n",dataFrame2)
# 在“validate”参数中使用“many-to-one”合并数据集
mergedRes = pd.merge(dataFrame1, dataFrame2, validate ="many_to_one")
print("\n使用多对一关系合并的数据帧...\n", mergedRes)
输出
这将产生以下输出−
DataFrame1 ...
Car Units
0 BMW 100
1 Audi 110
2 Mustang 80
3 Bentley 110
4 Jaguar 90
DataFrame2 ...
Car Reg_Price
0 BMW 7000
1 Lexus 1500
2 Tesla 5000
3 Mustang 8000
4 Mercedes 9000
5 Jaguar 6000
使用多对一关系合并的数据帧...
Car Units Reg_Price
0 BMW 100 7000
1 Mustang 80 8000
2 Jaguar 90 6000
极客教程