使用Python Pandas合并带有标识值的DataFrame
要合并Pandas DataFrame,请使用 merge ()函数。在该函数中,可以将参数 indicator 设置为 True 或 False 。如果要检查哪个DataFrame具有特定记录,则使用−
indicator = True
如上所示,使用以上参数为True,将向输出DataFrame添加名为“_merge”的列。
首先,让我们导入带有别名的pandas库−
import pandas as pd
让我们创建DataFrame1−
dataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],
"Units": [100, 150, 110, 80, 110, 90]
}
)
创建DataFrame2−
dataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],
"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]
}
)
现在,使用值为True的指示器合并DataFrame−
#合并DataFrame与指示器值
mergedRes = pd.merge(dataFrame1, dataFrame2, how = "left", indicator=True)
示例
以下是代码−
import pandas as pd
# 创建DataFrame1
dataFrame1 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Audi', 'Mustang', 'Bentley', 'Jaguar'],
"Units": [100, 150, 110, 80, 110, 90]
}
)
print"DataFrame1 ...\n",dataFrame1
# 创建DataFrame2
dataFrame2 = pd.DataFrame(
{
"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],
"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000]
}
)
print"\nDataFrame2 ...\n",dataFrame2
# 合并DataFrame与指示器值
mergedRes = pd.merge(dataFrame1, dataFrame2, how = "left", indicator=True)
print"\n合并后的DataFrame...\n", mergedRes
输出
这将产生以下输出。这里,“both”“在“_merge中显示,表示该值存在于两个DataFrame中−
DataFrame1 ...
Car Units
0 BMW 100
1 Lexus 150
2 Audi 110
3 Mustang 80
4 Bentley 110
5 Jaguar 90
DataFrame2 ...
Car Reg_Price
0 BMW 7000
1 Lexus 1500
2 Tesla 5000
3 Mustang 8000
4 Mercedes 9000
5 Jaguar 6000
合并后的DataFrame...
Car Units Reg_Price _merge
0 BMW 100 7000.0 both
1 Lexus 150 1500.0 both
2 Audi 110 NaN left_only
3 Mustang 80 8000.0 both
4 Bentley 110 NaN left_only
5 Jaguar 90 6000.0 both
极客教程