Python – 通过交集提取两个 Pandas DataFrames 之间的列

Python – 通过交集提取两个 Pandas DataFrames 之间的列

要提取两个DataFrame之间的列,可使用intersection()方法。让我们创建两个DataFrame-.-

# 创建数据帧1
dataFrame1 = pd.DataFrame({"Car": ['Bentley', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Cubic_Capacity": [2000, 1800, 1500, 2500, 2200, 3000],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000],
})

# 创建数据帧2
dataFrame2 = pd.DataFrame({"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Units_Sold": [ 100, 110, 150, 80, 200, 90]
})

提取公共列 –

dataFrame2.columns.intersection(dataFrame1.columns)

实例

下面是完整的代码-

import pandas as pd

# 创建数据帧1
dataFrame1 = pd.DataFrame({"Car": ['Bentley', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Cubic_Capacity": [2000, 1800, 1500, 2500, 2200, 3000],"Reg_Price": [7000, 1500, 5000, 8000, 9000, 6000],
})

print"数据帧1...\n",dataFrame1

# 创建数据帧2
dataFrame2 = pd.DataFrame({"Car": ['BMW', 'Lexus', 'Tesla', 'Mustang', 'Mercedes', 'Jaguar'],"Units_Sold": [ 100, 110, 150, 80, 200, 90]
})

print"数据帧2...\n",dataFrame2

# 使用intersection()获取公共列
res = dataFrame2.columns.intersection(dataFrame1.columns)

print"\n公共列...\n",res

输出

这将产生以下输出 –

数据帧1...
        Car   Cubic_Capacity   Reg_Price
0   Bentley             2000        7000
1     Lexus             1800        1500
2     Tesla             1500        5000
3   Mustang             2500        8000
4  Mercedes             2200        9000
5    Jaguar             3000        6000
数据帧2...
        Car   Units_Sold
0       BMW          100
1     Lexus          110
2     Tesla          150
3   Mustang           80
4  Mercedes          200
5    Jaguar           90

公共列...
Index([u'Car'], dtype='object')

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程