连接Pandas数据帧,无重复的数据帧
在这篇文章中,我们将使用pandas模块来连接两个数据帧。
为了对两个数据帧进行连接,我们将使用pandas.concat().drop_duplicates()方法,在pandas模块。
一步一步实现:
- 引入模块
- 加载两个样本数据框作为变量。
- 使用pandas.concat().drop_duplicates()方法将数据帧串联起来。
- 显示生成的新数据框架。
下面是一些例子,描述了如何使用 pandas 模块在两个数据帧之间进行连接,而不出现重复:
示例 1:
# Importing pandas library
import pandas as pd
# loading dataframes
dataframe1 = pd.DataFrame({'columnA': [20, 30, 40],
'columnB': [200, 300, 400]})
dataframe2 = pd.DataFrame({'columnA': [50, 20, 60],
'columnB': [500, 200, 600]})
# Concatenating dataframes without duplicates
new_dataframe = pd.concat([dataframe1, dataframe2]).drop_duplicates()
# Display concatenated dataframe
new_dataframe
输出:
在这里,我们使用pandas.concat()方法将两个数据帧连接起来。
示例 2:
# Importing pandas library
import pandas as pd
# loading dataframes
dataframe1 = pd.DataFrame({'name': ['rahul', 'anjali', 'kajal'],
'age': [23, 28, 30]})
dataframe2 = pd.DataFrame({'name': ['devesh', 'rashi', 'anjali'],
'age': [20, 15, 28]})
# Concatenating two dataframes without duplicates
new_dataframe = pd.concat([dataframe1, dataframe2]).drop_duplicates()
# Resetting index
new_dataframe = new_dataframe.reset_index(drop=True)
# Display dataframe generated
new_dataframe
输出:
如输出图像所示,我们得到的是数据帧的连接,而没有删除重复的数据帧。
示例 3:
# Importing pandas library
import pandas as pd
# Loading dataframes
dataframe1 = pd.DataFrame({'empname': ['rohan', 'hina', 'alisa', ],
'department': ['IT', 'admin', 'finance', ],
'designation': ['Sr.developer', 'administrator', 'executive', ]})
dataframe2 = pd.DataFrame({'empname': ['rishi', 'huma', 'alisa', ],
'department': ['cyber security', 'HR', 'finance', ],
'designation': ['penetration tester', 'HR executive', 'executive', ]})
# Concatenating two dataframes without duplicates
new_dataframe = pd.concat([dataframe1, dataframe2]).drop_duplicates()
# Resetting index
new_dataframe = new_dataframe.reset_index(drop=True)
# Display dataframe generated
new_dataframe
输出:
下面是另一个例子,它描述了如何连接两个数据帧。
例3的输出数据集