Pandas 合并两个行数相同的数据集

在本文中，我们将介绍如何使用Pandas将两个行数相同的数据集合并成一个。

背景

在实际工作和研究中，经常需要将两个数据集中的相关数据合并到一起进行分析。当两个数据集中的行数相同时，我们可以使用Pandas的merge函数将它们合并。

步骤

1. 导入需要的库和数据集

在使用merge函数之前，我们需要先导入需要的库和数据集。在本文中，我们将使用以下数据集：

import pandas as pd

# 创建数据集1
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'C': ['C0', 'C1', 'C2', 'C3'],
                    'D': ['D0', 'D1', 'D2', 'D3']})

# 创建数据集2
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
                    'B': ['B4', 'B5', 'B6', 'B7'],
                    'C': ['C4', 'C5', 'C6', 'C7'],
                    'D': ['D4', 'D5', 'D6', 'D7']})

这里我们创建了两个包含四行四列的数据集，它们具有相同的列名和行数。

2. 使用`merge`函数合并数据集

Pandas的merge函数可以根据某列（或多列）的值将两个数据集中的行连接起来。例如，我们可以使用merge函数将上面的两个数据集按列A连接起来。

merged_df = pd.merge(df1, df2, on='A')

这里我们将数据集df1和df2按列A连接起来，存储到一个新的数据集merged_df中。

3. 查看合并结果

现在，我们可以查看合并后的结果，来确认合并操作是否正确。

print(merged_df)

输出结果为：

    A   B_x   C_x   D_x   B_y   C_y   D_y
0  A4    B4    C4    D4    B4    C4    D4
1  A5    B5    C5    D5    B5    C5    D5
2  A6    B6    C6    D6    B6    C6    D6
3  A7    B7    C7    D7    B7    C7    D7