pandas append|极客教程

pandas append

在 Pandas 中，append 函数用于将一个 DataFrame 连接到另一个 DataFrame 的末尾。这个函数能够很方便地将多个数据集进行合并，特别是当数据集的结构相同或者需要进行简单的堆叠时。

append 函数的基本语法如下：

DataFrame.append(other, ignore_index=False, verify_integrity=False, sort=None)

参数说明：

接下来，我们通过一些示例来演示 append 函数的用法。

首先，我们导入 Pandas 库：

import pandas as pd

假设我们有两个简单的 DataFrame，分别是 df1 和 df2：

data1 = {'A': [1, 2], 'B': [3, 4]}
df1 = pd.DataFrame(data1)

data2 = {'A': [5, 6], 'B': [7, 8]}
df2 = pd.DataFrame(data2)

我们可以使用 append 函数将 df2 追加到 df1 的末尾：

result = df1.append(df2)
print(result)

运行结果如下：

在上面的示例中，我们没有设置 ignore_index 参数，默认情况下为 False，这样会保留原始数据集的索引。如果我们想生成新的索引，可以将 ignore_index 设置为 True：

result = df1.append(df2, ignore_index=True)
print(result)

运行结果如下：

如果我们追加的数据集可能存在重复的索引，可以通过将 verify_integrity 参数设置为 True 来检查索引的唯一性。如果索引存在重复，则会抛出异常：

df3 = pd.DataFrame({'A': [9, 10], 'B': [11, 12]}, index=[1, 2])
result = df1.append(df3, verify_integrity=True)
print(result)

运行结果：

ValueError: Index has duplicates.

除了可以追加 DataFrame，append 函数也支持追加 Series：

s = pd.Series([13, 14], index=['A', 'B'], name='C')
result = df1.append(s)
print(result)

运行结果如下：

通过上面的示例，我们了解了在 Pandas 中如何使用 append 函数来连接多个数据集。这个函数能够很方便地进行数据的堆叠和合并，是数据处理中常用的功能之一。在实际应用中，我们可以根据具体需求灵活运用该函数，以实现数据的整合和处理。