pandas append

在 Pandas 中,append 函数用于将一个 DataFrame 连接到另一个 DataFrame 的末尾。这个函数能够很方便地将多个数据集进行合并,特别是当数据集的结构相同或者需要进行简单的堆叠时。
基本语法
append 函数的基本语法如下:
DataFrame.append(other, ignore_index=False, verify_integrity=False, sort=None)
参数说明:
other:要追加的 DataFrame 或 Series。ignore_index:是否忽略索引,如果为 True,则会为新数据集生成一个新的索引。verify_integrity:是否检查索引的唯一性,如果为 True,则会检查新数据集的索引是否唯一。sort:是否对结果数据集进行排序,默认为 None。
示例
接下来,我们通过一些示例来演示 append 函数的用法。
首先,我们导入 Pandas 库:
import pandas as pd
示例 1:追加一个 DataFrame
假设我们有两个简单的 DataFrame,分别是 df1 和 df2:
data1 = {'A': [1, 2], 'B': [3, 4]}
df1 = pd.DataFrame(data1)
data2 = {'A': [5, 6], 'B': [7, 8]}
df2 = pd.DataFrame(data2)
我们可以使用 append 函数将 df2 追加到 df1 的末尾:
result = df1.append(df2)
print(result)
运行结果如下:
A B
0 1 3
1 2 4
0 5 7
1 6 8
示例 2:忽略索引
在上面的示例中,我们没有设置 ignore_index 参数,默认情况下为 False,这样会保留原始数据集的索引。如果我们想生成新的索引,可以将 ignore_index 设置为 True:
result = df1.append(df2, ignore_index=True)
print(result)
运行结果如下:
A B
0 1 3
1 2 4
2 5 7
3 6 8
示例 3:检查索引唯一性
如果我们追加的数据集可能存在重复的索引,可以通过将 verify_integrity 参数设置为 True 来检查索引的唯一性。如果索引存在重复,则会抛出异常:
df3 = pd.DataFrame({'A': [9, 10], 'B': [11, 12]}, index=[1, 2])
result = df1.append(df3, verify_integrity=True)
print(result)
运行结果:
ValueError: Index has duplicates.
示例 4:使用 Series 追加数据
除了可以追加 DataFrame,append 函数也支持追加 Series:
s = pd.Series([13, 14], index=['A', 'B'], name='C')
result = df1.append(s)
print(result)
运行结果如下:
A B
0 1 3
1 2 4
C 13 14
总结
通过上面的示例,我们了解了在 Pandas 中如何使用 append 函数来连接多个数据集。这个函数能够很方便地进行数据的堆叠和合并,是数据处理中常用的功能之一。在实际应用中,我们可以根据具体需求灵活运用该函数,以实现数据的整合和处理。
极客教程