Pandas 合并两个 DataFrame
参考:pandas concat two dataframes
Pandas 是一个强大的 Python 数据分析库,它提供了大量的功能来操作和分析数据。在数据分析的过程中,经常需要将不同的数据集合并在一起,以便进行更全面的分析。本文将详细介绍如何使用 Pandas 的 concat
函数来合并两个 DataFrame。
1. Pandas concat
函数简介
concat
函数是 Pandas 中用于合并两个或多个 pandas 对象的主要函数之一。该函数不仅可以合并行,也可以合并列,非常灵活。基本语法如下:
objs
: 一个序列或映射,这里是要合并的 DataFrame 或 Series。axis
: {0/’index’, 1/’columns’},默认为 0。如果是 0,将在索引(行)上进行合并;如果是 1,则在列上进行合并。join
: {‘inner’, ‘outer’},默认为 ‘outer’。指定合并的方式,外连接或内连接。ignore_index
: 布尔值,默认为 False。如果为 True,则不使用索引值,而是创建一个新的索引。keys
: 序列,默认为 None。如果传递了序列,则创建一个多级索引(层次化索引)。verify_integrity
: 布尔值,默认为 False。检查新连接的轴是否包含重复项。sort
: 布尔值,默认为 False。在合并时根据非连接轴排序。
2. 示例代码
示例 1: 基本的行合并
Output:
示例 2: 使用 ignore_index
选项
Output:
示例 3: 列合并
Output:
示例 4: 使用 keys
创建多级索引
Output:
示例 5: 内连接
Output:
示例 6: 检查合并后的数据完整性
示例 7: 排序非连接轴
Output:
示例 8: 复制数据
Output:
示例 9: 使用自定义索引
Output:
示例 10: 合并具有不同列的 DataFrame
Output:
示例 11: 合并时保留原有 DataFrame 的索引
Output:
示例 12: 创建多级列索引
Output:
示例 13: 合并时使用不同的连接方式
Output:
以上示例展示了如何使用 Pandas 的 concat
函数来合并两个 DataFrame。通过不同的参数设置,可以实现多种数据合并的需求,从而为数据分析提供更多的灵活性和功能。