Python Pandas 重新索引
重新索引 可以更改DataFrame的行标签和列标签。重新索引意味着将数据调整为与给定的一组标签相匹配。
索引可以通过多种操作来实现,例如:
- 重新排序现有数据以匹配新的标签集。
- 在标签位置上插入缺失值(NA),以对应没有该标签的数据。
示例
它的 输出 如下:
重新索引以与其他对象对齐
您可能希望将一个对象的轴重新索引,使其标签与另一个对象相同。请考虑以下示例以更好地理解。
示例
它的输出如下所示:
注意 - 这里,DataFrame df1 被修改并像 df2 一样重新索引。列名应匹配,否则会为整个列标签添加 NAN。
在重新索引时填充
reindex() 可以接受一个可选参数 method,它是一种填充方法,取值如下:
- pad/ffill - 前向填充值
-
bfill/backfill - 后向填充值
-
nearest - 从最近的索引值填充
示例
它的 输出 如下所示−
注意 - 最后四行是填充的。
重新索引时填充的限制
limit参数在重新索引时提供了更多的填充控制。limit指定连续匹配的最大计数。让我们通过以下示例来理解:
示例
它的 输出 如下:
注意 −注意,只有第7行由前面的第6行填充。然后,行保持不变。
重命名
rename()方法允许你基于某个映射(字典或Series)或任意函数来重新标记一个轴。
让我们考虑以下示例来了解这个。
它的 输出 如下所示:
rename()方法提供了一个名为 inplace 的参数,默认为False,会复制底层数据。将 inplace=True 传递给该方法,可以原地重命名数据。