Pandas 重新索引(Reindexing),重新索引会更改DataFrame的行标签和列标签。重新索引意味着符合数据以匹配特定轴上的一组给定的标签。
可以通过索引来实现多个操作
- 重新排序现有数据以匹配一组新的标签。
- 在没有标签数据的标签位置插入缺失值(NA)标记。
执行结果如下:
重建索引与其他对象对齐
有时可能希望采取一个对象和重新索引,其轴被标记为与另一个对象相同。 考虑下面的例子来理解这一点。
执行结果如下:
注意 – 在这里,
df1
数据帧(DataFrame)被更改并重新编号,如df2
。 列名称应该匹配,否则将为整个列标签添加NAN
。
重建索引时的填充方法
reindex()
采用可选参数方法,它是一个填充方法,其值如下:
pad/ffill
– 向前填充值bfill/backfill
– 向后填充值nearest
– 从最近的索引值填充
执行结果如下:
注 – 最后四行被填充了。
重建索引时的填充限制
限制参数在重建索引时提供对填充的额外控制。限制指定连续匹配的最大计数。看看下面的例子来理解这个概念:
执行结果如下:
注意 – 只有第
7
行由前6
行填充,然后,其它行按原样保留。
重命名
rename()
方法允许基于一些映射(字典或者Series
)或任意函数来重新标记一个轴。看看下面的例子来理解这一概念:
执行结果如下:
rename()
方法提供了一个inplace
命名参数,默认为False
并复制底层数据。 指定传递inplace = True
则表示将数据重命名。