Python Pandas 重新索引
重新索引 改变了一个DataFrame的行标签和列标签。 重新索引 意味着使数据与特定轴上的一组标签相匹配。
通过索引可以完成多种操作,比如:
- 对现有的数据进行重新排序,以匹配一组新的标签。
-
在没有标签数据的地方插入缺失值(NA)的标记。
例子
其 输出结果 如下 –
重新索引以与其他对象对齐
你可能希望对一个对象进行重新索引,使其轴线与另一个对象的标示相同。请看下面的例子来理解这一点。
例子
其 输出结果 如下 –
注意 - 在这里, df1 数据框架被改变并像 df2 一样被重新索引 。 列名应该是匹配的,否则将为整个列标添加NAN。
重新索引时的填充
reindex() 需要一个可选的参数方法,这是一个填充方法,其数值如下
- pad/ffill – 向前填充数值
-
bfill/backfill – 向后填充数值
-
nearest – 从最近的索引值开始填充
例子
其 输出结果 如下 –
注意 --最后四行是填充的。
重新索引时填充的限制
limit参数提供了对重新索引时填充的额外控制。限制值指定了连续匹配的最大数量。让我们考虑下面的例子来理解同样的问题:
例子
其 输出结果 如下 –
注意 - 观察一下,只有第7行被前面的第6行填满。然后,这几行就保持原样了。
重命名
rename()方法允许你根据一些映射(dict或Series)或一个任意的函数来重新标记一个轴。
让我们考虑下面的例子来理解这一点
其 输出结果 如下 –
rename()方法提供了一个 inplace 命名的参数,默认为False,并复制底层数据。传递 inplace=True 来重命名原地的数据。