Python Pandas – 返回删除重复值后的索引,仅保留第一次出现的值
要返回删除重复值后仅保留第一次出现的索引,请使用 index.drop_duplicates() 方法。使用值为 first 的 keep 参数。
首先,导入所需的库 −
import pandas as pd
创建具有一些重复值的索引−
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])
显示索引−
print("带有重复项的Pandas索引...\n",index)
返回删除重复值后的索引。 值为“first”的“keep”参数仅保留每组重复条目的第一次出现−
index.drop_duplicates(keep='first')
示例
以下是代码−
import pandas as pd
# 创建具有一些重复值的索引
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])
# 显示索引
print("带有重复项的Pandas索引...\n",index)
# 返回数据的dtype
print("\n数据的dtype对象...\n",index.dtype)
# 获取数据中的字节
print("\n获取字节...\n",index.nbytes)
# 获取数据的维度
print("\n获取维度...\n",index.ndim)
# 返回删除重复值后的索引
# 值为“first”的“keep”参数仅保留每组重复条目的第一次出现
print("\n索引删除重复值(保留第一次出现)...\n",index.drop_duplicates(keep='first'))
输出
这将生成以下代码−
带有重复项的Pandas索引...
Index(['Car', 'Bike', 'Airplane', 'Ship', 'Airplane'], dtype='object')
数据的dtype对象...
object
获取字节...
40
获取维度...
1
索引删除重复值(保留第一次出现)...
Index(['Car', 'Bike', 'Airplane', 'Ship'], dtype='object')