Python Pandas – 返回去掉重复值的索引，只保留最后一次出现的值

要返回去掉重复值的索引，只保留最后一次出现的值，请使用 index.drop_duplicates() 方法。使用 keep 参数，并将其值设为 last 。

首先，导入所需的库−

import pandas as pd

创建一些包含重复值的索引−

index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])

显示索引−

print("具有重复值的 Pandas 索引...\n",index)

返回去掉重复值的索引。”keep” 参数的值为 “last”，表示每组重复项中只保留最后一次出现的值−

print("\n去掉重复值的索引（只保留最后一次出现的值）...\n",index.drop_duplicates(keep='last'))

示例

下面是代码−

import pandas as pd

# 创建一些包含重复值的索引
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])

# 显示索引
print("具有重复值的 Pandas 索引...\n",index)

# 返回数据类型
print("\n数据类型...\n",index.dtype)

# 获取数据的字节数
print("\n获取数据的字节数...\n",index.nbytes)

# 获取数据的尺寸
print("\n获取数据的尺寸...\n",index.ndim)

# 返回去掉重复值的索引

# "keep" 参数的值为 "last"，表示每组重复项中只保留最后一次出现的值
print("\n去掉重复值的索引（只保留最后一次出现的值）...\n",index.drop_duplicates(keep='last'))

输出结果

这将生成以下代码−

具有重复值的 Pandas 索引...
Index(['Car', 'Bike', 'Airplane', 'Ship', 'Airplane'], dtype='object')

数据类型...
object

获取数据的字节数...
40

获取数据的尺寸...
1

去掉重复值的索引（只保留最后一次出现的值）...
Index(['Car', 'Bike', 'Ship', 'Airplane'], dtype='object')