Python Pandas – 返回去掉重复值的索引,只保留最后一次出现的值
要返回去掉重复值的索引,只保留最后一次出现的值,请使用 index.drop_duplicates() 方法。使用 keep 参数,并将其值设为 last 。
首先,导入所需的库−
import pandas as pd
创建一些包含重复值的索引−
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])
显示索引−
print("具有重复值的 Pandas 索引...\n",index)
返回去掉重复值的索引。”keep” 参数的值为 “last”,表示每组重复项中只保留最后一次出现的值−
print("\n去掉重复值的索引(只保留最后一次出现的值)...\n",index.drop_duplicates(keep='last'))
示例
下面是代码−
import pandas as pd
# 创建一些包含重复值的索引
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])
# 显示索引
print("具有重复值的 Pandas 索引...\n",index)
# 返回数据类型
print("\n数据类型...\n",index.dtype)
# 获取数据的字节数
print("\n获取数据的字节数...\n",index.nbytes)
# 获取数据的尺寸
print("\n获取数据的尺寸...\n",index.ndim)
# 返回去掉重复值的索引
# "keep" 参数的值为 "last",表示每组重复项中只保留最后一次出现的值
print("\n去掉重复值的索引(只保留最后一次出现的值)...\n",index.drop_duplicates(keep='last'))
输出结果
这将生成以下代码−
具有重复值的 Pandas 索引...
Index(['Car', 'Bike', 'Airplane', 'Ship', 'Airplane'], dtype='object')
数据类型...
object
获取数据的字节数...
40
获取数据的尺寸...
1
去掉重复值的索引(只保留最后一次出现的值)...
Index(['Car', 'Bike', 'Ship', 'Airplane'], dtype='object')