Python Pandas – 指示除第一次出现以外的重复索引值

要指示除第一次出现以外的重复索引值，请使用 index.duplicated（）。 使用值为 first 的 keep 参数。

首先，导入所需的库 −

import pandas as pd

创建具有一些重复的索引−

index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])

显示索引 −

print("带有重复项的Pandas索引...\n",index)

标识除第一次出现以外的重复索引值为真。将 “keep” 参数设置为 “first”−

print("\n指示除第一次出现以外的重复值...\n", index.duplicated(keep='first'))

范例

以下是代码-

import pandas as pd

# 创建具有一些重复的索引
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])

# 显示索引
print("带有重复项的Pandas索引...\n",index)

# 返回数据的dtype
print("\n dtype对象...\n",index.dtype)

# 获取数据的维度
print("\n获取尺寸...\n",index.ndim)

# 标识除第一次出现以外的重复索引值为真。将 "keep" 参数设置为 "first"
print("\n指示除第一次出现以外的重复值...\n", index.duplicated(keep='first'))

输出

这将产生以下代码-

带有重复项的Pandas索引...
Index(['Car', 'Bike', 'Airplane', 'Ship', 'Airplane'], dtype='object')

 dtype对象...
object

获取尺寸...
1

指示除第一次出现以外的重复值...
[False False False False True]