Python Pandas – 指示除第一次出现以外的重复索引值
要指示除第一次出现以外的重复索引值,请使用 index.duplicated()。 使用值为 first 的 keep 参数。
首先,导入所需的库 −
import pandas as pd
创建具有一些重复的索引−
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])
显示索引 −
print("带有重复项的Pandas索引...\n",index)
标识除第一次出现以外的重复索引值为真。将 “keep” 参数设置为 “first”−
print("\n指示除第一次出现以外的重复值...\n", index.duplicated(keep='first'))
范例
以下是代码-
import pandas as pd
# 创建具有一些重复的索引
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])
# 显示索引
print("带有重复项的Pandas索引...\n",index)
# 返回数据的dtype
print("\n dtype对象...\n",index.dtype)
# 获取数据的维度
print("\n获取尺寸...\n",index.ndim)
# 标识除第一次出现以外的重复索引值为真。将 "keep" 参数设置为 "first"
print("\n指示除第一次出现以外的重复值...\n", index.duplicated(keep='first'))
输出
这将产生以下代码-
带有重复项的Pandas索引...
Index(['Car', 'Bike', 'Airplane', 'Ship', 'Airplane'], dtype='object')
dtype对象...
object
获取尺寸...
1
指示除第一次出现以外的重复值...
[False False False False True]
极客教程