Python Pandas Index.Doubleicated()

Python Pandas Index.Doubleicated()

Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。

Pandas Index.diplicated()函数 显示重复的索引值。重复的值在结果数组中被表示为True值。既可以表示所有的重复值,也可以表示除第一个以外的所有重复值,或者表示除最后出现的重复值以外的所有重复值。

语法: Index.duplicated(keep=’first’)

参数 :
keep : {‘first’, ‘last’, False}, default ‘first’ 。
在一组重复的数值中,要标记为缺失的数值。
**- > ** ‘first’ : 除了第一次出现外,将重复的标记为真。
**- > ** ‘last’ : 除了最后一次出现外,将重复的标记为真。
**- > ** False : 将所有的重复标记为True。

返回: numpy.ndarray

例子#1:使用Index.diplicated()函数来表示Index中除第一个以外的所有重复的值。

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador', 
                      'Lhasa', 'Husky', 'Beagle'])
  
# Print the Index
idx

输出 :
Python Pandas Index.Doubleicated()

让我们看看索引中的一个值是重复的还是唯一的。

# Identify the duplicated values except the first
idx.duplicated(keep ='first')

输出 :
Python Pandas Index.Doubleicated()
正如我们在输出中看到的,Index.diplicated()函数将所有出现的重复值都标记为True,除了第一次出现的。

例子2:使用Index.diplicated()函数来识别所有的重复值。这里所有的重复值将被标记为True

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index([100, 50, 45, 100, 12, 50, None])
  
# Print the Index
idx

输出 :
Python Pandas Index.Doubleicated()

让我们找出索引中所有重复的值。

注意:我们在索引中出现了NaN值。

# Identify all duplicated occurrence of values
idx.duplicated(keep = False)

输出 :
Python Pandas Index.Doubleicated()

该函数将所有重复的值都标记为 “真”。它还将单次出现的NaN值视为唯一值,并将其标记为假。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程