Python Pandas Index.get_duplicates()

Python Pandas Index.get_duplicates()

Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。

Pandas Index.get_duplicates()函数提取重复的索引元素。这个函数返回一个在索引中出现过一次以上的索引元素的排序列表。

语法: Index.get_duplicates()

返回:重复的索引列表。

例子#1:使用Index.get_duplicates()函数来查找索引中所有的重复值。

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', 'Labrador',
                    'Lhasa', 'Husky', 'Beagle'])
  
# Print the Index
idx

输出 :
Python Pandas Index.get_duplicates()

让我们找出索引中所有重复的值。

# print the duplicated values.
idx.get_duplicates()

输出 :
Python Pandas Index.get_duplicates()
正如我们在输出中看到的,Index.get_duplicates()函数已经返回了所有在索引中出现超过一次的值。

例子#2:使用Index.get_duplicates()函数来查找索引中的所有重复。该索引还包含NaN值。

# importing pandas as pd
import pandas as pd
  
# Creating the Index
idx = pd.Index(['Labrador', 'Beagle', None, 'Labrador',
             'Lhasa', 'Husky', 'Beagle', None, 'Koala'])
  
# Print the Index
idx

输出 :
Python Pandas Index.get_duplicates()
正如我们在输出中看到的,我们有一些缺失的值。让我们看看Index.get_duplicates()函数如何处理它们。

# print the duplicate values in Index
idx.get_duplicates()

输出 :
Python Pandas Index.get_duplicates()
多次出现的缺失值已被视为重复值。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程