如何计算Pandas数据框架中的重复数

如何计算Pandas数据框架中的重复数

让我们看看如何计算Pandas数据框架中的重复项。我们的任务是计算单列和多列中重复条目的数量。

在单列下:我们将使用pivot_table()函数来计算单列中的重复次数。要查找重复的列将作为索引参数的值被传递。aggfunc的值将是’size’。

# importing the module
import pandas as pd
   
# creating the DataFrame
df = pd.DataFrame({'Name' : ['Mukul', 'Rohan', 'Mayank', 
                             'Sundar', 'Aakash'],
                   'Course' : ['BCA', 'BBA', 'BCA', 'MBA', 'BBA'],
                   'Location' : ['Saharanpur', 'Meerut', 'Agra', 
                                 'Saharanpur', 'Meerut']})
  
# counting the duplicates
dups = df.pivot_table(index = ['Course'], aggfunc ='size')
  
# displaying the duplicate Series
print(dups)

输出 :
如何计算Pandas数据框架中的重复数?

跨多列:我们将使用pivot_table()函数来计算跨多列的重复数据。要查找重复的列将作为索引参数的值以列表形式传递。aggfunc的值将是’size’。

# importing the module
import pandas as pd
   
# creating the DataFrame
df = pd.DataFrame({'Name' : ['Mukul', 'Rohan', 'Mayank', 
                             'Sundar', 'Aakash'],
                   'Course' : ['BCA', 'BBA', 'BCA', 'MBA', 'BBA'],
                   'Location' : ['Saharanpur', 'Meerut', 'Agra', 
                                 'Saharanpur', 'Meerut']})
  
# counting the duplicates
dups = df.pivot_table(index = ['Course', 'Location'], aggfunc ='size')
  
# displaying the duplicate Series
print(dups)

输出

如何计算Pandas数据框架中的重复数?

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程