Python Pandas Series.nunique()

Python Pandas Series.nunique()

Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。

在分析数据的时候,很多时候,用户希望看到某一列的唯一值。Pandas nunique()被用来获取唯一值的数量。

要下载所用的CSV文件,请点击这里 。

语法: Series.nunique(dropna=True)

参数:
dropna:如果为真,则排除NULL值

返回类型: 整数 – 一列中唯一值的数量。

示例 #1: 使用 nunique()
在这个例子中,nunique()方法被用来获取团队列中所有唯一值的数量。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv")
  
# storing unique value in a variable
unique_value = data["Team"].nunique()
  
# printing value
print(unique_value)

输出:
返回唯一值数量的输出。

10

示例#2:NULL值处理
在这个例子中,unique()方法返回的数组的长度与nunique()方法返回的整数进行比较。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv")
  
# storing unique value in a variable
arr = data["Team"].unique()
  
# storing unique value in a variable
unique_value = data["Team"].nunique(dropna = True)
  
# printing values
print(len(arr), unique_value)

输出:
在这两种情况下,输出结果是不一样的,因为dropna参数被设置为True,因此在计算唯一值时,NULL值被排除。

11 10

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程