Python Pandas dataframe.nunique()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas dataframe.nunique()函数返回所要求的axis上的独特观测值的数量系列。如果我们将坐标axis的值设置为0,那么它将找到索引axis上的唯一观测值的总数。如果我们将axis的值设置为1,那么它将找到列axis上唯一的观测值的总数。它还提供了将NaN值从唯一数字的计数中排除的功能。
语法:
DataFrame.nunique(axis=0, dropna=True)
参数 :
axis: {0或’索引’,1或’列’},默认0
dropna :不要在计数中包括NaN。
返回 : nunique :系列
例子#1:使用nunique()函数来查找列axis上的唯一值的数量。
# importing pandas as pd
import pandas as pd
# Creating the first dataframe
df = pd.DataFrame({"A":[14, 4, 5, 4, 1],
"B":[5, 2, 54, 3, 2],
"C":[20, 20, 7, 3, 8],
"D":[14, 3, 6, 2, 6]})
# Print the dataframe
df
让我们使用dataframe.nunique()函数来查找列axis上的唯一值。
# find unique values
df.nunique(axis = 1)
输出 :
正如我们在输出中看到的,该函数打印了每一行中唯一值的总数。
示例#2:使用nunique()函数来查找数据帧中索引axis上的唯一值的数量。该数据框架包含NaN值。
# importing pandas as pd
import pandas as pd
# Creating the first dataframe
df = pd.DataFrame({"A":["Sandy", "alex", "brook", "kelly", np.nan],
"B":[np.nan, "olivia", "olivia", "", "amanda"],
"C":[20 + 5j, 20 + 5j, 7, None, 8],
"D":[14.8, 3, None, 6, 6]})
# apply the nunique() function
df.nunique(axis = 0, dropna = True)
输出 :
该函数将空字符串视为第2列的唯一值。