Python Pandas Series.value_counts()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas系列是一个带有轴标签的一维ndarray。标签不需要是唯一的,但必须是一个可散列的类型。该对象支持基于整数和标签的索引,并提供了大量的方法来执行涉及索引的操作。
Pandas Series.value_counts()函数返回一个包含唯一值计数的系列。得到的对象将按降序排列,因此第一个元素是最常出现的元素。默认情况下,不包括NA值。
语法: Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
参数:
normalize : 如果为真,那么返回的对象将包含唯一值的相对频率。
sort :按数值排序。
ascending:以升序排序。
bins : 与其计算数值,不如将它们分组到半开的bins中,这是pd.cut的一个便利,只对数字数据有效。
dropna :不要包括NaN的计数。
返回 : Series
示例#1:使用Series.value_counts()函数来查找给定Series对象中每个元素的唯一值计数。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series(['New York', 'Chicago', 'Toronto', 'Lisbon', 'Rio', 'Chicago', 'Lisbon'])
# Print the series
print(sr)
输出 :
现在我们将使用Series.value_counts()函数来查找给定系列对象中每个独特值的值数。
# find the value counts
sr.value_counts()
输出 :
正如我们在输出中所看到的,Series.value_counts()函数已经返回了给定的Series对象中每个独特值的值数。
示例#2:使用Series.value_counts()函数来查找给定的Series对象中每个元素的唯一值计数。
# importing pandas as pd
import pandas as pd
# Creating the Series
sr = pd.Series([100, 214, 325, 88, None, 325, None, 325, 100])
# Print the series
print(sr)
输出 :
现在我们将使用Series.value_counts()函数来查找给定系列对象中每个独特值的值数。
# find the value counts
sr.value_counts()
输出 :
正如我们在输出中所看到的,Series.value_counts()函数已经返回了给定的Series对象中每个独特值的值数。