如何计算Pandas列中特定值的出现次数
在这篇文章中,我们将讨论如何在pandas列中计算一个特定列值的出现次数。
使用中的数据集。
我们可以通过使用value_counts()方法进行计数。这个函数用来计算整个数据框架中存在的数值,也可以计算某一列的数值。
语法 :
其中,
- data是输入数据帧
- value是指要计算的列中存在的字符串/整数值
- column_name是数据框架中的列。
例子 :要计算一个特定值的出现次数
输出:
如果我们想计算某一列的所有数值,那么我们就不需要提到这个数值。
语法 :
例子:要计算一个值在某一列中的出现次数
输出:
如果我们想按顺序获得结果(如升序和降序),我们必须指定参数
语法:
升序:
data[‘column_name’].value_counts(ascending=True)
降序:
data[‘column_name’].value_counts(ascending=False)
例子:要以一种有序的方式获得结果
输出:
处理缺失值的问题
这里我们可以计算有无NA值的出现。通过使用dropna参数,如果设置为True,则包括NA值,如果设置为False,则不计算NA。
语法 :
包括 NA 值:
data[‘column_name’].value_counts(dropna=True)
不包括NA 值:
data[‘column_name’].value_counts(dropna=False)
例子:处理缺失值的问题
输出:
具有相对频率的计数值
我们要添加normalize参数来获得重复数据的相对频率。它被设置为True。
语法:
例子:具有相对频率的计数值
输出:
获取详细信息
如果我们想获得计数、平均值、标准差、最小值、25%、50%、75%、最大值等详细信息,那么我们必须使用describe()方法。
语法 :
示例:获得详细信息
输出:
使用size()和groupby()
在这里,这将返回某一列中所有出现的计数。
语法 :
例子 :对某一列中所有出现的情况进行计数
输出:
使用count()和groupby()
在这里,这将返回所有列中某一列的所有出现的计数。
语法 :
例子 :对某一列中所有出现的情况进行计数
输出:
使用 bins
如果我们想得到某个特定范围内的计数,那么就应用bins参数。我们可以指定范围(bins)的数量。
语法:
其中,
- data是输入数据帧
- column_name是要得到的列。
- bins是指要指定的分选区总数
例子:在特定的数值范围内获取计数
输出:
使用 apply()
如果我们想获得所有列的计数,那么我们必须使用apply()函数。在此,我们将使用value_counts()方法。
语法:
例子:获得所有列的计数,跨所有列的计数
输出: