Pandas的绝对频率和相对频率

Pandas的绝对频率和相对频率

频率是一个结果在给定样本中出现的次数。它可以用两种不同的方式来称呼。

1.绝对频率:
它是一个特定类别中的观察值的数量。它总是有一个整数值,或者我们可以说它有离散值。

示例:

以下是关于某班学生在数学考试中的通过或失败的数据。
P, P, F, P, F, P, P, F, P, P, P.

其中,P=通过,F=失败。

解决方案:
从给定的数据我们可以说。
有8名学生通过了考试
有4名学生没有通过考试

在Python中的实现:
让我们把12人的成绩分为两类,即合格(P)和不合格(F),分别归为1和0。

P, P, F, P, F, P, P, F, F, P, P, P
1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1

import pandas as pd
  
data = [1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1]
  
# Create Data Frame using pandas library
# .value_counts() counts the number of 
# occurrences of particular observation
  
df = pd.Series(data).value_counts()
print(df)

输出:

1    8
0    4
dtype: int64

2.相对频率:
它是指在给定的数据集中某一特定类别的观察值的分数。它有浮动值,也可以用百分比表示。让我们考虑一下数学考试中通过和未通过的学生的例子。那么。

通过的学生的相对频率= 8 / ( 8 + 4 ) = 0.666 = 66.6 %。
不及格学生的相对频率 = 4 / ( 8 + 4 ) = 0.333 = 33.3 %。

import pandas as pd
  
data = [1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1]
  
# Create Data Frame using pandas library
# .value_counts() counts the number of 
# occurrences of particular observation
  
df = pd.Series(data).value_counts()      
print(df / len(data))

输出:

1    0.666667
0    0.333333
dtype: float64

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程