Pandas的绝对频率和相对频率
频率是一个结果在给定样本中出现的次数。它可以用两种不同的方式来称呼。
1.绝对频率:
它是一个特定类别中的观察值的数量。它总是有一个整数值,或者我们可以说它有离散值。
示例:
以下是关于某班学生在数学考试中的通过或失败的数据。
P, P, F, P, F, P, P, F, P, P, P.
其中,P=通过,F=失败。
解决方案:
从给定的数据我们可以说。
有8名学生通过了考试
有4名学生没有通过考试
在Python中的实现:
让我们把12人的成绩分为两类,即合格(P)和不合格(F),分别归为1和0。
输出:
2.相对频率:
它是指在给定的数据集中某一特定类别的观察值的分数。它有浮动值,也可以用百分比表示。让我们考虑一下数学考试中通过和未通过的学生的例子。那么。
通过的学生的相对频率= 8 / ( 8 + 4 ) = 0.666 = 66.6 %。
不及格学生的相对频率 = 4 / ( 8 + 4 ) = 0.333 = 33.3 %。
输出: