R语言 绝对频率和相对频率
在统计学中, 频率 或绝对频率表示一个数据值的出现次数或一个数据值的出现次数。这些频率经常被绘制在柱状图或直方图上,以比较数据值。例如,为了找出某一地区的儿童、成人和老年人的数量,为了建立一个关于某些标准的投票,等等。
在R语言中,频率可以被描绘成绝对频率和相对频率。
绝对频率
绝对频率显示数值在数据向量中重复出现的次数。
公式 。
其中 。
表示每个值的绝对频率
N 表示数据值的总数
在R语言中,数据向量的频率表可以用 table() 函数创建。
语法
table(x)
其中,
x 是数据向量
例如:
假设在下面的数据向量中,”M “代表男性,”F “代表女性。
# Defining vector
x <- c("M", "M", "F", "M", "M", "M", "F", "F", "F", "M")
# Absolute frequency table
af <- table(x)
# Printing frequency table
print(af)
# Check the class
class(af)
输出 。
x
F M
4 6
[1] "table"
相对频率
相对频率是该事件的绝对频率除以事件的总数。它代表了数据向量中存在的特定数据类别的比例。在数学上。
其中
代表
事件的相对频率
代表每个值的绝对频率
N 代表数据值的总数
在R语言中, table() 函数和数据向量的长度一起用于查找数据向量的相对频率。
语法 。
table(x)/length(x)
例子 。
# Defining vector
x <- c("M", "M", "F", "M", "M", "M", "F", "F", "F", "M")
# Relative frequency table
rf <- table(x)/length(x)
# Printing frequency table
print(rf)
# Check the class
class(rf)
输出 。
x
F M
0.4 0.6
[1] "table"