R语言 带有区间的频率表

R语言 带有区间的频率表

R中的数据框可能包含整数或浮点值形式的离散数据。这些值可能是不同的,也可能是重复的。离散数据的频率表可以在R语言中table()方法的帮助下轻松创建,该方法会返回值和它们各自的计数值。

R语言 获得一个带有间隔的频率表

区间表可以用cut()方法轻松创建。cut方法的语法如下。

语法: cut ( vec , bins-to-divide)

参数 :

  • vec – 要划分的区间的向量
  • bins-to-divide – 创建向量的类的数量。

内置的seq()方法用于生成一个序列,从第一个参数开始,直到第二个参数,每个参数与第三个参数有差异。

语法:seq( st, end, diff )

这里。

st – 序列的起始整数

end – 序列的结束整数

diff – 每个bin值之间的差异

然后,指定的向量被切割成指定的bin,每个区间的各自计数由R中的table()方法返回。

#creating a data frame
 
data_frame <- data.frame(col1 = c(1,3,5,6,23,6,2,5,7,
                                  16,8,9,36,7,12,1,
                                  6,4,14,23,19,18,
                                   14,2,20,30))
print("Original Data")
print(data_frame)
 
# creating intervals between 1 to 30 with a gap of 5 each
interval_table <- table(cut(data_frame$col1,seq(1,30,5)))
print("Data in Intervals")
print(interval_table)
R

输出

R语言中带有区间的频率表

在R中获得基于样本数据的间隔的频率

随机样本也可以在一个指定的数字集之间产生,并有一个固定的长度与之相关。它使我们免于手动创建样本列表。它返回一个值的向量作为输出。

语法: sample(range , length)

参数

  • range – 取出的样本值的范围
  • length – 样本向量的长度

如前所述,在cut()方法的帮助下,区间再次被创建。用户可以根据自己的需要来选择分选区的大小。对于一个大的数据集来说,小的分选区大小是不太可取的,但是我们可以在一个大的数据集上轻松地使用它。

#creating a sample vector of values
vec <- sample(11:50,20)
 
#creating a data frame
data_frame <- data.frame(col1 = vec)
print("Original Data")
print(data_frame)
 
#creating intervals between 10 to 50 with a gap of 10 each
interval_table <- table(cut(data_frame$col1,seq(10,50,10)))
print("Data in Intervals")
print(interval_table)
R

输出

R语言中带有区间的频率表

在R中获得基于向量数据的间隔的频率

函数也可以用来生成整数或字符串值的向量。R中的rpois()方法是用来绘制随机计算的泊松密度。rpois方法的语法如下:

语法: rpois(num-of-observations, rate=rate )

参数

  • num-of-observations – 观察值的数量
  • rate – 分布的事件率

然而,由于只是使用观察数随机抽取数值,而不是手动决定bin,我们可以使用内置的min()和max()方法提取密度向量中返回数值的最小值和最大值。

然后可以在这些区间之间生成一个序列,以返回准确的结果。然后使用R中的table()方法绘制一个频率表。

#using a func to generate values
vec <- rpois(10,30)
 
#creating a data frame
data_frame <- data.frame(col1 = vec)
print("Original Data")
print(data_frame)
 
#getting the min and max intervals in the vec
min<- min(vec)
max <- max(vec)
 
#creating intervals between 10 to 50 with a gap of 10 each
interval_table <- table(cut(data_frame$col1,seq(min,max,2)))
print("Data in Intervals")
print(interval_table)
R

输出

R语言中带有区间的频率表

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册