R语言 累积频率图

R语言 累积频率图

在这篇文章中,我们将使用R编程语言绘制一个累积频率图。

累积频率

当第一类区间的频率与第二类区间的频率相加后,这个总数再加到第三类区间,以此类推,就被称为累积频率。

累积频率图

能够显示分组数据的累积频率分布的图形被称为累积频率图或圆锥图。这是理解累积频率数据并得出结论的最有效技术,就是绘制数据。特别是图表在统计学领域是至关重要的,因为它使我们能够更好地理解数据并描绘它。

使用的函数

seq( )方法

seq()方法创建了一个从下限到上限的数值列表,并将它们与 “by “参数中指定的差异隔离开来。

语法: seq( start , end, by )

参数:

start - 序列的开始

end - 序列的结束

by - 序列的增量值

cut()方法

R中的cut()方法将指定的数据点向量的范围划分为若干区间,并根据向量中的数值所属的区间进行编码。

语法: cut(x, breaks)

参数:

x – 数据点的向量。

breaks – 分割点的向量。

table(x)方法

转换后的向量被转换为一个数值表,以构建一个频率表。这些值根据它们所在的区间进行映射。它被用来创建一个具有指定变量名称及其相应频率的数据的分类表示。

语法: table(x)

参数:

x – 要转换的值的向量。

cumsum(x) 方法

可以使用cumsum()方法为指定的向量生成累积频率。一个数据点在第 n个区间的累积频率是直到第 (n-1)个区间的频率之和。

语法:cumsum(x )

参数:

x – 一个数据点的向量。

plot()方法

该方法将断点作为x轴上的坐标,将其各自的累积频率作为y轴上的坐标作为参数,然后可以使用R中的plot()方法创建累积频率图。

语法: plot(x-coordinates, y-coordinates, xlab, ylab)

参数:

x-坐标 – X坐标的向量。

y -coordinates – Y坐标的向量。

xlab – X轴的标记。

ylab – Y轴的标记。

创建一个频率表

频数表是用来描述某事或某一特定时间间隔或数据的频率。在这里,我们将数据点存储在一个变量 “data_points “中,然后用seq()方法制作六个断点。使用cut()和table()方法将其转换为表格。

# declaring data points
data_points < - c(1, 2, 3, 5, 1, 1,
                  2, 4, 5, 1, 2, 3, 3)
# declaring the break points
break_points = seq(0, 6, by=1)
# transforming the data
data_transform = cut(data_points, breaks,
                     right=FALSE)
# creating the frequency table
freq_table = table(data_transform)
# printing the frequency table
print("Frequency Table")
print(freq_table)

输出

[1] "Frequency Table" 
data_transform
[0,1) [1,2) [2,3) [3,4) [4,5) [5,6)      
0     4     3     3     1     2 

解释:

在区间[1,2]中包括1和不包括2的数据点的数量是4,同样,在数据点的矢量中有3个3,所以对应于[3,4]的值=3

绘制累积频率图

在继续上面的代码时,我们将首先使用cumsum()方法制作一个频率表,然后使用该表绘制累积频率图,将x轴标记为数据点,y轴标记为累积频率。然后可以用lines()方法将这些点连接起来。

# declaring data points
data_points < - c(1, 2, 3, 5, 1, 1, 2,
                  4, 5, 1, 2, 3, 3)
# declaring the break points
break_points = seq(0, 6, by=1)
# transforming the data
data_transform = cut(data_points, breaks,
                     right=FALSE)
# creating the frequency table
freq_table = table(data_transform)
# printing the frequency table
print("Frequency Table")
print(freq_table)
# calculating cumulative frequency
cumulative_freq = c(0, cumsum(freq_table))
print("Cumulative Frequency")
print(cumulative_freq)
# plotting the data
plot(break_points, cumulative_freq,
     xlab="Data Points",
     ylab="Cumulative Frequency")
# creating line graph
lines(break_points, cumulative_freq)

输出

[1] "Frequency Table" 
data_transform
[0,1) [1,2) [2,3) [3,4) [4,5) [5,6)      
0     4     3     3     1     2 
[1] "Cumulative Frequency" 
[0,1) [1,2) [2,3) [3,4) [4,5) [5,6)      
0     0     4     7    10    11    13 

解释:

与[5,6]的累积频率相对应的值是之前所有频率的总和。

R语言中的累积频率图

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程