R语言 定性数据的频率分布
R编程语言中的频数表是用来为离散值和分组区间创建一个具有各自计数的表格。它表示表格中每个区段的计数。它有助于构建概率,并对数据的分布有一个概念。
R中的定性数据的频率分布
定性数据是以数值的形式表达的,它不能以数字的形式表达,而是以字符或字符串变量的形式。
可以使用R语言中的data.frame方法创建一个数据框,它可以使用管道操作符追加到操作中。它可以受制于count()方法,用来计算每个遇到的字符串值的计数。在count()方法中指定的所有列值都会显示在输出中。
count(df-col)
library("dplyr")
#using a func to generate values
#creating a data frame
data_frame <- data.frame(col1 = c("Maths","Physics","Chem","Bio","Bio",
"Maths","Physics","Chem","Maths","Physics",
"Chem","Bio","Physics","Physics","Chem"))
print("Original Data")
print(data_frame)
#creating a frequency table using col1 columns of data frame
data_frame %>%
count(col1)
输出
R还包含一个内置的方法来描述数据的频率表。用来计算频率的数据框架列被用作表格方法的输入参数。变量的各自计数将作为输出返回。该方法的输出是一个数据表。
table(df-col)
library("dplyr")
#using a func to generate values
#creating a data frame
data_frame <- data.frame(col1 = c("Maths","Physics","Chem","Bio","Bio",
"Maths","Physics","Chem","Maths","Physics",
"Chem","Bio","Physics","Physics","Chem"))
print("Original Data")
print(data_frame)
#creating a frequency table using col1 columns of data frame
freq_table <- table(data_frame$col1)
print("Frequency table")
print(freq_table)
输出
dplyr包用于通过执行操作和转换来对数据进行模拟。它可以通过以下命令安装到工作空间。
install.packages("dplyr")
多列也可以用来计算输入列的值的频率。所有属于这些列的唯一集合被选为计算输出的行。在count()方法中出现的列会在输出中返回。必须指定group_by组件,以指示输出中使用的分组列。
library(dplyr)
#creating a data frame
data_frame <- data.frame(col1 = c("Geeks","Coding","Programming","Coding",
"Coding","Coding","Programming","Geeks",
"Learning","Programming","Geeks","Learning" ),
grp = c(rep(c("a","b","c"),4)))
print("Original Data")
print(data_frame)
#creating a frequency table using col1 and grp columns of data frame
data_frame %>%
count(col1, grp) %>%
group_by(grp)
输出