R语言 如何进行单变量分析
在这篇文章中,我们将讨论如何在R编程语言中进行单变量分析。单变量分析是指对一个变量进行分析。
概括统计
总结统计包括。
- 最小值 – 获取最小元素
语法:
min(data)
- 最大值 – 获取最大值元素
语法:
max(data)
- 平均值 – 获取给定元素的平均值
语法:
mean(data)
- 中位数 – 获取给定元素的中位数
语法:
median(data)
- 四分位数范围 – 获取给定元素的IQR。
语法:
IQR(data)
- 标准偏差 – 获取给定元素的标准偏差
语法
sd(data)
- 范围 – 从元素中获取范围
语法:
max(data)-min(data)
例子 :R程序创建一个有10个元素的向量,并显示汇总统计。
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# minimum
print(min(data))
# maximum
print(max(data))
# mean
print(mean(data))
# median
print(median(data))
# IQR
print(IQR(data))
# range
print(max(data)-min(data))
# standard deviation
print(sd(data))
输出:
[1] 1 2 3 4 5 6 7 8 9 10
[1] 1
[1] 10
[1] 5.5
[1] 5.5
[1] 4.5
[1] 9
[1] 3.02765
频率表
我们可以使用table()方法显示频率表,这将返回元素出现的次数。
语法:
table(data)
例子 :
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display frequency table
print(table(data))
输出 :
视觉化
在这里,我们可以使用一些图来可视化数据
波谱图
boxplot()函数将产生一个五点总结(最小值、最大值、中位数、第一四分位数、第三四分位数)。
语法:
boxplot(data)
例子 :
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display boxplot
print(boxplot(data))
输出:
[1] 1 2 3 4 5 6 7 8 9 10
stats
[,1]
[1,] 1.0
[2,] 3.0
[3,] 5.5
[4,] 8.0
[5,] 10.0
attr(,"class")
1
"integer"n
[1] 10
conf
[,1]
[1,] 3.001801
[2,] 7.998199out
numeric(0)
group
numeric(0)names
[1] "1"
输出 :
柱状图
这将返回数据的柱状图,使用的函数是hist()
语法:
hist(data)
例子 :
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display histogram
print(hist(data))
输出:
[1] 1 2 3 4 5 6 7 8 9 10
breaks
[1] 0 2 4 6 8 10counts
[1] 2 2 2 2 2
density
[1] 0.1 0.1 0.1 0.1 0.1mids
[1] 1 3 5 7 9
xname
[1] "data"equidist
[1] TRUE
attr(,"class")
[1] "histogram"
输出 :
密度图
这将显示密度图。我们必须在使用density()函数的同时使用plot()函数。
语法 :
plot(density(data))
例子 :
# create a vector with 10 elements
data = c(1: 10)
# display
print(data)
# display density plot
print(plot(density(data)))
输出:
[1] 1 2 3 4 5 6 7 8 9 10
NULL