R语言 如何使用摘要函数
在这篇文章中,我们将讨论R编程语言中的摘要函数。
摘要函数是用来从给定的数据中返回以下内容的。
- 最小值。给定数据中的最小值
- 1st Qu:给定数据中第一四分位数(第25个百分点)的值
- 中位数。给定数据中的中值
- 第3个四分位数。第3个四分位数(第75个百分位数)在给定数据中的值
- 最大值:给定数据中的最大值
语法:
summary(data)
其中,数据可以是一个矢量,数据帧等。
例1:在向量中使用summary()
在这里,我们将创建一个有一些元素的向量,并获得汇总统计。
# create a vector wit 10 elements
data = c(1: 5, 56, 43, 56, 78, 51)
# display
print(data)
# get summary
print(summary(data))
输出 :
例子2:在DataFrame中使用summary()
在这里,我们将获得数据框架中所有列的摘要。
# create a dataframe with 3 columns
data = data.frame(col1=c(1: 5, 56, 43, 56, 78, 51),
col2=c(100: 104, 56, 43, 56, 78, 51),
col3=c(1: 5, 34, 56, 78, 76, 79))
# display
print(data)
# get summary
print(summary(data))
输出 :
例子3:使用summary()处理特定的数据框架列
在这里,我们可以得到数据框架中特定列的摘要。
语法:
summary(dataframe)
# create a dataframe with 3 columns
data = data.frame(col1=c(1: 5, 56, 43, 56, 78, 51),
col2=c(100: 104, 56, 43, 56, 78, 51),
col3=c(1: 5, 34, 56, 78, 76, 79))
# display
print(data)
# get summary of column 1 and column 3
print(summary(data[c('col1', 'col3')]))
输出 :
例子4:在回归模型中使用summary()
这里我们也可以计算线性回归模型的summary()。我们可以使用lm()函数为数据帧列创建一个线性回归模型。
语法:
summary(lm(column1~column2, dataframe))
# create a dataframe with 3 columns
data = data.frame(col1=c(1: 5, 56, 43, 56, 78, 51),
col2=c(100: 104, 56, 43, 56, 78, 51))
# create the model for regression with 2 columns
reg = lm(col1~col2, data)
# get summary of the model
summary(reg)
输出 :
例5:使用summary()与方差分析模型
这里aov()被用来创建ANOVA模型,代表方差分析。
语法:
summary(aov(col1 ~ col2, data))
例子 :
# create a dataframe with 3 columns
data = data.frame(col1=c(1: 5, 56, 43, 56, 78, 51),
col2=c(100: 104, 56, 43, 56, 78, 51))
# create the model for anova model with 2 columns
reg = aov(col1 ~ col2, data)
# get summary of the model
summary(reg)
输出: