R语言 如何在R中计算F-统计量的P值
F检验是一种统计检验,它产生的F统计量在无效假设下具有F分布。本文主要介绍如何在R编程语言中计算F统计量的P值。
在R语言中寻找F统计量的P值
R提供了pf()函数,我们可以用它来确定与F-统计量相关的P值。该函数的语法如下。
语法: pf(F_statistic, dataframe1, dataframe2, lower.tail = FALSE)
参数 。
- F_statistic:它代表f统计量的值
- dataframe1:它代表自由度1
- dataframe2:它代表自由度2
- lower.tail = TRUE:返回与F分布的下尾部相关的概率。
- lower.tail = FALSE:不返回与F分布的下尾部相关的概率。
例子 。
考虑一个有以下参数的例子。
- fstat:7
- df1: 4
- df2: 5
- lower.tail = FALSE
pf(7, 4, 5, lower.tail = FALSE)
输出 。
因此,与F-statistic相关的p值等于0.027。F检验也被用来检验回归模型的总体意义。
从回归模型的F-统计量计算P值
考虑到我们有一个数据集,其中显示了旅行的总距离,产生的总排放量,最后获得的里程。
# Create a dataset
dataset <- data.frame(distance = c(112, 217, 92, 98, 104),
emission = c(4.5, 9.8, 12.1, 3.2, 7.6),
mileage = c(15, 12, 16, 19, 21))
# Display the dataset
dataset
输出 。
现在,我们可以用距离和里程作为预测变量,用里程作为响应变量来拟合这个数据的线性回归模型。为了拟合回归模型,R提供了lm(),使用它我们可以很容易地拟合线性回归模型。它的语法如下。
语法: lm( formula,dataframe )
参数。
- formula。它表示线性模型的公式。
- dataframe。它代表一个包含数据的数据框。
为了打印线性模型的摘要,我们可以使用summary()函数。这个函数的语法如下。
语法: summary(model)
参数: model。它代表一个模型
下面给出了完整的源代码。
# Create a dataset
dataset <- data.frame(distance = c(112, 217, 92, 98, 104),
emission = c(4.5, 9.8, 12.1, 3.2, 7.6),
mileage = c(15, 12, 16, 19, 21))
# Fit a regression model
model <- lm(mileage ~ distance + emission, data = dataset)
# Display the output of the model
summary(model)
输出 。
整个回归模型的F统计量等于1.321。这个F统计量对于分子和分母都有2个自由度。这个F-statistic的P值等于0.4309。
我们可以在以下代码的帮助下计算出这个等效的P值。
# Compute the p-value
pf(1.321, 2, 2, lower.tail = FALSE)
输出 。
正如你在输出中看到的,我们得到了一个几乎相似的结果。