R语言 如何解释显著性代码
在这篇文章中,我们将讨论如何在R编程语言中解释显著性代码。
显著性代码表明我们对以下系数对因变量的影响的确定程度。这有助于我们确定影响我们目标变量变化的主要成分。为了计算R语言中回归模型的显著性代码,我们使用summary()函数。summary()函数使用每个分量的统计措施对线性模型拟合进行总结。
语法
summary( Regression_model )
参数 。
Regression_model: 决定了我们必须找到其摘要的模型。
回归模型摘要中的显著性代码是对其p值变化的衡量。下表显示了每个显著性代码的p值范围。
Significance Codes | p-value |
---|---|
*** | [0, 0.001] |
** | (0.001, 0.01] |
* | (0.01, 0.05] |
. | (0.05, 0.1] |
(0.1, 1] |
这里,一个变量的P值越小,它对该模型的意义就越大。例如,如果var1的显著性代码为**,var2的显著性为*,那么这意味着var1对于该回归模型来说比var2更有意义,因为它的p值更小。
例如: 线性模型的显著性代码。
# load library tidyverse
library(tidyverse)
# fit regression model
linear_model <- lm(price ~ carat + depth + table,
data = diamonds)
# view model summary
summary(linear_model)
输出
Call:
lm(formula = price ~ carat + depth + table, data = diamonds)
Residuals:
Min 1Q Median 3Q Max
-18288.0 -785.9 -33.2 527.2 12486.7
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 13003.441 390.918 33.26 <2e-16 ***
carat 7858.771 14.151 555.36 <2e-16 ***
depth -151.236 4.820 -31.38 <2e-16 ***
table -104.473 3.141 -33.26 <2e-16 ***
—
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1526 on 53936 degrees of freedom
Multiple R-squared: 0.8537, Adjusted R-squared: 0.8537
F-statistic: 1.049e+05 on 3 and 53936 DF, p-value: < 2.2e-16
例子: 单程方差分析模型的显著性代码。
# load library tidyverse
library(tidyverse)
# fit anova model
anova_model <- aov(price~carat, data = diamonds)
# view model summary
summary(anova_model)
输出
Df Sum Sq Mean Sq F value Pr(>F)
carat 1 7.291e+11 7.291e+11 304051 <2e-16 ***
Residuals 53938 1.293e+11 2.398e+06
—
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1