R语言 泊松回归
泊松回归涉及回归模型,其中响应变量是计数而不是分数。例如,出生数量或足球比赛系列中的胜利数量的计数。此外,响应变量的值符合泊松分布。
泊松回归的通用数学方程为:
以下是使用的参数的描述:
- y 是响应变量。
-
a 和 b 是数值系数。
-
x 是预测变量。
用于创建Poisson回归模型的函数是 glm() 函数。
语法
Poisson回归中 glm() 函数的基本语法是:
以下是上述函数中使用的参数的描述:
- formula 是表示变量之间关系的符号。
-
data 是给出这些变量的值的数据集。
-
family 是R对象,用于指定模型的详细信息。对于逻辑回归,其值为“Poisson”。
示例
我们有内置的数据集“warpbreaks”,它描述了羊毛类型(A或B)和张力(低、中或高)对织机每台的纱断裂次数的影响。让我们将“breaks”作为响应变量,即断裂次数的计数。羊毛“type”和“tension”被视为预测变量。
输入数据
当我们执行上面的代码时,会产生以下结果 −
创建回归模型
当我们执行上述代码时,会产生以下结果 −
在总结中,我们查找最后一列中的p值小于0.05,以考虑预测变量对响应变量的影响。从上面可以看到,具有张力类型M和H的B型羊毛对断裂次数产生影响。