对数赔率在逻辑回归中的作用
简介
逻辑回归是一种统计方法,根据一个或多个独立变量之间的关系来预测因果数据变量。它利用对数几率,在逻辑函数的帮助下,预测事件发生的概率。它是一种分类方法。
什么是对数概率,为什么它们对逻辑回归有用
Logistic回归是用来预测二元结果的。例如,在选举中,候选人是否会获胜,短信是垃圾邮件还是火腿,等等。
赔率是指成功与失败的概率之比。它的定义为
其中p=成功的概率,1-p=失败的概率
赔率的对数将由以下公式给出
上述公式(1)是对数函数,表示为
将此方程拟合到一条直线上,我们得到
失败的几率可写为
对数赔率可以写成
这就是逻辑回归的方程。
Python中的赔率实例
让我们来看看以下数据。
country1 | country2 | |
---|---|---|
cheetah | 8 | 2 |
lion | 1 | 5 |
示例
from scipy.stats import fisher_exact as fe
odds_ratio, p_value = fe([[8, 2], [1, 5]])
print(odds_ratio)
输出
20.0
对数赔率的优势
- 对数赔率将基于概率的Logistic回归模型转换为基于概率的模型。
-
Logistic回归的参数是由最大似然估计(MLE)确定的
-
它们在解决赢或输、欺诈或不欺诈、跨度不跨度等场景的问题上非常有用。
总结
当我们想要一个非二进制的结果时,Logistic回归中使用了对数赔率。对数赔率使Logistic回归在回归和分类模型中都能发挥作用。