如何在Python中从Z-Score找到P-Value?
从Z-Score获取P-Value是一种典型的统计过程。一个正态分布中一个数值距离其均值的标准差数表示为Z-Score,有时也称为标准分数。Z-Score可用于评估在正态分布中出现特定数值的概率。
在假设原始假设为真的情况下,获得至少和观察到的相同严重程度的检验统计量的概率就是P-Value。由于Z-Score通常是检验统计量,从Z-Score确定P-Value可以评估观察到的Z-Score的统计显著性。本文将讨论P-Values、Z-Scores,以及如何在Python中从Z-Score计算P-Value。
什么是P-Value?
在统计学中,假设原始假设为真的情况下,测试统计量至少和观察到的相同严重程度的概率被表示为P-Value。原始假设声称实验结果与预测结果之间没有明显的差异。
假设检验使用P-Value来帮助确定研究结果的统计显著性。如果原始假设成立,因为非常小的P-Value表明观察到的数据非常不可能是偶然发生的,所以原始假设被拒绝。由于观察到的事实极有可能是偶然发生的结果,则不驳斥原始假设。
什么是Z-Score?
一个正态分布中一个数值距离其均值的标准差数表示为Z-Score,有时也称为标准分数。计算方法为:将感兴趣的值减去分布的平均值并将结果除以分布的标准差。
Z-Score是一个有价值的指标,因为它能够对来自各种正态分布的值进行无尺度比较。现在可以更容易地评估某个数字是否为异常值或该值在正态分布中出现的概率。
如何在Python中从Z-Score找到P-Value?
可以使用scipy.stats包中的norm.sf函数来从Z-Score计算P-Value。该函数返回输入Z-Score大于典型正态随机变量的概率。下面演示了如何使用该函数获取Z-Score的P-Value-
语法
p_value = norm.sf(abs(2.0))
p_value = norm.cdf(2.0)
示例1
可以使用scipy.stats包中的norm.cdf方法找到Z-Score的P-Value。该方法返回输入Z-Score小于或等于标准正态随机变量的概率。
from scipy.stats import norm
# 计算Z-Score为2.0的P-Value
p_value = norm.sf(abs(2.0))
# 打印P-Value
print(p_value)
输出
0.022750131948179195
示例2
下面给出了使用该函数获取Z-Score的P-Value的演示。
from scipy.stats import norm
# 计算Z-Score为2.0的P-Value
p_value = norm.cdf(2.0)
# 打印P-Value
print(p_value)
输出
0.9772498680518208
结论
最后,从Z-Score计算P-Value是一种典型的统计活动。假设原始假设为真的情况下,P-Value是获得至少和观察到的相同严重程度的检验统计量的概率。由于Z-Score通常是检验统计量,从Z-Score计算P-Value是确定观察到的Z-Score的统计显著性的一种方法。
从z得分中获取p值是确定正态分布的统计学意义的便捷方法。它可以帮助研究人员在对结果的后果作出明智判断和得出有关变量联系的结论方面发挥作用。