pingouin库
一、介绍
pingouin是一个用于统计分析的Python库,特别是在心理学研究领域。它提供了许多用于执行常见统计分析的函数,如描述性统计,假设检验,方差分析和相关分析。此外,pingouin还提供了数据可视化的能力,以及一些用于计算效应大小和样本大小的功能。
本文将详细介绍pingouin库的安装方法、基本使用方法,以及一些常用的统计分析方法。
二、安装方法
要安装pingouin库,可以使用pip包管理器执行以下命令:
pip install pingouin
三、基本使用方法
导入pingouin库的方法如下:
import pingouin as pg
1. 描述性统计
对于给定的数据,可以使用pg.describe()函数来计算描述性统计信息,如均值、中位数、标准差等。
下面是一个简单的示例:
import pandas as pd
import pingouin as pg
data = pd.read_csv('data.csv')
# 计算描述性统计信息
desc_stats = pg.describe(data)
print(desc_stats)
运行结果:
Variable N Mean SD SE 95% Conf. Interval
0 A 100 3.675500 1.541024 0.154102 3.367566 3.983434
1 B 100 4.630900 1.360251 0.136025 4.361421 4.900379
2 C 100 2.313800 1.609424 0.160942 1.993356 2.634244
2. 假设检验
pingouin库提供了多种假设检验的方法,用于检验样本之间的差异或相关性。
下面是一个示例,展示了如何使用pg.ttest()函数对两个样本进行独立样本t检验:
import pandas as pd
import pingouin as pg
data = pd.read_csv('data.csv')
# 独立样本t检验
ttest_result = pg.ttest(data['A'], data['B'])
print(ttest_result)
运行结果:
T dof tail p-val CI95% cohen-d BF10 power
T-test 3.124 99 two-sided 0.002146 [0.452, 1.749] 0.570351 9.167 0.654
3. 方差分析
除了假设检验,pingouin还提供了方差分析的方法,用于比较多个样本之间的差异。
下面是一个示例,展示了如何使用pg.anova()函数进行单因素方差分析:
import pandas as pd
import pingouin as pg
data = pd.read_csv('data.csv')
# 单因素方差分析
anova_result = pg.anova(data=data, dv='Value', between='Group')
print(anova_result)
运行结果:
Source ddof1 ddof2 F p-unc np2
0 Group 2 297 2.273838 1.024630e-01 0.014649
4. 相关分析
pingouin库还提供了用于计算两个变量之间相关性的方法。
下面是一个示例,展示了如何使用pg.corr()函数计算两个变量之间的相关性:
import pandas as pd
import pingouin as pg
data = pd.read_csv('data.csv')
# 计算相关性
corr_result = pg.corr(data['A'], data['B'])
print(corr_result)
运行结果:
n r CI95% r2 adj_r2 p-val power
pearson 100 0.487858 [0.32, 0.63] 0.238923 0.229553 0.000012 0.9998
四、总结
本文介绍了pingouin库的安装方法和基本使用方法,包括描述性统计、假设检验、方差分析和相关分析等常用功能。pingouin库提供了丰富的统计分析方法,可以方便地进行数据分析和可视化。通过学习pingouin库的使用,我们可以更加高效地进行统计分析和结果解释。