如何在Pandas中获取两列之间的相关性?

如何在Pandas中获取两列之间的相关性?

我们可以使用 .corr() 方法来获取Pandas中两列之间的相关性。让我们举一个例子,看看如何应用此方法。

更多Pandas相关文章,请阅读:Pandas 教程

步骤

  • 创建一个二维的,大小可变的,可能是异构的表格数据, df。
  • 打印输入的DataFrame, df。
  • 初始化两个变量, col1col2 ,并将它们分配给要查找相关性的列。
  • 通过使用df[col1].corr(df[col2])查找 col1col2 之间的相关性,并将相关系数保存在变量corr中。
  • 打印相关性的值,corr。

示例

import pandas as pd

df = pd.DataFrame(
   {
      "x": [5, 2, 7, 0],
      "y": [4, 7, 5, 1],
      "z": [9, 3, 5, 1]
   }
)
print "输入的DataFrame是:\n", df

col1, col2 = "x", "y"
corr = df[col1].corr(df[col2])
print col1, "和", col2, "之间的相关性是:", round(corr, 2)

col1, col2 = "x", "x"
corr = df[col1].corr(df[col2])
print col1, "和", col2, "之间的相关性是:", round(corr, 2)

col1, col2 = "x", "z"
corr = df[col1].corr(df[col2])
print col1, "和", col2, "之间的相关性是:", round(corr, 2)

col1, col2 = "y", "x"
corr = df[col1].corr(df[col2])
print col1, "和", col2, "之间的相关性是:", round(corr, 2)

输出

输入的DataFrame是:
  x y z
0 5 4 9
1 2 7 3
2 7 5 5
3 0 1 1
x和y之间的相关性是:0.41
x和x之间的相关性是:1.0
x和z之间的相关性是:0.72
y和x之间的相关性是:0.41

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程