Python Pandas dataframe.corr()

Pandas dataframe.corr()用于在Python中找到Pandas Dataframe中所有列的成对相关性。任何NaN值都会被自动排除。任何非数字数据类型或Dataframe中的列，都会被忽略。

dataframe.corr()

使用corr()函数，使用’Pearson’方法找到数据框架中各列之间的相关关系。

语法: DataFrame.corr(self, method=’pearson’, min_periods=1)

参数:

method :
- pearson：标准相关系数
- kendall:Kendall Tau相关系数
- spearman：Spearman等级相关。
min_periods : 为了得到有效的结果，每对列所需的最小观察数。目前只适用于pearson和spearman相关。

返回： count :y :数据框架

示例

一个简单的例子来展示Python中的相关工作。

import pandas as pd
 
df = {
  "Array_1": [30, 70, 100],
  "Array_2": [65.1, 49.50, 30.7]
}
 
data = pd.DataFrame(df)
 
print(data.corr())

输出:

          Array_1   Array_2
Array_1  1.000000 -0.990773
Array_2 -0.990773  1.000000

Pandas dataframe.corr()的演示

打印Dataframe的前10行。

注意：变量与自身的相关性为1。关于代码中使用的CSV文件的链接，请点击这里。

# importing pandas as pd
import pandas as pd
 
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
 
# Printing the first 10 rows of the data frame for visualization
df[:10]

输出:

Python Pandas dataframe.corr()

示例 1:

现在使用corr()函数来寻找各列之间的相关性。我们在Dataframe中只有四个数字列。输出的Dataframe可以解释为对于任何单元格，行变量与列变量的相关性是该单元格的值。如前所述，一个变量与自身的相关度为1。

# To find the correlation among
# the columns using pearson method
df.corr(method ='pearson')

输出:

Python Pandas dataframe.corr()

示例 2:

使用corr()函数，使用’kendall’方法找到Dataframe中各列之间的相关性。输出的Dataframe可以被解释为对于任何单元格，行变量与列变量的相关性是该单元格的值。如前所述，一个变量与自身的相关性是1，因此，所有的对角线值都是1.00。

# importing pandas as pd
import pandas as pd
 
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
 
# To find the correlation among
# the columns using kendall method
df.corr(method='kendall')

输出 :

Python Pandas dataframe.corr()