Python Pandas dataframe.corr()

Python Pandas dataframe.corr()

Pandas dataframe.corr()用于在Python中找到Pandas Dataframe中所有列的成对相关性。任何NaN值都会被自动排除。任何非数字数据类型或Dataframe中的列,都会被忽略。

dataframe.corr()

使用corr()函数,使用’Pearson’方法找到数据框架中各列之间的相关关系。

语法: DataFrame.corr(self, method=’pearson’, min_periods=1)

参数:

  • method :
    • pearson:标准相关系数
    • kendall:Kendall Tau相关系数
    • spearman:Spearman等级相关。
  • min_periods : 为了得到有效的结果,每对列所需的最小观察数。目前只适用于pearson和spearman相关。

返回: count :y :数据框架

示例

一个简单的例子来展示Python中的相关工作。

import pandas as pd
 
df = {
  "Array_1": [30, 70, 100],
  "Array_2": [65.1, 49.50, 30.7]
}
 
data = pd.DataFrame(df)
 
print(data.corr())
Python

输出:

          Array_1   Array_2
Array_1  1.000000 -0.990773
Array_2 -0.990773  1.000000
Python

Pandas dataframe.corr()的演示

打印Dataframe的前10行。

注意:变量与自身的相关性为1。 关于代码中使用的CSV文件的链接,请点击这里。

# importing pandas as pd
import pandas as pd
 
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
 
# Printing the first 10 rows of the data frame for visualization
df[:10]
Python

输出:

Python Pandas dataframe.corr()

示例 1:

现在使用corr()函数来寻找各列之间的相关性。我们在Dataframe中只有四个数字列。输出的Dataframe可以解释为对于任何单元格,行变量与列变量的相关性是该单元格的值。如前所述,一个变量与自身的相关度为1。

# To find the correlation among
# the columns using pearson method
df.corr(method ='pearson')
Python

输出:

Python Pandas dataframe.corr()

示例 2:

使用corr()函数,使用’kendall’方法找到Dataframe中各列之间的相关性。输出的Dataframe可以被解释为对于任何单元格,行变量与列变量的相关性是该单元格的值。如前所述,一个变量与自身的相关性是1,因此,所有的对角线值都是1.00。

# importing pandas as pd
import pandas as pd
 
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
 
# To find the correlation among
# the columns using kendall method
df.corr(method='kendall')
Python

输出 :

Python Pandas dataframe.corr()

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程