Python Pandas dataframe.corr()
Pandas dataframe.corr()用于在Python中找到Pandas Dataframe中所有列的成对相关性。任何NaN值都会被自动排除。任何非数字数据类型或Dataframe中的列,都会被忽略。
dataframe.corr()
使用corr()函数,使用’Pearson’方法找到数据框架中各列之间的相关关系。
语法: DataFrame.corr(self, method=’pearson’, min_periods=1)
参数:
- method :
- pearson:标准相关系数
- kendall:Kendall Tau相关系数
- spearman:Spearman等级相关。
- min_periods : 为了得到有效的结果,每对列所需的最小观察数。目前只适用于pearson和spearman相关。
返回: count :y :数据框架
示例
一个简单的例子来展示Python中的相关工作。
import pandas as pd
df = {
"Array_1": [30, 70, 100],
"Array_2": [65.1, 49.50, 30.7]
}
data = pd.DataFrame(df)
print(data.corr())
输出:
Array_1 Array_2
Array_1 1.000000 -0.990773
Array_2 -0.990773 1.000000
Pandas dataframe.corr()的演示
打印Dataframe的前10行。
注意:变量与自身的相关性为1。 关于代码中使用的CSV文件的链接,请点击这里。
# importing pandas as pd
import pandas as pd
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
# Printing the first 10 rows of the data frame for visualization
df[:10]
输出:
示例 1:
现在使用corr()函数来寻找各列之间的相关性。我们在Dataframe中只有四个数字列。输出的Dataframe可以解释为对于任何单元格,行变量与列变量的相关性是该单元格的值。如前所述,一个变量与自身的相关度为1。
# To find the correlation among
# the columns using pearson method
df.corr(method ='pearson')
输出:
示例 2:
使用corr()函数,使用’kendall’方法找到Dataframe中各列之间的相关性。输出的Dataframe可以被解释为对于任何单元格,行变量与列变量的相关性是该单元格的值。如前所述,一个变量与自身的相关性是1,因此,所有的对角线值都是1.00。
# importing pandas as pd
import pandas as pd
# Making data frame from the csv file
df = pd.read_csv("nba.csv")
# To find the correlation among
# the columns using kendall method
df.corr(method='kendall')
输出 :