Python Pandas dataframe.corr()
Pandas dataframe.corr()用于在Python中找到Pandas Dataframe中所有列的成对相关性。任何NaN值都会被自动排除。任何非数字数据类型或Dataframe中的列,都会被忽略。
dataframe.corr()
使用corr()函数,使用’Pearson’方法找到数据框架中各列之间的相关关系。
语法: DataFrame.corr(self, method=’pearson’, min_periods=1)
参数:
- method :
- pearson:标准相关系数
- kendall:Kendall Tau相关系数
- spearman:Spearman等级相关。
- min_periods : 为了得到有效的结果,每对列所需的最小观察数。目前只适用于pearson和spearman相关。
返回: count :y :数据框架
示例
一个简单的例子来展示Python中的相关工作。
输出:
Pandas dataframe.corr()的演示
打印Dataframe的前10行。
注意:变量与自身的相关性为1。 关于代码中使用的CSV文件的链接,请点击这里。
输出:
示例 1:
现在使用corr()函数来寻找各列之间的相关性。我们在Dataframe中只有四个数字列。输出的Dataframe可以解释为对于任何单元格,行变量与列变量的相关性是该单元格的值。如前所述,一个变量与自身的相关度为1。
输出:
示例 2:
使用corr()函数,使用’kendall’方法找到Dataframe中各列之间的相关性。输出的Dataframe可以被解释为对于任何单元格,行变量与列变量的相关性是该单元格的值。如前所述,一个变量与自身的相关性是1,因此,所有的对角线值都是1.00。
输出 :