用Pairplot Seaborn和Pandas进行数据可视化

用Pairplot Seaborn和Pandas进行数据可视化

数据可视化是以图片的形式呈现数据。它对数据分析极为重要,主要是因为以数据为中心的Python软件包的奇妙生态系统。而且,它有助于理解数据,不管它有多复杂,通过总结并以简单易懂的格式呈现大量的数据,帮助清晰有效地沟通信息,从而理解数据的意义。

用Pairplot Seaborn和Pandas进行数据可视化

Pandas和Seaborn是其中的一个软件包,使导入和分析数据变得更加容易。在这篇文章中,我们将使用Pandas和Pairplot Seaborn来分析数据。

Pandas

Pandas提供清理和处理数据的工具。它是最流行的Python库,用于数据分析。在pandas中,一个数据表被称为数据框架。

那么,我们先来创建一个Pandas数据框架:

示例 1:

# Python code demonstrate creating 
    
import pandas as pd
    
# initialise data of lists.
data = {'Name':[ 'Mohe' , 'Karnal' , 'Yrik' , 'jack' ],
        'Age':[ 30 , 21 , 29 , 28 ]}
    
# Create DataFrame
df = pd.DataFrame( data )
    
# Print the output.
display(df)

输出:

用Pairplot Seaborn和Pandas进行数据可视化

例子2:从系统中加载CSV数据并通过pandas显示。

# import module
import pandas
 
# load the csv
data = pandas.read_csv("nba.csv")
 
# show first 5 column
data.head()

输出:

用Pairplot Seaborn和Pandas进行数据可视化

seaborn.pairplot()

要在一个数据集中绘制多个成对的双变量分布,你可以使用pairplot()函数。这将数据框架中变量的(n, 2)组合的关系显示为一个矩阵图,对角线图是单变量图。

语法: seaborn.pairplot( data, **kwargs )

示例 1:

# importing packages
import seaborn
import matplotlib.pyplot as plt
 
# loading dataset using seaborn
df = seaborn.load_dataset('tips')
 
# pairplot with hue sex
seaborn.pairplot(df, hue ='size')
plt.show()

输出:

用Pairplot Seaborn和Pandas进行数据可视化

用Pairplot Seaborn和pandas进行数据可视化

我们看到如何创建pandas数据框架和Pairplot。我们将用pandas的pairplot将数据可视化。

示例 1:

在这个例子中,我们将简单地用pandas数据框架绘制一个对图。在这里,我们只是简单地加载nba.csv数据,并创建一个数据框架,虽然作为参数传递给了pairplot。

# importing packages
import seaborn
import pandas
 
# load the csv
data = pandas.read_csv("nba.csv")
 
# pairplot
seaborn.pairplot(data)

输出:

用Pairplot Seaborn和Pandas进行数据可视化

示例 2:

在这个例子中,我们将使用色调属性来实现一个特定列的可视化。

# importing packages
import seaborn
import pandas
 
# load the csv
data = pandas.read_csv("nba.csv")
seaborn.pairplot(data.head(), hue = 'Age')

输出:

用Pairplot Seaborn和Pandas进行数据可视化

示例 3:

在这个例子中,我们将传递双变量绘图函数的关键字参数字典( plot_kws 和 diag_kws )。

# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
 
seaborn.pairplot(data, hue = 'Age', diag_kind = 'kde',
             plot_kws = {'edgecolor': 'k'}, size = 4)

输出:

用Pairplot Seaborn和Pandas进行数据可视化

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程