用Pairplot Seaborn和Pandas进行数据可视化
数据可视化是以图片的形式呈现数据。它对数据分析极为重要,主要是因为以数据为中心的Python软件包的奇妙生态系统。而且,它有助于理解数据,不管它有多复杂,通过总结并以简单易懂的格式呈现大量的数据,帮助清晰有效地沟通信息,从而理解数据的意义。
Pandas和Seaborn是其中的一个软件包,使导入和分析数据变得更加容易。在这篇文章中,我们将使用Pandas和Pairplot Seaborn来分析数据。
Pandas
Pandas提供清理和处理数据的工具。它是最流行的Python库,用于数据分析。在pandas中,一个数据表被称为数据框架。
那么,我们先来创建一个Pandas数据框架:
示例 1:
# Python code demonstrate creating
import pandas as pd
# initialise data of lists.
data = {'Name':[ 'Mohe' , 'Karnal' , 'Yrik' , 'jack' ],
'Age':[ 30 , 21 , 29 , 28 ]}
# Create DataFrame
df = pd.DataFrame( data )
# Print the output.
display(df)
输出:
例子2:从系统中加载CSV数据并通过pandas显示。
# import module
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
# show first 5 column
data.head()
输出:
seaborn.pairplot()
要在一个数据集中绘制多个成对的双变量分布,你可以使用pairplot()函数。这将数据框架中变量的(n, 2)组合的关系显示为一个矩阵图,对角线图是单变量图。
语法: seaborn.pairplot( data, **kwargs )
示例 1:
# importing packages
import seaborn
import matplotlib.pyplot as plt
# loading dataset using seaborn
df = seaborn.load_dataset('tips')
# pairplot with hue sex
seaborn.pairplot(df, hue ='size')
plt.show()
输出:
用Pairplot Seaborn和pandas进行数据可视化
我们看到如何创建pandas数据框架和Pairplot。我们将用pandas的pairplot将数据可视化。
示例 1:
在这个例子中,我们将简单地用pandas数据框架绘制一个对图。在这里,我们只是简单地加载nba.csv数据,并创建一个数据框架,虽然作为参数传递给了pairplot。
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
# pairplot
seaborn.pairplot(data)
输出:
示例 2:
在这个例子中,我们将使用色调属性来实现一个特定列的可视化。
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
seaborn.pairplot(data.head(), hue = 'Age')
输出:
示例 3:
在这个例子中,我们将传递双变量绘图函数的关键字参数字典( plot_kws 和 diag_kws )。
# importing packages
import seaborn
import pandas
# load the csv
data = pandas.read_csv("nba.csv")
seaborn.pairplot(data, hue = 'Age', diag_kind = 'kde',
plot_kws = {'edgecolor': 'k'}, size = 4)
输出: