如何从Pandas数据框架创建直方图
直方图是一个显示计量变量区间内数值频率的图形。这些区间被称为 “bin”,它们的宽度都是一样的。
我们可以使用df.hist()函数从熊猫的数据框中创建一个直方图。
语法 :
DataFrame.hist(column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=None, bins=10, backend=None, legend=False, kwargs)
例1:创建一个基本的直方图(单个列的直方图)
我们使用df.hist()和plot.show()来显示柱状图。
使用的CSV文件: gene_expression.csv
# import libraries and packages
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# reading the CSV file
df = pd.read_csv('gene_expression.csv')
# displaying the DataFrame
print(df)
# creating a basic histogram
df.hist()
plt.show()
输出:
例2:创建一个修正的直方图(按组绘制直方图)
在这个例子中,我们给hist方法增加了额外的参数。我们改变了fig的大小,bin的数量被指定为15,并且给出了参数,以确保每个癌症组的直方图被创建。
# import libraries and packages
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# reading the CSV file
df = pd.read_csv('gene_expression.csv')
# displaying the DataFrame
print(df)
# creating a basic histogram
df.hist(by='Cancer Present', figsize=[12, 8], bins=15)
plt.show()
输出: