Python可视化使用柱状图查看乘客幸存情况

Python可视化使用柱状图查看乘客幸存情况

Python可视化使用柱状图查看乘客幸存情况

介绍

在数据分析和可视化中,柱状图是一种常见的图表类型。它可以用来表示不同类别的数据,并比较它们之间的数量或频率。在本文中,我们将使用Python的可视化库来创建一个柱状图,用于查看乘客的幸存情况。

数据集

我们将使用Titanic号的乘客数据集,它包含了Titanic号上乘客的相关信息,包括乘客的年龄、性别、船票等级、登船港口以及是否幸存。这个数据集可以从Kaggle网站上下载到,并且是一个常用的用于数据分析和机器学习的练手数据集。

我们将使用pandas库来读取和处理数据集。首先,我们需要导入必要的库和加载数据集。

import pandas as pd

# 读取数据集
data = pd.read_csv('titanic.csv')

# 查看数据集的前几行
print(data.head())
Python

运行上述代码,我们可以看到数据集的前几行,包括了乘客的信息以及是否幸存的标注。

数据清洗

在绘制柱状图之前,我们需要对数据集进行一些清洗,以确保数据的准确性和一致性。在这个示例中,我们关注的是乘客的幸存情况,所以我们需要提取出与幸存相关的列。

# 提取幸存状态列
survived = data['Survived']

# 查看幸存状态的取值
print(survived.unique())
Python

运行上述代码,我们可以看到幸存状态的取值为0和1,分别表示未幸存和幸存。

绘制柱状图

我们将使用matplotlib库来绘制柱状图。首先,我们需要安装相关的库。

!pip install matplotlib
Python

接下来,我们导入必要的库并绘制柱状图。

import matplotlib.pyplot as plt

# 统计幸存和未幸存的人数
survived_count = survived.value_counts()

# 绘制柱状图
plt.bar(['No', 'Yes'], survived_count)

# 添加标题和标签
plt.title('Passenger Survival')
plt.xlabel('Survived')
plt.ylabel('Count')

# 显示图表
plt.show()
Python

运行上述代码,我们可以看到一个以幸存状态为横坐标、幸存人数为纵坐标的柱状图。通过此图,我们可以直观地比较幸存和未幸存的人数。

结论

通过以上的分析,我们可以得出以下结论:

  • 在Titanic号上,幸存的乘客数量比未幸存的乘客数量要少。
  • 通过柱状图的对比,我们可以更直观地比较幸存和未幸存的人数。

柱状图是一种简单直观的可视化方式,在数据分析和报告中广泛应用。Python的可视化库提供了丰富的功能和灵活的选项,使得我们可以根据数据的特点和需求创建出各种形式的柱状图。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册