从列表创建Pandas DataFrame

从列表创建Pandas DataFrame

Pandas DataFrame是一个具有行和列的二维表格,它们是不可变的,也就是说一旦创建就不能改变。使用列表从头创建一个DataFrame是数据科学和信息技术中的常见任务。列表是一个有序的元素集合,它是Python中最常用的数据结构之一。列表可以存储任何类型的值,例如数字、字符串和布尔值。

在本文档中,我将提供一个详细的说明,介绍如何使用逐步说明、代码片段和每个子部分的解释,以实际案例为例,从列表中创建Pandas DataFrame。

数据帧和列表之间的主要区别是什么?

列表是Python中的基本数据结构,它可以容纳任何数据类型的元素集合,而数据帧是一种类似于电子表格或SQL表格的二维表格结构,它以行和列的方式存储数据。下面是DataFrame和列表之间的一些关键区别 −

  • 结构 − 列表是简单的一维值集合,而数据帧是一个二维的类似表格的结构,具有行和列。

  • 数据类型 − 列表可以容纳任何数据类型的元素,包括数字、字符串,甚至其他列表,而数据帧则设计为以表格格式存储数据,具有特定数据类型的列,例如整数、浮点数和字符串。

  • 规模 − 列表可以容纳任意数量的元素,而数据帧通常设计为容纳大量数据的,可能具有数百万行和列。

  • 操作 − 列表支持基本操作,如索引、切片和追加,而数据帧支持更复杂的操作,如过滤、连接和分组。

  • 数据操作 − 列表提供数据操作的基本功能,而数据帧提供强大的数据操作工具,如根据特定标准过滤、排序和聚合数据。

先决条件

在我们深入探讨任务之前,需要在您的系统上安装以下内容−

推荐的设置列表−

  • pip install pandas,bokeh

  • 预期用户将使用任何独立的IDE,如VS-Code,PyCharm,Atom或Sublime文本。

  • 甚至在线Python编译器也可以使用,如Kaggle.com,Google Cloud平台或任何其他编译器。

  • Python的更新版本。编写本文时,我使用的是3.10.9版本。

  • 了解使用Jupyter笔记本的知识。

  • 了解和应用虚拟环境将是有益的,但不是必需的。

  • 也可以预期个人对统计学和数学有较好的理解。

需要的步骤

导入库

要在Pandas中创建DataFrame,我们需要导入Pandas库。以下代码用于导入Pandas库−

import pandas as pd

创建列表

在我们使用列表创建DataFrame之前,我们首先需要创建列表来存储数据。在本节中,我将向您展示如何使用简单数据实例创建列表。

创建一个名称列表

names = ['John', 'Mary', 'Peter', 'Jane', 'Daniel']

在上面的代码片段中,我们创建了一个名为names的列表,其中包含表示个体名称的五个字符串值。

创建一个年龄列表

ages = [32, 25, 41, 29, 36]

在上面的代码片段中,我们创建了一个名为ages的列表,其中包含五个整数值,表示个体的年龄。

创建一个布尔值列表

current_status = [True, False, True, False, True]

在上面的代码片段中,我们创建了一个名为current_status的列表,其中包含表示个体当前状况的五个布尔值。

从列表创建DataFrame

一旦我们有包含数据的列表,我们可以使用pd.DataFrame()函数在Pandas中创建一个DataFrame。我们可以将列表作为参数传递给pd.DataFrame()函数。以下代码用于从列表创建DataFrame −

df = pd.DataFrame(list(zip(names, ages, current_status)), columns=['Name', 'Age', 'Current_Status'])

在上面的代码片段中,我们首先使用zip()函数创建了一个元组列表。zip()函数将列表组合成单个元组列表。然后,我们将这个元组列表作为第一个参数传递给pd.DataFrame()函数。

pd.DataFrame()函数的第二个参数是DataFrame的列名称列表。在这种情况下,我们使用columns=['Name','Age','Current_Status']将列名称指定为NameAgeCurrent_Status

查看DataFrame

创建DataFrame之后,我们可以使用.head()函数查看DataFrame的前几行。以下代码用于显示DataFrame的前几行 −

print(df.head())

在上面的代码片段中,我们使用.head()函数显示了DataFrame的前几行。

输出

    Name   Age  Current_Status
0   John   32            True
1   Mary   25           False
2   Peter  41            True
3   Jane   29           False
4   Daniel 36            True

在上面的输出中,我们可以看到从列表创建DataFrame的过程。

总结

在本文中,我提供了一个详细的步骤指南,介绍了如何从列表创建Pandas DataFrame。我演示了如何导入Pandas库,创建列表以及如何使用pd.DataFrame()函数创建DataFrame。此外,我展示了如何使用.head()函数查看DataFrame的前几行。通过跟随这些说明,您现在应该能够使用真实世界的示例从列表中创建Pandas DataFrame。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程