Pandas基于字典向数据框中添加新列

Pandas基于字典向数据框中添加新列

在本文中,我们将介绍如何基于字典向 Pandas 数据框中添加新的列。

阅读更多:Pandas 教程

什么是 Pandas 数据框?

Pandas 数据框是 Pandas 库中最重要的数据结构之一。它类似于 Excel 或 SQL 表格,并且能够处理复杂的数据操作。数据框由多个行和列组成,每列代表一种数据类型,而每行则代表一条记录。数据框也可以看做是由多个 Series 组成的。

如何创建 Pandas 数据框?

我们可以使用 Pandas 库的 DataFrame 函数来创建数据框。我们可以传递多种数据类型来创建数据框,如列表、数组、字典等。下面是一个使用字典创建 Pandas 数据框的示例:

import pandas as pd

data = {'名字': ['小明', '小红', '小刚', '小明'], '年龄': [20, 18, 21, 19], '性别': ['男', '女', '男', '男']}

df = pd.DataFrame(data)

上述代码创建了一个具有 3 列数据的数据框,其中指定了每一列的名称和对应的数据。

如何基于字典向数据框中添加新列?

我们可以使用 Pandas 数据框的 assign() 函数向数据框中添加新列。该函数可以接受一个字典或带有列名称和列值的参数,然后将这些列添加到数据框中。在添加新列时,我们需要确保该列的长度与其他列的长度相同。

下面是一个使用字典向 Pandas 数据框添加新列的示例:

import pandas as pd

data = {'名字': ['小明', '小红', '小刚', '小明'], '年龄': [20, 18, 21, 19], '性别': ['男', '女', '男', '男']}
df = pd.DataFrame(data)

height = {'身高': [175, 165, 180, 175]}
df = df.assign(**height)

在上述代码示例中,我们为 df 数据框添加了一个名为 “身高” 的新列,并将该列的值指定为一个长度为 4 的列表。

如何基于多个字典向数据框中添加新列?

如果我们要向数据框中添加多个新列,我们可以将每个列的信息存储在一个单独的字典中,并将这些字典传递给 assign() 函数。下面是一个使用多个字典向 Pandas 数据框添加新列的示例:

import pandas as pd

data = {'名字': ['小明', '小红', '小刚', '小明'], '年龄': [20, 18, 21, 19], '性别': ['男', '女', '男', '男']}
df = pd.DataFrame(data)

height = {'身高': [175, 165, 180, 175]}
weight = {'体重': [80, 60, 70, 72]}

df = df.assign(**height, **weight)

在上述代码示例中,我们为 df 数据框添加了两个新列,分别是 “身高” 和 “体重”。

总结

本文介绍了如何基于字典向 Pandas 数据框中添加新的列。我们学习了如何创建 Pandas 数据框、使用 assign() 函数添加新列,以及如何基于多个字典添加多个新列。希望这篇文章能够帮助你更好地使用 Pandas 库进行数据处理。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程