Pandas基于字典向数据框中添加新列
在本文中,我们将介绍如何基于字典向 Pandas 数据框中添加新的列。
阅读更多:Pandas 教程
什么是 Pandas 数据框?
Pandas 数据框是 Pandas 库中最重要的数据结构之一。它类似于 Excel 或 SQL 表格,并且能够处理复杂的数据操作。数据框由多个行和列组成,每列代表一种数据类型,而每行则代表一条记录。数据框也可以看做是由多个 Series 组成的。
如何创建 Pandas 数据框?
我们可以使用 Pandas 库的 DataFrame
函数来创建数据框。我们可以传递多种数据类型来创建数据框,如列表、数组、字典等。下面是一个使用字典创建 Pandas 数据框的示例:
import pandas as pd
data = {'名字': ['小明', '小红', '小刚', '小明'], '年龄': [20, 18, 21, 19], '性别': ['男', '女', '男', '男']}
df = pd.DataFrame(data)
上述代码创建了一个具有 3 列数据的数据框,其中指定了每一列的名称和对应的数据。
如何基于字典向数据框中添加新列?
我们可以使用 Pandas 数据框的 assign()
函数向数据框中添加新列。该函数可以接受一个字典或带有列名称和列值的参数,然后将这些列添加到数据框中。在添加新列时,我们需要确保该列的长度与其他列的长度相同。
下面是一个使用字典向 Pandas 数据框添加新列的示例:
import pandas as pd
data = {'名字': ['小明', '小红', '小刚', '小明'], '年龄': [20, 18, 21, 19], '性别': ['男', '女', '男', '男']}
df = pd.DataFrame(data)
height = {'身高': [175, 165, 180, 175]}
df = df.assign(**height)
在上述代码示例中,我们为 df
数据框添加了一个名为 “身高” 的新列,并将该列的值指定为一个长度为 4 的列表。
如何基于多个字典向数据框中添加新列?
如果我们要向数据框中添加多个新列,我们可以将每个列的信息存储在一个单独的字典中,并将这些字典传递给 assign()
函数。下面是一个使用多个字典向 Pandas 数据框添加新列的示例:
import pandas as pd
data = {'名字': ['小明', '小红', '小刚', '小明'], '年龄': [20, 18, 21, 19], '性别': ['男', '女', '男', '男']}
df = pd.DataFrame(data)
height = {'身高': [175, 165, 180, 175]}
weight = {'体重': [80, 60, 70, 72]}
df = df.assign(**height, **weight)
在上述代码示例中,我们为 df
数据框添加了两个新列,分别是 “身高” 和 “体重”。
总结
本文介绍了如何基于字典向 Pandas 数据框中添加新的列。我们学习了如何创建 Pandas 数据框、使用 assign()
函数添加新列,以及如何基于多个字典添加多个新列。希望这篇文章能够帮助你更好地使用 Pandas 库进行数据处理。