如何在Python中向现有的数据框中添加新列?
数据框是一种二维数据结构,数据以行和列的形式存储在表格格式中。
它可以被视为SQL数据表或Excel表格的表示形式。可以使用以下构造函数创建它:
pd.Dataframe(data, index, columns, dtype, copy)
可以以不同的方式向数据框中添加新列。
让我们看一种方法,首先形成一个序列数据结构,然后将其作为附加列传递给现有的数据框,创建一个新的列。
让我们看看代码的运行过程 –
更多Python相关文章,请阅读:Python 教程
示例
import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("数据框是:")
print(my_df)
print ("通过将其作为序列结构传递,向数据框添加新列 :")
my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c'])
print("向数据框添加新列后:")
print(my_df)
输出结果
数据框是:
ab cd
a 1.0 1
b 8.0 2
c 7.0 0
d NaN 9
通过将其作为系列结构传递,向数据框添加新列:
向数据框添加新列后:
ab cd ef
a 1.0 1 56.0
b 8.0 2 78.0
c 7.0 0 32.0
d NaN 9 NaN
解释
- 导入所需的库,并为其提供别名以方便使用。
-
创建一个字典数据结构,其中一个字典中包含一个键值对。
-
这样,多个字典会被创建并存储在一个列表中。
-
‘值’ 是一个系列数据结构。
-
指数也是一个自定义列表。
-
字典后来被传递为’pandas’库中的“Dataframe”函数的参数。
-
通过将字典值的列表作为参数传递给它,创建数据框。
-
创建另一个新列并初始化其中的值。
-
这个新列被索引到原来的数据框中。
-
这样,新列绑定到数据框中。
-
数据框在控制台上打印出来。
注意 − 单词’NaN’指的是 ‘Not a Number’,这意味着特定的[row,col]值没有任何有效的记录。