如何在Python中向现有的数据框中添加新列?

如何在Python中向现有的数据框中添加新列?

数据框是一种二维数据结构,数据以行和列的形式存储在表格格式中。

它可以被视为SQL数据表或Excel表格的表示形式。可以使用以下构造函数创建它:

pd.Dataframe(data, index, columns, dtype, copy)
Python

可以以不同的方式向数据框中添加新列。

让我们看一种方法,首先形成一个序列数据结构,然后将其作为附加列传递给现有的数据框,创建一个新的列。

让我们看看代码的运行过程 –

更多Python相关文章,请阅读:Python 教程

示例

import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])}
my_df = pd.DataFrame(my_data)
print("数据框是:")
print(my_df)
print ("通过将其作为序列结构传递,向数据框添加新列 :")
my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c'])
print("向数据框添加新列后:")
print(my_df)
Python

输出结果

数据框是:
    ab   cd
a  1.0  1
b  8.0  2
c  7.0  0
d  NaN  9
通过将其作为系列结构传递,向数据框添加新列:
向数据框添加新列后:
    ab  cd  ef
a  1.0  1   56.0
b  8.0  2  78.0
c  7.0  0  32.0
d  NaN  9  NaN
Python

解释

  • 导入所需的库,并为其提供别名以方便使用。

  • 创建一个字典数据结构,其中一个字典中包含一个键值对。

  • 这样,多个字典会被创建并存储在一个列表中。

  • ‘值’ 是一个系列数据结构。

  • 指数也是一个自定义列表。

  • 字典后来被传递为’pandas’库中的“Dataframe”函数的参数。

  • 通过将字典值的列表作为参数传递给它,创建数据框。

  • 创建另一个新列并初始化其中的值。

  • 这个新列被索引到原来的数据框中。

  • 这样,新列绑定到数据框中。

  • 数据框在控制台上打印出来。

注意 − 单词’NaN’指的是 ‘Not a Number’,这意味着特定的[row,col]值没有任何有效的记录。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册