如何在 Python 中使用已有的列来创建一个新的 DataFrame 列?

如何在 Python 中使用已有的列来创建一个新的 DataFrame 列?

Dataframe 是一种二维数据结构,其中数据以行和列的形式以表格格式存储。它可以视为 SQL 数据表或 Excel 表格表示。

可使用以下构造函数创建 Dataframe:

pd.DataFrame(data, index, columns, dtype, copy)

我们之前看过一种方法,其中新的列作为 Series 数据结构创建。它与原始 dataframe 索引,因此被添加到 dataframe 中。

让我们看看如何使用已有的 dataframe 列来创建一个新的列。当我们需要对已有的列执行一些计算并将其结果存储在新列中时,这非常有用。

更多Python相关文章,请阅读:Python 教程

示例

import pandas as pd
my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),
'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']),
'ef' :pd.Series([56, 78, 32],index=['a','b','c'])}
my_df = pd.DataFrame(my_data)
print("The dataframe is :")
print(my_df)
my_df['gh'] = my_df['ab'] + my_df['ef']
print("After adding column 0 and 2 to the dataframe, :")
print(my_df)

输出结果

The dataframe is :
   ab   cd  ef
a  1.0  1  56.0
b  8.0  2  78.0
c  7.0  0  32.0
d NaN 9 NaN
After adding column 0 and 2 to the dataframe, :
   ab   cd  ef    gh
a  1.0  1   56.0  57.0
b  8.0  2   78.0  86.0
c  7.0  0   32.0  39.0
d  NaN  9   NaN   NaN

解释

  • 导入所需的库,并以东都别名以便使用。

  • 创建字典值,其中值实际上是 Series 数据结构。

  • 创建多个此类字典值。

  • 将此字典作为参数传递给 “pandas” 库中的 “Dataframe” 函数。

  • 通过将字典作为参数传递给它来创建 dataframe。

  • 为 dataframe 索引一个新列,并添加第0列和第2列,从而创建新列。

  • 将 dataframe 打印到控制台。

注意: - “NaN” 的意思是“不是数字”,这意味着特定的 [row,col] 值没有任何有效条目。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程