Pandas 填充新的 列

Pandas 填充新的 列

在本文中,我们将介绍如何使用 Pandas 中的 Python 包,将新的列填充为行号。

阅读更多:Pandas 教程

什么是 Pandas?

Pandas 是用于数据操作和分析的 Python 包。它提供了高效的数据结构,如 DataFrame 和 Series,以及各种工具来处理、操作和分析数据。Pandas 为数据的清洗、处理、整理、变换、重构和可视化等工程师和科学家们所需的广泛数据操作提供了强大而简单的工具。

创建 Pandas DataFrame

在深入探讨如何添加新列之前,让我们先创建一个 DataFrame。这里,我们将使用一个简单的 CSV 文件,并将其加载到 DataFrame 中。

如下为读取一个 CSV 文件的代码:

   import pandas as pd
   df = pd.read_csv('file_name.csv')

创建新列

现在,我们已经加载了数据,想要在 DataFrame 中添加一个新列。

   import pandas as pd
   df = pd.read_csv('file_name.csv')

   # Add row numbers to DataFrame
   df['RowNumber'] = range(1, len(df) + 1)

在上面的代码中,我们使用内置的 Python range 函数来创建一个数字序列。这里,我们使用 len(df) 函数来获取 DataFrame 中的行数,然后添加 1 来创建范围从 1 到 DataFrame 行数的数字系列,最后将这个数字系列创建为新列 RowNumber。这样就可以给 DataFrame 每一行添加新的行号。

演示通过 row numbers 来访问 Pandas DataFrame 的行

在这个示例中,为了演示如何使用 row numbers 访问 Pandas DataFrame 的行,我们将使用 iris 数据集,并对其进行一些基本的操作。

   import pandas as pd
   from sklearn.datasets import load_iris

   iris = load_iris()
   df = pd.DataFrame(iris.data, columns=iris.feature_names)

   # Add row numbers to DataFrame
   df['RowNumber'] = range(1, len(df) + 1)

   # Access the 10th row of DataFrame
   row_10 = df.iloc[9]

   # Access the first three rows of the DataFrame
   first_three_rows = df.iloc[0:3]

   # Print the row and first three rows with row numbers
   print("Row number 10: \n" + str(row_10))
   print("\nFirst three rows: \n" + str(first_three_rows))

在上面的代码段中,我们首先导入了必要的包,并使用 scikit-learn 中的 iris 数据集来创建 DataFrame。 接着,我们添加新的行号列,然后使用 iloc 函数访问数据框中的第 10 行和前三行。在打印语句中,我们用字符串输入打印出结果。

总结

在本文中,我们重点介绍了 Pandas DataFrame 中如何添加一个新的列,并将其填充为行数。我们还使用 iris 数据集来演示如何使用 row numbers 访问 DataFrame 的行。希望这篇文章对您有帮助!

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程