如何用Python Pandas在Excel中过滤和保存数据为新文件

如何用Python Pandas在Excel中过滤和保存数据为新文件

现在我们的目的是按物种类别过滤这些数据,并将这些过滤后的数据保存在不同的工作表中,文件名=物种.子类别名称,即在执行代码后,我们将得到三个文件,名称如下

  1. Setosa.xlsx
  2. Versicolor.xlsx
  3. Virginica.xlsx

以下是实现。

# Python code to filter and save the
# data with different file names
import pandas
 
 
data = pandas.read_excel("datasets.xlsx")
 
speciesdata = data["Species"].unique()
 
for i in speciesdata:
    a = data[data["Species"].str.contains(i)]
    a.to_excel(i+".xlsx")

Output: 解释:

  • 首先,我们已经导入了Pandas库。
  • 然后我们在数据对象中加载了data.xlsx excel文件。
  • 为了从该物种列中获取唯一值,我们使用了unique()函数。为了检查物种列中的唯一值,我们在speciesdata对象中调用了unique()。
  • 然后我们将迭代speciesdata对象,因为我们将逐一存储Species列的唯一值(即Setosa, Versicolor, Virginica)。
  • 在对象 “a “中,我们要过滤出与Species.speciesdata相匹配的数据,即在每次迭代中,对象a将存储三种不同类型的数据,即Setosa类型的数据和Versicolor类型的数据,最后是Virginica类型的数据。
  • 现在,为了将过滤后的数据逐一保存在excel文件中,我们使用了to_excel函数,其中,文件将以speciesdata的名字保存。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程