在Python中把多个CSV文件读入独立的DataFrames中
在这篇文章中,我们将看到如何将多个CSV文件读入独立的数据框。对于只读取一个数据框,我们可以使用pd.read_csv()函数。它接受一个路径作为输入,并返回数据框,如
df = pd.read_csv("file path")
让我们来看看它是如何工作的
# import module
import pandas as pd
# read dataset
df = pd.read_csv("./csv/crime.csv")
这里,crime.csv是当前文件夹中的文件。CSV是包含crime.csv文件的文件夹,CSV Reader.ipynb是包含上述代码的文件。
输出:
这是从上述函数中读取的数据框。还有一个文件存在于文件夹中,名为 – username.csv。要读取这两个文件并将其存储在不同的数据框中,请使用以下代码
# import module
import pandas as pd
# assign dataset names
list_of_names = ['crime','username']
# create empty list
dataframes_list = []
# append datasets into the list
for i in range(len(list_of_names)):
temp_df = pd.read_csv("./csv/"+list_of_names[i]+".csv")
dataframes_list.append(temp_df)
dataframes_list分别包含所有的数据框架。
dataframes_list[0]:
dataframes_list[1]:
下面是另一种方法,现在假设有许多文件,而我们不知道名称和数量,那么就使用下面的代码
# import modules
import os
import pandas as pd
# assign path
path, dirs, files = next(os.walk("./csv/"))
file_count = len(files)
# create empty list
dataframes_list = []
# append datasets to the list
for i in range(file_count):
temp_df = pd.read_csv("./csv/"+files[i])
dataframes_list.append(temp_df)
# display datasets
for dataset in dataframes_list:
display(dataset)
输出: