pandas读取多个csv文件
在数据分析中,经常需要处理多个csv文件,这时就可以利用pandas库来进行读取和处理。pandas是一个开源的数据分析库,提供了许多功能强大的数据结构和数据分析工具,适用于处理各种类型的数据。
读取单个csv文件
首先,我们可以先来看一下如何读取单个csv文件。假设有一个名为”data.csv”的文件,存放了一些数据,我们可以使用pandas的read_csv()
函数来读取该文件。
import pandas as pd
# 读取单个csv文件
data = pd.read_csv("data.csv")
print(data.head())
上面的代码中,我们使用read_csv()
函数读取了”data.csv”文件,并将数据存放在DataFrame中。然后使用head()
方法展示了DataFrame的前几行数据。
读取多个csv文件
接下来,我们来看如何读取多个csv文件。假设有多个名为”data1.csv”、”data2.csv”、”data3.csv”等文件,分别存放了不同时间段的数据,我们可以使用循环来读取这些文件并进行处理。
# 读取多个csv文件
data_list = []
filenames = ["data1.csv", "data2.csv", "data3.csv"]
for filename in filenames:
data = pd.read_csv(filename)
data_list.append(data)
# 合并数据
final_data = pd.concat(data_list)
print(final_data.head())
上面的代码中,我们先定义了一个空的列表data_list
来存放读取的数据,然后使用循环遍历filenames
列表中的文件名,依次读取数据并将其添加至data_list
中。最后使用concat()
函数将所有数据合并成一个DataFrame,并输出前几行数据。
运行结果
假设”data1.csv”、”data2.csv”、”data3.csv”文件的内容如下:
“data1.csv”:
A,B,C
1,2,3
4,5,6
“data2.csv”:
A,B,C
7,8,9
10,11,12
“data3.csv”:
A,B,C
13,14,15
16,17,18
则运行上述代码后的输出为:
A B C
0 1 2 3
1 4 5 6
0 7 8 9
1 10 11 12
0 13 14 15
1 16 17 18
以上就是使用pandas读取多个csv文件的方法,通过循环读取并合并数据,方便进行后续的数据处理和分析。