pandas读取多个csv文件|极客教程

pandas读取多个csv文件

在数据分析中，经常需要处理多个csv文件，这时就可以利用pandas库来进行读取和处理。pandas是一个开源的数据分析库，提供了许多功能强大的数据结构和数据分析工具，适用于处理各种类型的数据。

读取单个csv文件

首先，我们可以先来看一下如何读取单个csv文件。假设有一个名为”data.csv”的文件，存放了一些数据，我们可以使用pandas的read_csv()函数来读取该文件。

import pandas as pd

# 读取单个csv文件
data = pd.read_csv("data.csv")
print(data.head())

上面的代码中，我们使用read_csv()函数读取了”data.csv”文件，并将数据存放在DataFrame中。然后使用head()方法展示了DataFrame的前几行数据。

读取多个csv文件

接下来，我们来看如何读取多个csv文件。假设有多个名为”data1.csv”、”data2.csv”、”data3.csv”等文件，分别存放了不同时间段的数据，我们可以使用循环来读取这些文件并进行处理。

# 读取多个csv文件
data_list = []
filenames = ["data1.csv", "data2.csv", "data3.csv"]

for filename in filenames:
    data = pd.read_csv(filename)
    data_list.append(data)

# 合并数据
final_data = pd.concat(data_list)
print(final_data.head())

上面的代码中，我们先定义了一个空的列表data_list来存放读取的数据，然后使用循环遍历filenames列表中的文件名，依次读取数据并将其添加至data_list中。最后使用concat()函数将所有数据合并成一个DataFrame，并输出前几行数据。

运行结果

假设”data1.csv”、”data2.csv”、”data3.csv”文件的内容如下：

“data1.csv”:

A,B,C
1,2,3
4,5,6

“data2.csv”:

A,B,C
7,8,9
10,11,12

“data3.csv”:

A,B,C
13,14,15
16,17,18

则运行上述代码后的输出为：

   A   B   C
0  1   2   3
1  4   5   6
0  7   8   9
1  10  11  12
0  13  14  15
1  16  17  18

以上就是使用pandas读取多个csv文件的方法，通过循环读取并合并数据，方便进行后续的数据处理和分析。

pandas读取多个csv文件