如何使用Python Pandas将所有CSV文件合并为单个数据框?
要合并所有CSV文件,请使用GLOB模块。 os.path.join()方法在concat()中用于将CSV文件合并在一起。
首先,导入所需的库。我们已将pd设置为pandas库的别名−
import pandas as pd
import glob
import os
假设我们有以下3个CSV文件−
销售1.csv

销售2.csv

销售3.csv

首先,设置合并多个文件的路径。我们将所有要合并的CSV文件都放在桌面上−
files = os.path.join("C:\Users\amit_\Desktop\", "sales*.csv")
接下来,使用glob返回合并文件的列表−
files = glob.glob(files)
更多Pandas相关文章,请阅读:Pandas 教程
示例
以下是代码−
import pandas as pd
import glob
import os
#设置合并多个文件的路径
files = os.path.join("C:\Users\amit_\Desktop\", "sales*.csv")
#返回合并文件的列表
files = glob.glob(files)
print("在特定位置合并所有CSV文件后的结果CSV...");
#使用concat和read_csv合并文件
df = pd.concat(map(pd.read_csv, files), ignore_index=True)
print(df)
输出
这将产生以下结果−
在特定位置合并所有CSV文件后的结果CSV...
车 地点 销售量
0 奥迪 班加罗尔 80
1 保时捷 孟买 110
2 劳斯莱斯 敏 100
3 宝马 德里 95
4 奔驰 海得拉巴 80
5 兰博基尼 昌迪加尔 80
6 沃尔沃 拉贾斯坦邦 150
7 现代 摩尼普尔 120
8 丰田 马尼普 70
极客教程