Pandas从多个文件创建数据框
在本文中,我们将介绍如何使用Pandas从多个文件中创建数据框。这是一个常见的数据处理任务,尤其是当数据分布在多个文件中时。Pandas提供了一些方便的函数来处理这种情况,例如pd.concat()和pd.merge()。
阅读更多:Pandas 教程
从多个CSV文件创建数据框
假设我们有几个CSV文件,每个文件都包含来自不同城市的气温数据。我们希望将这些数据合并成一个数据框,并进行一些简单的分析。
import pandas as pd
import glob
csv_files = glob.glob('temperatures/*csv') # 获取所有CSV文件的路径
df_list = []
for file in csv_files:
df = pd.read_csv(file)
df_list.append(df)
df = pd.concat(df_list) # 合并数据框
在上面的代码中,我们使用了glob模块来获取所有CSV文件的路径。然后,我们读取每个文件并将其添加到一个数据框列表中。最后,我们使用pd.concat()函数将所有数据框合并成一个数据框。
从多个Excel文件创建数据框
与CSV文件类似,我们可以使用pandas库从多个Excel文件中创建数据框。假设我们有几个Excel文件,每个文件包含来自不同城市的气温数据。
import pandas as pd
import glob
excel_files = glob.glob('temperatures/*xlsx') # 获取所有Excel文件的路径
df_list = []
for file in excel_files:
df = pd.read_excel(file)
df_list.append(df)
df = pd.concat(df_list) # 合并数据框
在上面的代码中,我们使用了glob模块来获取所有Excel文件的路径。然后,我们读取每个文件并将其添加到一个数据框列表中。最后,我们使用pd.concat()函数将所有数据框合并成一个数据框。
从不同格式的文件创建数据框
假设我们有几个文件,其中有一些是CSV文件,有一些是Excel文件。我们需要将它们合并成一个数据框。
import pandas as pd
import glob
csv_files = glob.glob('temperatures/*.csv') # 获取所有CSV文件的路径
excel_files = glob.glob('temperatures/*.xlsx') # 获取所有Excel文件的路径
df_list = []
for file in csv_files:
df = pd.read_csv(file)
df_list.append(df)
for file in excel_files:
df = pd.read_excel(file)
df_list.append(df)
df = pd.concat(df_list) # 合并数据框
在上面的代码中,我们使用了glob模块来获取CSV和Excel文件的路径。然后,我们按照文件类型依次读取每个文件并将其添加到一个数据框列表中。最后,我们使用pd.concat()函数将所有数据框合并成一个数据框。
总结
在本文中,我们介绍了如何使用Pandas从多个文件创建数据框。我们演示了从多个CSV和Excel文件中创建数据框的方法,并提供了代码示例。Pandas提供了许多方便的函数来处理这种情况,例如pd.concat()和pd.merge(),我们可以根据具体情况选择适当的方法来创建数据框。
极客教程