使用Python Pandas将多个文件中的Excel数据连接起来

使用Python Pandas将多个文件中的Excel数据连接起来

让我们看看如何连接两个Excel文件的数据并将合并后的数据保存为一个新的Excel文件。

我们有2个文件,注册详情.xlsx和考试结果.xlsx 。

registration details.xlsx
使用Python Pandas将多个文件中的Excel数据连接起来

在这个文件中,我们有7个列,有14个独特的学生信息。列的名称如下。

  • Admission Date
  • 学生姓名
  • Gender
  • DOB
  • 学生电子邮件地址
  • 查询号码
  • 注册号

exam results.xlsx
使用Python Pandas将多个文件中的Excel数据连接起来

在这个文件中,我们有7个列,有32个唯一的学生信息。列的名称如下。

  • 注册号
  • Name
  • 尝试的问题数量
  • Correct
  • Incorrect
  • Marks Obtained
  • Percentage

你可以从这些链接中下载这些文件:注册详情.xlsx和考试结果.xlsx。

现在,让我们看看这两个文件之间的共同列。

使用Python Pandas将多个文件中的Excel数据连接起来

所以这两个excel文件的共同列是注册号。因此,我们需要将这两个文件合并,使新的excel文件只保留所需的列,即 。

使用Python Pandas将多个文件中的Excel数据连接起来

算法:

1.导入Pandas模块。
2.使用read_excel()函数读取这两个文件。
3.使用merge()函数将其合并。
4.使用to_excel()函数,创建结果文件。

# importing the module
import pandas
  
# reading the files
f1 = pandas.read_excel("registration details.xlsx")
f2 = pandas.read_excel("exam results.xlsx")
  
# merging the files
f3 = f1[["REGISTRATION NO", 
         "STUDENT EMAIL ID "]].merge(f2[["REGISTRATION NO", 
                                         "Name", "Marks Obtained", 
                                         "Percentage"]], 
                                     on = "REGISTRATION NO", 
                                     how = "left")
  
# creating a new file
f3.to_excel("Results.xlsx", index = False)
Python

输出 :
使用Python Pandas将多个文件中的Excel数据连接起来

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册