使用Python Pandas将多个文件中的Excel数据连接起来
让我们看看如何连接两个Excel文件的数据并将合并后的数据保存为一个新的Excel文件。
我们有2个文件,注册详情.xlsx和考试结果.xlsx 。
registration details.xlsx

在这个文件中,我们有7个列,有14个独特的学生信息。列的名称如下。
- Admission Date
- 学生姓名
- Gender
- DOB
- 学生电子邮件地址
- 查询号码
- 注册号
exam results.xlsx

在这个文件中,我们有7个列,有32个唯一的学生信息。列的名称如下。
- 注册号
- Name
- 尝试的问题数量
- Correct
- Incorrect
- Marks Obtained
- Percentage
你可以从这些链接中下载这些文件:注册详情.xlsx和考试结果.xlsx。
现在,让我们看看这两个文件之间的共同列。

所以这两个excel文件的共同列是注册号。因此,我们需要将这两个文件合并,使新的excel文件只保留所需的列,即 。

算法:
1.导入Pandas模块。
2.使用read_excel()函数读取这两个文件。
3.使用merge()函数将其合并。
4.使用to_excel()函数,创建结果文件。
# importing the module
import pandas
# reading the files
f1 = pandas.read_excel("registration details.xlsx")
f2 = pandas.read_excel("exam results.xlsx")
# merging the files
f3 = f1[["REGISTRATION NO",
"STUDENT EMAIL ID "]].merge(f2[["REGISTRATION NO",
"Name", "Marks Obtained",
"Percentage"]],
on = "REGISTRATION NO",
how = "left")
# creating a new file
f3.to_excel("Results.xlsx", index = False)
输出 :

极客教程