Pandas xlrd.biffh.XLRDError: Excel xlsx file; not supported错误

Pandas xlrd.biffh.XLRDError: Excel xlsx file; not supported错误

在本文中,我们将介绍关于pandas的一个常见问题:Pandas xlrd.biffh.XLRDError: Excel xlsx file; not supported。

阅读更多:Pandas 教程

问题描述

在使用pandas中的read_excel方法读取Excel时,有时会遇到以下错误:

xlrd.biffh.XLRDError: Excel xlsx file; not supported

这是因为read_excel方法默认使用xlrd包解析Excel文件,而xlrd包目前只支持解析.xls文件,不支持解析.xlsx文件。

解决方法

为了解决这个问题,我们需要安装openpyxl包,并将read_excel方法的engine参数设置为’openpyxl’,以便pandas使用openpyxl包解析Excel文件。

安装openpyxl包

使用以下命令可以在命令行中安装openpyxl包:

pip install openpyxl

设置engine参数为’openpyxl’

使用以下代码可以将read_excel方法的engine参数设置为’openpyxl’:

import pandas as pd

df = pd.read_excel('file.xlsx', engine='openpyxl')

这样就可以使用openpyxl包解析Excel文件,避免了xlrd.biffh.XLRDError错误的发生。

示例

如果我们直接使用以下代码读取该文件:

import pandas as pd

df = pd.read_excel('file.xlsx')

会遇到以下错误:

xlrd.biffh.XLRDError: Excel xlsx file; not supported

现在,我们来尝试使用openpyxl包解析Excel文件:

import pandas as pd

df = pd.read_excel('file.xlsx', engine='openpyxl')

print(df.head())

输出结果如下:

   A    B      C
0  1  abc  100.0
1  2  def  200.0
2  3  ghi  300.0
3  4  jkl  400.0
4  5  mno    NaN

可以看到,通过使用openpyxl包,我们成功地读取了Excel文件,避免了xlrd.biffh.XLRDError错误的发生。

总结

在pandas中读取Excel文件时,可能会遇到xlrd.biffh.XLRDError: Excel xlsx file; not supported错误,这时我们可以使用openpyxl包,并将read_excel方法的engine参数设置为’openpyxl’,以便使用openpyxl包解析Excel文件。希望这篇文章可以帮助您解决该问题。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程