Pandas xlrd.biffh.XLRDError: Excel xlsx file; not supported错误
在本文中,我们将介绍关于pandas的一个常见问题:Pandas xlrd.biffh.XLRDError: Excel xlsx file; not supported。
阅读更多:Pandas 教程
问题描述
在使用pandas中的read_excel方法读取Excel时,有时会遇到以下错误:
xlrd.biffh.XLRDError: Excel xlsx file; not supported
这是因为read_excel方法默认使用xlrd包解析Excel文件,而xlrd包目前只支持解析.xls文件,不支持解析.xlsx文件。
解决方法
为了解决这个问题,我们需要安装openpyxl包,并将read_excel方法的engine参数设置为’openpyxl’,以便pandas使用openpyxl包解析Excel文件。
安装openpyxl包
使用以下命令可以在命令行中安装openpyxl包:
pip install openpyxl
设置engine参数为’openpyxl’
使用以下代码可以将read_excel方法的engine参数设置为’openpyxl’:
import pandas as pd
df = pd.read_excel('file.xlsx', engine='openpyxl')
这样就可以使用openpyxl包解析Excel文件,避免了xlrd.biffh.XLRDError错误的发生。
示例
如果我们直接使用以下代码读取该文件:
import pandas as pd
df = pd.read_excel('file.xlsx')
会遇到以下错误:
xlrd.biffh.XLRDError: Excel xlsx file; not supported
现在,我们来尝试使用openpyxl包解析Excel文件:
import pandas as pd
df = pd.read_excel('file.xlsx', engine='openpyxl')
print(df.head())
输出结果如下:
A B C
0 1 abc 100.0
1 2 def 200.0
2 3 ghi 300.0
3 4 jkl 400.0
4 5 mno NaN
可以看到,通过使用openpyxl包,我们成功地读取了Excel文件,避免了xlrd.biffh.XLRDError错误的发生。
总结
在pandas中读取Excel文件时,可能会遇到xlrd.biffh.XLRDError: Excel xlsx file; not supported错误,这时我们可以使用openpyxl包,并将read_excel方法的engine参数设置为’openpyxl’,以便使用openpyxl包解析Excel文件。希望这篇文章可以帮助您解决该问题。