如何使用Python Pandas将excel文件导入
并不总是能够得到CSV格式的数据集。因此,Pandas为我们提供了将其他格式的数据集转换为数据框架的功能。一个excel文件有一个’.xlsx’格式。
在我们开始之前,我们需要安装一些库。
pip install pandas
pip install xlrd
为了使用Pandas将Excel文件导入Python,我们必须使用pandas.read_excel()函数。
语法:
pandas.read_excel( io , sheet_name=0 , header=0 , names=None,….)
返回: DataFrame或DataFrames的dict。
我们假设Excel文件是这样的。
现在,我们可以深入研究代码了。
示例1:读取一个Excel文件
import pandas as pd
df = pd.read_excel("sample.xlsx")
print(df)
输出:
示例2:要选择一个特定的列,我们可以传递一个参数”index_col”
import pandas as pd
# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
index_col = 0)
print(df)
输出:

示例3:如果你不喜欢列的初始标题,你可以使用参数 “header”将其改为索引
import pandas as pd
df = pd.read_excel('sample.xlsx',
header = None)
print(df)
输出:
示例4:如果你想改变某一列的数据类型,你可以使用参数 “dtype”来实现
import pandas as pd
df = pd.read_excel('sample.xlsx',
dtype = {"Products": str,
"Price":float})
print(df)
输出:
示例5:如果你有未知的值,那么你可以使用参数”na_values”来处理。它将把提到的未知值转换成 “NaN”
import pandas as pd
df = pd.read_excel('sample.xlsx',
na_values =['item1',
'item2'])
print(df)
输出:
极客教程