如何使用Python Pandas将excel文件导入

并不总是能够得到CSV格式的数据集。因此，Pandas为我们提供了将其他格式的数据集转换为数据框架的功能。一个excel文件有一个’.xlsx’格式。

在我们开始之前，我们需要安装一些库。

pip install pandas
pip install xlrd

为了使用Pandas将Excel文件导入Python，我们必须使用pandas.read_excel()函数。

语法:

pandas.read_excel( io , sheet_name=0 , header=0 , names=None,….)

返回： DataFrame或DataFrames的dict。

我们假设Excel文件是这样的。

如何使用Pandas将excel文件导入Python？

现在，我们可以深入研究代码了。

示例1：读取一个Excel文件

import pandas as pd
  
df = pd.read_excel("sample.xlsx")
print(df)

输出:

如何使用Pandas将excel文件导入Python？

示例2：要选择一个特定的列，我们可以传递一个参数”index_col”

import pandas as pd
  
# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
                   index_col = 0)  
  
print(df)

输出:

如何使用Pandas将excel文件导入Python？

示例3：如果你不喜欢列的初始标题，你可以使用参数 “header”将其改为索引

import pandas as pd
  
df = pd.read_excel('sample.xlsx',
                   header = None)
print(df)

输出:

如何使用Pandas将excel文件导入Python？

示例4：如果你想改变某一列的数据类型，你可以使用参数 “dtype”来实现

import pandas as pd
  
df = pd.read_excel('sample.xlsx', 
                   dtype = {"Products": str,
                            "Price":float})
print(df)

输出:

如何使用Pandas将excel文件导入Python？

示例5：如果你有未知的值，那么你可以使用参数”na_values”来处理。它将把提到的未知值转换成 “NaN”

import pandas as pd
df = pd.read_excel('sample.xlsx', 
                   na_values =['item1', 
                               'item2'])
print(df)

输出:

如何使用Pandas将excel文件导入Python？

如何使用Python Pandas将excel文件导入

如何使用Python Pandas将excel文件导入

示例1：读取一个Excel文件

示例2：要选择一个特定的列，我们可以传递一个参数”index_col”

示例3：如果你不喜欢列的初始标题，你可以使用参数 “header”将其改为索引

示例4：如果你想改变某一列的数据类型，你可以使用参数 “dtype”来实现

示例5：如果你有未知的值，那么你可以使用参数”na_values”来处理。它将把提到的未知值转换成 “NaN”

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Pandas 精品教程

回顶部