如何使用Python Pandas将excel文件导入

如何使用Python Pandas将excel文件导入

并不总是能够得到CSV格式的数据集。因此,Pandas为我们提供了将其他格式的数据集转换为数据框架的功能。一个excel文件有一个’.xlsx’格式。

在我们开始之前,我们需要安装一些库。

pip install pandas
pip install xlrd
Python

为了使用Pandas将Excel文件导入Python,我们必须使用pandas.read_excel()函数。

语法:

pandas.read_excel( io , sheet_name=0 , header=0 , names=None,.)
Python

返回: DataFrame或DataFrames的dict。

我们假设Excel文件是这样的。

如何使用Pandas将excel文件导入Python?

现在,我们可以深入研究代码了。

示例1:读取一个Excel文件

import pandas as pd
  
df = pd.read_excel("sample.xlsx")
print(df)
Python

输出:

如何使用Pandas将excel文件导入Python?

示例2:要选择一个特定的列,我们可以传递一个参数”index_col”

import pandas as pd
  
# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
                   index_col = 0)  
  
print(df)
Python

输出:

如何使用Pandas将excel文件导入Python?

示例3:如果你不喜欢列的初始标题,你可以使用参数 “header”将其改为索引

import pandas as pd
  
df = pd.read_excel('sample.xlsx',
                   header = None)
print(df)
Python

输出:

如何使用Pandas将excel文件导入Python?

示例4:如果你想改变某一列的数据类型,你可以使用参数 “dtype”来实现

import pandas as pd
  
df = pd.read_excel('sample.xlsx', 
                   dtype = {"Products": str,
                            "Price":float})
print(df)
Python

输出:

如何使用Pandas将excel文件导入Python?

示例5:如果你有未知的值,那么你可以使用参数”na_values”来处理。它将把提到的未知值转换成 “NaN”

import pandas as pd
df = pd.read_excel('sample.xlsx', 
                   na_values =['item1', 
                               'item2'])
print(df)
Python

输出:

如何使用Pandas将excel文件导入Python?

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册