使用Python Pandas .iloc[] 提取行数
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。_Pandas _是其中一个包,它使导入和分析数据变得更加容易。
Pandas库提供了一种独特的方法来检索数据框中的行。Dataframe.iloc[]方法用于数据框架的索引标签不是0、1、2、3….n的数字系列,或者用户不知道索引标签的情况。可以使用一个在数据框中不可见的假想的索引位置来提取行。
语法: pandas.DataFrame.iloc[]
参数:
索引位置:整数或整数列表中的行的索引位置。
返回类型:数据框或系列,取决于参数
例子#1:提取单行并与.loc[]进行比较 在这个例子中,相同的索引号行被.iloc[]和.loc[]方法提取出来并进行比较。由于索引列默认是数字,因此索引标签也将是整数。
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("nba.csv")
# retrieving rows by loc method
row1 = data.loc[3]
# retrieving rows by iloc method
row2 = data.iloc[3]
# checking if values are equal
row1 == row2
输出:
如输出图像所示,两种方法返回的结果是相同的。
例子#2:用索引提取多条记录 在这个例子中,首先通过传递一个列表来提取多条记录,然后通过传递整数来提取该范围内的记录。之后,对这两个值进行比较。
# importing pandas package
import pandas as pd
# making data frame from csv file
data = pd.read_csv("nba.csv")
# retrieving rows by loc method
row1 = data.iloc[[4, 5, 6, 7]]
# retrieving rows by loc method
row2 = data.iloc[4:8]
# comparing values
row1 == row2
输出:
如输出图片所示,两种方法返回的结果都是一样的。所有的值都是 “真”,除了学院那一栏的值,因为那些是NaN值。