Python Pandas DataFrame.nlargest()

Python Pandas DataFrame.nlargest()

Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。

Pandas nlargest()方法用于从一个数据框或一个系列中获取n个最大的值。

语法:

DataFrame.nlargest(n, columns, keep='first')

参数:

n: int, 要选择的值的数量
columns:检查值的列,或者用户也可以在调用时选择列。[例如: data[“age”].nsmallest(3) OR data.nsmallest(3, “age”)]

keep:设置在重复退出时选择哪个值的对象。选项是 “第一 “或 “最后”。

代码#1:提取最大的5个值
在这个例子中,最大的5个值被提取出来,然后与其他通过sort_values()函数排序的值进行比较。在尝试这个方法之前,NaN值被移除。

参考 sort_values 和 dropna() 函数。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv")
  
# removing null values
data.dropna(inplace = True)
  
# extracting greatest 5
large5 = data.nlargest(5, "Salary")
  
# display
large5

输出:
Python Pandas DataFrame.nlargest()

代码#2:通过sort_values()进行排序

# importing pandas package
import pandas as pd
  
# making data frame from csv file 
data = pd.read_csv("employees.csv")
  
# removing null values
data.dropna(inplace = True)
  
# sorting in descending order
data.sort_values("Salary", ascending = False, inplace = True)
  
# displaying top 5 values
data.head()

输出:

如输出图像所示,两个函数返回的值是相似的。
Python Pandas DataFrame.nlargest()

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程