Python Pandas DataFrame.nsmallest()

Python是一种进行数据分析的伟大语言，主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个，使导入和分析数据变得更加容易。
Pandas nsmallest()方法是用来从一个数据框或一个系列中获取n个最小值。

语法:

DataFrame.nsmallest(n, columns, keep=’first’)

参数:
n: int, 要选择的值的数量
列：列来检查最小值，或者用户也可以在调用时选择列。[例如：data[“age”].nsmallest(3) OR data.nsmallest(3, “age”)]
keep:对象，设置在重复退出时选择哪个值。选项是 “第一 “或 “最后”。
例子#1：提取至少5个值
在这个例子中，至少有5个值被提取出来，然后通过sort_values()函数与其他排序的值进行比较。
在尝试这个方法之前，NaN值被删除。
参考 sort_values 和 dropna() 。

# importing pandas package
import pandas as pd
 
# making data frame from csv file
data = pd.read_csv("employees.csv")
 
# removing null values
data.dropna(inplace = True)
 
# extracting least 5
least5 = data.nsmallest(5, "Salary")
 
# display
least5

输出:

Python Pandas DataFrame.nsmallest()

例子#2：通过sort_values()进行排序。

# importing pandas package
import pandas as pd
 
# making data frame from csv file
data = pd.read_csv("employees.csv")
 
# removing null values
data.dropna(inplace = True)
 
# sorting in ascending order
data.sort_values("Salary", ascending = True, inplace = True)
 
# displaying top 5 values
data.head()

输出:
如输出图像所示，两个函数返回的值是相似的。

Python Pandas DataFrame.nsmallest()