Python Pandas Dataframe.sort_values() Set-1
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas sort_values()函数对一个数据框按照所传递的列的升序或降序进行排序。它与Python的sorted函数不同,因为它不能对数据帧进行排序,也不能选择特定的列。
我们来讨论一下Dataframe.sort_values()单参数排序的问题。
语法:
DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=’quicksort’, na_position=’last’)
除了’by’参数,每个参数都有一些默认值。
参数:
by: 单一/列的列名,用于对数据框架进行排序。
axis: 0或’index’为行,1或’columns’为列。
ascending:布尔值,如果为真,则以升序对数据框架进行排序。
inplace:布尔值。如果为真,则在传递的数据框中进行更改。
kind:字符串,可以有三个输入(’quicksort’, ‘mergesort’ or ‘heapsort’)用于排序数据框的算法。
na_position:可以有两个字符串输入 “last “或 “first “来设置Null值的位置。默认为 “最后”。
返回:返回一个排序的数据框,其尺寸与函数调用者的数据框相同。
例子#1:按名称排序
在下面的例子中,从csv文件中制作了一个数据框,数据框按球员姓名的升序排序。
Before Sorting-
输出:
分类后-
如图所示,由于数据框架是按名称排序的,所以索引列现在是杂乱无章的。
输出:
例子#2:改变空值的位置
在给定的数据中,在不同的列中有许多空值,它们被默认放在最后。在这个例子中,数据框是按照工资列排序的,空值被放在最上面。
如输出图像所示,NaN值在顶部,之后是Salary的排序值。
输出: