Pandas – Dataframe.sort_values() part1
Python是一种做数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。 Pandas 是这些软件包之一,它使导入和分析数据变得更加容易。
Pandas sort_values()函数对一个数据框按照所传递的列的升序或降序进行排序。它与Python的sorted函数不同,因为它不能对数据帧进行排序,也不能选择特定的列。
我们来讨论一下Dataframe.sort_values()单参数排序的问题。
语法:
DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=’quicksort’, na_position=’last’)
除了’by’参数,每个参数都有一些默认值。
参数:
by: 对数据框架进行排序的单列/列名称。
axis: 0或’index’代表行,1或’columns’代表列。
ascending: 布尔值,如果为真,则以升序排列数据框。
inplace: 布尔值。如果为真,则在通过的数据框中进行修改。
kind: 字符串,可以有三个输入(’quicksort’、’mergesort’或’heapsort’),用于对数据帧进行排序的算法。
na_position: 接受两个字符串输入’last’或’first’来设置Null值的位置。默认为 “最后”。
返回值:
返回一个排序的数据框,其尺寸与函数调用者的数据框相同。
示例 #1: 按名称排序
在下面的例子中,从csv文件中制作了一个数据框,数据框按球员姓名的升序排序。
分拣前-
输出:
如图所示,由于数据框架是按名称排序的,所以索引列现在是杂乱无章的。
输出:
示例 #2: 改变空值的位置
在给定的数据中,在不同的列中有许多空值,它们被默认放在最后。在这个例子中,数据框是按照工资列排序的,空值被放在最上面。
如输出图像所示,NaN值在顶部,之后是Salary的排序值。
输出: