Pandas – Dataframe.sort_values() part1

Python是一种做数据分析的伟大语言，主要是因为以数据为中心的Python软件包的奇妙生态系统。 Pandas 是这些软件包之一，它使导入和分析数据变得更加容易。
Pandas sort_values()函数对一个数据框按照所传递的列的升序或降序进行排序。它与Python的sorted函数不同，因为它不能对数据帧进行排序，也不能选择特定的列。
我们来讨论一下Dataframe.sort_values()单参数排序的问题。
语法:

DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=’quicksort’, na_position=’last’)

除了’by’参数，每个参数都有一些默认值。
参数:

by: 对数据框架进行排序的单列/列名称。
axis: 0或’index’代表行，1或’columns’代表列。
ascending: 布尔值，如果为真，则以升序排列数据框。
inplace: 布尔值。如果为真，则在通过的数据框中进行修改。
kind: 字符串，可以有三个输入（’quicksort’、’mergesort’或’heapsort’），用于对数据帧进行排序的算法。
na_position: 接受两个字符串输入’last’或’first’来设置Null值的位置。默认为 “最后”。

返回值:

返回一个排序的数据框，其尺寸与函数调用者的数据框相同。

示例 #1: 按名称排序
在下面的例子中，从csv文件中制作了一个数据框，数据框按球员姓名的升序排序。
分拣前-

# importing pandas package
import pandas as pd
 
# making data frame from csv file
data = pd.read_csv("nba.csv")
 
# display
data

输出:

Pandas - Dataframe.sort_values

# importing pandas package
import pandas as pd
 
# making data frame from csv file
data = pd.read_csv("nba.csv")
 
# sorting data frame by name
data.sort_values("Name", axis = 0, ascending = True,
                 inplace = True, na_position ='last')
 
# display
data

如图所示，由于数据框架是按名称排序的，所以索引列现在是杂乱无章的。
输出:

Pandas - Dataframe.sort_values

示例 #2: 改变空值的位置
在给定的数据中，在不同的列中有许多空值，它们被默认放在最后。在这个例子中，数据框是按照工资列排序的，空值被放在最上面。

# importing pandas package
import pandas as pd
 
# making data frame from csv file
data = pd.read_csv("nba.csv")
 
# sorting data frame by name
data.sort_values("Salary", axis = 0, ascending = True,
                 inplace = True, na_position ='first')
 
data
# display

如输出图像所示，NaN值在顶部，之后是Salary的排序值。
输出:

Pandas - Dataframe.sort_values