Pandas – Dataframe.sort_values() part1

Pandas – Dataframe.sort_values() part1

Python是一种做数据分析的伟大语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。 Pandas 是这些软件包之一,它使导入和分析数据变得更加容易。
Pandas sort_values()函数对一个数据框按照所传递的列的升序或降序进行排序。它与Python的sorted函数不同,因为它不能对数据帧进行排序,也不能选择特定的列。
我们来讨论一下Dataframe.sort_values()单参数排序的问题。
语法:

DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=’quicksort’, na_position=’last’)

除了’by’参数,每个参数都有一些默认值。
参数:

by: 对数据框架进行排序的单列/列名称。
axis: 0或’index’代表行,1或’columns’代表列。
ascending: 布尔值,如果为真,则以升序排列数据框。
inplace: 布尔值。如果为真,则在通过的数据框中进行修改。
kind: 字符串,可以有三个输入(’quicksort’、’mergesort’或’heapsort’),用于对数据帧进行排序的算法。
na_position: 接受两个字符串输入’last’或’first’来设置Null值的位置。默认为 “最后”。

返回值:

返回一个排序的数据框,其尺寸与函数调用者的数据框相同。

示例 #1: 按名称排序
在下面的例子中,从csv文件中制作了一个数据框,数据框按球员姓名的升序排序。
分拣前-

# importing pandas package
import pandas as pd
 
# making data frame from csv file
data = pd.read_csv("nba.csv")
 
# display
data
Python

输出:

Pandas - Dataframe.sort_values


# importing pandas package
import pandas as pd
 
# making data frame from csv file
data = pd.read_csv("nba.csv")
 
# sorting data frame by name
data.sort_values("Name", axis = 0, ascending = True,
                 inplace = True, na_position ='last')
 
# display
data
Python

如图所示,由于数据框架是按名称排序的,所以索引列现在是杂乱无章的。
输出:

Pandas - Dataframe.sort_values

示例 #2: 改变空值的位置
在给定的数据中,在不同的列中有许多空值,它们被默认放在最后。在这个例子中,数据框是按照工资列排序的,空值被放在最上面。

# importing pandas package
import pandas as pd
 
# making data frame from csv file
data = pd.read_csv("nba.csv")
 
# sorting data frame by name
data.sort_values("Salary", axis = 0, ascending = True,
                 inplace = True, na_position ='first')
 
data
# display
Python

如输出图像所示,NaN值在顶部,之后是Salary的排序值。
输出:

Pandas - Dataframe.sort_values

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册