Pandas头、尾巴和样本的区别
在这篇文章中,我们将看到Pandas头部、尾部和使用Python的样本之间的区别。
Pandas是一个开源的库,主要是为了方便和直观地处理关系型或标记型数据。它提供了各种数据结构和操作来处理数字数据和时间序列。读取CSV文件后的第一行代码是显示我们给定数据集的数据。Pandas提供了三个这样的功能,你可以通过它们来显示样本数据集。这三种方法是Head, Tail, 和 Sample。
头部、尾部和样本之间的区别
人们必须分析他们应该如何显示给定的数据。通常情况下,许多程序员喜欢选择head()并检查起始行来分析数据。但有时这可能并不足够。我说要用这三种方法来分析数据。
样本
使用样本方法,你可以显示你的数据集中的随机数据。你可以通过不同的方式来显示数据集中的样本数据。
示例:
import pandas as pd
data = {
"Anime": ["One Piece", "Naruto", "Bleach",
"Hunter X Hunter", "Attack On Titan",
"Gintama", "Code Geass", "Death Note",
"Black Lagoon", "Classroom Of Elite",
"Cowboy Bepop", "Jujutsu Kaisen",
"Blue Period"],
"Episodes": [1009, 720, 366, 148, 74, 366,
50, 37, 24, 12, 26, 24, 12],
"Year": [1999, 2002, 2004, 2011, 2013, 2006,
2007, 2008, 2006, 2016, 1995,
2020, 2021]
}
df = pd.DataFrame(data)
现在我们有了我们的数据,试着用样本方法查看数据。
语法:
df.sample() #returns only one row
df.sample(n) #returns n number of row
print(df.sample()) # just one row
print(df.sample(6)) # randomly selected 6 row
输出:

请注意,样本返回的随机数据是无序的。
头
作为简单的英语意思,头是用来表示身体的上半部分。在Pandas中,head是用来从顶部显示有序的数据。在传递空参数时,默认情况下,它显示前5行。通过提供’n’值,你甚至可以显示n个数据。
Syntax:
df.head() #default=5 Rows
df.head(n) #n number of rows
print(df.head()) # default:5 rows
print(df.head(8)) # first 8 ordered rows
输出:

尾部
尾部与头部相反。它显示来自下面的有序数据。
语法:
df.tail() #default 5 number of rows
df.tail(n) #n number of rows
print(df.tail()) # default:5 rows
print(df.tail(8)) # last 8 ordered rows
输出:

总结
sample、head和tail的主要区别是:在传递空参数时,sample只返回一条记录,而head和tail则返回5条记录。sample返回无序的数据,而head和tail则返回有序的数据。
极客教程