如何选择一个DataFrame的子集

如何选择一个DataFrame的子集

在这篇文章中,我们将讨论如何从一个DataFrame中选择一个列和行的子集。我们将使用nba.csv数据集来执行所有操作。

# import required module
import pandas as pd
 
# assign dataframe
data = pd.read_csv("nba.csv")
 
# display dataframe
data.head()
Python

输出:

如何选择一个DataFrame的子集?

下面是各种操作,通过这些操作我们可以为一个给定的数据框架选择一个子集。

  • 从一个数据框架中选择一个特定的列

要选择一个单列,我们可以使用方括号[ ]。

# import required module
import pandas as pd
 
# assign dataframe
data = pd.read_csv("nba.csv")
 
# get a single columns
ages = data["Age"]
 
# display the column
ages.head()
Python

输出:

如何选择一个DataFrame的子集?

  • 从一个数据框架中选择多列

我们可以在方括号[]内传递一个列名的列表,以获得多个列。

# import required module
import pandas as pd
 
# assign dataframe
data = pd.read_csv("nba.csv")
 
# get a single columns
name_sex = data[["Name","Age"]]
 
# display the column
name_sex.head()
Python

输出:

如何选择一个DataFrame的子集?

  • 从数据框架中选择一个行的子集

为了在给定的数据集中选择25岁以上的人的行,我们可以在括号内加上条件,根据条件选择特定的行。

# importing pandas library
import pandas as pd
 
# reading csv file
data = pd.read_csv("nba.csv")
 
# subset of dataframe
above_25 = data[data["Age"] > 35]
 
# display subset
print(above_25.head())
Python

输出:

如何选择一个DataFrame的子集?

  • 选择一个行和列的组合子集

在这种情况下,所有行和列的子集要一次性完成,现在选择[]是不够的。需要使用lociloc操作符。逗号之前的部分是你选择的行,逗号之后的部分是你想通过使用lociloc来选择的列。这里我们只选择25岁以上的人的名字。

# importing pandas library
import pandas as pd
 
# reading csv file
data = pd.read_csv("nba.csv")
 
# subset of dataframe
adults = data.loc[data["Age"] > 25, "Name"]
 
# display subset
print(adults.head())
Python

输出:

如何选择一个DataFrame的子集?

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册