在Pandas数据框架中选择具有特定数据类型的列

在Pandas数据框架中选择具有特定数据类型的列

在这篇文章中,我们将看到如何从一个数据框架中选择具有特定数据类型的列。这个操作可以使用pandas模块中的DataFrame.select_dtypes()方法进行。

语法: DataFrame.select_dtypes(include=None, exclude=None)
参数 :
include,exclude:选择要包括/排除的dtypes或字符串。这些参数中至少有一个必须被提供。
返回:框架的子集,包括include中的dtypes,排除exclude中的dtypes。

一步一步实现:

  • 首先,导入模块然后加载数据集。
# import required module
import pandas as pd
  
# assign dataset
df = pd.read_csv("train.csv")
  • 然后我们将使用dataframe.info()方法找到数据集中的数据类型。
# display description
# of the dataset
df.info()

输出:

在Pandas数据框架中选择具有特定数据类型的列

  • 现在,我们将使用DataFrame.select_dtypes()来选择一个特定的数据类型。
# store columns with specific data type
integer_columns = df.select_dtypes(include=['int64']).columns
float_columns = df.select_dtypes(include=['float64']).columns
object_columns = df.select_dtypes(include=['object']).columns
  • 最后,显示具有特定数据类型的列。
# display columns
print('\nint64 columns:\n', integer_columns)
print('\nfloat64 columns:\n', float_columns)
print('\nobject columns:\n', object_columns)

输出:

在Pandas数据框架中选择具有特定数据类型的列

以下是基于上述方法的完整方案:

# import required module
import pandas as pd
  
# assign dataset
df = pd.read_csv("train.csv")
  
# store columns with specific data type
integer_columns = df.select_dtypes(include=['int64']).columns
float_columns = df.select_dtypes(include=['float64']).columns
object_columns = df.select_dtypes(include=['object']).columns
  
# display columns
print('\nint64 columns:\n',integer_columns)
print('\nfloat64 columns:\n',float_columns)
print('\nobject columns:\n',object_columns)

输出:

在Pandas数据框架中选择具有特定数据类型的列

示例:

在这里,我们将提取以下数据集的列。

# import required module
import pandas as pd
from vega_datasets import data
  
# assign dataset
df = data.seattle_weather()
  
# display dataset
df.sample(10)

输出:

在Pandas数据框架中选择具有特定数据类型的列

现在,我们将显示所有数据类型为float64的列。

# import required module
import pandas as pd
from vega_datasets import data
  
# assign dataset
df = data.seattle_weather()
  
# display description
# of dataset
df.info()
  
# store columns with specific data type
columns = df.select_dtypes(include=['float64']).columns
  
# display columns
print('\nColumns:\n', columns)

输出:

在Pandas数据框架中选择具有特定数据类型的列

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程