Pandas 读取 CSV 文件并使用 usecols 过滤列

在本文中，我们将介绍如何使用 Pandas 读取 CSV 文件，并使用 usecols 过滤需要的列。

Pandas 读取 CSV 文件

首先，我们需要导入 Pandas 库：

import pandas as pd

接下来，我们可以使用 Pandas 的 read_csv 函数读取 CSV 文件：

df = pd.read_csv('data.csv')

这里的 data.csv 是一个 CSV 文件的文件名，需要保证在同一目录下。read_csv 函数会返回一个 DataFrame 对象，我们可以使用 head 方法查看前几行数据：

print(df.head())

输出结果类似于：

   ID  Name  Age  Gender
0   1   Tom   18    Male
1   2   Bob   20    Male
2   3  Lily   19  Female
3   4  Jack   21    Male
4   5  Lucy   17  Female

使用 usecols 过滤列

使用 usecols 参数可以过滤需要的列。例如，我们只需要 Age 和 Gender 两列：

df = pd.read_csv('data.csv', usecols=['Age', 'Gender'])
print(df.head())

输出结果类似于：

   Age  Gender
0   18    Male
1   20    Male
2   19  Female
3   21    Male
4   17  Female

另外，我们也可以使用列位置或者列名的正则表达式来选择需要的列，例如选择第二和第三列：

df = pd.read_csv('data.csv', usecols=[1, 2])
print(df.head())

输出结果类似于：

   Name  Age
0   Tom   18
1   Bob   20
2  Lily   19
3  Jack   21
4  Lucy   17

或者选择以 N 开头的列：

df = pd.read_csv('data.csv', usecols=lambda col: col.startswith('N'))
print(df.head())

输出结果类似于：

   Name
0   Tom
1   Bob
2  Lily
3  Jack
4  Lucy

总结

使用 Pandas 的 read_csv 函数可以方便地读取 CSV 文件，而使用 usecols 参数可以过滤需要的列，从而减少不必要的计算和内存占用。在使用时，需要仔细考虑需要的列，尽可能减少多余的列。

Pandas 读取 CSV 文件并使用 usecols 过滤列

Pandas 读取 CSV 文件并使用 usecols 过滤列

Pandas 读取 CSV 文件

使用 usecols 过滤列

总结

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Pandas 精品教程

回顶部

Pandas 读取 CSV 文件并使用 usecols 过滤列

Pandas 读取 CSV 文件

使用 usecols 过滤列

总结

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Pandas 精品教程

回顶部

切换注册登录

用户名或邮箱

密码

切换登录注册

昵称

邮箱