Pandas 读取 CSV 文件并使用 usecols 过滤列

Pandas 读取 CSV 文件并使用 usecols 过滤列

在本文中,我们将介绍如何使用 Pandas 读取 CSV 文件,并使用 usecols 过滤需要的列。

阅读更多:Pandas 教程

Pandas 读取 CSV 文件

首先,我们需要导入 Pandas 库:

import pandas as pd
Python

接下来,我们可以使用 Pandas 的 read_csv 函数读取 CSV 文件:

df = pd.read_csv('data.csv')
Python

这里的 data.csv 是一个 CSV 文件的文件名,需要保证在同一目录下。read_csv 函数会返回一个 DataFrame 对象,我们可以使用 head 方法查看前几行数据:

print(df.head())
Python

输出结果类似于:

   ID  Name  Age  Gender
0   1   Tom   18    Male
1   2   Bob   20    Male
2   3  Lily   19  Female
3   4  Jack   21    Male
4   5  Lucy   17  Female
Python

使用 usecols 过滤列

使用 usecols 参数可以过滤需要的列。例如,我们只需要 Age 和 Gender 两列:

df = pd.read_csv('data.csv', usecols=['Age', 'Gender'])
print(df.head())
Python

输出结果类似于:

   Age  Gender
0   18    Male
1   20    Male
2   19  Female
3   21    Male
4   17  Female
Python

另外,我们也可以使用列位置或者列名的正则表达式来选择需要的列,例如选择第二和第三列:

df = pd.read_csv('data.csv', usecols=[1, 2])
print(df.head())
Python

输出结果类似于:

   Name  Age
0   Tom   18
1   Bob   20
2  Lily   19
3  Jack   21
4  Lucy   17
Python

或者选择以 N 开头的列:

df = pd.read_csv('data.csv', usecols=lambda col: col.startswith('N'))
print(df.head())
Python

输出结果类似于:

   Name
0   Tom
1   Bob
2  Lily
3  Jack
4  Lucy
Python

总结

使用 Pandas 的 read_csv 函数可以方便地读取 CSV 文件,而使用 usecols 参数可以过滤需要的列,从而减少不必要的计算和内存占用。在使用时,需要仔细考虑需要的列,尽可能减少多余的列。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册