Pandas 读取 CSV 文件并使用 usecols 过滤列
在本文中,我们将介绍如何使用 Pandas 读取 CSV 文件,并使用 usecols 过滤需要的列。
阅读更多:Pandas 教程
Pandas 读取 CSV 文件
首先,我们需要导入 Pandas 库:
接下来,我们可以使用 Pandas 的 read_csv 函数读取 CSV 文件:
这里的 data.csv 是一个 CSV 文件的文件名,需要保证在同一目录下。read_csv 函数会返回一个 DataFrame 对象,我们可以使用 head 方法查看前几行数据:
输出结果类似于:
使用 usecols 过滤列
使用 usecols 参数可以过滤需要的列。例如,我们只需要 Age 和 Gender 两列:
输出结果类似于:
另外,我们也可以使用列位置或者列名的正则表达式来选择需要的列,例如选择第二和第三列:
输出结果类似于:
或者选择以 N 开头的列:
输出结果类似于:
总结
使用 Pandas 的 read_csv 函数可以方便地读取 CSV 文件,而使用 usecols 参数可以过滤需要的列,从而减少不必要的计算和内存占用。在使用时,需要仔细考虑需要的列,尽可能减少多余的列。