Pandas 读取CSV文件时指定列名

Pandas 读取CSV文件时指定列名

在本文中,我们将介绍如何使用Pandas读取CSV文件时指定列名。

CSV文件是一种常用的数据格式,但在实际应用中,经常会遇到以下两种情况:

  1. CSV文件没有列名
  2. CSV文件的列名与实际数据不匹配

这时候,我们就需要在读取CSV文件时手动指定列名。

阅读更多:Pandas 教程

使用read_csv函数指定列名

在Pandas中,我们可以通过read_csv函数读取CSV文件,并指定列名。

语法如下:

import pandas as pd
df = pd.read_csv('file.csv', names=['col1', 'col2', 'col3'])
Python

其中,file.csv表示要读取的CSV文件路径,names表示指定的列名。names参数接受一个列表,列表中每个元素表示一个列名。

例如,我们有一个students.csv文件,内容如下:

1,John,18
2,Bob,21
3,Mary,19
Python

我们可以使用以下代码读取该文件,并指定列名:

import pandas as pd
df = pd.read_csv('students.csv', names=['id', 'name', 'age'])
print(df)
Python

输出结果如下:

   id  name  age
0   1  John   18
1   2   Bob   21
2   3  Mary   19
Python

可以看到,读取的结果中,列名与我们指定的完全一致。

使用header参数指定列名所在行数

有时候,CSV文件中会包含列名所在的行数,我们也可以通过header参数来指定这个行数。

语法如下:

import pandas as pd
df = pd.read_csv('file.csv', header=0)
Python

其中,header=0表示第一行为列名所在行数。如果列名不在第一行,可以将参数设置为对应的行数。

例如,我们有一个students1.csv文件,内容如下:

id,name,age
1,John,18
2,Bob,21
3,Mary,19
Python

我们可以使用以下代码读取该文件,并指定列名:

import pandas as pd
df = pd.read_csv('students1.csv', header=0)
print(df)
Python

输出结果如下:

   id  name  age
0   1  John   18
1   2   Bob   21
2   3  Mary   19
Python

指定部分列名

有时候,CSV文件中包含了大量的数据,而我们只需要其中的部分列,这时候我们可以使用usecols参数来指定需要读取的列名。

语法如下:

import pandas as pd
df = pd.read_csv('file.csv', usecols=['col1', 'col2'])
Python

其中,usecols参数接受一个列表,列表中每个元素表示一个需要读取的列名。

例如,我们有一个students2.csv文件,内容如下:

id,name,age,gender,score
1,John,18,M,90
2,Bob,21,M,85
3,Mary,19,F,95
Python

我们可以使用以下代码读取该文件,并指定需要读取的列名:

import pandas as pd
df = pd.read_csv('students2.csv', usecols=['id', 'name', 'score'])
print(df)
Python

输出结果如下:

   id  name  score
0   1  John     90
1   2   Bob     85
2   3  Mary     95
Python

总结

本文介绍了在Pandas中读取CSV文件时指定列名的三种方法,包括使用names参数、header参数和usecols参数。这些方法可以有效解决CSV文件中列名不匹配的问题,提高数据分析的效率。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册