如何在使用Pandas读取csv文件时跳过行

如何在使用Pandas读取csv文件时跳过行

由于以数据为中心的Python包的惊人的生态系统,Python是一种做数据分析的好语言。Pandas包就是其中之一,它使导入和分析数据变得非常容易。

这里,我们将讨论如何在读取csv文件时跳过行。我们将使用 Pandas 库的 read_csv() 方法来完成这项任务。

语法:

pd.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None,mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None,nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False,keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

以下是一些有用的参数。

参数 使用
filepath_or_buffer 文件的URL或Dir位置
sep 代表分隔符,默认为csv(逗号分隔值)中的’,’ 。
index_col 该参数用于将所传递的列作为索引,而不是0、1、2、3…r。
header 该参数用于将传递的行[int/int list]作为标题。
use_cols 这个参数只使用传递的col[字符串列表]来制作数据框。
squeeze 如果是True并且只传递了一列,则返回pandas系列。
skiprows 该参数用于跳过新数据框中已通过的行。
skipfooter 该参数用于跳过文件底部的行数。

下载student.csv文件,请点击这里

方法1:在读取csv文件时,从开始跳过N行。

代码:

# Importing Pandas library
import pandas as pd
 
# Skipping 2 rows from start in csv
# and initialize it to a  dataframe
df = pd.read_csv("students.csv",
                  skiprows = 2)
 
# Show the dataframe
df

输出 :

如何在使用Pandas读取csv文件时跳过行?

方法2:在读取csv文件时跳过特定位置的行。

代码:

# Importing Pandas library
import pandas as pd
 
# Skipping rows at specific position
df = pd.read_csv("students.csv",
                  skiprows = [0, 2, 5])
 
# Show the dataframe
df

输出 :

如何在使用Pandas读取csv文件时跳过行?

方法3:在读取csv文件时,从开始除列名外跳过N行。

代码:

# Importing Pandas library
import pandas as pd
 
# Skipping 2 rows from start
# except the column names
df = pd.read_csv("students.csv",
                 skiprows = [i for i in range(1, 3) ])
 
# Show the dataframe
df

输出 :

如何在使用Pandas读取csv文件时跳过行?

方法4:在读取csv文件时,根据一个条件跳过行。

代码:

# Importing Pandas library
import pandas as pd
 
# function for checking and
# skipping every 3rd line
def logic(index):
 
    if index % 3 == 0:
        返回值 True
 
    返回值 False
 
# Skipping rows based on a condition
df = pd.read_csv("students.csv",
                 skiprows = lambda x: logic(x) )
 
# Show the dataframe
df

输出 :

如何在使用Pandas读取csv文件时跳过行?

方法5:在读取csv文件时,从最后跳过N行。

代码:

# Importing Pandas library
import pandas as pd
 
# Skipping 2 rows from end
df = pd.read_csv("students.csv",
                  skipfooter = 5,
                  engine = 'python')
 
# Show the dataframe
df

输出 :

如何在使用Pandas读取csv文件时跳过行?

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程