如何用NumPy读取CSV文件

如何用NumPy读取CSV文件

在这篇文章中,我们将讨论如何在Python中用Numpy读取CSV文件。使用Python NumPy库读取CSV文件有助于更快地加载大量的数据。由于性能原因,在从CSV文件读取大量数据时,NumPy是首选。

使用中的数据集:

如何用NumPy读取CSV文件?

使用内置的Python open()函数读取CSV文件

这里我们没有使用Python中的任何第三方库。我们只是使用内置的Python open()函数打开文件并逐行读取。

# using open function
 
file = open("data.csv")
 
for i in file:
    print(i)

输出:

如何用NumPy读取CSV文件?

使用NumPy loadtxt()方法读取CSV文件

为了从一个文本文件中导入数据,我们将使用NumPy loadtxt()方法。要使用这个函数,我们需要确保文本文件中每一行的条目数应该是相等的。在Python中,numpy.load()用于从文本文件中加载数据,其目的是为了快速读取基本的文本文件。

语法: numpy.loadtxt(‘data.csv’)

参数:

  • fname:加载数据的文件名。
  • delimiter (可选):在从文本中创建数组时要考虑的分隔符,默认为空白。
  • encoding(可选):用于对输入文件进行解码的编码。
  • dtype(可选):结果数组的数据类型

返回:返回NumPy数组

例子:使用numpy loadtxt()方法加载csv

import numpy as np
 
# using loadtxt()
arr = np.loadtxt("sample_data.csv",
                 delimiter=",", dtype=str)
display(arr)

输出:

如何用NumPy读取CSV文件?

使用NumPy genfromtxt()方法读取CSV文件

genfromtxt()方法用于从一个文本文件中导入数据。我们可以指定如何处理缺失的数值(如果有的话)。

语法: numpy.genfromtxt('data.csv')

参数:

  • fname:要读取的文件
  • delimiter (optional):当从文本中创建数值数组时要考虑的分隔符,默认是任何连续的白色空格作为分隔符。
  • missing_values (optional):在出现缺失值的情况下使用的一组字符串。
  • dtype (可选):结果数组的数据类型。

返回: 返回NumPy 数组

例子:使用numpy genfromtxt()方法加载CSV数据

import numpy as np
 
# using genfromtxt()
arr = np.genfromtxt("sample_data.csv",
                    delimiter=",", dtype=str)
display(arr)

输出:

如何用NumPy读取CSV文件?

使用Pandas read_csv()函数读取CSV文件

这里我们只是创建数据框架,在values函数的帮助下,我们得到了文件中的数值数组。

#importing required library
from pandas import read_csv
 
d = read_csv('data.csv')
 
df = d.values
print(df)

输出:

如何用NumPy读取CSV文件?

使用内置的Python csv模块读取CSV文件

csv.reader()函数读取了CSV文件的每一行。我们逐行读取数据,然后将每一行转换为一个项目列表。

语法: csv.reader(x)

参数:

  • x : CSV文件的TextIOWrapper。

例子:使用csv阅读器加载CSV数据

import numpy as np
 
# Importing csv module
import csv
 
 
with open("sample_data.csv", 'r') as x:
    sample_data = list(csv.reader(x, delimiter=","))
 
sample_data = np.array(sample_data)
display(sample_data)

输出:

如何用NumPy读取CSV文件?

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Numpy教程