如何用NumPy读取CSV文件
在这篇文章中,我们将讨论如何在Python中用Numpy读取CSV文件。使用Python NumPy库读取CSV文件有助于更快地加载大量的数据。由于性能原因,在从CSV文件读取大量数据时,NumPy是首选。
使用中的数据集:
使用内置的Python open()函数读取CSV文件
这里我们没有使用Python中的任何第三方库。我们只是使用内置的Python open()函数打开文件并逐行读取。
# using open function
file = open("data.csv")
for i in file:
print(i)
输出:
使用NumPy loadtxt()方法读取CSV文件
为了从一个文本文件中导入数据,我们将使用NumPy loadtxt()方法。要使用这个函数,我们需要确保文本文件中每一行的条目数应该是相等的。在Python中,numpy.load()用于从文本文件中加载数据,其目的是为了快速读取基本的文本文件。
语法: numpy.loadtxt(‘data.csv’)
参数:
- fname:加载数据的文件名。
- delimiter (可选):在从文本中创建数组时要考虑的分隔符,默认为空白。
- encoding(可选):用于对输入文件进行解码的编码。
- dtype(可选):结果数组的数据类型
返回:返回NumPy数组
例子:使用numpy loadtxt()方法加载csv
import numpy as np
# using loadtxt()
arr = np.loadtxt("sample_data.csv",
delimiter=",", dtype=str)
display(arr)
输出:
使用NumPy genfromtxt()方法读取CSV文件
genfromtxt()方法用于从一个文本文件中导入数据。我们可以指定如何处理缺失的数值(如果有的话)。
语法: numpy.genfromtxt('data.csv')
参数:
- fname:要读取的文件
- delimiter (optional):当从文本中创建数值数组时要考虑的分隔符,默认是任何连续的白色空格作为分隔符。
- missing_values (optional):在出现缺失值的情况下使用的一组字符串。
- dtype (可选):结果数组的数据类型。
返回: 返回NumPy 数组
例子:使用numpy genfromtxt()方法加载CSV数据
import numpy as np
# using genfromtxt()
arr = np.genfromtxt("sample_data.csv",
delimiter=",", dtype=str)
display(arr)
输出:
使用Pandas read_csv()函数读取CSV文件
这里我们只是创建数据框架,在values函数的帮助下,我们得到了文件中的数值数组。
#importing required library
from pandas import read_csv
d = read_csv('data.csv')
df = d.values
print(df)
输出:
使用内置的Python csv模块读取CSV文件
csv.reader()函数读取了CSV文件的每一行。我们逐行读取数据,然后将每一行转换为一个项目列表。
语法: csv.reader(x)
参数:
- x : CSV文件的TextIOWrapper。
例子:使用csv阅读器加载CSV数据
import numpy as np
# Importing csv module
import csv
with open("sample_data.csv", 'r') as x:
sample_data = list(csv.reader(x, delimiter=","))
sample_data = np.array(sample_data)
display(sample_data)
输出: