numpy读取csv|极客教程

numpy读取csv

在数据分析和科学计算中，经常需要读取和处理CSV文件。CSV文件是一种通用的文件格式，它简单、易于扩展、且能被几乎所有的数据处理软件支持。在Python中，numpy库提供了一种方便快捷的方式来读取和处理CSV文件。

numpy库简介

numpy是一个专门用于科学计算的Python库，它提供了一个强大的多维数组对象（ndarray）和许多用于操作这些数组的工具。numpy中的核心对象是ndarray，它是一个N维数组，提供了大量的数学函数和操作符，可以用于数组计算。

读取CSV文件

numpy中提供了genfromtxt()函数来读取CSV文件。这个函数可以自动推断数据类型，并且可以处理不同的缺失值标记。下面是genfromtxt()函数的基本用法：

import numpy as np

# 读取CSV文件
data = np.genfromtxt('data.csv', delimiter=',')
print(data)

上面的代码中，首先导入numpy库，然后使用genfromtxt()函数读取名为data.csv的CSV文件。delimiter=','指定CSV文件中的分隔符为逗号。genfromtxt()函数将CSV文件加载到一个numpy数组中，并返回这个数组。最后，通过print(data)打印出文件中的数据。

示例

假设我们有一个名为data.csv的CSV文件，内容如下：

1,John,23
2,Alice,30
3,Bob,28
4,Emily,25

我们可以使用上面的代码来读取这个CSV文件，并打印出数据：

import numpy as np

# 读取CSV文件
data = np.genfromtxt('data.csv', delimiter=',')
print(data)

运行上面的代码，输出如下：

[[ 1. nan 23.]
 [ 2. nan 30.]
 [ 3. nan 28.]
 [ 4. nan 25.]]

可以看到，genfromtxt()函数成功地将CSV文件中的数据加载到了一个numpy数组中。每一行数据对应数组中的一行，逗号分隔的每一列数据对应数组中的一个元素。需要注意的是，nan代表缺失值。

指定数据类型

genfromtxt()函数会根据数据自动推断数据类型，但有时候我们需要手动指定数据类型。我们可以使用dtype参数来指定数据类型，如下所示：

import numpy as np

# 读取CSV文件并指定数据类型
data = np.genfromtxt('data.csv', delimiter=',', dtype=[('id', 'i'), ('name', 'U10'), ('age', 'i')])
print(data)

上面的代码中，dtype=[('id', 'i'), ('name', 'U10'), ('age', 'i')]指定了三个列的数据类型：整数型、Unicode字符串型和整数型。通过这种方式，我们可以确保numpy正确地读取文件中的数据，并以指定的数据类型加载到数组中。

示例

假设我们有一个名为data.csv的CSV文件，内容如下：

1,John,23
2,Alice,30
3,Bob,28
4,Emily,25

我们可以使用上面的代码来读取这个CSV文件，并指定数据类型：

import numpy as np

# 读取CSV文件并指定数据类型
data = np.genfromtxt('data.csv', delimiter=',', dtype=[('id', 'i'), ('name', 'U10'), ('age', 'i')])
print(data)

运行上面的代码，输出如下：

[(1, 'John', 23) (2, 'Alice', 30) (3, 'Bob', 28) (4, 'Emily', 25)]

可以看到，genfromtxt()函数按照指定的数据类型成功地加载了CSV文件中的数据到一个numpy数组中。

结语

numpy提供了一个方便快捷的方式来读取CSV文件，genfromtxt()函数非常灵活，可以自动推断数据类型，也可以手动指定数据类型。通过numpy库，我们可以方便地处理和分析各种数据集。

numpy读取csv

numpy读取csv

numpy库简介

读取CSV文件

示例

指定数据类型

示例

结语

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

NumPy 精品教程

回顶部