NumPy frombuffer 和 fromstring 的区别

在使用NumPy时，经常会用到两个函数：numpy.frombuffer()和numpy.fromstring()。这两个函数都可以将字符串转换成数组。本文将讨论这两个函数的区别以及他们各自的用途。

阅读更多：Numpy 教程

numpy.frombuffer

numpy.frombuffer()函数是将一个字符串转换成一个数组。它需要指定一个缓冲区，从而将该缓冲区中的数据转换为数组。缓冲区可以是一个字符串，也可以是一个Python的bytes对象。

以下是一个简单的例子：

import numpy as np

# 将字符串转换成数组
s = b'hello world'
a = np.frombuffer(s, dtype='S1')
print(a)

这将输出以下结果：

[b'h' b'e' b'l' b'l' b'o' b' ' b'w' b'o' b'r' b'l' b'd']

可以看到，该字符串已经成功地转换为了一个数组。需要注意的是，这里的dtype参数被设置成了'S1'，这意味着每个元素是一个长度为1的字节数组。如果不指定dtype，将会自动选择一个合适的数据类型。另外，需要注意的是，numpy.frombuffer()返回的数组是只读的。

numpy.fromstring

numpy.fromstring()函数也将一个字符串转换成一个数组。与numpy.frombuffer()不同的是，numpy.fromstring()将字符串解释为一组连续的字符，而不考虑底层的数据类型。因此，该函数的参数dtype用于指定输出数组的数据类型，而不是输入字符串数据的类型。这个函数接收两个参数：要转换的字符串和要使用的数据类型。

以下是一个简单的例子：

import numpy as np

# 将字符串转换为数组
s = '1 2 3 4 5'
a = np.fromstring(s, dtype=int, sep=' ')
print(a)

这将输出以下结果：

[1 2 3 4 5]

可以看到，使用numpy.fromstring()函数将字符串成功地转换为数组。注意，需要使用dtype参数来指定输出数组的数据类型，这里使用了int作为类型。此外，在这个例子中，我们还指定了一个分隔符sep，指明了原始字符串中的数字之间使用的分隔符。如果没有指定sep，默认情况下，该函数将把所有字符都视为数字，并使用空格作为分隔符。需要注意的是，numpy.fromstring()返回的数组也是只读的。

区别和用途

尽管numpy.frombuffer()和numpy.fromstring()都可以将一个字符串转换成一个数组，但它们的方法完全不同。基本上，numpy.frombuffer()假设底层数据是一个连续的二进制流，并按照给定的数据类型解释这些数据。另一方面，numpy.fromstring()只是将字符串解释为一个连续的字符数组，不考虑底层数据类型的细节。因此，numpy.fromstring()更加通用，并且可以用来解析各种格式的字符串。另一方面，numpy.frombuffer()是更底层的，更适合于处理二进制流。这两个函数有一个重要的区别：numpy.frombuffer()函数可以处理Python的bytes对象，而numpy.fromstring()函数只能处理字符串。

综上所述，使用numpy.frombuffer()函数时，需要确定底层数据的类型。如果我们想要处理bytes对象，我们需要使用numpy.frombuffer()函数。而使用numpy.fromstring()函数时，我们需要确定输出数组的数据类型和输入字符串的格式，并且需要指定分隔符，以将字符串正确地解析为数字数组。

总结

在该文章中，我们看到了numpy.frombuffer()和numpy.fromstring()的区别和用途。numpy.frombuffer()函数将一个字符串解释为底层数据流，并按照给定的数据类型解析数据，而numpy.fromstring()只是将字符串解释为一组连续的字符，并根据指定的数据类型解析数据。需要注意的是，numpy.frombuffer()函数可以处理Python的bytes对象，而numpy.fromstring()函数只能处理字符串。当处理二进制流时，numpy.frombuffer()更加适合。在解析各种格式的字符串时，numpy.fromstring()则更加通用。