NumPy 数据类型
NumPy支持比Python更多种类的数值类型。下表展示了NumPy中定义的不同标量数据类型。
序号 | 数据类型和描述 |
---|---|
1 | bool_ 布尔型(True或False),以字节形式存储 |
2 | int_ 默认整数类型(与C语言的long相同;通常为int64或int32) |
3 | intc 与C语言的int相同(通常为int32或int64) |
4 | intp 用于索引的整数(与C语言的ssize_t相同;通常为int32或int64) |
5 | int8 字节型(-128到127) |
6 | int16 整型(-32768到32767) |
7 | int32 整数(-2147483648至2147483647) |
8 | int64 整数(-9223372036854775808至9223372036854775807) |
9 | uint8 无符号整数(0至255) |
10 | uint16 无符号整数(0至65535) |
11 | uint32 无符号整数(0至4294967295) |
12 | uint64 无符号整数(0至18446744073709551615) |
13 | float_ float64的简写 |
14 | float16 半精度浮点数:符号位,5位指数,10位尾数 |
15 | float32 单精度浮点数:符号位1位,指数位8位,尾数位23位 |
16 | float64 双精度浮点数:符号位1位,指数位11位,尾数位52位 |
17 | complex_ complex128的简写 |
18 | complex64 复数,由两个32位浮点数表示(实部和虚部) |
19 | complex128 复数,由两个64位浮点数表示(实部和虚部) |
NumPy数值类型是dtype(数据类型)对象的实例,每个对象都具有独特的特性。这些数据类型可以表示为np.bool_,np.float32等。
数据类型对象(dtype)
数据类型对象描述了对应于数组的固定存储区块的解释方式,具体取决于以下方面:
- 数据的类型(整型、浮点型或Python对象)
-
数据的大小
-
字节序(小端或大端)
-
对于结构化类型,字段名、每个字段的数据类型以及每个字段占用的存储区块的一部分
-
如果数据类型是一个子数组,它的形状和数据类型
字节序可以通过在数据类型前加上'<‘或’>’来决定。'<‘表示编码为小端序(最低有效位存储在最小地址),’>’表示编码为大端序(最高有效字节存储在最小地址)。
可以使用以下语法构造dtype对象:
numpy.dtype(object, align, copy)
参数分别是−
- Object − 需要转换为对象数据类型的对象
-
Align − 如果为True,则对字段添加填充,使其类似于C-struct
-
Copy − 创建dtype对象的新副本。如果为False,结果是内建数据类型对象的引用
示例1
# using array-scalar type
import numpy as np
dt = np.dtype(np.int32)
print dt
输出结果如下:
int32
示例2
#int8, int16, int32, int64 can be replaced by equivalent string 'i1', 'i2','i4', etc.
import numpy as np
dt = np.dtype('i4')
print dt
输出结果如下−
int32
示例3
# using endian notation
import numpy as np
dt = np.dtype('>i4')
print dt
输出结果如下:
>i4
以下示例显示了结构化数据类型的使用。在这里,要声明字段名称和相应的标量数据类型。
示例4
# first create structured data type
import numpy as np
dt = np.dtype([('age',np.int8)])
print dt
输出的结果如下:
[('age', 'i1')]
示例5
# now apply it to ndarray object
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print a
输出如下:
[(10,) (20,) (30,)]
示例6
# file name can be used to access content of age column
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print a['age']
输出如下 -
[10 20 30]
示例7
以下示例定义了一个叫做 student 的结构化数据类型,它包含一个名为’name’的字符串字段,一个 整数字段 ‘age’,以及一个 浮点数字段 ‘marks’。该数据类型被应用于ndarray对象。
import numpy as np
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
print student
输出如下:
[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')])
示例8
import numpy as np
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
a = np.array([('abc', 21, 50),('xyz', 18, 75)], dtype = student)
print a
输出结果如下-
[('abc', 21, 50.0), ('xyz', 18, 75.0)]
每个内置数据类型都有一个字符代码,用于唯一标识它。
-
‘b’ − 布尔型数据
-
‘i’ − (有符号)整型数据
-
‘u’ − 无符号整型数据
-
‘f’ − 浮点型数据
-
‘c’ − 复数浮点型数据
-
‘m’ − 时间间隔数据
-
‘M’ − 日期时间数据
-
‘O’ − (Python)对象数据
-
‘S’, ‘a’ − (字节)字符串数据
-
‘U’ − Unicode 数据
-
‘V’ − 原始数据(空类型)