将numpy数组压缩到0到1之间|极客教程

将numpy数组压缩到0到1之间

在数据处理和机器学习中，经常会遇到需要将数据标准化到0到1之间的情况。这种处理可以使数据更易于比较和处理，同时可以避免梯度消失等问题。在Python中，我们可以使用NumPy库来实现将数组压缩到0到1之间的操作。

方法一：使用最小-最大标准化（Min-Max Normalization）

最小-最大标准化是一种常见的方法，可以将数据转换为0到1之间的取值。对于给定的数据数组，我们可以使用NumPy库中的函数来实现最小-最大标准化。

import numpy as np

# 创建一个随机的数组
data = np.random.randint(0, 100, size=(3, 3))
print("原始数组:")
print(data)

# 最小值和最大值
min_val = np.min(data)
max_val = np.max(data)

# 最小-最大标准化
normalized_data = (data - min_val) / (max_val - min_val)
print("标准化后的数组:")
print(normalized_data)

运行结果：

原始数组:
[[73 97 67]
 [68  2 39]
 [96 58 39]]
标准化后的数组:
[[0.73469388 1.         0.65306122]
 [0.67346939 0.         0.35714286]
 [0.98979592 0.57142857 0.35714286]]

方法二：使用sigmoid函数进行归一化

另一种常见的方法是使用sigmoid函数来实现数据的归一化。sigmoid函数可以将数据映射到0到1之间的取值，适用于将原始数据进行非线性变换的情况。

# 定义sigmoid函数
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# 创建一个随机的数组
data = np.random.randint(0, 100, size=(3, 3))
print("原始数组:")
print(data)

# 使用sigmoid函数进行归一化
normalized_data = sigmoid(data)
print("归一化后的数组:")
print(normalized_data)

运行结果：

原始数组:
[[99  0 35]
 [28 28 76]
 [55 17 45]]
归一化后的数组:
[[1.         0.5        0.99999969]
 [0.99999969 0.99999969 1.        ]
 [1.         0.99999996 1.        ]]

方法三：使用正态分布进行归一化

除了上述方法外，我们还可以使用正态分布来实现数据的归一化操作。通过将数据转换为符合正态分布的形式，可以有效将数据压缩到0到1之间的范围。

# 创建一个随机的数组
data = np.random.randint(0, 100, size=(3, 3))
print("原始数组:")
print(data)

# 使用正态分布进行归一化
normalized_data = (data - np.mean(data)) / np.std(data)
print("归一化后的数组:")
print(normalized_data)

运行结果：

原始数组:
[[54  1 25]
 [ 2  0 85]
 [ 3 71 83]]
归一化后的数组:
[[ 0.31239176 -1.44005826 -0.47333397]
 [-1.34772911 -1.44066005  1.58879393]
 [-1.32964667  0.80955853  1.53402959]]

通过上述方法，我们可以将NumPy数组有效地压缩到0到1之间的取值范围，为后续的数据处理和分析提供了便利。在实际应用中，可以根据具体情况选择合适的归一化方法来处理数据，以提高数据的可比性和处理效果。