numpy L2归一化|极客教程

numpy L2归一化

在数据处理和机器学习中，归一化是一种非常重要的预处理步骤。其中L2归一化是一种常见的归一化方式，它的原理是将向量的每个元素除以向量的L2范数，从而使得整个向量的长度为1。本文将详细介绍如何使用numpy库来实现L2归一化。

numpy简介

Numpy是Python中用于科学计算的一个重要库，提供了高性能的多维数组对象以及用于数组操作的各种工具。在本文中，我们将使用numpy来进行L2归一化操作。

L2范数的定义

在数学中，向量的L2范数定义如下：

$||x||_2 = \sqrt{\sum_{i=1}^{n} x_i^2}$

其中， $x$ 是一个n维向量， $x_i$ 是向量中的第i个元素。

numpy实现L2归一化

下面我们将使用numpy来实现L2归一化操作。假设我们有一个向量 $x=[1, 2, 3, 4]$ ，我们首先需要计算向量的L2范数，然后将每个元素除以L2范数即可。

import numpy as np

# 定义向量x
x = np.array([1, 2, 3, 4])

# 计算向量x的L2范数
l2_norm = np.linalg.norm(x)

# 对向量x进行L2归一化
x_normalized = x / l2_norm

print("原始向量x：", x)
print("L2范数：", l2_norm)
print("归一化后的向量：", x_normalized)

运行上面的代码，我们将得到以下输出：

原始向量x： [1 2 3 4]
L2范数： 5.477225575051661
归一化后的向量： [0.18257419 0.36514837 0.54772256 0.73029674]

可以看到，原始向量x为[1, 2, 3, 4]，经过L2归一化后，向量变为[0.18257419, 0.36514837, 0.54772256, 0.73029674]，其L2范数为1。

批量L2归一化

除了对单个向量进行L2归一化外，我们还可以对多个向量进行批量L2归一化。假设我们有一个矩阵X，每一行代表一个向量，我们可以分别对每一行向量进行L2归一化操作。

# 定义矩阵X
X = np.array([[1, 2, 3, 4],
              [4, 3, 2, 1],
              [2, 2, 2, 2]])

# 计算矩阵X每行向量的L2范数
l2_norms = np.linalg.norm(X, axis=1, keepdims=True)

# 对矩阵X进行L2归一化
X_normalized = X / l2_norms

print("原始矩阵X：\n", X)
print("L2范数：\n", l2_norms)
print("归一化后的矩阵：\n", X_normalized)

运行上面的代码，我们将得到以下输出：

原始矩阵X：
 [[1 2 3 4]
  [4 3 2 1]
  [2 2 2 2]]
L2范数：
 [[ 5.47722558]
  [ 5.47722558]
  [ 4.        ]]
归一化后的矩阵：
 [[0.18257419 0.36514837 0.54772256 0.73029674]
  [0.73029674 0.54772256 0.36514837 0.18257419]
  [0.5        0.5        0.5        0.5       ]]

可以看到，原始矩阵X中的每行向量都被分别归一化为单位向量。