如何使用Python中的scikit-learn库实现L1正则化？

将一系列值转换为标准化的值范围的过程称为正则化。这些值可以在-1到+1或0到1之间。数据也可以通过减法和除法进行标准化。

输入学习算法的数据应始终保持一致和结构化。所有输入数据的特征应在单个比例上，以有效地预测值。但在现实世界中，数据是不受限制的，并且大多数情况下不在相同的比例上。

这就是正则化发挥作用的时候，它是数据准备阶段中最重要的过程之一。

它有助于将输入数据集的列值更改为落在同一比例上的值。

在正则化过程中，保证值的范围不受扭曲。

注意 − 并非所有输入数据集都必须标准化。仅当数据集中的特征具有完全不同的值尺度时才需要标准化。

有不同种类的正则化 −

最大-最小值正则化
Z正则化
单位向量正则化

让我们了解一下L1正则化是如何工作的。

L1正则化也被称为最小绝对偏差，它改变数据以使每行的绝对值之和保持为1。

让我们看看如何使用scikit learn来实现L1正则化。

更多Python相关文章，请阅读：Python 教程

示例

import numpy as np
from sklearn import preprocessing
input_data = np.array(
   [[34.78, 31.9, -65.5],[-16.5, 2.45, -83.5],[0.5, -87.98, 45.62],[5.9, 2.38, -55.82]]
)
data_normalized_l1 = preprocessing.normalize(input_data, norm='l1')
print("\nL1 normalized data is \n", data_normalized_l1)

输出

L1 normalized data is
[[ 0.26312604 0.24133757 -0.49553639]
[-0.16105417 0.0239141 -0.81503172]
[ 0.00372856 -0.65607755 0.34019389]
[ 0.09204368 0.03712949 -0.87082683]]