如何在Python中将Sklearn DIGITS数据集转换为2和3特征数据集?
Sklearn DIGITS数据集有64个特征,因为每个数字的图像都是8×8像素大小的。我们可以使用主成分分析(PCA)将Scikit-learn DIGITS数据集转换成具有2个特征的新特征空间。将64个特征数据集转换为2个特征数据集将大大减少数据的大小,并且我们将失去一些有用的信息。这也会影响ML模型的分类准确性。
将DIGITS数据集转换为2特征数据集的步骤
我们可以按以下步骤使用PCA将DIGITS数据集转换为2特征数据集 –
-
首先,从scikit-learn中导入必要的包。我们需要导入数据集和分解包。
-
加载DIGITS数据集。
-
初始化主成分分析(PCA)并应用拟合(fit)函数拟合数据。
-
将数据集转换为新尺寸,即2特征数据集。
示例
在下面的示例中,我们将使用上述步骤使用PCA将sklearn DIGITS数据集转换为2特征。
输出
它将产生以下输出 –
将具有6个类的DIGITS数据集转换为2特征数据集
Sklearn DIGITS数据集有64个特征和10个0-9数字类别。我们可以使用主成分分析(PCA)将具有前6个类别的数字数据集转换为具有2个特征的新特征空间。
我们可以按以下步骤使用PCA将带有前6个类别的DIGITS数据集转换为2特征数据集 –
-
首先,从scikit-learn中导入必要的包。我们需要导入数据集和分解包。
-
加载带有前6个类别的DIGITS数据集。
-
初始化主成分分析(PCA)并应用拟合(fit)函数拟合数据。
-
将数据集转换为新尺寸,即2特征数据集。
示例
在下面的示例中,我们将使用上述步骤使用PCA将带有前6个类别的sklearn DIGITS数据集转换为2特征。
输出
将会产生以下输出:-
使用PCA将DIGITS数据集转换为3特征数据集
Scikit-learn的DIGITS数据集有64个特征,因为每个数字图像的大小为8乘8像素。我们可以使用主成分分析(PCA)将DIGITS数据集转换为具有3个特征的新的特征空间。将64个特征的数据集转换为具有3个特征的数据集会大大减小数据的大小,我们将失去一些有用的信息。这也会影响ML模型的分类准确性。
我们可以遵循以下步骤将DIGITS数据集转换为具有3个特征的数据集:-
-
首先,从scikit-learn导入必要的包。我们需要导入数据集和分解包。
-
加载DIGITS数据集。
-
初始化主成分分析(PCA)并应用fit()函数来拟合数据。
-
将数据集转换为新的维度,即3特征数据集。
示例
在下面的示例中,我们将使用上述步骤将Scikit-learn的DIGITS数据集转换为具有3个特征的PCA。
输出
将会产生以下输出:-