如何使用Scikit-learn库在Python中加载数据?
Scikit-learn(通常称为sklearn)是Python中的一个开源库,用于实现机器学习算法。
这包括分类、回归、聚类、降维等许多领域,它通过Python提供了一个强大而稳定的接口。该库是构建在Numpy、SciPy和Matplotlib库上的。
让我们来看一个加载数据的例子 –
更多Python相关文章,请阅读:Python 教程
示例
from sklearn.datasets import load_iris
my_data = load_iris()
X = my_data.data
y = my_data.target
feature_name = my_data.feature_names
target_name = my_data.target_names
print("Feature names are : ", feature_name)
print("Target names are : ", target_name)
print("\nFirst 8 rows of the dataset are : \n", X[:8])
输出
Feature names are : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
Target names are : ['setosa' 'versicolor' 'virginica']
First 8 rows of the dataset are :
[[5.1 3.5 1.4 0.2]
[4.9 3. 1.4 0.2]
[4.7 3.2 1.3 0.2]
[4.6 3.1 1.5 0.2]
[5. 3.6 1.4 0.2]
[5.4 3.9 1.7 0.4]
[4.6 3.4 1.4 0.3]
[5. 3.4 1.5 0.2]]
说明
- 所需的包已导入。
- 此数据集也已加载到环境中。
- 特征和目标值已从数据集中分离出来。
- 这些特征和目标值被打印到控制台上。
- 此外,为了查看数据的示例,还在控制台上打印了前8行数据。