如何在Python中把Sklearn数据集转换成Pandas数据框
在这篇文章中,我们看看如何在Python中把Sklearn数据集转换成Pandas数据框。
Sklearn和pandas是Python库,广泛用于数据科学和机器学习操作。Pandas主要集中在数据处理、操作、清理和可视化方面,而Sklearn库则提供了大量的工具和函数来训练机器学习模型。
示例1:将Sklearn数据集(iris)转换为Pandas数据框架
这里我们从Sklearn库中导入iris数据集。然后我们通过调用 load_iris() 方法加载这些数据,并将其保存在 iris_data 命名的变量中。这个变量的类型是sklearn.utils._bunch.Bunch 。iris_data有不同的属性,即数据、目标、框架、目标名称、DESCR、特征名称、文件名、data_module。我们将利用data和feature_names属性。data属性返回iris数据集的完整数据矩阵。feature_names属性返回一个列名的列表,以考虑数据。
输出:
示例2:将Sklearn数据集(diabetes)转换为Pandas数据框架
在这个例子中,我们将创建一个名为convert_to_dataframe的函数,它将帮助我们将Sklearn数据集转换为Pandas数据框架。这个函数将需要一个参数,即 sk_data ,这是sklearn数据集,并返回这个数据的pandas数据框架格式。我们在这个例子中使用sklearn的diabetes数据集。
输出: