如何使用TensorFlow加载鲍鱼数据集中的csv数据?
可以使用存储此数据集的google API下载鲍鱼数据集。在Pandas库中,使用“read_csv”方法将数据从API中读入csv文件,特征名称也被明确指定。
更多Python相关文章,请阅读:Python 教程
我们将使用包含鲍鱼测量值的鲍鱼数据集。鲍鱼是一种海螺,目标是根据其他测量值预测年龄。
我们使用Google Colaboratory来运行以下代码。Google Colab或Colaboratory可以通过浏览器运行Python代码,并且无需配置即可免费访问GPU(图形处理单元)。 Colaboratory是建立在Jupyter Notebook之上的。
import pandas as pd
import numpy as np
print("下面一行使NumPy值更易于阅读")
np.set_printoptions(precision=3, suppress=True)
import tensorflow as tf
from tensorflow.keras import layers
from tensorflow.keras.layers.experimental import preprocessing
print("读取csv数据")
abalone_train = pd.read_csv("https://storage.googleapis.com/download.tensorflow.org/data/abalone_train.csv",
names=["长度", "直径", "高度", "总重量", "去壳重量","内脏重量", "壳重量", "年龄"])
代码来源:https://www.tensorflow.org/tutorials/load_data/csv
输出
下面一行使NumPy值更易于阅读
读取csv数据
说明
- 所需的软件包已经下载到环境中。
- 使用“read_csv”方法读取csv数据。
- 数据集中的所有特征都需要以相同的方式处理。
- 完成后,将所有特征包装到单个NumPy数组中。
极客教程