如何用Python下载和探索Iliad数据集
Tensorflow 是一个免费的开源机器学习和人工智能库,广泛流行于训练和部署神经网络。它是由谷歌大脑团队开发的,支持广泛的平台。在本教程中,我们将学习下载、加载和探索著名的Iliad数据集。
在Iliad数据集中,有不同的作品,对同一本荷马的伊利亚特文本有不同的英文翻译。Tensorflow对这些文件进行了修改,以关注其作品的例子。该数据集可在以下网址获得.
https://storage.googleapis.com/download.tensorflow.org/data/illiad/
示例 :在下面的例子中,我们将以三位译者的作品为例。威廉-考伯,爱德华,德布伯爵,和塞缪尔-巴特勒。然后在TensorFlow的帮助下,我们将加载他们,并将他们的作品与他们的翻译进行分类。
安装TensorFlow文本包:
下载并加载Iliad数据集
我们需要给每个数据集单独贴标签,因此我们使用Dataset.map函数。这将返回例子-标签对。
输出:
连接并洗刷数据集。使用Dataset.concatenate函数对其进行连接。shuffle函数被用来洗数据。然后我们打印出一些例子。
输出: