如何使用Tensorflow在Python中下载和探索IMDB数据集?
Tensorflow是由Google提供的机器学习框架。它是一个开源框架,与Python一起使用以实现算法、深度学习应用程序等等。它用于研究和生产目的。
这是因为它使用NumPy和多维数组。这些多维数组也称为“张量”。该框架支持与深度神经网络一起工作。它具有高度的可扩展性,并带有许多流行的数据集。它使用GPU计算并自动化资源管理。它配备了大量的机器学习库,并且得到了良好的支持和文档。该框架能够运行深度神经网络模型、训练它们,并创建应用程序,以预测相应数据集的相关特征。
可以使用以下代码在Windows上安装’tensorflow’包 −
Tensor是TensorFlow中使用的数据结构。它有助于连接流程图中的边缘。此流程图称为”数据流图”。张量不过是多维数组或列表。它们可以使用以下三个主要属性进行识别 −
“IMDB”数据集包含超过50,000部电影的评论。通常与自然语言处理相关的操作使用该数据集。
我们使用Google Colaboratory运行以下代码。Google Colab或Colaboratory可以在浏览器上运行Python代码,不需要任何配置,并免费使用GPU(图形处理单元)。Colaboratory是建立在Jupyter Notebook之上的。
以下是代码 −
更多Python相关文章,请阅读:Python 教程
示例
代码来源 − https://www.tensorflow.org/tutorials/keras/text_classification
输出结果
说明
-
要导入所需的软件包并进行别名设置。
-
加载IMdB数据并将其存储在Colab可访问的位置。
-
在控制台上显示原始数据的样本。
-
将原始数据分成训练集和测试数据集。
-
使用训练数据构建模型。
-
尝试将给定的数据分类为负面评价或正面评价。