如何检查Tensorflow是否在使用GPU

在这篇文章中，我们将看到如何检查TensorFlow是否在使用GUP。

GPU是深度学习的新标准。GPU拥有更多的逻辑核心，通过它们可以达到更高的并行化水平，与CPU相比，可以提供更好、更快的计算结果。在深度学习任务中，需要训练的参数数量可以达到数十亿。我们知道，在神经网络中，调整权重矩阵的操作，如矩阵乘法，是一个昂贵的操作，需要在CPU上完成。为了更快地执行这些操作，需要同时进行多项操作。GPU有更好的并行化支持，而且深度学习模型所需的内存也很庞大，可以适用于GPU。

你可能有一个GPU，但你的模型可能没有使用它。在这种情况下，训练将默认在CPU上完成。因此，有必要检查Tensorflow是否正在运行它所提供的GPU。

如果你想知道TensorFlow是否使用了GPU加速，我们可以简单地使用以下命令来检查。

import tensorflow as tf
tf.config.list_physical_devices('GPU')

输出:

如何检查Tensorflow是否在使用GPU

tf.keras模型如果有GPU可用，默认会在单个GPU上运行。如果你想使用多个GPU，你可以使用一个分布策略。

一旦你得到这个输出，现在去终端输入” _nvidia-smi _ “。这是一个命令行工具，旨在监控NVIDIA的GPU设备。它是基于Nvidia管理库（NVML）之上的。键入后，它应该产生与此类似的东西。

nvidia-smi

如何检查Tensorflow是否在使用GPU

该命令将返回一个由Tensorflow正在运行的GPU的信息组成的表格。它包含了你正在使用的GPU的类型，它的性能，内存使用情况和它正在运行的不同进程的信息。要知道你的ML模型是否正在GPU上进行训练，只需记下你的模型的进程ID，并将其与给定表格的进程标签进行比较。如果模型是在GPU上运行的，那么在进程标签中就会有一个模型的进程ID。

你也可以将设备日志设置为真，以了解你的操作和张量被分配到哪些设备上。这将让你知道哪个GPU在执行你的操作并存储结果。

tf.debugging.set_log_device_placement(True)

This should return “Executing op _EagerConst in device /job:localhost/replica:0/task:0/device:GPU:0“

检查对TensorFlow可用的设备

from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())

输出:

[name: "/device:CPU:0"
device_type: "CPU"
memory_limit: 268435456
locality {
}
incarnation: 13414683734401945856
xla_global_id: -1
]

如何检查Tensorflow是否在使用GPU

如何检查Tensorflow是否在使用GPU

检查对TensorFlow可用的设备

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

Tensorflow 教程

回顶部