深度学习框架|极客教程

每个框架都以不同的方式构建，以用于不同的目的。在这里，我们将介绍八大深度学习框架，以便您更好地了解哪个框架非常适合您，或者在解决您的业务挑战时更方便。

TensorFlow

深度学习框架

TensorFlow可以说是最好的深度学习框架之一，并且已经被空中客车，Twitter，IBM和其他几个巨头采用，这主要归功于其高度灵活的系统架构。

最着名的TensorFlow用例是谷歌翻译，加上自然语言处理，文本分类/摘要，语音/图像/手写识别，预测和标记等功能。

TensorFlow可在桌面和移动设备上使用，还支持Python，C ++和R等语言，以创建深度学习模型和包装库。

TensorFlow附带两个广泛使用的工具：

TensorBoard用于网络建模和性能的有效数据可视化。
TensorFlow Serving 用于快速部署新算法/实验，同时保留相同的服务器架构和API。它还提供与其他TensorFlow模型的集成，这与传统实践不同，可以扩展为其他模型和数据类型。

如果您迈出深度学习的第一步，那么选择TensorFlow是明智的选择，因为它基于Python，受Google支持，并附带文档和演练来指导您。
TensorFlow的局限性
TensorFlow目前的一个主要缺点是，构建一个新的深度学习体系结构相对较慢(初始化一个体系结构需要几秒钟)。因此，在TensorFlow中构建一些复杂的、能够动态改变结构的深层架构并不方便。其中一个架构是TreeLSTM，它使用英语句子的语法解析树来执行需要理解自然语言的任务。由于每个句子都有不同的解析树，所以每个句子都需要稍微不同的体系结构。图1说明了TreeLSTM体系结构。
深度学习框架

图1 。树形结构的概念描述。对于每个输入数据点，树的形状是不同的，因此必须为每个示例构造一个不同的计算图。

虽然这样的模型可以在TensorFlow中实现，但是由于当前TensorFlow API的限制，这样做需要很大的灵活性。新的框架，如Chainer、DyNet和PyTorch，承诺通过使新架构的构建足够轻量级，从而能够轻松地构建TreeLSTM之类的模型，从而消除这些障碍。幸运的是，TensorFlow开发人员已经在开发对基本TensorFlow API(如TensorFlow Eager)的扩展，这将使动态架构的构建更加容易。

Caffe

深度学习框架

Caffe是一个深度学习框架，支持C，C ++，Python和MATLAB等接口以及命令行界面。众所周知，它的速度和可转换性及其在建模卷积神经网络（CNN）中的适用性。使用Caffe的C ++库（附带Python接口）的最大好处是能够从深度网络存储库Caffe Model Zoo访问可用网络，这些网络经过预先培训并可立即使用。在建模CNN或解决图像处理问题时，这应该是您的首选库。

Caffe最大的卖点是速度。它每天可以使用单个 Nvidia K40 GPU 处理超过 6000 万张图像。这是 1 毫秒/图像的推理和 4 ms/图像的学习 – 并且最近的库版本会更快。

Caffe是一个很受欢迎的用于视觉识别的深度学习网络。然而，Caffe不支持TensorFlow或CNTK中发现的细粒度网络层。考虑到体系结构、对递归网络的整体支持以及语言建模，它非常差，而且必须使用低级语言来建立复杂的层类型。

Microsoft Cognitive Toolkit / CNTK

深度学习框架

Microsoft Cognitive Toolkit（以前称为CNTK）通常以易于培训和跨服务器的流行模型类型而闻名，是一个开源深度学习框架，用于培训深度学习模型。它执行有效的卷积神经网络和图像，语音和基于文本的数据培训。与Caffe类似，它受Python，C ++和命令行界面等接口的支持。

鉴于其资源的连贯使用，可以使用工具包轻松实现强化学习模型或生成对抗网络（GAN）。众所周知，与在Theano或TensorFlow等工具包上运行时，在多台机器上运行时，可提供更高的性能和可扩展性。

与Caffe相比，在发明新的复杂层类型时，由于构建块的精细粒度，用户不需要以低级语言实现它们。Microsoft Cognitive Toolkit支持RNN和CNN类型的神经模型，因此能够处理图像，手写和语音识别问题。目前，由于缺乏对ARM架构的支持，其在移动设备上的功能相当有限。

Torch / PyTorch

深度学习框架

Torch是一个科学的计算框架，为机器学习算法提供了广泛的支持。它是一个基于lua的深度学习框架，广泛应用于Facebook、Twitter和谷歌等行业巨头。它使用CUDA和C/ c++库进行处理，基本上是为了扩展构建模型的生产，并提供整体的灵活性。

到目前为止，PyTorch已经在深度学习框架社区中得到了高水平的采用，并且被认为是TensorFlow的竞争对手。PyTorch基本上是Torch深度学习框架的一个端口，用于构建深度神经网络和执行复杂程度高的张量计算。

与Torch相反，PyTorch运行在Python上，这意味着任何对Python有基本了解的人都可以开始构建自己的深度学习模型。

考虑到PyTorch框架的体系结构风格，与Torch相比，整个深度建模过程要简单得多，而且透明得多。

MXNet

深度学习框架

MXNet(发音为mix-net)是一个由Python、R、c++和Julia支持的深度学习框架，专门为高效、高效和灵活性而设计。

MXNet的美妙之处在于，它使用户能够用各种编程语言编写代码。这意味着你可以用任何一种你觉得舒服的语言来训练你的深度学习模型，而不必从头学新东西。使用c++和CUDA编写的后端，MXNet能够扩展和处理大量的gpu，这使得它对于企业来说是不可或缺的。例如:Amazon使用MXNet作为其深度学习的参考库。

MXNet支持长短时记忆(LTSM)网络以及RNNs和CNNs。
这个深度学习框架以其在成像、手写/语音识别、预测和NLP方面的能力而闻名。

Chainer

深度学习框架

Chainer功能强大、动态直观，是一个基于python的神经网络深度学习框架，由run策略设计。与使用相同策略的其他框架相比，您可以在运行时修改网络，从而允许您执行任意控制流语句。
Chainer支持CUDA计算和多gpu。该深度学习框架主要用于使用RNNs和CNNs进行情感分析、机器翻译、语音识别等。