深度学习框架的比较（MXNet, Caffe, TensorFlow, Torch, Theano)-白红宇

深度学习框架的比较（MXNet, Caffe, TensorFlow, Torch, Theano)

阅读量：146 次

发布时间：2019-02-26

本文共 1468 字，大约阅读时间需要 4 分钟。

1. 基本概念

1.1 MXNet相关概念

深度学习的目标是如何方便地表达神经网络，以及如何快速训练得到模型。CNN（卷积层）能够表达空间相关性（学表示），而 RNN/LSTM 则能够表达时间连续性（建模时序信号）。命令式编程（imperative programming）相对浅嵌入，用户可以直接通过语句执行操作，如 numpy 和 Torch 就属于这种类型。声明式语言（declarative programming）则深嵌入，提供一整套针对具体应用的迷你语言。用户只需声明要做什么，系统自行执行。这类系统包括 Caffe、Theano 和 TensorFlow。命令式编程更直观，但对优化和自动求导不利；而声明式语言则更适合优化和自动化处理。

	浅嵌入，命令式编程	深嵌入，声明式编程
如何执行 a=b+1	需要 b 已经被赋值	返回对应的计算图
优点	语义直观，灵活	性能优化全面，可视化

MXNet 则尝试将两种编程模式无缝结合。用户可以自由混合使用命令式和声明式编程。例如，可以用声明式编程描述神经网络并利用自动求导训练模型，同时用命令式编程实现迭代训练和控制逻辑，方便调试和与主语言交互。

1.2 深度学习的关键特点

层级抽象：通过多个层次逐步建模复杂概念。

端到端学习：从输入到输出进行统一建模。

2. 比较表

比较项	Caffe	Torch	Theano	TensorFlow	MXNet
主语言	C++/cuda	C++/Lua/cuda	Python/c++/cuda	Python/c++/cuda	C++/cuda
从语言	Python/Matlab	-	-	-	Python
硬件支持	CPU/GPU	CPU/GPU/FPGA	CPU/GPU	CPU/GPU	CPU/GPU
分布式	N	N	N	Y (未开源)	Y
速度	快	快	中等	中等	快
灵活性	一般	好	好	好	好
文档	全面	全面	中等	中等	全面
适合模型	CNN	CNN/RNN	CNN/RNN	CNN/RNN	CNN/RNN
命令式支持	N	Y	Y	N	Y
声明式支持	Y	N	Y	Y	Y

3. 详细描述

3.1 MXNet

MXNet 的系统架构包括多种主语言的嵌入、编程接口（矩阵运算、符号表达式、分布式通讯）、两种编程模式的统一系统实现，以及硬件支持。

MXNet 的设计细节包括符号执行和自动求导、运行依赖引擎、内存节省等。

3.2 Caffe

优点：

第一个主流的工业级深度学习工具。

出色卷积神经网络实现。

专注于图像处理。

缺点：

扩展性差，递归网络支持不足。

层结构需要自行实现 forward/backward。

3.3 TensorFlow

优点：

Google 开源框架，应用广泛。

符号张量操作便捷。

TensorFlowBoard 提供优质可视化工具。

编译速度快。

缺点：

速度较慢，内存占用大。

层支持不足，时间序列功能缺失。

3.4 Torch

优点：

Facebook 开源框架。

高灵活性和速度。

优化基础计算单元。

支持时间卷积和 3D 卷积。

缺点：

Lua 接口学习成本高。

缺少 Python 接口。

层结构扩展性差。

RNN 官方支持不足。

3.5 Theano

优点：

Python 开源框架。

强大灵活性和实验支持。

第一个使用符号张量图描述模型的架构。

支持多平台。

提供高级工具如 Blocks 和 Keras。

缺点：

编译速度慢。

导入效率低。

代码基础为 Python，难以优化。

转载地址：http://cmuz.baihongyu.com/

你可能感兴趣的文章

OSChina 周日乱弹 —— 2014 年各种奇葩评论集合

OSChina 技术周刊第十期，每周技术抢先看！

OSError: no library called “cairo-2“ was foundno library called “cairo“ was foundno library called

OSError: [WinError 193] %1 不是有效的 Win32 应用程序。

OSGi与Maven、Eclipse PlugIn的区别

Osgi环境配置

OSG——选取和拖拽

OSG中找到特定节点的方法（转）

OSG学习：C#调用非托管C++方法——C++/CLI

OSG学习：OSG组成（三）——组成模块（续）：OSG核心库中的一些类和方法

OSG学习：OSG组成（二）——渲染状态和纹理映射

OSG学习：WIN10系统下OSG+VS2017编译及运行

OSG学习：人机交互——普通键盘事件：着火的飞机

OSG学习：几何体的操作（一）——交互事件、简化几何体

OSG学习：几何体的操作（二）——交互事件、Delaunay三角网绘制

OSG学习：几何对象的绘制（一）——四边形

OSG学习：几何对象的绘制（三）——几何元素的存储和几何体的绘制方法

OSG学习：几何对象的绘制（二）——简易房屋

OSG学习：几何对象的绘制（四）——几何体的更新回调：旋转的线