斯坦福大学CS博士生带来全面解答 用PyTorch还是TensorFlow (斯坦福大学创始人)

文章编号:43523 资讯动态 2024-12-09 PyTorch TensorFlow

雷锋网 AI 评论按:关于深度学习的框架之争一直没有停止过。PyTorch,TensorFlow,Caffe还是Keras ?近日,斯坦福大学计算机科学博士生Awni Hannun就发表了一篇文章,对比当前两个主流框架PyTorch和TensorFlow。

雷锋网 AI 科技评论编译如下:

这篇指南是我目前发现的PyTorch和TensorFlow之间的主要差异。写这篇文章的目的是想帮助那些想要开始新项目或者转换深度学习框架的人进行选择。文中重点考虑训练和部署深度学习堆栈组件时框架的可编程性和灵活性。我不会权衡速度、内存使用情况等性能。

结论

PyTorch更适合于在研究中快速进行原型设计、业余爱好者和小型项目,TensorFlow则更适合大规模的调度,尤其当考虑到跨平台和嵌入式调度操作时。

准备时间

优胜者: PyTorch

PyTorch实际上是NumPy的替代,它支持gpu,有着更高级的功能,可以用来构建和训练深度神经网络。

如果你熟悉NumPy、Python和常见的深度学习概念(卷积层、递归层、SGD等),那么学习Python对你来说会很容易。

而TensorFlow则可以看成是一种嵌入Python的编程语言。当你在编写TensorFlow代码时,它们会通过Python编译成一张图,然后由TensorFlow执行引擎运行。我看到过刚使用TensorFlow的人因为这个额外的间接层而苦思冥想。也因为如此,想用TensorFlow还需要学一些额外的概念,比如会话、图、变量作用域和占位符等。要运行基本模型,还需要更多的样板代码。使用TensorFlow的前期准备时间肯定比PyTorch要长。

图创建和调试

优胜者:PyTorch

创建和运行计算图可能是这两个框架最大的不同。在PyTorch中,图架构是动态的,这意味着图是在运行时创建的。而在TensorFlow中,图架构是静态的,这意味着先编译出图然后再运行。

下面是一个简单的例子,在PyTorch中可以使用标准的Python语言编写for循环结构

for _ in range(T):

h = torch.matmul(W, h) + b

你可以在这段代码的执行过程中改变T的值。而在TensorFlow中,需要使用控制流运算( control flow operation )来创建图,例如tf.while_loop。对于更常见的结构,TensorFlow可以执行dynamic_rnn语句,但是创建自定义的动态计算更加困难。

PyTorch中简单的图架构更容易推导,或许更重要的一点是,它更容易调试。调试PyTorch代码如同调试Python代码,可以使用pdb并在任何地方设置断点。而调试TensorFlow代码并不那么容易,你有两个选择,一是请求会话中你想要检查的变量,二是学习和使用TensorFlow调试器(tfdbg)。

优胜者:TensorFlow

因为PyTorch在逐渐发展,我认为两者之间的差距会缩小到零。然而,目前仍有一些TensorFlow支持但PyTorch不支持的功能,

此外,TensorFlow的contrib包中有更多比PyTorch更高级的函数和模型。

序列化

优胜者:TensorFlow

在这两种框架下保存和加载模型都很简单。PyTorch有一个特别简单的API,既可以保存模型的所有权重,也可以pickle全部类。

TensorFlow的Saver对象也很容易使用,并为检查点(check-pointing)提供了更多选择。

在序列化中TensorFlow的主要优点是可以将整个图保存为协议缓冲区。这包括参数和运算。此外,该图可以通过其他支持的语言(C++,JAVA)加载。这对不支持Python的调度栈来说至关重要。理论上,在改变模型源代码之后,你想要运行旧模型时它也能有所帮助。

部署

优胜者:TensorFlow

对于小规模的服务器端部署,两个框架都很容易封装在诸如Flask web服务器中。

不过,TensorFlow支持移动和嵌入式部署。可以确定的说,这比包括PyTorch在内的大多数深度学习框架支持功能的都要多。将TensorFlow部署到Android或iOS上确实需要大量的工作,但至少你不必用Java或C++重写模型的整个推理程序。

此外,TensorFlow Serving支持高性能的服务器端部署。我没有使用过 TensorFlow Serving ,因此不能很确信地写出它的利弊。由于机器学习服务使用的频率很高,我猜想这是人们坚持使用TensorFlow的充分理由。除了性能之外,TensorFlow Serving的一个明显特点是,支持轻松地换用模型而不会降低服务性能。

文档

平手

我在两种框架的文档中都找到了我需要的东西。Python的 API在两个框架中都有良好的文档记录,并且有足够的例子和教程来学习这两种框架。

一个比较边缘的问题是,PyTorch的 C语言库大多是无文档记录的,不过这只影响到编写定制的C语言扩展程序,而且这种操作是否有助于软件还存疑。

数据加载

优胜者: PyTorch

PyTorch中用于数据加载的API设计得很好。接口在数据集、采样器和数据加载器中有明确规定。数据加载器接收数据集和采样器,根据采样器的调度,在数据集上生成迭代器。加载并行数据就像把num_workers语句传递到数据加载器一样简单。

我在TensorFlow还没发现特别有用的加载数据的工具,例如readers, queues, queue runners等,都不够好。部分原因是因为将想要运行的所有预处理代码添加到TensorFlow图中并不总是直接的,例如计算时频谱(spectrogram)。

而且,API本身更繁琐,更难以学习。

设备管理

优胜者:TensorFlow

TensorFlow管理设备时的无缝性非常好。通常不需要规定任何东西,因为默认已经设好了。例如,如果GPU可用,TensorFlow将默认在GPU上运行。在PyTorch中,即使支持CUDA,都必须明确地将所有东西移到设备上。

TensorFlow设备管理的唯一缺点是,即使你只使用一个GPU它也会默认占用所有GPU的显存。简单的解决方法是用CUDA_VISIBLE_DEVICES语句指定显卡。但有时会忘了设置,所以当GPU实际上处于空闲状态时,会显示内存不足。

在PyTorch中,代码需要更频繁地检查CUDA的可用性和更明确的设备管理,当编写能够同时在CPU和GPU上运行的代码时尤甚。另外,将GPU上的PyTorch Variable转换为NumPy数组有点繁琐。

numpy_var = variable.cpu().data.numpy()

自定义扩展

优胜者:PyTorch

在这两种框架中都可以用C语言、C++或CUDA构建或绑定自定义扩展。但TensorFlow需要更多的样板代码,即使它支持多种类型和设备。在PyTorch中,只需为每个CPU和GPU版本编写一个接口和相应的实现。用这两种框架来编译扩展都很直接,并且不需要下载除了pip安装包之外的任何头文件或源代码。

扩展

TensorBoard是用于展示训练机器学习模型过程的可视化工具。它是TensorFlow自带的最有用的功能之一。只需要通过训练脚本中的一些代码片段,就可以查看任何模型的训练曲线和验证结果。TensorBoard作为web服务运行,它可以非常方便地将存储在无头节点(headless node)上的结果可视化。

我在用PyTorch之前一直在用这种功能并尝试找到能替代这种功能的选择。值得庆幸的是,目前至少有两个开源项目支持这种功能。一个是 istensorboard_logger ,另一个是。istensorboard_logger库甚至比TensorFlow中的TensorBoard摘要数据更容易使用,不过需要安装TensorBoard来使用。crayon完全能取代TensorBoard,不过需要更多的设置(支持docker是先决条件)。

是一个更高级的API,可配置后端,支持TensorFlow、Theano和CNTK,也许在不久的将来也会支持PyTorch。Keras就像TensorFlow里的tf.contrib库一样。

我上面没有讨论Keras,不过它使用起来特别容易。它是调试最常用的几种深度神经网络架构最快的方法之一。不过它的灵活性不如PyTorch或core TensorFlow。

谷歌在2017年2月发布了 TensorFlow Fold 。该库构建在TensorFlow之上,支持更多动态图构建,主要优点是动态批处理功能——可以对不同规模的输入数据(如解析树上的递归网络)自动进行批量计算。在可编程性上,它的语法不如PyTorch直接,不过在某些情况下,批量处理带来的性能改进可以让我们忽略语法上的不足。

雷锋网 AI科技评论

原创文章,未经授权禁止转载。详情见 转载须知 。

用PyTorch还是TensorFlow?斯坦福大学CS博士生带来全面解答


本文地址: https://www.gpxz.com/article/dc51c6bbab8abbc2810a.html
全局中部横幅
全局中部横幅
百度AI开放平台

百度AI开放平台提供全球领先的语音、图像、NLP等多项人工智能技术,开放对话式人工智能系统、智能驾驶系统两大行业生态,共享AI领域最新的应用场景和解决方案,帮您提升竞争力,开创未来。

欢乐斗地主

腾讯先锋(原腾讯先游)是腾讯官方推出的云游戏平台,用户无需下载游戏,就能畅玩各类游戏大作。

企查查

企查查是官方备案的企业征信机构,为您提供全国企业信息查询,包括企业工商信息查询,信用信息查询,经营状况查询等相关信息。查企业,查老板,查风险就上企查查!

870游戏

870游戏是一款低门槛高质量的综合游戏平台,为广大游戏玩家提供好玩、流畅的综合游戏服务。平台通过云游戏技术,实现PC游戏和手机游戏无需下载,低配手机也能随心畅玩。通过免安装技术,实现手机游戏无需安装也能在870游戏上游玩。

导热油,导热油专业提供厂商

上海久星导热油股份有限公司是全国知名的导热油生产单位,公司以优质的导热油产品,良好的售后服务赢得了市场,并秉承“科技创新,诚信做人”、“永“久”追求、用“星”服务”的宗旨将引领着久星在导热油领域里不断攀登新的高峰,竭诚欢迎各界朋友前来参观洽谈!

长春洗车机厂家

洗车设备系列电脑洗车机,全自动洗车设备,无人洗车机,价格实惠,适合加油站及4S店,汽车修理厂,汽车美容连锁店等汽车售后服务业使用的隧道式洗车机,龙门往复式洗车机和公交客运站使用.

永安陵公墓

天津永安陵公墓提供安全可靠的静海、青县、武清地点。国营永安陵公墓价格合法,服务周到,致力于为客户提供优质的殡葬服务。

苏州意美特科技有限公司

苏州意美特科技有限公司主要业务涉及客户定制化真空灌封设备,项目方案、样品验证和新能电机灌封技术咨询,设备及产线自动化方案的实施和维修保养服务等

安装冷库设备公司

福州兴顺达是一家专业的安装冷库公司,致力于生产冷库机组、冷库设备、螺杆式冷水机组、工业冷水机组、真空冻干设备、真空冷冻干燥机、低温冷冻机、块冰机的冷库设备厂家。

软件下载

PC9软件园,一个安全绿色的下载网站,提供各种最新软件,正版软件,官方软件,免费软件,绿色软件,汉化软件,破解软件,手机应用及热门游戏,下载软件就到PC9软件园!

善恶资源网

每天更新大量原创技术教程、绿色软件、娱乐资讯、生活百科等网络优质内容,致力打造网络技术的免费资源分享平台,好资源不私藏,大家一起分享

金库门

河北晟兴是专注于金融安防产品订制生产企业,主营产品有:金库门,不锈钢金库门,移动金库房,智能枪柜,咨询电话:0318-5931666,手机:15631870566.

全局底部横幅