DPU 英特尔买下了的魔力何在 Nervana 然而 (英特尔dpg)

文章编号：39870 资讯动态 2024-12-03 Intel NVIDIA 深度学习芯片 Wave 寒武纪 Computing

导读：在过去的一个月中，Intel收购了深度学习芯片公司 Nervana Systems ，以及移动和嵌入式机器学习公司 Movidius，给未来的深度学习下了重注。而Intel所做的这一切，正是在为未来适应深度学习的数据流（DPU）架构升级布局。

这些新公司将一起解决英特尔仍在形成的难题：捕捉未来深度学习领域——这块预估达到数万亿美元的蛋糕。而这个艰巨的任务，都将通过 Intel 自己的 Knights Mill 在机器学习代码和工具方面的成果，加上软件优化的工作来实现。而与此同时，NVIDIA正在加强其自产的GPU训练和推理芯片市场，以及配备了最新 Pascal GPU 和所需深度学习书库的自产硬件市场。 SPAn>

Intel 最近令人惊讶的收购行为，也成为了重磅头条，而此举使得 NVIDIA更难说明 GPU 该如何加速（目前在模型训练占主导地位的计算引擎），想要在这个新兴市场上占有一席之地，他们还要更加努力。然而在过去的两年中，有很多新成员加入了该领域，这无疑是雪上加霜。

深度学习芯片新贵宣扬的理念是：通用体系架构（包括GPU）无法在低精度、固定点及专业性上与之比拟。事实上，我们可能进入到计算机体系结构的“寒武纪爆炸”时代，它由深度学习方面的新需求形成。不过，我们可以设想在短时间内，应用程序和用户的数量足够多，实际上就能确保芯片初创公司在等待大爆发时不会玩完。

Wave Computing

这些新贵中，其中一家专注深度学习的初创公司名为 Wave Computing ，它在 Nervana 系统方面有很多优点，这些都可以使它成为 Intel（或者其它公司）的最佳收购对象。

虽然Wave Computing 的技术和执行方法不同于 Nervana，但公认的是：在有着低级随机舍入和其他相同技术的超低精度硬件上，进行大规模深度学习训练时，它在实用性上略胜一筹。同时该公司的 Jin Kim 告诉 The Next Platform，他们看到了自身技术对于如英特尔这类公司的价值所在。Nervana 的采购行为对大局来说是有益的，因为它表明了该类型的市场需要非通用硬件。

有一个可能性是：Intel 对于芯片的兴趣就如同对于 Nervana 的 Neon 软件框架一样，但 Wave Computing 的 Kim 说：“还有另一个会遭公司哄抢的需求未被满足：开发板和加速器板。可当我们与该领域的人交谈时发现，他们都希望有一个针对深度学习具体需求的单体系统。”

当然，在 NVIDIA 的 DGX-1 appliance 中这种东西已经存在，它配备了 Pascal generation GPUs ，且具备了进行训练和推理的所有软件。然而，Kim 说，他们已经掌握了硬件和软件技术，且可以凭借更低的功耗和更短的训练时间（理论上无需 DGX-1 appliance）击败 Pascal。关键点是除了 DGX-1 外，它是深度学习采取的第一个系统，毫无疑问，它肯定是基于一种新架构。

Wave Computing 方法基于通过其DPU处理单元的数据流架构。和 Nervana 一样，Wave 的核心部位也有一个高度可扩展的共享内存架构（有着混合内存立方体或 HMC）。

Wave 的业务并不在销售加速板，它专注的是提供一个完整的排序和推理系统。这也正是 Kim 说的：数据中心网络中的即插即用节点，它可以本地支持 TensorFlow ，Hadoop，Spark，和 kafka 。系统会在 2017 年从 Q2 开始进入到 1U 和 3U 配置。他们有一个 28 nm 的测试芯片，虽然在两年前就交付验证了，但即将到来的 16 nm FinFET芯片现在正在流片，今年年底交付时将提供大幅提升。

Kim说：“第一个 28 nm 芯片可以将 16000 个处理单元置于一块硅上，但 16 nm 的 FinFEt 芯片即将问世，它可以将 64000 个处理单元置于一块硅上。”它首先将通过一个私有云，培养那些想要在系统变得可用之前就先行体验的早期用户。“我们的商业模式，并不是使用我们的云端来供服务，但是，需求非常高，而且私有云可以更快的选择出那些是想要早期访问的人。”

那么，数据流架构（DPU）芯片和系统的内部到底长什么样？

英特尔买下了 Nervana，然而 DPU 的魔力何在？

获取这里所有内存的负载和最重要的内存带宽能力。实际上，它与数据流处理单元自身一样重要，毕竟，如果无法移动数据的话，即使是最聪明的处理器也没什么用。当然，这只是绝大部分的移动指令，另一个主要特征是，用于深度学习工作负载的法案，在其数据重用的地方可以显著提高效率。

每个 8 位 RISC 型处理器都有 RAM 指令和局部寄存器，以保存大量局部操作的内存数据。这样使得话，就无需移动数据，只要移动指令。基本的指令序列包括：乘法、添加、转移等。每个处理单元组都集合到有着16 元素的集群中，共享算术单元（每个有2个）。这些集群组成了核心计算引擎，且可以聚集在一起单独完成 8 位的工作，或者一起做 64 位的工作（可变长度的算法）。

英特尔买下了 Nervana，然而 DPU 的魔力何在？

它的主要原理很简单。将每一个 DPUs 组合到一起，并完成多个任务。这是一个 NIMD 框架（有两种控制流），可以支持很高的内存带宽。第一代芯片在 6.7-8 GHz 之间跑来跑去，且在 150-200 瓦的范围内，但 Kim 没有评论冬季将出来下一代的芯片。每个数据流处理单元（DPUs）都成为了群集的一部分。它通过团队开发的战术调度工具包进行静态调度，且不会遇到内存一致问题，因为它明确了：在DPU的特定部分运行那些算法。

每个 DPU 有 24 个“计算机器”，且从上面你可以看出，建筑能支持高度的随机访问存储器，该存储器有着 4 个 HMC 和DDR4存储器（由将这些铺在一起的核心组成元素组成）。在 Wave 的 3U 配置下，他们可以把 16 台这样的机器结合在一起。

当然，它与通用处理器之间的关键区别是：低精度与固定点的数学能力。 Kim说：“我们专注于在多个线程中，处理单元级别上的高度并行操作。我们还专注于高内存带宽的能力。由于它是实时可重构的，所以有可能得到支持随机四舍五入的硬件，进行混合精度的数学问题。这是深度学习向低精度发展的正确趋势，这样可以节省内存带宽。只要你可以在更高的精度下积累结果，就可以保证准确性，”

“整体的想法是，成为一个企业数据中心的 tensorflow 计算服务器节点，所有的 tensorflow 模型都以最小的修改运行，且分区也在一个可扩展的数据流架构高效运行，这样的话，整个系统都可以利用共享内存，我们就可以更好的测量 GPU ，且不消耗 CPU 。”

Wave 方法的核心是：通过随机四舍五入技术使用固定点，和许多小的高并行计算元素。 Kim指着IBM和斯坦福的研究说：“使用固定点和低精度算法，你只要小心转动浮点基本相同的收敛，”如下图所示。

英特尔买下了 Nervana，然而 DPU 的魔力何在？

模型上进行推测的成本不能太高，这也是深度压缩工作为何如此重要的原因（就像来自斯坦福的 Song Han一样利用 EIE 成果）。顶部绿色线采用的是低精度、无智能四舍五入的固定点。这项研究是在几年前进行的，那时人们认为浮点数是必需的。

Kim 说：“事实上，如果你进行随机或对数为基础的四舍五入，且使用固定点训练的话，其浮点几乎都是一样的。”底部的黑色线表示是固定状态下红色和蓝色的浮点。

在系统水平的性能方面，所有厂商依然可以一起竞争，因为 NVIDIA 的 DGX-1 appliances 并没有对很多框架进行太大冲击。然而，根据 NVIDIA 深度学习盒中现有的 P100 性能数据，以及Xeon 的实际基准，Wave 分享了以下指标。

英特尔买下了 Nervana，然而 DPU 的魔力何在？

我们能想象出一些 Wave Computing 的可能结果，其中最有可能的是“ 一部分大公司以收购的方式，寻找可以在价格和性能击败 NVIDIA，且与深度学习挂钩的系统。” 当然，在恰当的位置，它也要有必需的软件堆栈。这一领域，NVIDIA已经让自己的 CUDA 库与最知名的深度学习框架进行对接。

Wave Computing 系统是个容器，它可以支持微服务方向结构，该结构有着基于tensorflow的SDk 以运行和执行模型（有着用于tensorflow的python和C++API ），和一个用于大型数据中心（想要支持不同的语言）的低水平 SDK。Kin 说：“目标是为了使 tensorflow 模型在没有匣子的情况下运行更快，尽可能的远离用户。”这听起来很像 DGX-1 Appliance，然而，Kim 说“这将是有竞争力的价格。”没有人知道这是否意味着少几千元，还是相同的价格。

需要注意的是，我们应该指出：Kim 并没有说这是 CPU 或 GPU 的所有用户的替代物。“在某些情况下，这样的 tensorflow 分区方式，图表的某些部分将在 DPU 上运行，有一些在 CPU 上运行、还有一些在 GPU 上运行。我们的目标是用最好的混合和匹配加快速度。”它在人购买的系统中是如何形成的，以及它是怎么实施的还有待观察，但我们希望随着重点转移到新的结构，有人可以在明年结束之前抢到 Wave，且深度学习开始将其应用于有真实用户的实际系统中。

Via： The Next Plat Form

推荐阅读：

一路“买买买”，英特尔怎样铺平了它在人工智能上的道路？

英特尔3.5亿美元收购深度学习公司Nervana

原创文章，未经授权禁止转载。详情见转载须知。

本文地址： https://www.gpxz.com/article/7ffbf468f540ed174034.html

上一篇：Disrupt大会直击TCdisruption

下一篇：移动人工智能时代已来临甲骨文产品开发高级

首页

皇城艺术馆

电影视频 2026-01-21 12:14:16

炉石传说iOS游戏下载

《炉石传说》是暴雪娱乐开发的首款集换式卡牌游戏。魔兽世界中的九大职业悉数登场。支持多平台同场竞技，全新乱斗模式，每周新玩法，每周送卡包！

游戏网游 2024-08-16 22:34:15

单人小游戏,单人小游戏大全,4399单人小游戏,4399小游戏

4399单人小游戏大全收录国内外单人游戏,单人游戏大全,单人小游戏闯关,单人冒险小游戏,单人小游戏大全无敌版,单人闯关小游戏大全。好玩就拉朋友们一起来玩吧！

游戏网游 2024-08-16 23:01:37

牛肉的功效

牛肉是一种常见的食材,豆果美食食材百科为您整理了牛肉的别名,基本信息,适宜人群,不宜人群,搭配禁忌,牛肉的功效与作用,牛肉的烹饪技巧等信息,让您做出美味的牛肉。

图片摄影 2024-08-17 00:32:40

济南金开辐射防护技术有限公司

济南金开辐射防护技术有限公司位于泉城济南，地理位置优越，交通便利，公司占地十余亩、拥有现代化厂房数千平米是山东地区大型从事射线防护工程、工业探伤防护设计、个人防护用品、手术室净化装修施工建设等工程项目的专业化公司。致力于环保科技事业。公司公司拥有专业的工程师和施工设计队伍、并培养了一批专业的防护施工人员。我们以科技为先导，集各家所长，打造自已的形象，以实实在在的产品，朴实无华的商业风格，立足于当今强手之林。

设计美化 2026-01-25 00:27:09

汽车之声

汽车之声-您的专属汽车信息平台,汽车信息，二手车、汽车问答、汽车展会新能源汽车等信息尽在汽车之声！

行业信息 2026-01-28 23:06:02

力鼎智能装备（青岛）集团有限公司

力鼎智能装备（青岛）集团有限公司力鼎智能装备（青岛）集团有限公司成立于2004年，是一家国家高新技术企业，先后荣获“市级企业技术中心”、“省级智能制造系统解决方案供应商”、“省市级专精特新”、“国家专精特新小巨人”等荣誉称号。公司坚持以技术立足，品质致胜的产品理念，融合国内外先进的技术，专注于为机械制造领域的客户提供加工、装配以及物流智能一体化产线，致力于成为机械制造领域智能产线卓越提供者。

企业品牌 2026-01-29 12:05:11

烟囱新建

江苏金蜘蛛高空工程有限公司主要从事烟囱新建、烟囱拆除、烟囱美化、烟囱维修、烟囱防腐、电视塔防腐、凉水塔美化、冷却塔美化、烟囱彩绘、凉水塔防腐、冷却塔防腐、钢烟囱安装、烟囱安装爬梯、烟囱平台安装、烟囱刷航标、烟囱航标灯维修更换、凉水塔栏杆更换、冷却塔栏杆更换、砖烟囱拆除、水泥烟囱拆除、烟囱避雷针维修更换。

设计美化 2026-01-29 15:27:30

上海宣传片制作公司

上海拓石数字影视专注于企业宣传片制作,公司宣传片制作,产品宣传片,电视广告制作,电视广告拍摄,宣传片拍摄,广告片拍摄.我们在企业宣传片制作与拍摄中方面有着丰富的经验,争做行业领跑者.

电影视频 2025-02-07 15:32:32

同城8信息网

同城8信息网是一个专业的分类信息平台,在这里可以免费发布各个城市的同城供求信息。

网站模板 2025-02-16 00:30:26

巫山网

巫山网-系由巫山报社主办,集合巫山报.巫山手机报.巫山APP.巫山网微信.巫山新闻微信等,打造主流融合媒体,巫山最大宣传平台!服务电话:023-5763118818996597592

电影视频 2026-01-23 23:50:28

温州豆芽云居3D云设计

温州豆芽云居为您提供神奇的装修云设计软件、免费的室内设计效果图、专业的装修装潢公司，致力打造中国最信赖的家装O2O平台，给您最棒的装修体验。

手机软件 2026-01-29 21:56:49

Bing在中国的市场份额只有不到1%了 (病在中脉实坚病在外脉不实坚翻译)

2009年6月微软搜索引擎的Bing在国内上线，但Bing的市场份额一直在1%上下，而在2月，Bing的市场份额只有0.52%，然后Bing改变了策略，在中国主攻英文搜索，不过这个策略没有奏效，前段时间与百度合作提供英文搜索也不了了之，不过Bing在美国市场通过与雅虎、Facebook合作，市场份额已经到达了30%，Bing已经不行了...。

2025-02-02 01:05:55

侨鑫国际如何玩转高效智能智能楼宇 (侨鑫国际如何交房产税)

自1984年，美国出现了第一座智能大厦——，都市办公大楼，CityPlaceBuilding，，开启了运用信息系统管理楼宇的新时代之后，时至今日，人们对于楼宇的智能化已陆陆续续探索了30多年，近年来，大城市里的城市综合体如雨后春笋般发展起来，智能楼宇不断涌现，智能楼宇为什么频频出现呢，据美国和德国政府近年来的统计数据，住宅和商用建筑...。

2024-12-10 01:43:10

生意经这家AI独角兽插上了腾飞翅膀科研企业念起 (生意经视频)

10月29日，深兰科技2023年度渠道建设大会在上海举行，来自全国各地的200余家经销商出席了本次会议，共谋新形势下AI产业的商业化大计，会议期间，深兰最新研发的业内首款AI交互轮腿式家用机器人以及刚问世不久的硅基大脑SaaS平台等产品，也公开亮相，据悉，在本次会议中，深兰科技共与超过20家市级或区域级经销商企业成功签订，生态伙伴合作...。

2024-12-10 00:36:43

商用服务机器人出海修炼史一场内功与外功的 (商用服务机器人实施与应用赛项)

2017年7月3日，普渡设计的第一代欢乐送机器人获得了德国，红点最佳设计奖，，在参赛的全球5500件产品中，中国内地仅有13家企业的作品获此殊荣，此时的普渡刚刚开始起步，6月完成了pre，A轮融资，在那个资本喧嚣的AI浪潮时段，一两千万的融资额度显得平平无奇，一个月后，普渡的官方邮箱收到了一封来自奥地利的邮件，由于是德文，普渡团队把邮...。

2024-12-01 01:20:52

极米H6Pro对比当贝F6区别有哪些极米H6Pro和当贝F6哪款好 (极米h6pro参数)

发表在极米投影仪2023，8，715，04极米H6Pro是最新上市的投影仪，拥有不错的性能配置，那么和当贝F6对比有什么区别呢，下面就通过详细的参数配置进行对比分析，看看极米H6Pro对比当贝F6区别有哪些，究竟哪款更值得入手，一、极米H6Pro对比当贝F6区别有哪些1.光学参数对比在光源方面，极米H6Pro采用超级混光光源，当贝F6...。

2024-11-29 02:53:10

极米无屏电视H2Slim V1.3.17固件 (极米无屏电视多少钱)

发表在投影固件2018，9，109，11请使用格式为FAT32的U盘进行升级USB强刷包，V1.3.17，链接，此处内容被隐藏，回复本帖后可见MD5，e3a03900c322d2170864d47762b3fea1更新与修正1、自动对焦速度提升2、优化开机过程视觉及内容展示3、若干系统问题修复H2Slim强刷升级，关机状态，①下载US...。

2024-11-29 00:44:52

正在越建越多跨海大桥

已建和在建的跨海大桥，集中在长三角和粤港澳大湾区，动辄百亿的投资面前，算的是经济账和民生账文，财经，实习生吕宜函2005年，中国第一座真正意义上的跨海大桥——东海大桥完工，这座大桥起于上海浦东新区，终点是浙江舟山洋山深水港，打破跨海、跨区的物理隔膜，助力上海港集装箱吞吐量延续12年蝉联环球第一，近20年后的2024年，中国曾经建成并...。

2024-11-13 13:46:06

联结国环球人口本世纪80年代将达103亿峰值 (环球联合国际有限公司)

[联结国，#环球人口本世纪80年代将达103亿峰值#]#环球人口将在本世纪80年代达峰值#外地期间7月11日，联结国经济和社会事务部，经社部，颁布，环球人口展望2024，报告，报告预测，环球人口将在本世纪80年代到达约103亿的峰值，随先人口数量将会缓慢降低，在21世纪完结前回落至102亿人，对2100年人口数量的预测较10年前的预测...。

2024-07-13 05:56:51

流星雨之王是哪个星座什麽时刻发生 (流星雨之王是谁)

流星雨有很多种，发生的期间不同，最大值也不同，每次流星雨的流星量都不一样，那么哪场流星雨最大，被称为流星雨之王呢，上方咱们就从星座常识来揭秘一下哪个星座是流星雨之王，什么时刻会发生，哪个星座是流星雨之王，狮子座流星雨狮子座流星雨，被称为流星雨之王，是与坦普尔塔特尔彗星有关的流星雨，周期约33年，普通来说，流星数量约为每小时10至15颗...。

2024-07-09 21:29:05

平江内涝南边强降雨被洪水围困高处接济队来了 (平江水库泄洪)

自湖南平江遭逢自有气候记载以来继续期间最长、强度最大、雨量最多的汛情后，各方力气齐聚平江，万众一心抢险抗洪，目前，平江水位正逐渐降低，汨罗江支流平江站已分开警戒水位，本次超警时长为72小时15分，自7月3日0时起，平江防汛应急照应降为Ⅱ级，2024年7月2日，湖南岳阳，平江县遭逢洪水侵袭，接济人员划着皮艇寻觅转移被困大众，视觉中国图闻...。

2024-07-04 13:53:47

王者荣耀删除的角色怎么恢复

王者荣耀删除的角色怎么恢复王者荣耀删除的角色恢复的方法步骤是：1、进入王者营地软件，在首页底部选择个人主页，点击界面右上方的设置按钮。2、切换游戏角色以上设置点击，在管理游戏角色页面上，单击右上角的角色恢复。3、在角色恢复页面上，选择要恢复的角色。

2023-10-25 17:34:53

【宝马】宝马汽车报价_图片_宝马新款车型

宝马:网易汽车提供最新宝马新闻资讯,宝马车型报价,宝马汽车图片,宝马视频,宝马全国经销商等,宝马在线询价,预约试驾,团购买车,尽在网易汽车。

2023-09-19 01:00:25

文章推荐

2022制作姓氏头像的软件有哪些能够自由制作姓氏头像的app合集 (怎么制作2022年)

很多小伙伴还不清楚2022制作姓氏头像的软件有哪些，现在虽然换头像的方法有很多，但是想要自己制作的话，还是有条件的，很多app确实无法满足大家，那么今天小编就给大家带来一个详细的介绍，用来帮助用户去进行更好的选择，若是小伙伴们对于这一方面比较感兴趣的话，不妨就一起来看下吧，1、，头像制作，玩家能够在这里自由的去进行DIY制作，根据自己...。

2025-02-10 01:54:25

资讯动态

与麒麟980竞争还是骁龙855或成高通首款搭载NPU的AI芯片时机已到 (麒麟8000与麒麟980)

去年，麒麟970凭借全球首款搭载NPU的手机AI芯片备受关注，消息称今年麒麟980将升级NPU并首发全球7nm手机SoC，因此麒麟980吸引了更多关注，作为全球移动SoC的霸主，高通自然不会视而不见，雷锋网消息，高通新一代旗舰处理器骁龙855不仅将采用台积电7nm工艺，还将首次配备专用神经处理单元，NPU，另外，曝光的消息也指出新款...。

2024-12-09 20:36:03

资讯动态

中铁三局好进吗 (中铁三局好进吗现在)

不好进，根据企查查查询得知，中铁三局集团有限公司是中国中铁股份有限公司的全资子公司，是一家具有雄厚实力和高度专业性的大型工程建设企业，因为其业务涉及交通基础设施等国家重点建设领域，对于人才的需求非常严格，要求应聘者不仅具备扎实的专业知识和丰富的实践经验，还要拥有良好的团队协作能力和创新精神，中铁三局在招聘过程中还非常注重候选人的综合素...。

2024-11-29 15:20:48

资讯动态

汤姆之家汉堡加盟优势 (汤姆之家汉堡加盟费多少钱)

3大店型任意选，夺堡带劲！汤姆之家汉堡根据以往经验开发了三款店型适合不同层次的合作伙伴，客源真心不用愁，整是！经营轻松归一店，不分四季！别羡慕他人，想成功你也能！三大店，经营省事省心！调料靠配送，对手再难模仿操作标准化、流程化，缺乏餐饮经验皆可学会，各种产品口味标准统一，无需大厨照样能玩转，选址有知道，没经验不担心店面选址专人指导，你...。

2024-11-22 22:28:41

创业加盟

披长发妩媚动人关晓彤穿抹胸黑裙露香肩 (披长发妩媚动漫图片)

二八鸡婆巧梳妆，洞房夜夜换新郎，一双玉臂千人枕，半点朱唇万客尝，装成一身娇体态，扮做一副假心地，迎来送往知多少，惯作相思泪两行，...。

2024-09-07 21:30:26

娱乐热点

DPU 英特尔买下了 的魔力何在 Nervana 然而 (英特尔dpg)

Wave Computing

那么，数据流架构（DPU）芯片和系统的内部到底长什么样？

相关文章

文章推荐

DPU 英特尔买下了的魔力何在 Nervana 然而 (英特尔dpg)