英伟达推出首个CPU!预计2023年正式投入使用 (英伟达推出首款提供HBM3e内存的GPU)

文章编号:45215 资讯动态 2024-12-09 英伟达

今日凌晨,一年一度影响人工智能及高性能计算技术盛会NVIDIA GTC如期而至,这是GTC大会继去年后第二次在线上举行,其图形和加速器设计师宣布他们将再次设计自己的Arm处理器/SoC。

英伟达推出首个CPU!预计年正式投入使用

这款CPU以计算机编程先驱、美国海军少将格蕾丝•霍珀(Grace Hopper)的名字命名,它是英伟达在全面垂直整合硬件堆栈方面的最新尝试,能够在常规GPU产品的同时提供高性能CPU。据英伟达介绍,该芯片是专为大规模神经网络工作负载设计的,预计将于2023年在英伟达的产品中使用。

距离芯片准备完毕仍有两年,英伟达这次表现得相对克制。该公司只提供了关于芯片有限的细节——例如,未来它将基于Arm的Neoverse内核迭代——因为今天的发布会更多关注的是英伟达未来的工作路线图,而不是速度和产品。

目前,英伟达已经明确表示,“Grace”是英伟达的内部产品,将作为其大型服务器产品的一部分。该公司并没有直接争夺英特尔或AMD EPYC服务器市场。相反,他们正在建造自己的芯片来补充他们的GPU产品,创造一种可以直接连接其GPU的专用芯片,帮助处理庞大的万亿级参数人工智能模型。

英伟达推出首个CPU!预计年正式投入使用

从广义上说,“Grace”旨在填补英伟达AI服务器产品中CPU的空白。 该公司的GPU非常适合某些特定类的深度学习工作负载,但不是所有工作负载都是纯粹的GPU-bound,所有工作负载都不都是GPU绑定的。

相应地,英伟达当前的服务器产品通常依赖于AMD的EPYC处理器,该处理器对于以通用计算为目的而言非常快,但缺少英伟达寻找的那种高速I / O和深度学习优化。 特别是英伟达目前因使用PCI Express进行CPU-GPU连接而成为瓶颈,它们的GPU可以通过NVLink进行快速通信,但不能返回主机CPU或系统RAM。

英伟达推出首个CPU!预计年正式投入使用

正因如此,该问题解决方案是使用NVLink进行CPU-GPU通信,就像“Grace”之前的情况一样。此前,英伟达曾与OpenPOWER基金会合作,将NVLink引入到POWER9中。

然而,随着POWER的流行度下降,以及POWER10正在跳过NVLink,这种关系似乎正在逐渐消失。相反,英伟达正在以自己的方式构建带有必要NVLink功能的Arm服务器CPU。

根据英伟达的说法,最终的结果将是一种高性能、高带宽的CPU,其设计目的是与未来一代的英伟达服务器GPU协同工作。在英伟达讨论将每个英伟达 GPU与一个Grace CPU集成在同一块板上的情况下(类似于今天的夹层卡),CPU性能和系统内存通过迂回方式随GPU的数量而增加。这是英伟达特色鲜明的解决方案,不仅可以提高性能,而且在传统上集成了AMD或Intel的处理器尝试某种类似的CPU + GPU融合发挥。

据估计到2023年,英伟达将达到NVLink 4, SoC和GPU之间的累积带宽将至少达到900GB/秒,Grace SoC之间的累积带宽将超过600GB/秒。关键在于,这大于SoC的内存带宽,这意味着英伟达的GPU将有一个到CPU的高速缓存连贯链接,可以在全带宽下访问系统内存,同时也允许整个系统拥有一个单一的共享内存地址空间。

英伟达将此描述为平衡系统中可用的带宽数量。拥有包内CPU是增加英伟达 GPU能够有效访问和使用的内存数量的主要手段,因为内存容量仍然是大型神经网络的主要限制因素——你只能有效地运行与本地内存池一样大的网络。

这种以内存为中心的策略也反映在Grace的内存池设计中。英伟达将CPU放在GPU共享包上,并将RAM放在其旁边,Grace配备的GPU模块将包括一个有待确定的LPDDR5x内存数量,英伟达的目标是至少达到500GB/秒的内存带宽。

在2023年,LPDDR5x或将成为带宽最高的非显卡存储器选项。此外,由于LPDDR5x技术的目的是应用于移动设备,而且追踪长度非常短,英伟达还在大力宣传使用LPDDR5x可以提高能源效率。同时,由于这是服务器的一部分,Grace的内存也将启用ECC。

英伟达推出首个CPU!预计年正式投入使用

至于CPU性能,这实际上是英伟达公布最少的部分。该公司将使用下一代Arm的Neoverse CPU内核,最初的N1设计已经成为了转折点。但是除此之外,该公司透露内核应该在SPECrate2017_int_base吞吐量的基准上突破300点,这可以与AMD第二代64核EPYC CPU中的某些处理器相媲美。

该公司没有透露太多关于如何配置CPU或专门针对神经网络处理添加了哪些优化。但是,由于Grace旨在支持英伟达的GPU,预计在GPU较弱的情况下它会更强大。

另外如前所述,英伟达对Grace的预期目标是大大减少大型神经网络模型所需的时间。 英伟达力争在1万亿个参数模型上实现10倍的更高性能,而他们对64模块Grace + A100系统(具有理论NVLink 4支持)的性能预测将把此模型的训练时间从一个月缩短至三天。或者,能够在8个模块的系统上对5000亿个参数模型进行实时推断。

英伟达的Project Denver计划最初于十年前宣布,但从未真正达到其预期。自定义Arm内核家族仍不够好,也从未使用英伟达的移动SoC制成。相比之下,对于英伟达而言,Grace是一个更安全的项目。它们只是授予Arm内核许可,而不是构建自己的内核,这些内核也将被其他许多方使用。因此,英伟达的风险得以降低,可以在很大程度上使I / O和内存检测正确无误,并保持最终设计的能源效率。

如果一切都按计划进行,有望在2023年见到Grace。英伟达已经确认Grace模块将可用于HGX载板,以及扩展为DGX和所有其他使用这些板的系统。因此,尽管我们还没有看到英伟达有关Grace计划的全部内容,但是显然,他们正在计划使其成为未来服务器产品的核心部分。

英伟达推出首个CPU!预计年正式投入使用

编译链接:

版权文章,未经授权禁止转载。详情见 转载须知 。


本文地址: https://www.gpxz.com/article/afbad4d7a83814fbbc5c.html
全局中部横幅
全局中部横幅
华夏时报网

《华夏时报》官方网站,以中央级综合性主流媒体《华夏时报》专业的采编队伍为依托,以华夏时报社大数据、大智库优质资源为基础,以整合业内有影响力的专家团队、各类深受客户认可的品牌活动等为抓手,秉承“思想创造价值”理念,树立“公益慈善民生”价值观,现已成为新兴、专业的主流财经新闻网站。

好教练网|真实学车价格・就近学车・专业驾培服务

好教练网专注驾培服务18年,提供真实学车价格查询(每季度更新),智能推荐就近训考场,严选本地驾校教练,详尽的学车笔记、学车攻略、问答社区等服务一应俱全,选择你所在城市,获取个性化学车方案。

赏帮赚官网

赏帮赚官方网站,赏帮赚app下载,赏帮赚苹果APP下载,赏帮赚ios版下载,动动手指完成任务获得相应的佣金报酬,每天上万悬赏任务等你来做。网上闲人赚钱的APP软件,在家就能兼职完成任务,轻松帮助商家解决推广难的问题!

广州市金橡实业有限公司

广州金橡实业有限公司,制造和批发雨鞋、雨靴、安全防护鞋、耐油酸碱绝缘鞋、电工矿工鞋、劳保用鞋等用品的公司,拥有自家工厂生产,多个国际时装品牌OEM指定生产厂家,属于业界的龙头企业。

拖拉机厂家

山东正丰机械有限公司位于运河之都,工商业发达的“孔孟之乡”—济宁.公司成立于2014年,是集研发、制造、销售为一体的履带式拖拉机生产专业企业.具有噪音低、振动小、接地压力小、重量轻、牵引力大,对路面破坏力小,山地坡地均可使用等多种特性

55世纪官网

55世纪官网【✅AG6.ORG✅】数字时代,围绕企业数字化转型的关键要素,55世纪数码开创性的提出“数云融合”战略和技术体系框架,着力在云原生、数字原生、AI原生和信创产业上架构产品和服务能力,为处在不同数字化转型阶段的快消零售、汽车、金融、医疗、政企、教育、运营商等行业客户提供泛在的敏捷IT能力和融合的数据驱动能力,构建跨界融合创新的数字业务场景和新业务模式,助力企业级客户建立面向未来的核心能力和竞争优势,全面推动社会的数字化、智能化转型升级。

首页

首页,广东顺祥陶瓷有限公司

星禾网

星禾网为你提供最全的智能软件,办公软件,平面设计,网络编程,电脑基础等有用的知识!

智令互动

智令互动,国内领先的互动视频零代码制作平台,国标互动视频白皮书起草单位。平台根据融媒体、教育、营销等场景提供50余种互动组件,助力伙伴创新和创优,累计服务80000+创作者。

当图网

当图网致力于打造全国专业免费PPT模板下载网站,免费PPT模板、PPT课件模板、大气PPT模板、家长会PPT模板、党建PPT模板、精美PPT模板免费下载。

打桩机钻头

保定金卓阳机械配件有限公司从事打桩机钻头,打桩机锤头,覆膜砂铸件,公司紧邻保衡公路、京珠高速、保沧高速,交通十分便利,是大型铸造企业,拥有自主出口经营权。我公司具备砂型铸造、消失模铸造、覆膜砂铸造、树脂砂铸造、精密铸造、离心铸造、球墨铸铁等工艺

全局底部横幅