单个Pod性能是世界第一超算的两倍 里程碑式Google TPU v4重磅发布! (pod单是什么意思)

文章编号:44828 资讯动态 2024-12-09 TPU google

Google I/O开发者大会去年因为疫情而取消,今年采取线上形式强势回归。在没有开发者在场的Google园区内,Google CEO桑达尔·皮查伊(Sundar Pichai)宣布推出多项全新技术,除了能够帮助用户实现“空间瞬移”的全息视频聊天技术Project Starling让人耳目一新,还有最新一代AI芯片TPU v4。

“这是我们在Google上部署的最快的系统,对我们来说是一个具有历史意义的里程碑。”皮查伊这样介绍到。

里程碑式Google TPU v4重磅发布! 单个Pod性能是世界超算的两倍

最强TPU,速度提升2倍,性能提升10倍

Google官方介绍,在相同的64芯片规模下,不考虑软件带来的改善,TPU v4相较于上一代TPU v3性能平均提升2.7倍。

在实际应用中,TPU v4主要与Pod相连发挥作用,每一个TPU v4 Pod中有4096个TPU v4单芯片,得益于其独特的互连技术,能够将数百个独立的处理器转变为一个系统,互连带宽在规模上是其他任何网络技术的10倍,每一个TPU v4 Pod就能达到1 exaFlOP级的算力,实现每秒10的18次方浮点运算。这甚至是全球最快的超级计算机“富岳”的两倍性能。

“如果现在有1千万人同时使用笔记本电脑,所有这些计算机累加的计算能力,刚好就能够达到1 exaFLOP的算力。而之前要达到1 exaFLOP,可能需要专门定制一个超级计算机。”皮查伊如是说。

今年的MLPerf结果表明,GoogleTPU v4的实力不容小觑,在使用ImageNet数据集的图像分类训练测试(准确度至少75.90%),256 个TPU v4在1.82分钟内完成了这一任务,这几乎与768个NVIDIA A100图形卡、192个AMD EPYC 7742内核(1.06分钟)、512个华为AI优化的Ascend910芯片以及128个Intel Xeon Platinum 8168内核(1.56分钟)组合在一起的速度一样快。

当负责在大型维基百科语料库上训练基于Transform的阅读理解BERT模型时,TPU v4的得分也很高。使用256个TPU v4进行训练需要1.82分钟,比使用4096 TPU v3进行训练所需的0.39分钟要慢1分多钟。同时,如果想要使用Nvidia的硬件达到0.81分钟的训练时间,需要2048张A100卡和512个AMD Epyc 7742 CPU内核。

Google同样在I/O大会上展示了能够用到TPU v4的具体AI实例,包括能够同时处理网页、图像等多种数据的MUM模型(Multitask Unified Model,多任务统一模型)和专为对话打造的LaMDA都是能够用到TPU v4的场景模型,前者比阅读理解模型BERT强1000倍,适合赋能搜索引擎帮助用户更加高效地得到自己想要的信息,后者则可以与人类进行不间断的对话交流。

这一并不向外出售的TPU,很快将在被部署在Google的数据中心,且90%左右的TPU v4 Pod都将使用绿的能源。 另外,Google也表示,将在今年晚些时候开放给Google Cloud的客户。

Google最早于2016年宣布首款内部定制的AI芯片,区别于训练和部署AI模型的最常见的组合架构,即CPU和GPU组合,第一代TPU在那场世界著名的人机围棋大战助力AlphaGo打败李世石“一战成名”,宣告并不是只有GPU才能做训练和推理。

Google第一代TPU采用28nm工艺制程,功耗大约40w,仅适用于深度学习推理,除了AlphaGo,也用在Google搜索、翻译等机器学习模型中。

2017年5月,Google发布了能够实现机器学习模型训练和推理的TPU v2,达到180TFLOPs浮点运算能力,同时内存带宽也得以提升,比同期推出的CPU AI工作负载提升30倍,比GPU AI工作负载提升15倍,被基于4块TPU v2的AlphaGo击败的世界围棋冠军柯洁最直观地感受了这一切。

2018年5月,Google又发布第三代TPU,性能是上一代TPU的两倍,实现420TFLOPs浮点运算,以及128GB的高带宽内存。

按照一年一次迭代更新的节奏,Google理应在2019年推出第四代TPU,不过这一年的I/O大会上,Google推出的是第二代和第三代TPU Pod,可以配置超过1000颗TPU,大大缩短了在进行复杂的模型训练时所需耗费的时间。

在AI芯片发展史上,无论是从片上内存上,还是从可编程能力来看,Google TPU都是不可多得的技术创新,打破GPU的“垄断”地位,且打开云端AI芯片的新竞争格局。

发展五年的Google TPU在今天依然保持着强劲的竞争力,未来的世界是什么样的?Google TPU已经告诉了我们一小部分答案。

要用硅光单芯片替代3000块TPU的AI初创公司吸引了比尔盖茨的投资

Google 祸不单行

原创文章,未经授权禁止转载。详情见 转载须知 。


本文地址: https://www.gpxz.com/article/73a0da9bb91babf15017.html
全局中部横幅
全局中部横幅
域名管家

RealWhois查询,真正的Whois查询、域名查询工具。互联网爱好者都在用的工具。RealWhois提供一个平台,域名收藏者可以在这里发布域名,供域名购买者进行查询。弥补新规范下WHOIS查询的缺失。域名管家是域名爱好者、域名持有者管理域名的工具。注册前批量查询域名状态,域名查询后持续跟踪,分组管理。注册后已注册域名管理,到期提醒。

RFID设备厂家

上海营信是专业的RFID设备场景化解决方案研发生产商,主营高频HF/超高频UHF读写器(电子标签阅读器)、根据客户场景定制天线、工业级手持机、RFID智能设备及电子标签,可定制适配不同场景需求的RFID设备。产品覆盖智能制造、图书管理、餐饮结算智盘、档案管理、智能工具、医疗耗材、化工试剂等领域应用,高效助力企业智能化升级。

古诗词大全

今昔古文网收集了中国古代诗人的原文译文及古诗词鉴赏,包括唐诗三百首全集、宋词三百首、古诗三百首、清明古诗、古诗名句等古诗词大全。

事务树中小企业科创服务平台

事务树(www.oksws.com)是国内专业的一站式科技创新服务平台,为不同阶段的企业提供工商财税、知识服务、资质办理、创业咨询、法务咨询等全方位服务,致力于为企业用户提供《便捷、全面、创新》的创业解决方案。

升旺来蘑菇菌类网

菌类,一大类不含叶绿素、不能进行光合作用的异养生物。没有根、茎、叶的分化,不含叶绿素等光合色素(极少数光合细菌除外),不能进行光合作用,腐生生活或寄生生活,即异养生活。

千订网

千订网,您的全能生活助手,为您打造一站式娱乐休闲预订平台。选择千订网,让生活每一刻都充满惊喜与精彩!

镜面辊

青岛长丰制辊有限公司专业制造和修复各类镜面辊、压花辊、木纹压花机、雕花辊、网纹辊、磨砂辊、雾面辊、淋膜辊、皮纹辊、镀铬辊、冷却辊、模温机等。公司拥有先进的生产工艺,雄厚的技术力量,科学的检测手段,并引进国外先进的设备和材料,镜面辊粗糙度可达Ra0.01,同心度不大于0.01mm。

中国家居新闻网

中国家居新闻网为您提供关于设计案例,设计攻略以及装修攻略,家居风水,品牌资讯,卫浴,瓷砖,地板,油漆涂料,采暖,家具,家电,厨房等相关内容。

优文解说

优文影视解说网专注于分享影视电视剧动漫解说文案、影视电视剧动漫文案解说词,为广大影视剪辑爱好者提供丰富的影视剪辑文案影视剪辑素材,以及分享影视剪辑的技巧和教程,为您的剪辑工作保驾护航。

财华仁和会计网校

财华仁和会计网校是会计实操考证培训学习互联网实战平台,提供会计培训,税务培训,零基础培训,会计实操培训,会计岗位培训,初级职称中级职称培训,注册会计师培训,税务师培训,雄厚的师资力量,丰富的实战教学是会计职业培训领域的知名品牌


全局底部横幅