谷歌自研芯片替代上千万颗英特尔CPU (谷歌自研芯片TensorG4)

文章编号:44078 资讯动态 2024-12-09 谷歌vcu 至强cpu

雷锋网按,伴随着新兴应用的兴起以及数字化程度越来越高,已有的成熟处理器在性能、效率以及成本上的优势相较自研芯片的优势越来越小,因此借助成熟的第三方IP以及EDA工具和代工厂,科技巨头们纷纷开始自研芯片,其中最有代表性的就是谷歌TPU,除此之外,谷歌Argos VCU也值得关注。

谷歌自研芯片替代上千万颗英特尔CPU

谷歌设计了自己的新处理器Argos 视频(转)编码单元(VCU),其目的只有一个:处理视频。高效的新芯片使这家技术巨头能够用自己的芯片替换数千万颗英特尔 CPU。

多年来,英特尔内置于其CPU中的视频编解码引擎一直主导着市场,因为它们提供了领先的性能和功能,并且易于使用。但是定制的专用集成电路 (ASIC) 的性能往往优于通用硬件,因为它们仅针对一种工作负载而设计。因此,谷歌转而为YouTube的视频处理任务开发自己的专用硬件,并取得了很好的效果。

不过,英特尔可能会利用其最新技术来赢回谷歌的专业视频处理业务。

数据显示,用户每分钟向YouTube上传超过500小时的各种格式的视频内容。Google需要将该内容快速转码为多种分辨率(包括144p、240p、360p、480p、720p、1080p、1440p、2160p和4320p)和数据高效格式(例如,H.264、VP9 或 AV1),这需要强大的编码能力。

过去,谷歌有两种转码/编码内容的选择。第一个选项是英特尔的视觉计算加速器(VCA),它包含三个Xeon E3 CPU,内置Iris Pro P6300/P580 GT4e集成图形内核和先进的硬件编码器。第二种选择是使用软件编码和通用英特尔至强处理器。

谷歌认为,对于YouTube的工作负载来说,这两种选择都不够节能。视觉计算加速本身就相当耗电,而至强CPU的数量本质上要增加服务器的数量,这意味着额外的功率和数据中心占用空间。因此,谷歌决定采用自研的定制硬件。

谷歌的第一代 Argos VCU 并没有完全取代英特尔的CPU,因为服务器仍然需要运行操作系统并管理存储驱动器和网络连接。在很大程度上,谷歌的Argos VCU就像一个总是需要一个CPU的GPU。

谷歌自研芯片替代上千万颗英特尔CPU

谷歌的VCU与GPU中的流处理器不同,它集成了10个H.264/VP9编码器引擎、几个解码器内核、4个LPDDR4-3200内存通道(具有 4x32 位接口)、1个PCIe接口、1个DMA引擎和1个用于调度目的的小型通用内核。

VCU除了自研的编码器/转码器外,大多数IP都从第三方获得许可,以降低开发成本。每个 VCU还配备了8GB的可用ECC LPDDR4内存。

实际上,谷歌研发VCU的理念是将尽可能多的高性能编码器/转码器放入单个硅片中(同时保持节能),然后将VCU的数量与所需的服务器数量分别扩展。谷歌在一块板上放置两个 VCU,然后在每个双插槽英特尔至强服务器上安装10个卡,大大提高了每个机架的解码/转码性能。

谷歌表示,与英特尔Skylake驱动的服务器系统相比,其基于VCU的设备在性能、TCO(总体拥有成本)、计算效率方面实现了7倍(H.264)和高达33倍(VP9)的提升。这样的提升带来的成本优势(VCU与英特尔的 CPU 相比),使得 VCU 成为视频巨头YouTube的更好选择。

谷歌自研芯片替代上千万颗英特尔CPU

CPU、GPU 和配备 VCU 的系统离线双通道单输出 (SOT) 吞吐量

从谷歌分享的性能数据看,很明显单个Argos VCU仅比H.264 中的2路Skylake 服务器CPU快。但是,由于可以在单个服务器中安装20个VCU,从效率的角度来看,VCU胜出。但对于要求更高的VP9编解码器,谷歌的VCU似乎比英特尔的双路至强快五倍,有令人印象深刻的效率优势。

自从谷歌拥有Argos VCU,它用自己芯片取代了许多基于至强的YouTube服务器。很难估计谷歌实际更换了多少至强系统,但一些分析师认为,这家科技巨头本可以将3300-4000万个英特尔cpu换成自己的 VCU,即使第二个数字被高估了,单位仍然是数百万个。

由于谷歌的其他服务需要大量处理器,因此该公司从AMD或英特尔购买的CPU数量可能仍然非常高,并且不会很快减少,因为谷歌自己的数据中心级芯片的使用需要数年时间。

还值得注意的是,目前谷歌为了尝试使用创新的编码技术(例如,AV1),YouTube 需要使用通用CPU,因为Argos不支持新编码技术的编解码。此外,随着更高效的编解码器的出现,这些编解码器对计算能力的要求往往更高,谷歌将不得不继续使用 CPU 进行部署。

但具有讽刺意味的是,专用硬件的优势在未来只会越来越大。谷歌已经在开发支持AV1、H.264 和VP9编解码器的第二代VCU,因为它需要进一步提高其编码技术的效率。目前尚不清楚谷歌何时会部署新的VCU,但很明显该公司希望尽可能使用自己的处理器而不是通用处理器。

不过,英特尔并没有停滞不前。该公司基于DG1 Xe-LP的四芯片SG1服务器卡可以解码多达28路4Kp60流以及同时转码多达12路。本质上讲,英特尔的SG1与谷歌的Argos VCU 所做的工作完全一样:将视频解码和转码性能与服务器数量分开,从而减少用于视频应用的数据中心所需的通用处理器数量。

凭借即将推出的Xe-HP GPU,英特尔将同时提供10个高质量4Kp60流的转码。请记住,某些Xe-HP GPU将扩展到四个区块,并且每个系统可以安装一个以上的GPU,英特尔在领先的媒体解码和编码能力市场只会变得更加稳固。

Google 已成功构建了出色的H.264和支持VP9的视频(转)编码单元 (VCU),与英特尔现有的CPU相比,它可以在视频编码/转码工作负载方面提供显着更高的效率。此外,VCU 使 谷歌能够独立于服务器数量扩展其视频编码/转码性能。

然而,英特尔已经拥有Xe-LP GPU和SG1卡,它们也提供了一些重要的视频解码和编码功能,因此英特尔仍将在具有繁重视频流工作负载的数据中心取得成功。此外,随着英特尔 Xe-HP GPU的出现,该公司有望巩固其在该市场的地位。

原创文章,未经授权禁止转载。详情见 转载须知 。


本文地址: https://www.gpxz.com/article/dbdd4e25ecab6823937d.html
全局中部横幅
全局中部横幅
轻抖短视频创作工具

轻抖正版官网-百万达人在用的短视频工具:支持各大主流平台批量提取视频、数据查询、直播切片、提取话术,AI视频混剪、文生视频、图生视频、文案生成、全网高清素材一键搜索等

“居然要贴钱上班”!银行人吐槽自掏腰包“买存款”

“我绝对想不到,有一天我居然要贴钱上班。”在北京市某股份制银行工作一年多的刘博(化名)是一名客户经理,他的日常是向客户推销理财产品、基金、保险产品,并接受银行严格的考核制度。

365网(365音乐网)

高品质音乐Mp3下载试听网站,提供最新最好听的流行歌曲、网络歌曲,以及权威、全面的歌曲排行榜。

如皋市苏中玻璃瓶有限责任公司,主营西林瓶(模制,管制),输液瓶,各式广口瓶,易折曲颈瓿瓶,玻璃工艺品,实验室玻璃仪器,各式口服液瓶,各式蜂蜜瓶,各式螺旋口瓶,药用玻璃瓶等,还有各种型号的胶塞,瓶盖(金属,塑料),塑料瓶等.

西林瓶(模制,管制),输液瓶,各式广口瓶,易折曲颈瓿瓶,玻璃工艺品,实验室玻璃仪器,各式口服液瓶,各式蜂蜜瓶,各式螺旋口瓶,药用玻璃瓶等,还有各种型号的胶塞,瓶盖(金属,塑料),塑料瓶等.

视频会议

国华嘉信(010-81975899)为您提供POLYCOM视频会议硬件和服务、CISCO网络视频会议,华为高清视频会议系统、宝利通视频会议解决方案,HUAWEI视会议系统,思科视会议系统,包括多媒体会议室方案设计、工程实施和调测、会议租赁服务等。

宁波江北博盛刀具有限公司

我公司是一家专业从事生产美工刀刀片,实用刀刀片,单面刀片,异型刀片,雕刻刀片,打浆机刀片,切菜器刀片,苹果切刀片,多款美工刀,塑料制品以及各类冲件的制造企业。本工司已有十多年的刀片制造经验,雄厚的技术力量

音律星球

音律星球融入多元化玩法,一款旨在打造组队开黑、线上K歌、玩伴扩列、扩列交友、主播点唱、剧场PIA戏的语音社交软件。多人实时在线聊天,让多人聚会开始吧。

昂捷信息

昂捷信息,以软件开发为核心,聚焦于零售行业数字化赋能,为超市、便利店、百货、购物中心、专营专卖等各零售业态提供全面的数字化解决方案和咨询服务,是业界领先的全链路数字化解决方案服务商。

苗木网上贸易平台

我爱网是提供专业的花木市场前沿资讯,绿化苗木价格行情,花木技术文摘,花木企业动态,花木品种手册,花木展会,苗木采购,苗木供应,花木人物访谈等,是中国农业百强网站,园艺林业类十强网站,为各大企业提供网上贸易机会。

登录

阿里游戏SSP服务品平台专注于游戏垂直领域的广告变现,为各位站长和APP开发者提供专业的流量变现功能,广告投放效果数据,同时还支持SDK和JS两种对接方式,全方位帮助您优化广告投放效果。

音响

音响代理,音响设备实力厂家认准广东长新电子科技有限公司。旗下品牌均镁音响是一家集研发、制造、销售“音响、卡拉OK音响系统、公共广播系统、家庭影院”于一体的综合型音响企业。

首页

寿光市彤泰防水材料有限公司,创建于2003年,是一个集防水材料研制、开发、生产销售、设计施工于一体的专业化新型防水材料生产企业。


全局底部横幅