可重构架构是AI芯片的新风潮 5款芯片已经面世 (可重构架构是啥意思)

新的方法、新的思维、新的目标一直引领着新的浪潮。2017年的两位图灵奖得主John L. Hennessy 和 David A. Patterson在年初的一篇报告中展望,未来的十年将是计算机体系架构领域的“新的黄金十年”。

AI的发展更加期待新架构的出现,因为,经典的冯诺依曼架构处理器应用于深度学习计算时面临着内存墙挑战(访问存储器的速度无法跟上运算器消耗数据的速度)。粗粒度可重构架构(CGRA,Coarse Grain Reconfigurable Architecture)是AI芯片受关注的一个方向,目前已经有5款采用该技术的芯片推出。

可重构是否是解决AI计算挑战的一个好方向?已经推出的可重构AI芯片有何不同?

5款芯片已经面世,可重构架构是的新风潮?

可重构的概念最早在20世纪60年代被提出。到了80、90年代,可重构芯片技术源头的高层次综合理论和方法诞生。进入新的世纪,2015年国际半导体技术发展路线图(ITRS)认为,粗颗粒度可重构架构(CGRA)是未来最有发展前途的新兴计算架构之一。

2018年,美国DARPA正式启动旨在支撑美国2025-2030年电子技术能力的“电子复兴计划”(ERI),提到研发具有软件和硬件双编程能力,并获得接近专用电路性能的技术。在这里领域,魏少军教授牵头的清华大学可重构芯片课题组在这个计划提出的十年前就开始了研究,课题组现在的成果比ERI设定关键性能的指标更高。

魏少军教授总结认为动态可重构芯片预期的特点和潜在能力区别于传统芯片有7点:

(1)软硬件可编程;

(2)硬件架构的动态可变性及高效的架构变换能力;

(3)兼具高计算效率和高能量效率;

(4)本征安全性;

(5)应用简便性,不需要芯片设计的知识和能力;

(6)软件定义芯片;

(7)实现智能的能力。

可重构芯片的技术的源头高层次综合(High-LevelSynthesis)理论和方法,是一种从行为描述到电路的优化设计方法。也就是先找到数据依赖关系,然后通过运行时间的分割,对运算进行调度来实现计算资源的复用。

5款芯片已经面世,可重构架构是的新风潮?

高层次综合生成的专用集成电路架构

用高层次综合系统的实现过程进行更具体的解释,系统输入用硬件描述语言(HDL)写成的系统行为描述(如VHDL或Verilog),然后根据这些行为描述,通过高层次综合的编译器,生成包含数据和互连网络配置信息的微控制码以及与系统功能相关的有限状态机。

不过,这里所说的“编译器”与传统的计算机的编译器并没有任何关系,只是借用编译器的概念,其核心是一整套高层次综合方法学的内容。

高层次综合系统使设计过程变得非常有序,也被认为是20世纪80、90年代集成电路设计方法学中最好的选择。

5款芯片已经面世,可重构架构是的新风潮?

可重构芯片的基本架构

不过,半导体制程技术的演进也带来了高成本的问题。如果研发一款14nm制程的芯片,综合成本高达1.5-2亿美元,通常要销售3000万颗以上才能把研发成本合理地摊销到每颗芯片上。如果采用目前最先进的7nm制程的芯片,综合成本可能高达3亿甚至更多。芯片的设计和制造成本在增加,但AI对算力的需求也在按月增加。

这时候,复用芯片是个不错的选择。设想一下,相同的芯片,功能可通过软件改变,不同的软件写入就变成了“专用”芯片。这将是非常理想的情况,如果这个想法实现,可以认为软件定义芯片就成为了现实。

但挑战在于,软件可以无限复杂,执行时间可以无穷长,硬件不管多大都有边界。 可重构芯片业面临众多挑战,其中有三个主要的挑战:

计算模式:如何提高阵列利用率?

阵列结构:如何提高计算能效?

算法映射:如何优化映射效率?

可重构技术的优势和挑战都同样显著,采用这个技术,清微智能、耐能、云天励飞、燧原科技、WaveComputing相继推出了AI芯片,他们有何不同?

清微智的核心成员来自清华大学可重构计算研究团队,2019年量产的首颗芯片是TX210,这款语音SoC芯片可以应用于智能手机、可穿戴智能设备、小家电、大家电、玩具、车载等场景。清微的可重构芯片主要分为三个维度,从MAC层面支持不同的位宽重构,到执行单元层面支持不同算子重构,再到阵列层面支持不同功能重构。

用一个更容易理解的类比来解释清微可重构芯片的可重构程度,清微的可重构芯片既可以是“乐高”层级的可重构,也可以是“面粉”层级的可重构。

清微智能CTO欧阳鹏此前接受雷锋网采访时透露,在可重构计算更低能耗和更强灵活性的基础上,他们在具体的芯片设计上又做了两方面深化。

5款芯片已经面世,可重构架构是的新风潮?

清微的AI芯片支持从1bit-16bit的混合精度计算,同时,不同的神经网络层可以采用不同的精度表示,可实现实时切换精度。在具体实现过程中,可重构模式动态重组计算资源和带宽,根据精度表示,让计算资源和带宽接近满负荷进行计算,从而将混合精度网络下的计算资源和带宽的利用率逼近极限,高效支持多种混合精度的神经网络。

另外,清微的AI芯片针对神经网络部分和非神经网络均进行了计算效率考虑。针对非神经网络处理逻辑,从算法数据流图进行空间映射,以接近ASIC效率计算。同时,通过配置形成不同的电路结构来动态处理不同非神经网络计算逻辑,在保证灵活性前提下,计算效率有极大提升。

需要指出,可重构芯片代表的是采用的是数据驱动下的空域执行模式,区别于CPU、GPU、NPU诺依曼架构的时域计算模式,数据流驱动的芯片从架构上就可以避免了冯诺依曼架构的限制。

5款芯片已经面世,可重构架构是的新风潮?

目前,清微智能除了可重构架构的语音芯片,还发布了面向智能家居、智能安防和新零售领域的低功耗图像识别芯片。

云天励飞没有具体解释其芯片中的可重构架构,云天励飞副总裁 芯片产品线负责人李爱军在接受雷锋网采访时表示,云天的实现方式是从PE的维度进行可重构,可以理解为运算单元的可重构,通过工具链实现芯片的灵活性。因此,采用的方式和维度会有所不同(与清微相比),但最终的效果应该是异曲同工。

5款芯片已经面世,可重构架构是的新风潮?

在其今年11月发布的专注边缘和端侧视觉新产品DeepEye1000介绍中提到,采用存算融合体系架构和可重构计算阵列,可以灵活、高效的执行各种深度学习算法模型的推理计算,峰值算力达2.0Tops。

神经网络处理器采用可重构计算阵列,支持灵活可编程计算流,计算效率超过99%,同时采用存算融合体系架构,使得DDR存储访问带宽下降77%,功耗下降60%。

更多的技术细节,需要云天励飞进一步披露。

耐能今年5月在国内发布物联网专用AI SoC——KL520时表示这款新品使用了可重组架构,虽然不是可重构技术,但两者之间同样存在关联。还是用上面的类比来解释,耐能的架构是积木层级的可重组,清微智能的可重构则是面粉层级的可重组,更加底层。

5款芯片已经面世,可重构架构是的新风潮?

耐能CEO刘峻诚解释,可重组架构可以理解为这款芯片提供的是一堆乐高积木,需要支持语音AI的模型时就通过指令集进行组合,需要支持图像AI模型时,再重新组合,可以很好地支持多种神经网络模型,并且保持架构的精简性。

由此能够带来性能和功耗的优势,如果选用更加成熟的工艺制程,降低成本,最终能实现高性能、低成本、低功耗、高兼容性的优势。

至于如何解决AI芯片存储挑战的问题,刘峻诚透露,他们的巧思是实现了动态存储DMA(Dynamic Memory Assessment),当处理器对存储没有很高的需求时,就预先准备好,当需要使用的时候就直接读取,实现效率的提升。

另外,可重组架构还能动态支持同一个神经网络的不同数据精度需求。最终产品可以根据客户的需求,支持Int8、FP16或更高的精度。压缩率也能够控制在0.5%以内则是来源于耐能独特的开放平台,通过这个开放平台能够将压缩率提升40甚至50倍,压缩率损失则小于0.5%,这是软件或者说软硬一体优势的体现。

据悉,耐能的可重组架构研究已经在国际知名的半导体期刊上发布,并且在美国、台湾都拿到了专利。

除了将可重构的理念和技术应用于边缘端,同样是国内初创公司的燧原科技在其云端训练AI芯片中也用到了可重构。

燧原科技的首款芯片邃思DTU基于可重构芯片的设计理念,其计算核心包含32个通用可扩展神经元处理器(SIP),每8个SIP组合成1个可扩展智能计算群(SIC)。SIC之间通过HBM实现高速互联,通过片上调度算法,数据在搬迁中完成计算,实现SIP利用率最大化。

5款芯片已经面世,可重构架构是的新风潮?

如何理解DTU中的可重构芯片设计理念?燧原科技创始人兼 COO 张亚林告诉雷锋网,“端上的可重构更多是低功耗以及可以轻易移植应用。云端的可重构主要的是把整个数学计算变成一种可编程的指令集和可控的流水线,让数学计算的模型可以重构,这样可以保证芯片的通用性,也能够适应快速迭代的AI算法。”

更进一步的细节目前也暂不清楚。

国内采用可重构技术的AI芯片不少,国外初创公司Wave Computing的AI芯片也采用该技术。其基于数据流驱动DataFlow技术的DPU采用非冯诺依曼架构的软件可动态重构处理器CGRA技术,能在最合理分配和使用算力的同时,成倍节约了数据存储和传输带宽。官方表示,这一方案基本上能将芯片算力资源的利用效率保证在75%-80%以上。

5款芯片已经面世,可重构架构是的新风潮?

具体而言,DPU对一个完整的神经网络计算流程,每个计算节点,可以先分配好合理的资源,使得整个计算流程达到资源有效地使用。处理完第一个任务节点,它会将数据直接传输到第二个任务节点的输入端,第二个任务处理完数据后,又会将任务送到第三个任务节点的输入端,就像流水线,最大程度减少数据存储和传输。

同时, target="_self">Live回顾|清微智能科技CTO:可重构计算芯片的技术原理及实现难点

首发 | 全新类别AI芯片量产,清微的可重构芯片将成市场主流?

原创文章,未经授权禁止转载。详情见 转载须知 。

全局中部横幅
CCTV节目官网

CCTV节目官网是中央电视台电视节目官方呈现平台,提供央视24个频道的直播、点播、节目预告等服务,集纳央视所有栏目、电影、电视剧、纪录片、动画片、体育赛事、特别节目资源,提供节目搜索、检索、订阅、点赞、分享、收藏等多种功能,用户覆盖210多个国家和地区,是网民了解央视、收看央视、参与央视的最佳渠道。

站长API数据接口

站长之家免费向开发者提供seo信息查询的相关API数据接口。包括搜索引擎权重查询,网站收录信息,关键词排名,关键词相关信息,前50名网站相关信息,域名备案,域名whois查询,IP查询,seo信息查询等API数据接口。

山东网站建设

东营云商网络科技有限公司Since2011年,10年来目前主要核心服务领域有:高端网站建设,App定制开发,微信小程序开发等互联网技术支持和服务。

气弹簧

气弹簧-支撑气弹簧-可锁定气弹簧-不锈钢气弹簧-气弹簧厂家

NBE攻略

NBE游戏攻略网、一个关注游戏工作室的资讯门户,致力于手游职业评测、玩游戏赚钱及网游项目挖掘的观察平台,游戏搬砖爱好者必看网站。

苏州金属材料

苏州市金来达科技有限公司成立于2001年,是一家集研发、生产和销售机加工工程塑料和特种工程塑料的公司,并拥有国内外多个知名品牌的产品代理权。公司为中外客户提供稀缺、优质的各种配套材料,是长三角规模较大的绝缘材料及工程塑料的供应商之一。我们的目标是:引领长三角,覆盖全中国

纺丝阻燃剂

广州喜嘉新材料有限公司是一家专注特种有机磷阻燃剂/阻燃母粒研发及生产的企业,我们不仅提供有机磷阻燃化学品,同时提供无卤环保阻燃解决方案,帮顾客定制特种阻燃母粒,一直探求效率,高分散及可持续发展方法来应用阻燃化学品。

珠海其美光电科技有限公司

位于珠海市南屏科技园区内,拥有大面积厂房、的生产设备、的办公环境。是一家专业从事LED照明产品研发、生产、销售、安装、售后于一体的高新科技企业,是香港其美集团旗下全资子公司。

冷拉型材

无锡长源冷拉型钢有限公司专业从事生产各类冷拉型材,包括:冷拉型钢/方钢/圆钢/六角钢/异型钢/扁钢/槽钢/H型钢等冷拉钢材,主要规格在4-70mm之间,产品规格多样、应用广泛,热烈欢迎各位新老客户来电咨询,期待您的来电!

教程攻略一网打尽

0254攻略网是网络游戏门户站,全年365天保持不间断更新,您可以在这里找到各大热门游戏相关攻略,游戏攻略一网打尽!

天津道路划线

天津远达交通设施有限公司是一家从事道路、停车场(库)、物流厂区、市民小区、交通安全设施产品设计、生产、施工、维护一体化综合性公司。公司主要承接工厂停车场、厂区道路划线、学校停车场、学校道路划线、停车场、道路划线、生活小区停车场、生活小区道路划线、商业区停车场、商业区道路划线等各种交通施工工程。为京津翼建设“添砖加瓦”

全局底部横幅