Diffusion终端侧展示 全球首个运行在Android手机上的Stable (diffuse)

文章编号:40181 资讯动态 2024-12-03 高通AI Research Stable 高通 AI Diffusion

作者:高通技术公司工程技术副总裁侯纪磊,高通技术公司产品管理高级副总裁Ziad Asghar

全球首个运行在手机上的Stable Diffusion终端侧展示 上图为Stable Diffusion利用文本提示:“穿盔甲超级可爱的毛绒绒猫战士、逼真、4K、超细节、V-Ray渲染、虚幻引擎” 生成的图像

基础模型正在席卷AI行业。基础模型指基于海量数据进行大规模训练的大型神经网络,进而能以高性能表现适应广泛的后续任务。流行的基础模型Stable Diffusion是一个非常出色的从文本到图像的生成式AI模型,能够基于任何文本输入,在数十秒内创作出逼真图像。Stable Diffusion的参数超过10亿,迄今为止主要限于在云端运行。接下来我将介绍高通AI Research如何利用高通AI软件栈(Qualcomm AI Stack)执行全栈AI优化,首次在android智能手机上部署Stable Diffusion。

全球首个运行在手机上的Stable Diffusion终端侧展示 通过全栈AI优化,完全在终端侧高效运行Stable Diffusion

高通AI软件栈支持的全栈AI优化

在“AI首创”博客文章中,我们提到过高通AI Research不仅在开展全新AI研究工作,也率先在商用终端上展示概念验证,为在现实世界中的技术规模化应用铺平道路。我们的全栈AI研究指跨应用、神经网络模型、算法、软件和硬件进行优化,并在公司内进行跨部门合作。针对Stable Diffusion,我们从Hugging Face的FP32 1-5版本开源模型入手,通过量化、编译和硬件加速进行优化,使其能在搭载第二代骁龙8移动平台的手机上运行。

为了把模型从FP32压缩为INT8,我们使用了高通AI模型增效工具包(AIMET)的训练后量化。这是基于高通AI Research创造的技术所开发的工具,目前已经集成入新发布的Qualcomm AI Studio中。通过让模型在我们的专用AI硬件上高效运行,并降低内存带宽消耗,量化不仅能够提高性能,还可以降低功耗。自适应舍入(AdaRound)等先进的高通AIMET量化技术能够在更低精度水平保持模型准确性,无需进行重新训练。这些技术能够应用于构成Stable Diffusion的所有组件模型,即基于Transformer的文本编码器、VAE解码器和UNet。这对于让模型适合于在终端上运行至关重要。

全球首个运行在手机上的Stable Diffusion终端侧展示

高通AI软件栈将最优秀的AI软件产品集合到一个软件包中,帮助OEM厂商和开发者在我们的产品上创建、优化和部署他们的AI应用,充分利用高通AI引擎的性能。

对于编译,我们利用高通AI引擎Direct框架将神经网络映射到能够在目标硬件上高效运行的程序中。高通AI引擎Direct框架基于高通Hexagon处理器的硬件架构和内存层级进行序列运算,从而提升性能并最小化内存溢出。部分上述增强特性是AI优化研究人员与编译器工程团队共同合作的成果,以此来提升AI推理时的内存管理。高通AI引擎中所做的整体优化能够显著降低runTime的时延和功耗,而这一亟需的趋势也同样存在于Stable Diffusion上。

凭借紧密的软硬件协同设计,集成Hexagon处理器的高通AI引擎能够释放行业领先的边缘侧AI性能。支持微切片推理的最新第二代骁龙8移动平台有能力高效运行像Stable Diffusion这样的大模型,并且下一代骁龙预计还将带来更多提升。此外,由于构成Stable Diffusion的所有组件模型都采用了多头注意力机制,为加速推理而面向transformer模型(如MobileBERT)所做的技术增强发挥了关键作用。

这一全栈优化最终让Stable Diffusion能够在智能手机上运行,在15秒内执行20步推理,生成一张512x512像素的图像。这是在智能手机上最快的推理速度,能媲美云端时延,且用户文本输入完全不受限制。

全球首个运行在手机上的Stable Diffusion终端侧展示

Qualcomm AI Studio 将我们目前的所有工具整合到一个全新的GUI中,同时还有可视化工具,以简化开发者的使用体验全球首个运行在手机上的Stable Diffusion终端侧展示 上图为Stable Diffusion利用文本提示:“野外河谷和山脉间的日式花园,高细节,数字插图,ArtStation,概念艺术,磨砂,锐聚焦,插图,戏剧性的,落日,炉石,artgerm、greg rutkowski和lphonse mucha的艺术作品”生成的图像

边缘侧AI的时代已经到来

随着AI云端大模型开始转向在边缘终端上运行,高通打造智能网联边缘的愿景正在我们眼前加速实现,几年前还被认为不可能的事情正在成为可能。这很有吸引力,因为通过边缘AI进行终端侧处理具有诸多优势,包括可靠性、时延、隐私、网络带宽使用效率和整体成本。

尽管Stable Diffusion模型看起来过于庞大,但它编码了大量语言和视觉相关知识,几乎可以生成任何能想象到的图片。此外,作为一款基础模型,Stable Diffusion能做的远不止根据文字提示生成图像。基于Stable Diffusion的应用正在不断增加,例如图像编辑、图像修复、风格转换和超分辨率等,将带来切实的影响。能够完全在终端上运行模型而无需连接互联网,将带来无限的可能性。

扩展边缘侧AI

在智能手机上运行Stable Diffusion只是开始。让这一目标得以实现的所有全栈研究和优化都将融入高通AI软件栈。凭借高通的统一技术路线图,我们能够利用单一AI软件栈并进行扩展,以适用于不同的终端和不同的模型。

这意味着为了让Stable Diffusion在手机上高效运行所做的优化也可用于高通技术公司赋能的其他平台,比如笔记本电脑、XR头显和几乎任何其它终端。在云端运行所有AI处理工作成本高昂,因此高效的边缘侧AI处理非常重要。由于输入文本和生成图像始终无需离开终端,边缘侧AI处理能在运行Stable Diffusion(和其它生成式AI模型)时确保用户隐私,这对于使用消费级和企业级应用都有巨大的好处。全新AI软件栈优化还将有助于减少未来在边缘侧运行的下一代基础模型产品的上市时间。这就是我们如何能够实现跨终端和基础模型进行扩展,让边缘侧AI真正无处不在。

在高通,我们在基础研究领域实现突破,并跨终端和行业进行扩展,以赋能智能网联边缘。高通AI Research与公司所有团队通力合作,将最新AI发展成果和技术集成到我们的产品之中,让实验室研究所实现的AI进步能够更快交付,丰富人们的生活。

版权文章,未经授权禁止转载。详情见 转载须知 。


本文地址: https://www.gpxz.com/article/a04c6769c499bcfaf5fb.html
全局中部横幅
全局中部横幅
UPS电源

北京中科瑞祺科技有限公司,咨询热线:400-8078-771,,专注于UPS电源、EPS电源、免维护蓄电池、稳压电源、机房精密空调、直流屏等电力产品销售和售后服务的电源服务商。

北京保安公司

北京保安公司,北京七兵堂保安服务公司是北京市公安局批准正规资质高端安保服务保安服务公司,军事化管理,安保业务面向北京市及全国各省市,提供北京保安,北京保安公司,北京安保服务,北京保安服务公司,北京七兵堂保安服务有限公司是七兵堂国际安保集团公司旗下全资保安公司,期待您的合作!

不锈钢截止阀

温州市龙湾永兴鑫荣达阀门厂是一家专业生产球阀,闸阀,截止阀的阀门供应商。以质量求生存,以科技为发展。联系电话:0577-887677890577-88757879销售热线:15958706338

长沙鼻炎中医治疗

湘潭市雨湖区庞氏中医诊所专业治疗各类鼻炎、过敏性鼻炎、鼻窦炎、急慢性咽喉炎、声带小结、食道炎、小孩腺样体肥大、扁桃体肿大、甲亢病、甲减病和甲状腺结节等疾病。长沙湘潭均有门诊,患者遍布全国各地,电话:13647323067。

焦作市亚东制动器有限公司

焦作市亚东制动器有限公司是集制动器及相关产品的研制、开发、生产与销售为主。历史悠久,主要使用于起重、冶金、矿山、港口、建筑、电力等多个行业。

湖南跨线桥航天科技有限公司

湖南跨线桥航天科技有限公司是一家集设计、研发、生产、销售为一体的高新技术企业,经过多年积累,在卫星导航信号模拟、高动态高精度卫星导航产品测试、阵列抗干扰产品测试、高动态定位等方面具备核心技术优势。

酷站DNS

酷站DNS,租二级域名专业提供企业域名出租服务多年,可以绑定阿里云,可以绑定腾讯云,以及其它对接入没有苛刻要求的主机服务商,是阿里云和腾讯云接入的企业域名,已成功为上万用户提供子域名租用服务,是国内最好的域名出租服务网站。

全自动端子机

东莞市厚街慧鸿精密机械厂建于2001年,是专业生产线束末端加工设备制造企业。主要产品有全自动电脑裁线剥皮扭线机、全自动端子压着机、全自动沾锡机、新能源加工以及各式模具等系列设备。

多若特阀门,博尔梅特阀门

多若特阀门(江阴)有限公司是一家国外合资企业集研发、设计、开发制造为一体的企业。拥有多若特阀门,以色列阀门,博尔梅特阀门等多规格多种类产品。拥有多处生产基地,引进先进的制造工艺和管理体系,通过国家ISO9001质量体系认证和ISO14001环境管理体系认证。

专业防爆设备

广东英鹏环境设备有限公司自主研发防爆型产品,其中包括防爆空调,防爆冷水机,防爆暖风机,防爆机柜空调,防爆防潮柜,防爆直膨式空调,防爆一体式屋顶空调,防爆除湿机等防爆电器生产,专业定制技术方案,可免费咨询,专业生产厂家-广东英鹏环境设备有限公司

深圳市富翔鑫胶业有限公司

深圳市富翔鑫胶业有限公司即现在的深圳市富翔鑫电子材料有限公司为同一家公司,是一家专业从事电子工业胶粘剂,室温RTV硅橡胶研发、生产、销售一体的高新技术企业;公司自2006年成立以来依托精湛的专业技术、高品质的产品和完善的服务系统回报客户;帮助客户解决生产制造、工业装配各种粘接固定、密封、绝缘、防水、防潮、抗震、散热、保护等问题,公司产品主要有RTV硅橡胶、导热硅脂、电子固定胶,UL黄胶、UL热熔胶条、厌氧胶、螺丝固定剂、UV胶、三防漆等产品;广泛用于电子电器,电源、安防、LED光电、仪器仪表、工艺品、机械设备,灯具、光伏等制造生产领域。公司多年以來,秉持诚恳、务实、创新的经营理念、兢兢业业。提供全系列高品質之接著剂.以应各界需求,进一步服务社会,携手共进发展.我们持“以質為本,以诚为上”的理念;以“信誉第一,用户至上”作为我们的服务宗旨;合理的价格,完善的售后服务立足于市場。產品质量穩定,信譽度好。欢迎新老客戶来电咨询!公司与多家工厂及和代理商建立了长期稳定的合作关系。公司产品价格合理,实力雄厚,重信用、守合同、保证产品质量,以多品种经营特色和薄利多销的原则,赢得了广大客户的信任。


全局底部横幅