ICCV 2021放榜！发现一篇宝藏论文 (iccv2024截稿日期)

文章编号：45765 资讯动态 2024-12-09 2021 ICCV

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

经过漫长的等待，ICCV 2021终于迎来放榜时刻！

最终1617篇论文被接收，接收率为25.9% ，相比于2017年（约29%），保持了和2019年相当的较低水平。

而投稿量则依旧逐年大幅增长，从2017年的2143篇，到2109年的4328篇，再到如今的6236篇，相比上一届多了50%左右。

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

你看邮件的时候是这表情吗？

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

官方皮起来也是接地气、真扎心、没谁了哈哈~

也就在今天，AI科技评论发现了一项非常厉害的研究，号称

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

近来，Vision Transformer (ViT) 模型在诸多视觉任务中展现出了强大的表达能力和潜力。

纽约州立大学石溪分校与微软亚洲研究院的研究人员提出了一种新的 网络结构搜索方法AutoFormer ，用来自动探索最优的ViT模型结构。

AutoFormer能一次性训练大量的不同结构的ViT模型，并使得它们的性能达到收敛。

其搜索出来的结构对比手工设计的ViT模型有较明显的性能提升。

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

最近的研究发现，ViT能够从图像中学习强大的视觉表示，并已经在多个视觉任务（分类，检测，分割等）上展现出了不俗的能力。

Vision Transformer 模型的结构设计仍然比较困难。例如，如何选择最佳的网络深度、宽度和多头注意力中的头部数量？

作者的实验发现这些因素都和模型的最终性能息息相关。然而，由于搜索空间非常庞大，我们很难人为地找到它们的最佳组合。

图1: 不同搜索维度的变化会极大地影响模型的表现能力

本文的作者提出了一种专门针对Vision Transformer 结构的新的Neural Architecture Search (NAS) 方法 AutoFormer。AutoFormer大幅节省了人为设计结构的成本，并能够自动地快速搜索不同计算限制条件下ViT模型各个维度的最佳组合，这使得不同部署场景下的模型设计变得更加简单。

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

图2: AutoFormer的结构示意图，在每一个训练迭代中，超网会动态变化并更新相应的部分权重

常见的One-shot NAS 方法[1, 2, 3]通常采取权重共享的方式来节省计算开销，搜索空间被编码进一个权重共享的超网 (supernet) 中，并运用超网权重作为搜索空间中结构权重的一个估计。其具体搜索过程可分为两个步骤，第一步是更新超网的权重

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

第二步是利用训练好的超网权重来对搜索空间中结构进行搜索。

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

在实验的过程中，作者发现经典One-shot NAS方法的权重共享方式很难被有效地运用到Vision Transformer的结构搜索中。这是因为之前的方法通常仅仅共享结构之间的权重，而解耦同一层中不同算子的权重。

如图3所示，在Vision Transformer的搜索空间中，这种经典的策略会遇到收敛缓慢和性能较低的困难。

图3 权重纠缠和经典权重共享的训练以及测试对比

受到OFA [4], BigNAS [5] 以及Slimmable networks [6, 7] 等工作的启发，作者提出了一种新的权重共享方式—— 权重纠缠 (Weight Entanglement)。

权重纠缠进一步共享不同结构之间的权重，使得同一层中不同算子之间能够互相影响和更新，实验证明权重纠缠对比经典的权重共享方式，拥有占用显存少，超网收敛快和超网性能高的优势。

同时，由于权重纠缠，不同算子能够得到更加充分的训练，这使得AutoFormer能够一次性训练大量的ViT模型，且使其接近收敛。（详情见实验部分）

图4 权重纠缠和权重共享的对比示意图

作者设计了一个拥有超过备选结构的巨大搜索空间，其搜索维度包括ViT模型中的 五个主要的可变因素 ：宽度 (embedding dim)、Q-K-V 维度 (Q-K-V dimension)、头部数量 (head number)、MLP 比率 (MLP ratio) 和网络深度 (network depth)，详见表1。

为了验证方法的有效性，作者将AutoFormer搜索得到的结构和近期提出的ViT模型以及经典的CNN模型在ImageNet上进行了比较。

对于训练过程，作者采取了DeiT [8]类似的数据增强方法，如 Mixup, Cutmix, RanDAUgment等, 超网的具体训练参数如表2所示。所有模型都是在 16块Tesla V100 GPU上进行训练和测试的。

搜索得到的结构在ImageNet数据集上明显优于已有的ViT模型。

表3：各个模型在ImageNet 测试集上的结果

在下游任务中，AutoFormer依然表现出色，利用仅仅25%的计算量就超越了已有的ViT和DeiT模型，展现了其强大的泛化性能力。

表4：下游分类任务迁移学习的结果

够同时使得成千上万个Vision Transformers模型得到很好的训练（蓝色的点代表从搜索空间中选出的1000个较好的结构）。

不仅仅使得其在搜索后不再需要重新训练（retraining）结构，节约了搜索时间，也使得其能在各种不同的计算资源限制下快速搜索最优结构。

图5：左：AutoFormer能够同时训练大量结构，并使得其接近收敛。蓝色的点代表从搜索空间中选出的1000个较好的结构。右：ImageNet上各模型对比

本文提出了一种新的专用于Vision Transformer结构搜索的One-shot NAS方法—— AutoFormer。AutoFormer 配备了新的权重共享机制，即权重纠缠（Weight Engtanglement）。在这种机制下，搜索空间的网络结构几乎都能被充分训练，省去了结构搜索后重新训练（Retraining）的时间。大量实验表明所提出的算法可以提高超网的排序能力并找到高性能的结构。在文章的最后，作者希望通过本文给手工ViT结构设计和NAS+Vision Transformer提供一些灵感。在未来工作，作者将尝试进一步丰富搜索空间，以及给出权重纠缠的理论分析。

[8] Touvron, Hugo, et al. "Training>

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

若二维码过期或群内满200人时，添加小助手微信（AIyanxishe3），备注ICCV2021拉你进群。

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

特约稿件，未经授权禁止转载。详情见转载须知。

ICCV 2021放榜！发现一篇宝藏——如何一次性训练100,000+个Vision Transformers？

谷普下载提醒您

本文链接：http://www.gpxz.com/article/f758b339b36106a112e5.html

上一篇：Habana在英伟达牢固的AI训练城墙上打开了一

下一篇：本周专栏精选能为其带来下一场胜利吗Google

DOTA2

DOTA2刀塔官方网站，DOTA2资讯，DOTA2英雄资料，DOTA2活动发布官方阵地。DOTA2国服代理商完美世界，为你带来全球经典电竞大作DOTA2，进入刀塔畅享公平竞技体验。

新闻资讯 2024-01-15 01:47:10

无锡品纬小程序平台

小程序开发制作，广告投放

编程开发 2024-07-03 18:25:38

POS机办理申请

如果你每月要刷信用卡,肯定希望找一台稳定、秒到、资金安全的POS机！本站为大家提供多种品牌正规的POS机，费率稳定、到账安全让你可以放心使用，亿鑫合伙人正规聚合平台为你解忧！

安全杀毒 2024-07-11 13:24:50

防水线

惠州市康瑞精密组件有限公司拥有丰富的电子线束生产经验，产品有：新能源线束，防水线束，USB线束，线束加工定制，并和小米公司等建立了密切的合作关系。产品质量交期有保障！咨询热线：18688346088

管理咨询 2024-08-17 19:08:29

湛江市捷迅电梯有限公司

电影视频 2024-07-11 13:36:48

吹膜机

瑞安市国华机械有限公司专业生产吹膜机、制袋机、印刷机等塑料软包装成套设备，主要产品有：塑料吹膜机、降解吹膜机、降解制袋机、快递袋吹膜机、快递袋制袋机、pe吹膜机、pp吹膜机等

物流快递 2024-07-16 00:04:34

电子级硫酸

岷山环能高科股份公司是一家集城市矿产、资源再生、综合利用、新型材料、智慧能源为一体的循环经济清洁生产企业。目前公司综合回收黄金500公斤、银300吨（取得商务部白银配额）、铜3000吨、锌2万吨、锑白500吨、铋300吨、碲10吨、铟10吨、电子级硫酸3万吨、精制酸3万吨等。

下载资源 2024-07-17 00:08:40

西安迈顿品牌设计

陕西迈顿互动传媒有限公司—(位于西安服务全国)专注品牌设计服务,餐饮品牌设计,餐饮空间设计,是把餐饮品牌文化、创始人故事、餐饮运营管理与艺术设计情怀相结合，通过三维的手法表现在餐厅的空间里，提供“体验”的空间环境。关注Mtons迈顿，为餐饮助力！分享品牌设计,餐饮品牌设计,餐饮品牌策划,餐饮VI设计,logo设计,画册设计,品牌命名,餐饮空间设计,餐厅装修设计，网站设计、网站制作、餐饮品牌设计公

设计美化 2024-07-17 16:19:23

沂水信联信息科技有限公司

行业信息 2024-11-25 12:07:11

首页

柏士达电源公司创建于2016年，是一批拥有20多年专业UPS经验的专业人事组建而成。主导产品BODAYN柏达昱能UPS，逆变器，稳压电源、电力工业级UPS、变压器和定制特殊机型等。功率容量分别覆盖1--720KVA，拥有百余种型号和规格。

电影视频 2024-11-26 16:34:07

邮编查

邮编查,邮编查询,在线查询邮编,邮编大全

网络应用 2024-12-06 21:31:16

广州物流专线

广州物流专线-广州货运专线-广州物流公司-快时达物流

物流快递 2025-02-21 00:35:34

妙语艺术教育是可以加盟的吗 (妙语艺术教育怎么样)

目前国内艺术教育市场上拥有很大的发展前景，市场上的需求量很大，所以不少创业者都看中了艺术教育行业的发展，妙语艺术教育在国内拥有很高的口碑，也是创立比较早的语言类艺术品牌，在国内发展的时间比较长，现如今拥有完整的经营模式和发展方向，许多家长也将孩子送到这种专业的教育机构学习，得到了加盟商的关注，那么妙语艺术教育是可以加盟的吗，妙语艺术教...。

2024-12-21 18:41:17

在资本寒冬三个月斩获两轮融资肿瘤全病程智能管理平台海心智惠再获B2轮融资 (资本寒冬投资)

2022年5月25日，国内肿瘤诊疗领域领先智能服务平台、肿瘤患者全病程管理服务商浙江海心智惠科技有限公司，简称海心智惠，宣布再获B2轮融资，由泰珑投资、厦门宝拓、正和本源追加投资，这也是泰珑投资在肿瘤领域的首个投资项目，探针资本担任独家财务顾问，本次融资的资金将用于进一步加速团队的人才梯队建设，加速核心团队建设，引入更多行业内资深人才...。

2024-12-03 22:08:05

正新鸡排加盟费要多少钱 (正新鸡排加盟店一般要投资多少钱)

市面上小吃类产品经营总有着得天独厚的优势，比如说目标客户广泛，比如经营成本有限，比如经营方式灵活等等，大家无不对其向往不已，正新鸡排作为炸鸡界的元老品牌，其发展很值得期待，因此在有一定经济实力的条件下，不少创业者选择了与这一品牌合作，那么正新鸡排加盟费要多少钱呢，关于正新鸡排品牌信息的介绍正新成立于2006年，是以食品为主导，集生产、...。

2024-12-02 23:54:09

腾讯Angel机器学习平台获世界互联网大会领先科技奖 (腾讯angel)

11月19日，2024年世界互联网大会领先科技奖在乌镇发布，腾讯Angel机器学习平台凭借其卓越的技术积累、创新的关键技术和广泛的应用场景，荣获本年度领先科技奖，腾讯Angel机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产...。

2024-11-30 15:23:31

坚果N3Ultra对比ViddaC2Pro哪款好坚果N3Ultra和ViddaC2Pro区别有哪些 (坚果n3ultra max参数)

发表在坚果投影仪2024，10，1214，31坚果N3Ultra和ViddaC2Pro都是2024发布的激光投影仪，其中坚果N3Ultra是最新发布的，ViddaC2Pro是上半年发布的，具体坚果N3Ultra和ViddaC2Pro区别有哪些呢，下面就来详细了解一下，看看坚果N3Ultra对比ViddaC2Pro哪款好，一、坚果N3U...。

2024-11-28 16:19:34

这些污水都排向了哪里南昌每天直排超50万吨生活污水 (这些污水都排到哪里了)

今天我们来一起聊一下生活污水都排向了哪里，生活污水就是指人类在日常的生活当中所使用过的水，我们每天冲马桶的水，厨房洗碗的水，浴室里洗澡的水和洗衣机洗衣服的水，这些都属于生活污水，生活污水当中的恶臭是非常严重的污染危害之一，它会严重污染水体的环境，而且还会对我们的生活造成困扰，而在一些公共场所，住宅区，还有医院，工厂等这些地方的生活污水...。

2024-11-19 01:07:40

到底能不能走向世界鸿蒙到底是不是纯血

2016年5月鸿蒙系统开始立项，2018年美国开始经济战争，其中一项就是制裁华为，不让华为用安卓，2019年8月9日华为正式发布鸿蒙系统，问题就出在这里，大家可以仔细看，前期HarmonyOS和HMS肯定借鉴并抄袭了谷歌，这是可以肯定的，借鉴和抄袭能让你少走20年弯路，你说你抄不抄吧?要是换成你是华为，你也用……反正都是免费开源的，不...。

2024-11-15 23:00:42

特朗普关键任命马斯克与拉马斯瓦米将指导并将提名一电视掌管人为国防部长政府效率部 (特朗普关键任务有哪些)

外地期间12日，美国入选总统特朗普宣布多项任命，据央视资讯，外地期间11月12日，特朗普宣布，美国企业家埃隆·马斯克与维韦克·拉马斯瓦米将在他就职总统后独特指导拟成立的，政府效率部，特朗普示意，，政府效率部，将，为拆解政府官僚机构铺平路线，增添多余的监管法规和糜费的开销，偏重组联邦机构，特朗普发布新任国防部长人选据央视资讯，外地期...。

2024-11-13 19:40:29

我本该死了特朗普医生说这是奇观 (我本想一死了之)

据美国，纽约邮报，7月15日报道，在竞选集会上遭逢，未遂刺杀，后，美国前总统特朗普在接受采访回想起那场枪击事情时称，他自己，本应该曾经死了，，并称自己的耳朵被打掉了一小块，报道称，外地期间7月14日，为去缺席共和党全国代表大会，在飞往威斯康星州密尔沃基的公家飞机上接受采访时，特朗普回想起这次差点让他丧命的，十分超事实的教训，他宣称，...。

2024-11-13 02:06:52

天津日报记者周白石 (天津日报记者顾颖最新微博)

2024-07-17 03:07:12

office包含哪些办公软件 (office办公软件)

1、MicrosoftOfficeWord是文字解决软件，被以为是Office的重要程序，在文字解决软件市场上领有统治份额，DOC格局被尊为一个行业的规范，只管新版本Word2007也支持一个基于XML的格局，Word也适宜某些版的MicrosoftWorks，适宜Windows和Mac平台，2、MicrosoftOfficeExce...。

2024-07-10 22:54:02

阔腿裤永远的神！秋天穿又潮又好看，超百搭！|高腰|显高|上衣|裤装|条纹衫|平底鞋|身材比例

阔腿裤永远的神！秋天穿又潮又好看，超百搭！,高腰,显高,上衣,裤装,阔腿裤,条纹衫,平底鞋,身材比例

2023-09-02 16:49:18

文章推荐

2024高人气单机火影游戏介绍热门的火影单机手游下载推荐 (2024高分电影)

忍者一个神秘且充满魅力的职业，独特的忍者术以及其他的身体构造深深的吸引着大家，而忍者在日本也属于传说中的英雄，今天为大家推荐热门的火影单机手游下载推荐，在这些游戏里你可以体验到充满热血以及冒险的忍者世界，让你体验真实的忍者如何进行生存和战斗，接下来一起往下继续了解，1、，像素火影，像素火影，这里有多样多变的元素以及场景，等着玩家去体...。

2025-02-10 01:27:28

资讯动态

拥有好的心态你就成功一半 (拥有好的心态才有好的状态)

合理释放天性，就是善待自己，我发现很多人，都在压抑自己的天性，压抑自己的心情，人性是不能被压抑的，只能被释放，只是每个人释放的方式不太一样，有些人大喊大叫大吵大闹，跟朋友喝杯酒，有些人在马路上狂奔，有些人去看演唱会，有些人打电话跟朋友闺蜜诉苦，有些人吃一顿烧烤，不行就两顿，千万不要压抑自己，该释放时释放，憋久了就容易憋出心肌梗塞，抑郁...。

2025-01-30 23:42:46

网络百科

还记得你的第一个网名吗 QQ的18岁生日到了 (还记得你的第一个网名吗?)

1、，1999年2月10日，QQ的前身，OICQ99a发布中文网络寻呼机、公共聊天室、传输文件，2、，2000年，QQ的雏形，OICQ99b发布语音聊天的功能，2000年4月，QQ用户注册数达500万，5月27晚20，43分，QQ同时在线人数首次突破十万大关6月QQ注册用户数破千万，3、，2001年，QQ一步之遥，OICQ2000发布...。

2025-01-30 23:05:54

网络百科

异构集成安谋科技如何与Arm (异构集成技术上市公司)

安谋科技的纷争结束后，业界对于这技术和导向家公司的关注点回归到其产品，继上周Arm发布全新的面向移动端的CPU和GPU产品组合之后，本周安谋科技业发布了两款自研产品，一款是车规级高性能嵌入式处理器，星辰，STAR，MC2，另一款是面向多场景应用的高效视频处理器，玲珑，V6，V8，通过新产品的发布，安谋科技继续展现出其与Arm一如既往的...。

2024-12-03 20:13:04

资讯动态

能否卷出个未来智能客服企业卷到东南亚

大家已经把价格压得很低，相当于鼻孔贴着水面了，降得少没意义，降得多就要窒息了，在谈到智能客服行业的内卷现状时，一位资深行业人士对说道，价格战曾经是争夺市场份额无往不利的，大杀器，，但在智能客服市场的竞争烈度下，已经彻底失效，原本自诩颠覆者的AI公司们不得不低下高贵的头颅，开始贴身做起了服务，从浮在空中做技术和工具，转为更加接...。

2024-12-03 17:06:01

资讯动态

ICCV 2021放榜！发现一篇宝藏论文 (iccv2024截稿日期)

相关文章

文章推荐