和神经架构搜索初探 AutoML (神经架构搜索(NAS))

文章编号:43910 资讯动态 2024-12-09 DARTS 机器学习 AutoML

雷锋网按:本文由「图普科技」编译自 An Opinionated Introduction to AutoML and Neural Architecture Search

来自CMU和DeepMind的研究人员最近发布了一篇有趣的新论文,称为可微分网络结构搜索(DARTS),它提供了一种神经网络结构搜索的替代方法,这是目前机器学习领域的一个大热门。神经网络结构搜索去年被大肆吹捧,Google首席执行官Sundar Pichai和Google AI负责人Jeff Dean宣称,神经网络结构搜索及其所需的大量计算能力对于机器学习的大众化至关重要。科技媒体争相报道了谷歌在神经网络结构搜索方面的工作。

AutoML 和神经架构搜索初探

报道谷歌的AutoML和神经网络结构搜索的头条新闻

在2018年3月举办的TensorFlow DevSummit大会上,Jeff Dean在主题演讲(大约22:20左右开始)中宣称,未来谷歌可能会用100倍的计算能力取代机器学习专家。 他给出了需要庞大计算力的神经网络结构搜索作为例子(他给出的唯一例子),来说明为什么我们需要100倍的计算能力才能使更多人能够使用ML。

AutoML 和神经架构搜索初探

Jeff Dean在TensorFlow DevSummit大会上的主题演讲

什么是神经网络结构搜索?它是使得机器学习技术可以被非机器学习专家所使用的关键吗?

我将在这篇文章中深入研究这些问题,在下一篇文章中,我将专门研究Google的AutoML。 神经网络结构搜索是一个名为AutoML的更广泛领域的一部分。AutoML近年来受到了很多关注,我们将首先来探讨它。

目录:

• AutoML是什么?

• AutoML有用吗?

• 神经网络结构搜索是什么?

• DARTS是什么?

• 神经网络结构搜索有用吗?

• 如何让机器学习从业者更高效地工作? AutoML vs增强机器学习

AutoML 是什么?

传统上,术语AutoML用于描述模型选择和/或超参数优化的自动化方法。这些方法适用于许多类型的算法,例如随机森林,梯度提升机器(gradient boosting machines),神经网络等。 AutoML领域包括开源AutoML库,研讨会,研究和比赛。 初学者常常觉得他们在为模型测试不同的超参数时通常仅凭猜测,而将这部分过程的自动化可以使机器学习变得更加容易。即使是对经验丰富的机器学习从业者而言,这一自动化过程也可以加快他们的速度。

业内现存有许多AutoML库,其中最早出现的是AutoWEKA,它于2013年首次发布,可以自动选择模型和超参数。其他值得注意的AutoML库包括auto-sklearn(将AutoWEKA拓展到了python环境),H2O AutoML和TPOT。 AutoML.org(以前被称为ML4AAD,Machine Learning for Automated Algorithm Design)小组,自2014年以来一直在ICML机器学习学术会议上组织AutoML研讨会。

AutoML 有用吗?

AutoML提供了一种选择模型和优化超参数的方法。它还可以用于获取对于一个问题可能性能的基准结果。这是否意味着数据科学家将被取代? 并非如此,因为我们知道,机器学习从业者还有许多其他事情要做。

对于许多机器学习项目,选择模型不过是构建机器学习产品复杂过程中的一部分。 正如我在上一篇文章中所述,如果参与者不了解项目各个部分是如何相互关联的,那么项目必然会失败。我能想到过程中可能会涉及的30多个不同步骤。我必须要强调,机器学习(特别是深度学习)中最耗时的两个方面是清理数据(这是机器学习中不可或缺的一部分)和训练模型。 虽然AutoML可以帮助选择模型并选择超参数,但重要的是,我们仍然要理清有哪些数据科学的技能是需要的以及那些仍未解决的难题。

我将提出一些替代AutoML方法的建议,以使机器学习从业者在进行最后一步时更有效率。

神经网络结构搜索是什么?

现在我们已经介绍了AutoML的一些内容,让我们来看看该领域特别活跃的一个子集:神经网络结构搜索。谷歌首席执行官桑达·皮采Sundar Pichai在博客中写道:“设计神经网络是非常耗时的,其对专业知识的极高要求使得只有小部分科研人员和工程师才能参与设计。这就是我们创建AutoML方法的原因,有了它,神经网络也可以设计神经网络。”

Pichai所说的使用“神经网络也可以设计神经网络”就是神经网络结构搜索; 通常使用强化学习或进化算法来设计新的神经网络网络结构。这很有用,因为它使得我们能够发现比人们想象的要复杂得多的网络结构,并且这些网络结构可以针对特定目标进行优化。神经网络结构搜索通常需要大量计算力。

确切地说,神经网络结构搜索通常涉及学习像层(通常称为“单元”)之类的东西,它们可以组装成一堆重复的单元来创建神经网络:

AutoML 和神经架构搜索初探

来自Zoph等人2017年发表的论文。左边是单元堆叠的完整神经网络,右边是单元的内部结构

关于神经结构搜索的学术论文很多,所以我将在这里重点介绍几篇最近发表的论文:

• 在2017年5月举行的Google I / O大会上,Google AI研究人员Quoc Le和Barret Zoph发布了他们的研究成果(点击查看论文),AutoML这一术语迅速成为主流。该研究使用强化学习为计算机视觉领域的Cifar10问题和NLP领域的Penn Tree Bank问题寻找到了新的网络结构,并取得了与现有网络结构类似的结果。

AutoML 和神经架构搜索初探

来自Le和Zoph的博客文章:左边更简单的架构是人类设计的,右边更复杂的架构是神经网络设计的。

• 通过Learning Transferable Architectures for Scalable Image Recognition论文中提出的NASNet。这项研究在小数据集Cifar10上寻找一个网络结构构建块,然后为大型数据集ImageNet构建网络。这项研究需要大量计算,花费1800个GPU天(相当于1个GPU工作5年)来学习网络结构(谷歌团队使用500个GPU 训练了4天!)。

• Regularized Evolution for Image Classifier Architecture Search论文中提出的AmoebaNet。这项研究比NASNet需要更多的计算,它花费3150个 GPU天(相当于1 GPU近9年的时间)来学习网络结构(Google团队使用450个K40 GPU 训练了7天!)。 AmoebaNet由通过进化算法习得的“单元”组成,表明人工智能进化而来的架构可以媲美甚至超越人工制作和强化学习设计的图像分类器。 fast.ai对此架构进行了改进,学习进程加快的同时改变了训练过程中图像的尺寸。AmoebaNet已成为在单台机器上训练ImageNet最便宜的方式!

• 高效的神经网络结构搜索(ENAS):使用的GPU小时数比现有的自动模型设计方法少得多,特别是比标准的神经网络结构搜索所需的计算力要少1000倍。这项研究仅使用单个GPU训练了16个小时!

DARTS是什么?

可微分网络结构搜索(DARTS)。这项研究是最近由卡内基梅隆大学和DeepMind的一个团队发布的,我对这个想法很感兴趣。 DARTS假定候选网络结构的空间是连续的,而不是离散的,这使得它能够使用基于梯度的方法。这比大多数神经架构搜索算法使用的黑箱搜索效率高得多。

AutoML 和神经架构搜索初探

来自DARTS,它将所有可能的网络结构空间视为连续的,而非离散的

要为Cifar-10学习一个网络结构,DARTS仅需4个GPU天,相比之下,NASNet为1800 个GPU天,AmoebaNet为3150个GPU天(准确度都相同)。这是效率的巨大提升! 虽然还需要更多的探索,但这是一个很有前景的研究方向。 Google经常强调神经架构搜索需要巨大计算力,这说明有效的网络结构搜索方法很可能未被充分探索。

神经架构搜索有用吗?

在他的TensorFlow DevSummit主题演讲中(从22:20开始),Jeff Dean提出深度学习工作的一个重要部分是尝试不同的网络结构。这是Dean在他的简短的演讲中唯一强调的机器学习步骤,我对他的重点感到惊讶。Sundar Pichai的博文包含了类似的断言。

AutoML 和神经架构搜索初探

Jeff Dean的幻灯片显示神经网络结构搜索可以尝试20种不同的模型以找到最准确的一种。

但是,选择模型只是构建机器学习产品复杂过程中的一部分。 在大多数情况下,网络结构选择远不是最难,最耗时或最重要的问题。目前,没有证据能够证明每个问题最好用它自己独特的网络结构来建模,大多数从业者都认为不太可能会出现这种情况。

谷歌等组织致力于网络结构设计,并与其他人共享他们发现的网络结构。这样的服务是非常重要且有用的。 然而,只有那些致力于基础神经结构设计的小部分研究人员才需要基础架构搜索方法。 我们其他人可以通过迁移学习来利用他们找到的网络结构。

如何让机器学习从业者更高效地工作? AutoML vs增强机器学习(Augmented ML)

神经网络结构搜索是AutoML领域的一部分,该领域关注的核心问题是:我们如何将模型选择和超参数优化过程自动化? 然而,自动化忽视了人类参与的重要作用。 我想提出另一个问题:人类和计算机如何协同工作才能使机器学习效率更高? 增强机器的重点在于弄清楚人和机器应如何更好地协同工作以发挥他们的不同优势。

增强机器学习的一个例子是Leslie Smith的学习率查询器,它可在fastai库(在PyTorch之上运行的高级API)中实现,我们在免费的深度学习课程中也将其作为关键技术进行教学。 学习率是一个超参数,可以确定模型训练的速度,甚至可以确定模型是否训练成功。 学习速率查询器允许人类通过查看生成的图表中找到合适的学习速率。它比AutoML更快地解决了这一问题,增强了数据科学家对训练过程的理解,并鼓励采用更强大的多步骤方法来训练模型。

AutoML 和神经架构搜索初探

来自Surmenok关于学习率查询器的博客文章,显示了学习率与损失之间的关系

专注于自动化超参数选择存在的另一个问题是:它忽视了某些类型的模型可能适用性更广,需要调整的超参数更少以及对超参数选择不太敏感的情况。例如,随机森林优于梯度提升机器(Grandient Boosting Machine, GBM)的重要一点是随机森林更加稳定,而GBM往往对超参数的微小变化相当敏感。因此,随机森林在业内得到广泛应用。研究有效删除超参数的方法(通过更智能的默认值或通过新模型)将产生巨大的影响。当我在2013年开始对深度学习感兴趣时,对如此多的超参数感到不知所措,我很高兴新的研究和工具帮助消除了许多超参数(特别是为初学者)。例如,在fast.ai课程中,初学者只需要选择学习率这一个超参数,我们甚至会给你一个工具来做到这一点!

揭开谷歌 AutoML 的神秘面纱

揭秘 | 谷歌自动化机器学习真的那么神吗?

版权文章,未经授权禁止转载。详情见 转载须知 。

AutoML 和神经架构搜索初探


本文地址: https://www.gpxz.com/article/d4b2eb60d4df43aad08c.html
全局中部横幅
全局中部横幅
怡合达

怡合达工厂自动化零部件一站式采购平台,专业为自动化设备生产单位提供自动化零部件一站式采购服务,汇集千万种自动化零件,品质保障,亿级库存,极速发货,以节省客户采购成本,缩短产品交付周期,促进行业发展为理念,为客户提供安心的,愉悦的采购体验。

金相显微成像系统

北京瑞科中仪科技有限公司(www.lijiang1314.com)是奥林巴斯显微镜总经销,奥林巴斯显微镜总经销,经销金相显微成像系统,荧光显微成像系统,偏光显微成像系统,激光捕获显微切割系统,显微镜CCD成像,高性价比显微镜等实验室通用设备,公司长期储备各种显微镜现货,只要您有需求,我们就能随时为您提供各种产品选配服务!

滚子轴承

上虞市富龙轴承有限公司专业生产各类短圆柱滚子轴承及相关非标轴承,产品质量稳定,大量销售国内市场及出口德国、意大利、美国等欧美市场,深受客户信赖和推崇。FLB为公司注册商标,公司年生产圆柱滚子轴承150万套,其他系列轴承50万套。

中科维鑫(天津)科技有限公司

为您量身定制VR、AR、全景技术解决方案依托中国科学院的强大技术团队,在VR/AR各项领域不断锐意进取,业务覆盖众多垂直行业应用虚拟引领现实,未来清晰可见我们专注于提供包括安全、教育、娱乐、地产、仿真、旅游、在线全景等VR与AR行业应用解决方案。

Luoxinyuan

最新最全的企业介绍、行业新闻、招聘信息、招投标信息,海量资讯一网打尽

康锋影院

【康锋影院】(www.ahxgfd.com)为您提供2025vip热播电视剧全集【超前点播】高清电影手机免费在线观看服务【无广告不卡顿】康锋影院每天第一时间更新,更多精彩经典在线视频尽在康锋影视。

慧邮件

慧邮件是专业邮件营销平台,将邮件营销,邮件群发,EDM营销,电子邮件营销,Email营销融为一体,让您更好的营销自己产品,利用电子邮件营销方式获取更好的营销效果。

湖北给力钢模有限公司

湖北给力钢模有限公司,电话:15071258152给力钢模,建筑钢模板,墩柱钢模,平面钢模,异形钢模,圆柱钢模,盖梁钢模,箱梁钢模板,T梁钢模板,承台模板,组合钢模,挂篮模板,轨道梁模板,隧道台车,液压模板,液压箱梁模板,液压T梁模板,液压爬模,液压滑模,挂篮,挂篮租赁,模板租赁,武汉钢模厂,钢模厂,钢模板厂,钢模板加工厂,钢模板厂家,防撞墙护栏模板,桥梁钢模板,下构,打桩,预制梁场,梁场施工队

英超直播

欢迎光临24直播网~♉️Summer♉️7×24小时虔诚为您提供英超直播免费在线观看服务、包括英超免费在线高清直播、英超视频直播在线观看无插件♉️足球热门比赛直播♉️超全的英超直播赛事和高清英超直播信号源,24小时不间断更新英超直播赛程。无需安装任何插件,轻松畅享各类精彩球赛直播。

中国产业新闻网

中国产业新闻网,包括财经,经济,要闻等频道,全方面报道中国产业经济新闻资讯。

正苗启德青少年素质教育学校

正苗启德青少年素质教育学校是一所专业针对青春期叛逆期的孩子进行行为习惯调整、感恩励志教育、心理辅导、文化辅导于一体的正规特殊教育学校,教育局审批,非营利性民办专门学校,面向全国各地常年招生,可免费参观校区或视频参观校区。

中国青年志愿者网

中国青年志愿者网是共青团中央志愿者工作部、中国青年志愿者协会秘书处和中国青年报社合作建设的志愿者公益网站。


全局底部横幅