谷歌大脑撰文解析 神经网络如何自行设计神经架构 AutoML (谷歌大脑项目)

撰文解析 AutoML:神经网络如何自行设计神经架构? | Google I/O 2017

在 Google I/O 大会上,谷歌公布了最新的机器学习算法——AutoML,随即,Quoc Le 与 Barret Aoph 大神在 Google ReSearch Blog 上发布了一篇名为《采用机器学习探索神经网络架构》的文章。雷锋网进行了编译,并做了不改动原意的编辑和修改。

「在谷歌团队,我们成功地将深度学习模型应用于非常多的领域,从图像识别、语音识别到机器翻译等等。自然,这些工作离不开一整支工程师与科学家团队的努力。人工设计机器学习模型的过程实际上绝非坦途,因为所有可能组合模型背后的搜索空间非常庞大——一个典型的十层神经网络可能有~10种可能的神经网络组合。问题也接踵而至,为了应对这样庞大的数量级,神经网络的设计不仅耗时,而且需要机器学习专家们累积大量的经验。」

撰文解析 AutoML:神经网络如何自行设计神经架构? | Google I/O 2017

如图是 GoogleNet 的架构。神经网络的设计需要从最初的卷积架构开始,进行多年的细心调试

为了让机器学习模型的设计变得更加简单,谷歌团队一直希望能让这一过程自动化。此前谷歌也有做不少尝试,包括 evolutionary algorithms 与 reinforcement learning algorithms 等算法已经呈现了比较好的结果。而 Quoc Le 与 Barret Zoph 在此文中所展现的,是谷歌大脑团队目前在强化学习上得到的一些尝试与早期结果。

撰文解析 AutoML:神经网络如何自行设计神经架构? | Google I/O 2017

在团队一个名为「AutoML」的项目中(如图所示),左边有一个名为「控制器」(the controller)的 RNN,它设计出一个「child」的模型架构(雷锋网觉得可以称之为「雏形/子架构」),而后者能够通过某些特定任务进行训练与评估。随后,反馈的结果(feedback)得以返回到控制器中,并在下一次循环中提升它的训练设定。这一过程重复上千次——生成新的架构、测试、再把反馈输送给控制器再次学习。最终,控制器会倾向于设计那些在数据集中能获得更高准确性的架构,而反之亦然。

谷歌团队将这一方法应用于深度学习的两大数据集中,专注图像识别的 CIFAR-10 与语言建模的 Penn Treebank。在两个数据集上,系统自行设计的模型性能表现与目前机器学习专家所设计的领先模型不相上下(有些模型甚至还是谷歌成员自己设计的!)。

撰文解析 AutoML:神经网络如何自行设计神经架构? | Google I/O 2017

猜猜哪个是人类设计的神经网络架构,哪个是机器设计的?

让机器自行选择架构(machine-chosen architecture),与人类在设计神经网络的时候有一些共通之处,比如都采用了合并输入,并借鉴了此前的隐藏层。但其中也有一些亮点,比如机器选择的架构包含乘法组合 ( multiplicative combination),如右图最左边(机器设计)的蓝色标签为「elem_mult」。对于循环神经网络而言,出现组合的情况并不多见,可能因为人类研究者并没有发现明显的优势。有意思的地方在于,此前人类设计者也提议过机器采用的乘法组合,认为这种方法能够有效缓解梯度消失/爆炸问题。这也就意味着,机器选择的架构能够对发现新的神经架构大有裨益。

此外,机器还能教会人类为何某些神经网络的运行效果比较好。上图右边的架构有非常多的渠道,梯度可以向后流动,这也解释了为何 LSTM RNNs 的表现比标准 RNN 的性能要好。

「从长远看来,我们对于机器所设计的架构进行深入的分析和测试,这能够帮助我们重新定义原本自身对架构的看法。如果我们成功,这意味着将会启发新的神经网络的诞生,也能让一些非专家研究人员根据自己的需要创造神经网络,让机器学习造福每一个人。」

参考文献:

[1] Large-Scale Evolution of Image Classifiers ,Esteban Real, Sherry Moore, Andrew Selle, Saurabh Saxena, Yutaka Leon Suematsu, Quoc Le, Alex Kurakin. International Conference on Machine Learning, 2017.

[2] Neural Architecture Search with Reinforcement Learning ,Barret Zoph, Quoc V. Le. International Conference on Learning Representations, 2017.

via research.googleblog ,雷锋网编译

版权文章,未经授权禁止转载。详情见 转载须知 。

撰文解析 AutoML:神经网络如何自行设计神经架构? | Google I/O 2017


本文地址: https://www.gpxz.com/article/f9a662e8a9b2307e872f.html
全局中部横幅
全局中部横幅
上海生活服务网站

上海生活服务网站排名,根据网站的综合值按照不同的上海生活服务网站进行筛选排名结果,通过筛选上海生活服务网站可以看到每个上海生活服务网站里面的网站排名优质的网站是哪些

亿智蘑菇

亿智蘑菇是深入移动互联网与智能硬件行业的众测科技媒体,向厂商及用户提供媒体资讯、智能硬件试用、酷玩产品导购、社会化媒体传播等多元服务。

【租车

58同城租车网为您提供大量精选的租车信息,是专业的租车信息发布平台,经过严格审核保证租车信息的真实性,租车网是您查找租车信息的最佳选择。

石家庄电脑回收

石家庄电脑回收T:15350562341,淘汰电脑回收,石家庄二手电脑回收,台式电脑回收,笔记本电脑回收,同时回收石家庄及周边地区打印机,复印机,线路板等办公设备

北京档案密集柜,河北德吉特柜业有限公司

德吉特柜业北京档案密集柜厂家生产销售定制:密集柜、密集架、档案密集柜、档案密集架、密集架厂家、档案柜、底图柜、图书书架,北京朝阳区.北京丰台区.海淀区.大兴区德吉特智能密集柜办事处,服务热线:13932846457

PE自封袋,塑料方底袋,塑料包装袋厂家

丹阳康耐包装材料有限公司是一家专业生产塑料包装袋等产品的企业,主要产品有:PE袋、PE自封袋、塑料方底袋、PE塑料包装袋等,欢迎新老客户前来咨询合作。

四川以畅企业管理咨询有限公司

四川以畅企业管理咨询有限公司,2021年成立于四川省成都市,另设有6家分公司覆盖建筑业各领域;以畅咨询聚焦全国建筑企业及相关从业者对于资质的各类难题,定位各类资质相关服务,致力于打造服务于建筑企业的领先品牌。

弗兰德FLENDER联轴器

FLENDER联轴器以其卓越的技术特点而著称。它们通常采用高品质材料,具有优良的耐磨性和耐腐蚀性,弗兰德联轴器能够在高负载和高转速条件下运行。N-eupex弹性联轴器其设计灵活,适用于各种动力传输需求。此外,德国FLENDER联轴器常配备减震和缓冲功能,有效降低振动和冲击,延长设备使用寿命。

北海旅行社

广西遇见旅行社提供广西北海旅行社服务以及广西旅游、德天瀑布旅游、北海旅游和涠洲岛旅游服务。我们是一家专业的旅行社,致力于为您提供满意的旅游体验。

爱听音乐网

爱听音乐网-Mp3歌曲免费下载,MP3免费下载,音乐免费下载,mp3歌曲免费下载,mp3下载,音乐免费下载,MP4下载,视频下载,DJ舞曲排行,网络音乐排行,网络热门歌曲,酷我音乐排行,非主流音乐,经典老歌,劲舞团歌曲,搞笑歌曲,儿童歌曲,网络歌曲,MP4视频下载.收录了网上最新歌曲和流行音乐,网络歌曲,好听的歌,非主流音乐,经典老歌,搞笑歌曲,儿童歌曲,英文歌曲等。是您寻找好听的歌首选网站

碳钢弯头,管件厂家,3PE防腐厂,聚氨酯保温厂,管卡胶管

河北恒泰管道装备制造有限公司专业生产销售各种碳钢弯头,管件厂家,3PE防腐厂,聚氨酯保温厂,管卡胶管等产品,产品规格齐全,欢迎选购!


全局底部横幅