如何使用 Google AutoAugment 改进图像分类器的 (如何使用google play)

文章编号：46630 资讯动态 2024-12-10 数据增强谷歌图像分类

通过使用优化的数据增强方法，在CIFAR-10、CIFAR-100、SVHN和ImageNet上得到了目前最好的结果。您可以从这里找到和使用它们。

在ImageNet上得到的最好的增强效果，源自：

AutoML——使用机器学习来改进机器学习设计(如体系结构或优化器)的想法——已经来到了数据增强的领域。本文将解释什么是数据增强，谷歌AutoAugment如何搜索最佳增强策略，以及如何将这些策略应用到您自己的图像分类问题。

数据增强意味着在训练机器学习模型时，对输入数据随机的应用各种变换。这种人为地扩大训练数据，可以生成更多可能的输入数据。它还有助于防止过度拟合，因为网络几乎从来不会看到完全相同的两次输入然后仅仅记住它们。典型的图像数据增强技术包括从输入图像中随机裁剪部分，水平翻转，应用仿射变换，如平移、旋转或剪切等。

事实上，正如 AutoAugment 作者所指出的，近年来在ImageNet挑战赛上，人们为寻找更好的网络结构投入了大量的精力，但是数据增强技术，基本上与Krizhevsky等人在2012年为AlexNet设计的方法相同，或者只有一些微小的变化。

选择使用哪些数据增强的通用做法，是首先提出适合对应数据集的不同假设，然后进行试验。你可以从随机剪切、随机调整大小或者水平翻转开始，因为它们几乎总是有效的，并且还可以尝试诸如小尺度的旋转等。由于重复训练带来的验证集性能的随机波动，很难确定这些增加的旋转是否提高了模型性能，因为您可以从两次不同的训练中获得随机的改进，而这些改进并不是因为使用了数据增强。

通常来说，由于我们实验的高度不确定性，并且也没有时间或资源来严格测试所有的可能组合，所以我们放弃了搜索最好的方法，或者坚持使用某些固定的增强策略，而不知道它们是否有很大的贡献。但是，如果有一种可以迁移有用数据的增强技术，就像我们在迁移学习中从预先训练的模型中迁移参数一样，那会怎样呢?

从数据中学习增强策略

AutoAugment的思想是在强化学习(RL)的帮助下学习给定数据集的最佳增强策略。由于在图片上应用和组合转换的方法非常多，所以它们对可选择的方法增加了一些限制。一个主要策略由5个子策略组成，每个子策略依次应用2个图像操作，每个图像操作都有两个参数:应用它的概率和操作的幅值(70%的概率执行旋转30度的操作)

这种策略在训练时是如何应用在图片上的呢?对于我们当前批次的每张图片，首先随机均匀地选择一个子策略，然后应用该子策略。让我们来看一个包含5个子策略的示例，这些子策略应用于SVHN数据集中的图片:

对SVHN图像应用一些最佳增强的例子。源自：

子策略1在x的方向上，以90%的概率执行力度为7的剪裁。然后，有20%的概率，对图像的颜色进行翻转。子策略4以90%的概率对图像进行颜色反转，然后在10次中有6次进行颜色直方图均衡化。操作的次数是固定的，但是由于子策略的随机性和操作存在的概率，对于单个图像也可能有很多的增强结果。

让我们看看AutoAugment RL模型的搜索空间。他们考虑了16种操作:14种来自Python图像库PIL，比如旋转、颜色反转和一些不太知名的操作，比如色调分离(减少像素位)和过度曝光(将颜色反转到某个阈值以上)，再加上裁剪和采样(类似于Mixup)这些数据增强领域的新方法。增加11个离散概率值(0.0,0.1,…,1)和从0到9共10个等间距的幅值，这相当于对某一个子策略有(16 * 11 * 10)²种可能性，如果同时有五个子策略，则共有(16 * 11 * 10)¹⁰≈2.9 * 10³²种可能。需要强化学习来帮忙了!

AutoAugment像NASNet一样训练——一个源自Google的用于搜索最优图像分类模型结构的增强学习方法。它的训练方法如下：我们有一个控制器，它决定当前哪个增强策略看起来最好，并通过在特定数据集的一个子集上运行子实验来测试该策略的泛化能力。在子实验完成后，采用策略梯度法(Proximal policy Optimization algorithm, PPO)，以验证集的准确度作为更新信号对控制器进行更新。解释PPO超出了本文的范围，但是我们可以更详细地看看控制器和子模型实验。

控制器以Softmax输出要应用于哪个操作决策。然后，该决策作为输入传递到控制器的下一步，这是因为控制器是一个RNN(对于NASNet，使用了一个包含100个隐藏单元的LSTM)。然后控制器决定应用哪个幅值的操作。第三步是选择概率。因此，控制器拥有所有其他操作的上下文、早期的概率和幅值，以便做出最佳的下一个选择。(这是一个说明性的例子，因为这篇论文目前并没有告诉我们选择操作、大小和概率的顺序)。

总共有30个softmax预测值，因为有5个子策略，每个子策略需要在两个操作、大小和概率(5 * 2 * 3 = 30)中做出两个选择。

我们如何告诉控制器哪些策略选择得好，哪些没有真正提高性能(例如将亮度设为零)?为此，我们使用当前增强策略在子神经网络上进行泛化实验。实验结束后，对RNN控制器的权值进行更新，以验证集的准确度作为更新信号。当最后将整体最佳的5个策略(每个策略包含5个子策略)合并到最终策略(现在包含25个子策略)中时，共将执行15,000次迭代。最后的这个策略是用于该数据集所有数据的策略。

正如副标题已经给出的那样，AutoAugment提升了CIFAR-10、CIFAR-100、SVHN、ImageNet等数据集上的最优结果。此外，还有一些特别有趣的细节:

CIFAR-10测试集上的错误率，越低越好，源自：

ImageNet验证集上Top-1/Top-5的错误率，越低越好，源自：

FGVC测试集上Top-1错误率(%)。Inception v4是从零开始训练，没有应用最佳ImageNet增强策略。源自：

如果我们想要解决图像分类问题，通常使用来自ImageNet预训练的权重初始化模型，然后对这些权重进行微调。我们刚刚看到，使用AutoAugment的最佳ImageNet策略，同时从零开始训练，也有类似的正效果。如果我们同时使用这两种方法：在使用ImageNet AutoAugment 策略时微调ImageNet的权重?这些优化的效果会叠加起来，为我们解决新的图像分类问题提供新的最佳方法吗?

为了回答这个问题，我使用了相同的5个FGVC数据集(Oxford 102 Flowers, Caltech-101, Oxford- iiit Pets, FGVC Aircraft和Stanford Cars)，对Inception v4进行微调，使用或不使用来自AutoAugment的ImageNet策略。

对FGVC测试集上5次Top-1错误率结果进行平均。Inception v4通过对ImageNet权重进行微调，使用和不使用AutoAugment ImageNet策略。有趣的是，在5个数据集中，只有3个数据集的微调结果比从上面AutoAugment论文中从零开始训练的结果更好。正如在“Do Better ImageNet Models Transfer Better”中讨论的那样，微调似乎不会在所有情况下都提升模型性能。

将最佳的ImageNet增强策略应用于不同的数据集，可以将5个数据集中的3个的错误率平均降低18.7%。在另外两个数据集上，错误率平均增加了5.3%。

这些结果表明，当需要对ImageNet权重进行微调时，应该尝试额外应用ImageNet AutoAugment策略。通常情况下，基本上都可以额外获得显著的改进。

如何将AutoAugment策略应用于您的问题

我在本文附录中创建了一个包含最佳ImageNet、CIFAR-10和SVHN策略的repo。一些实现细节还不明确，但我正在与作者联系，一旦我知道更多细节，我将会在这个repo里及时更新。

将ImageNet策略的随机子策略通过PIL应用搭配图像上，可以如下:

要将它应用到PyTorch，您可以这样做:

AutoML再次展现：对于给定数据集，最好的数据增强操作是可学习的，甚至可以迁移到类似的数据集中。这只是许多可能的自动优化数据增强方法中的一个。提高学习此类策略的效率是另一种令人兴奋的方法，目的是使任何人都能够使用这些技术(无需使用GPU服务器群)。ENAS表明这是可行的。

把这个新方法应用到你自己的问题上吧，祝你好运！如有错误和疑问，请发邮件至philip@popien.net联系我。

想要继续查看该篇文章相关链接和参考文献？

如何使用 Google 的 AutoAugment 改进图像分类器】

今日博客推荐： ICML 2019 | 神经网络的可解释性，从经验主义到数学建模

本来想把题目取为「从炼丹到化学」，但是这样的题目太言过其实，远不是近期可以做到的，学术研究需要严谨。但是，寻找适当的数学工具去建模深度神经网络表达能力和训练能力，将基于经验主义的调参式深度学习，逐渐过渡为基于一些评测指标定量指导的深度学习，是新一代人工智能需要面对的课题，也是在当前深度学习浑浑噩噩的大背景中的一些新的希望。

原创文章，未经授权禁止转载。详情见转载须知。

如何使用 Google 的 AutoAugment 改进图像分类器

本文地址： https://www.gpxz.com/article/ad1a4983a19f05b608e5.html

上一篇：强化学习的10个现实应用

下一篇：大华股份重磅发布DahuaThink战略云联万物数

Net114

网络114是企业B2B电子商务平台，专注企业、连接世界,为您提供数千万的商家企业黄页信息，汇聚海量产品、供求信息、生活服务信息，您可以在网络114免费发布自己的产品信息,开展网络营销推广，获得千万询盘机会。

网络应用 2026-01-21 11:35:20

医硕考研

南京医硕考研是一家专业的医学类考研辅导机构，成立10年来一直专注于考研集训营，全程名师面授。

科研机构 2026-01-25 01:11:18

广州东华职业学院

广州东华职业学院创办于2011年,是经教育部批准成立的全日制普通高等院校,中国民办教育百强,粤港澳大湾区标杆性高职院校,位于广州市区,以

电影视频 2026-01-25 17:28:06

内六角冲头

海默克精密机械（昆山）有限公司成立于2017年，专注于六角冲棒，梅花冲棒梅花冲头，走心机冲头等冲头的生产加工及销售，主要针对各大走心机、冷镦机的使用。

电影视频 2026-01-25 18:38:20

淄博集装箱集成房屋

山东华禹集成房屋有限公司是一家专业生产制造山东集装箱集成房屋,山东打包集装箱办公室,折叠集装箱活动房等产品的公司，本公司在行业内经过多年发展，在山东淄博拥有较高的知名度，且在制作生产方面拥有较高的工艺,欢迎来厂参观和咨询。

管理咨询 2026-01-25 18:46:37

手板模型

上海凌鹰模型有限公司主要业务有手板模型、3D打印、快速样件、硅胶复模等，在业内深受好评，拥有强大的设计团队和设备，欢迎来电咨询!

设计美化 2026-01-25 18:58:18

成都东科盛业自动化设备有限公司

成都东科盛业自动化设备有限公司--赫思曼,赫斯曼工业交换机，赫斯曼工业以太网产品，Hirschmann,施耐德,Schneider,MOXA,摩莎交换机,TSC

电影视频 2026-01-28 17:47:43

天津鑫源森特自动化科技有限公司

科技创新 2026-01-28 22:38:12

奥瑞金

奥瑞金科技股份有限公司是一家集品牌策划、包装设计与制造、灌装服务、信息化辅助营销为核心的综合包装解决方案提供商。

设计美化 2026-01-28 22:52:50

杭州庆典公司

杭州庆典公司：萧山|富阳演出公司选择杭州节目演出策划公司！提供；会展礼仪,平面模特,外籍模特,小提琴,迎宾礼仪,舞狮队,魔术,小丑气球,乐队表演,人偶兼职,会议礼仪,车展模特,平面模特,歌手,舞蹈演出,武术,少林功夫,特色节目。承接开业策划,周年庆典,会议服务,车展服务,时装走秀,商演路演,乔迁仪式,封顶仪式,奠基仪式,启动仪式,房产活动,会展服务,答谢会议,品鉴会等。

商业服务 2026-01-29 19:19:33

丰缩网

丰缩网是一个专注于生活领域的知识平台,提供全面的生活百科知识大全,包括美食、娱乐、家居、时尚、旅游与网络知识等,让生涩的知识简单易懂。

新闻资讯 2025-03-04 22:06:37

粤港澳大湾区

粤港澳大湾区是中国国家战略中的重中之重，旨在打造一个具有全球影响力的国际一流湾区和世界级城市群。可以将其理解为中国版的“旧金山湾区”或“东京湾区”。

财经金融 2026-01-24 17:02:04

2022狗头大作战免广告下载狗头大作战下载链接 (2021狗头)

狗头大作战是一款模型的沙雕狗子策略塔防类型游戏，这一期小编就来给大家介绍下2022狗头大作战免广告下载炫酷的技能丰富的玩法，给你带来的是不一样的游体验，喜欢就跟着小编一起了解下吧，狗头大作战手机扫码下载豌豆荚预约预约订阅最新动态玩家可以将你拥有的卡牌里边任意选择跟搭配，在这个即刻的战斗里边通过不同的卡牌技能能够帮你实现超多的小目标，阵...。

2025-02-11 21:10:56

2023热门的火柴人格斗游戏大全好玩的火柴人格斗游戏合集 (2023热门电视剧)

在游戏世界中，有一类简单而又富有魅力的游戏一直备受玩家们的喜爱那就是火柴人格斗游戏，这些游戏以其独特的艺术风格和快节奏的战斗场景闻名，玩家们可以在其中扮演火柴人形象，展开一场场惊险刺激的格斗对决，无论是在游戏机上还是手机上，这些火柴人格斗游戏都成为了众多玩家消磨时光的首选，1、，逗斗火柴人，火柴人在这款游戏里的身手十分敏捷，可以进行跳...。

2025-02-11 19:03:58

猫捉老鼠题材的游戏分享热门的猫捉老鼠游戏合集2024 (猫捉老鼠题材作文)

热门的猫捉老鼠游戏有哪些，这类游戏以其直观的操作和易于上手的特性，在玩家群体中享有极高的声誉，游戏中，玩家将面对多种多样的老鼠角色，每种老鼠都拥有独特的技能和行为模式，极大地丰富了游戏的策略性和娱乐性，这些元素共同构成了一个既简单又深邃的游戏世界，等待着每一位玩家的探索和征服，老鼠变得更轻松，1、，猫和老鼠，经典的猫鼠追逐战被赋予了全...。

2025-02-10 01:51:01

将评选年度最优秀商业视频创作 B站举办首届花火奖 (年度最佳评选)

12月19日，哔哩哔哩，以下简称，B站，正式启动首届花火奖，并于上海举办线下终审评选，作为B站首个聚焦商业视频创作的专业奖项，花火奖将基于创意表现力、商业价值、传播力等维度综合评审，从数万个优质商业视频中遴选出该年度最优秀的近30个作品，自2020年成立以来，花火平台作为服务UP主与品牌方的官方内容合作平台，一直都是UP主创意内容与...。

2024-12-04 01:09:23

4D打印裙诞生还有什么能阻止她们买买买！ (4d 打印)

尽管4D打印技术出现的时间还非常短，但这并不影响它的发展，这不，美国麻省科技设计公司，NervousSystem，近日研发出一种利用4D打印技术，制造弹性贴身布料，并打印出了全球第一件，4D裙，这款裙子还可以根据穿戴者的体型情况进行自我改变，这或许正是女性衣柜里缺的那件衣服，而制作该裙子的布料纤维由2279个三角形和3316个连接点...。

2024-12-03 18:16:25

众里寻它千百度不如找DataFox探个底细 (众里寻它千百度,蓦然回首,它在灯火阑珊处什么意思)

销售人员不得不面对的一个问题是，在茫茫商海中凭一己之力找到自己觉得富有前景的公司，需要那么一点运气，，找个好理由打电话过去，防止被当作骚扰电话，，一次又一次地在搜索引擎上换关键词以碰运气找到潜在客户的信息……很多销售人员把广撒网的目标放在了展会上，有些人收获了大额的订单，但更多的人花了大量时间还是跑了个空，这一点让在高盛ESSG工作了...。

2024-12-03 17:18:48

陶瓷厂压机操作工有职业病吗 (陶瓷厂压机操作规程)

陶瓷厂压机操作工有职业病吗陶瓷压机岗位接触粉尘和噪声，假设不留意防护的话，是有或者患上职业病的，有或者，不必定，陶瓷成型机械干压机是什么设施摘要，陶瓷成型机械干压机是一种消费陶瓷的机械设施，驳回的是干压成型的方法，将粉料装入模具中，在压力机上加压，使粉粒在模具内相互接近，并借内摩擦力结实地联合，构成必定状态的坯体，成型坯体内孔隙尺寸清...。

2024-07-07 07:52:22

公众朗逸新款报价 (大众2022款朗逸)

公众朗逸，作为公众旗下的一款出色车型，仰仗其出色的销量、品质以及口碑，在汽车市场上占据了一席之地，关于许多生产者而言，了解朗逸的多少钱是他们最为关心的疑问之一，朗逸，这款紧凑级轿车，早已在生产者中赢得了，声名在外，的佳誉，其出色的体现不只使它终年位居销量榜单前列，甚至偶然能够登顶冠军宝座，充沛展现了其特殊实力，就多少钱而言，朗逸的官网...。

2024-07-07 00:42:52

荣威rx5二手车多少钱? (荣威rx5二维码在哪里找)

荣威RX5二手车的多少钱普通在5万，9万左右，荣威RX5逾越系列是2019年6月27日全新上市的车型，共推出8款车型，官网指点价在9.98，15.98万元之间，该系列车型不只满足真国六排放规范，还新增了两款高品价比车型和银叶金车身配色，并全系标配律动Pro展翼格栅，新车的轴距长达2700mm，同级最大全景天窗面积到达0.86m2，能源...。

2024-07-02 00:17:59

与科技大佬相关的文章聚合

介绍IT、互联网圈的科技大佬的故事。

2024-01-08 00:51:47

三理由认为五月将迎开门红_黄家茶社

三理由认为五月将迎开门红_黄家茶社_新浪博客,黄家茶社,

2023-11-11 04:48:56

2022个人所得税退税流程_2020年个人所得税如何退税操作步骤

又到了一年一度的退税时间，如何退个人所得税就上了热搜，相信很多用户还不知道如何具体申请退税操作，下面小编就给大家带来了2022年个人所得税退税流程详细操作教程感兴趣的小伙伴快来本站看看吧。2022年个人所得税如何退税操作步骤第一步：准备申报

2023-10-11 03:04:04

文章推荐

2024最受欢迎的农场种地游戏排行榜农场种地游戏好玩的有哪些 (2024最受欢迎暗黑界女演员)

现在人们生活工作非常繁忙，农场种地游戏成为很多人钟爱的游戏类型，将玩家带入虚拟的农场世界，远离喧闹，寻找一片安静的土地开荒种植、照顾动物，激发人们对大自然的向往，同时也能在种植养殖时获得满足感并打造轻松世界，今天为大家推荐2024最受欢迎的农场种地游戏吧，这是休闲益智类网络游戏，可以种植放牧体验，体验悠闲的农场生活，游戏中有多种农作物...。

2025-02-11 23:55:04

资讯动态

广西大学电气工程学院成立退伍大学生功能型团支部 (广西大学电气工程及其自动化怎么样)

中国青年报客户端讯，中青报·中青网记者谢洋，12月1日，广西大学电气工程学院退伍大学生功能型团支部，前往中广核广西防城港核电有限公司走访优秀退伍大学生毕业生校友，开展以，退伍再出发，职规进企业，为主题的社会实践活动，广西大学电气工程学院现有退伍大学生在校生26人，占全校退伍大学生在校生比例达23.42%，这些学生在部队服役期间，曾参与...。

2024-12-05 16:53:12

资讯动态

抖音短视频怎么关闭时间管理提醒 (抖音短视频怎么剪辑制作)

抖音短视频可以说是大家现在社交的主流软件之一了，拥有诸多功能和优质内容，大家不仅能在这里学习各种知识，同时还能在这里观看各种视频来打发时间，那么抖音短视频怎么关闭时间管理提醒呢?下面小编就为大家带来详细介绍，感兴趣的朋友快来看看吧，...。

2024-12-02 20:15:05

技术教程

详细参数对比分析哪个更好当贝F5和明基W1130X有哪些区别 (一加ace5参数详细参数对比)

发表在当贝投影仪2022，10，3116，07当贝F5和明基W1130X都是今年推出的家用投影仪，两者的质量性能各方面配置都相当不错，对于一些想要选购这个价格范围的投影仪的朋友，可能会比较纠结哪一款更好一些，更值得去购入，那么接下来就带大家了解一下当贝F5和明基W1130X有哪些区别，通过详细的参数对比分析来决定哪一款更好用，当贝F5...。

2024-11-28 23:05:06

网络百科

网友这回成了发福中年男人的衣柜了周杰伦代言海澜之家 (别人说你成网红了,该怎么回答)

前几天，海澜之家官宣了新的代言人，这次换成了周杰伦，很多人应该会很惊讶，为什么周董会代言海澜之家呢，不知道大家对海澜之家这个品牌有什么看法呢，海澜之家给人的感觉是专卖男装的品牌，就连广告词都是，男人的衣柜，一年逛两次就够，，海澜之家给人的感觉是太正经了，不时尚，简直就要成了中年人的衣柜了，不知道周杰伦的粉丝看了海澜之家的广告视频，有没...。

2024-11-18 22:45:53

资讯动态

如何使用 Google AutoAugment 改进图像分类器 的 (如何使用google play)

从数据中学习增强策略

如何将AutoAugment策略应用于您的问题

相关文章

文章推荐

如何使用 Google AutoAugment 改进图像分类器的 (如何使用google play)