如何优化你的图像分类模型效果 (如何优化你的人际关系)

文章编号:46029 资讯动态 2024-12-09 图像分类

图像分类是一个认为几乎解决了的问题。有趣的是,你必须竭尽所能来提升额外的1%的准确率。当我参加“ Intel Scene Classification Challenge hosted by Analytics Vidhya(由Analytics Vidhya主办的英特尔场景分类挑战)”我非常喜欢这次比赛,因为我尝试从我的深度学习模型中榨干所有的潜力。下面的技术通常是可以应用到手头上的任何图像分类问题中去。

问题

下面的问题是把给定的图片分类到下面的6个类别中去。

数据类别

数据中包含25,000张自然风景的图片,这些图片来自世界各地。

渐进的(图片)尺寸调整

训练CNN模型的时候,从小到大的线性调整图片尺寸是一项技术。渐进的尺寸调整在很赞的fastai课程中被描述为:程序员的深度学习实践。一种不错的方式是先用小的尺寸,如64 x 64进行训练,再用这个模型的参数,在128 x 128尺寸上进行训练,如此以往。每个较大的模型都在其体系结构中包含以前较小的模型层和权重。

fastai库是一个强大的深度学习库。如果fastai团队找到了一篇很感兴趣的论文,他们会在不同的数据集上进行测试,并实现调参。一旦成功,就会被合并到他们的库,并且对它的用户开放阅读。这个库包含了很多内置的先进的技巧。基于pytorch,fastai对于大多数任务都有很好的默认参数。部分技巧包括:

完整的权重初始化

在查看可用的标准数据集时,我偶然发现了Place365数据集。Place365数据集包含365种风景分类的1,800,000张图片。本次挑战赛提供的数据集与这个数据集很相似,所以在这个数据集训练的模型,具有一些学习的特征,与我们分类的问题是相关的。由于我们的问题中的类别是Place365数据集的子集,所以我使用了一个用Place365权重初始化的ResNet50模型。

这个模型的权重在“pytorch weights”中提供。下面使用的实用函数帮助我们正确地将数据加载到fastai的CNN学习器中。

混合增强

混合增强是一种通过对已有的两幅图像进行加权线性插值,来形成新图像的增强方法。我们取两张图像,然后使用这些图像的张量进行线性组合。

混合增强

λ是服从beta分布的随机采样。虽然论文的作者建议使用 λ=0.4,但是fastai的库默认值设为0.1。

fastai中的混合增强

学习率调优

学习率是训练神经网络中最重要的超参数之一。fastai有一种方法来找出合适的初始学习速率。这个技术被称作循环学习率,我们用较低的学习率进行试验,并以指数形式增加,记录整个过程的损失。然后我们根据学习率绘制损失曲线,并选择损失值最陡峭处的学习率。

在学习率为1e-06时,损失最陡峭

这个库还为我们自动的处理带有重新启动的随机梯度下降(SGDR)。在SGDR中,学习率在每次迭代开始时会重新设置为原始选择的数值,这些数值会随着迭代减小,就像余弦退火一样。这么做的主要收益是,由于学习率在每次迭代的开始可以重置,因此学习器能够跳出局部极小值或鞍点。

fastai中带有重启的随机梯度下降

通用对抗网络

生成式对抗网络(GAN是Generative Adversarial Networks的缩写)在2014年被Ian Goodfellow提出,GANs是由两个网络组成的深层神经网络结构,它们相互竞争。 GANs可以模拟任何数据分布。他们可以学习生成类似原始数据的数据,而且可以是任何领域——图像、语音、文本等等。我们使用fastai的Wasserstein GAN的实现来生成更多的训练数据。

GANs包括训练两个神经网络,一个被称为生成器,它生成新的数据实例,另一个被称为判别器,它对它们进行真实性评估,它决定每个数据实例是否属于实际的训练数据集。你可以从这个链接查阅更多。

去除混淆的图像

正如Andrej Karpathy所说,“数据调查”是一个重要的一步。关于数据调查,我发现很多数据包含不少于两种的类别。

方法-1

使用之前训练的模型,我对整个训练数据进行了预测。然后丢弃概率得分超过0.9但是预测错误的图像。下面这些图像,是模型明显错误分类的。深入观察以后,我发现这些图像是被人工错误分类了。

有些图像的预测概率在0.5到0.6之间,理论上可能是这个图像表现出不止一个类别,所以模型给他们分配了相同的概率,我也把这些图像剔除了。观察这些图像,这个理论最终被证明是正确的。

方法 2

fast.ai提供了一个方便的插件“图像清理器插件”,它允许你为自己的模型清理和准备数据。图像清理器可以清洗不属于你数据集的图像。它在一行中呈现图像,使你有机会在文件系统中删除文件。

测试时间增加

测试时间的增加包括提供原始图像的一系列不同的版本,并把他们传递到模型中。从不同的版本中计算出平均值,并给出图像的最终输出。

fast.ai中测试时间的增加

之前提出的10-crop技巧跟此技巧类似。我首先在残差网络的论文中读到了10-crop技巧。10-crop技巧包括沿着四角和中心点各裁剪一次,得到五张图像。反向重复以上操作,得到另外五张图像,一共十张。测试时间增加的方法无论如何比10-crop技巧要快。

集成

机器学习中的集成是一种使用多种学习算法的技术,这种技术可以获得比单一算法更好的预测性能。集成学习最好在下面的条件下工作:

在本例中,我通过选择最大发生类来集成所有模型的预测。如果有多个类有最大出现的可能,我随机选择其中的一个类。

结果:

公开排行榜——29名(0.962)

私人排行榜——22名(0.9499)

结论

想要继续查看该篇文章相关链接和参考文献?

点击 如何优化你的图像分类模型效果? 】 即可访问:

社长今日推荐: 2017春季CS231n斯坦福深度视觉

李飞飞主讲王牌课程,计算机视觉的深化课程,神经网络在计算机视觉领域的应用,涵盖图像分类、定位、检测等视觉识别任务,以及其在搜索、图像理解、应用、地图绘制、医学、无人驾驶飞机和自动驾驶汽车领域的前沿应用。

本课程完全免费!加入小组即可立即观看!

课程链接:

原创文章,未经授权禁止转载。详情见 转载须知 。

如何优化你的图像分类模型效果?


本文地址: https://www.gpxz.com/article/0b2709bcb8bccedf0d73.html
全局中部横幅
全局中部横幅
重庆不锈钢护栏和螺旋风管加工

重庆山之鹰金属制品有限责任公司咨询热线:18716364545,是重庆不锈钢加工和激光切割加工厂家,主营:不锈钢螺旋风管和护栏以及井盖和碳钢管道加工,不锈钢材料批发等。工厂专业加工,设备精良,成品品质保障,价格优惠。欢迎来电咨询。

康泓(东莞)医疗线束科技有限公司

康泓(东莞)医疗线束科技有限公司专业生产高频电刀电线、负极板连接线、血氧线、监护线、医用波纹管、理疗连接线、镊子连接线等各类标准性或定制医疗线束的研发制造及其配套销售服务。工厂已全面通过ISO9001、ISO13485和IATF16949质量管理体系认证。配置国外高端的全自动化生产设备,如全自动端子机,全自动剥皮沾锡机,全自动多根打端子沾锡机,全自动剥皮沾锡机等。

重庆电话录音系统销售中心

重庆电话录音系统销售中心历经10多年专业从事电话录音设备等安装、销售及渠道批发的企业!主要对座机电话录音、无线对讲机录音、交换机分机录音、拾音器信号录音,窗口对讲录音,会议电话录音等。

成都夹芯板

金堂荣旺彩钢有限公司是一家主要从事于成都夹芯板,成都钢材,成都彩钢瓦,成都岩棉板销售的公司,咨询电话:18382020988,欢迎新老顾客前来咨询,本公司竭诚为您服务!

洁净化验室净化建设

华锐净化工程公司(www.vnnu.cn)是专业的实验室装修、实验室建设、实验室设计、实验室改造,实验室装修公司、实验室建设公司、实验室设计公司、实验室改造公司、实验台厂家,总部位于四川省成都市,服务于:食品药品、检验检疫、环境水务、医疗卫生、第三方实验室领域;行业经验丰富,资质齐全。

有源电力滤波器

上海伟肯实业有限公司(www.chwicn.com)是从事有源滤波器、多功能谐波保护器、低压静电无功发生器、有源电力滤波器、开发与制造的专业化高科技企业,伟肯实业——专业的有源滤波器厂家!

BOPP预涂膜

BOPP预涂膜,PET预涂膜-扬州众和同盛包装材料有限公司_扬州众和同盛包装材料有限公司于2007年开始致力于预涂膜的研发与市场的开拓。

医用电气设备安规测试仪

电励士(上海)电子有限公司隶属于德国GMC-I高美测仪,提供电力新能源,汽车,医疗,光伏,通讯,光学,航空等领域测试测量仪器,产品包括万用表,安规测试仪,功率分析仪,电能质量分析仪,变送器等

幻域坊游戏网

幻域坊游戏网是玩家的游戏攻略集散地,提供全面的游戏攻略、秘籍和游戏资讯。我们的网站内容更新迅速,确保玩家能够第一时间获取最新的游戏攻略和信息。

正野排气扇,正野换气扇,安静的换气扇第一品牌,正野电器,正野排气扇,正野换气扇,正野排风扇,正野办事处

正野电器超静音排气扇产品设计咨询服务,正野换气扇价格,正野排风扇型号,正野排气扇报价:13601886499林先生

设计在线

深圳包装设计是一家10年品牌服务经验的深圳设计公司,致力于产品包装设计、平面画册品牌设计,为您全方位设计定制产品专属的包装设计。

全局底部横幅