显著降低模型训练成本的主动增量学习 CVPR 2017精彩论文解读 (显著降低模型的方法)

雷锋网 AI 科技评论按:计算机视觉盛会 CVPR 2017已经结束了,雷锋网 AI 科技评论带来的多篇大会现场演讲及收录论文的报道相信也让读者们对今年的 CVPR 有了一些直观的感受。

相对于 CVPR 2017收录的共783篇论文,即便雷锋网 AI 科技评论近期挑选报道的获奖论文、业界大公司论文等等是具有一定特色和代表性的,也仍然只是沧海一粟,其余的收录论文中仍有很大的价值等待我们去挖掘,生物医学图像、3D视觉、运动追踪、场景理解、视频分析等方面都有许多新颖的研究成果。

所以我们继续邀请了宜远智能的刘凯博士对生物医学图像方面的多篇论文进行解读,延续之前最佳论文直播讲解活动,陆续为大家解读2篇的论文。

刘凯博士是宜远智能的总裁兼联合创始人,有着香港浸会大学的博士学位,曾任联想(香港)主管研究员、腾讯高级工程师。半个月前宜远智能的团队刚刚在阿里举办的天池 AI 医疗大赛上从全球2887支参赛队伍中脱颖而出取得了第二名的优异成绩。

在 8 月 1 日的直播分享中,刘凯博士为大家解读了「Fine-tuning Convolutional Neural Networks for Biomedical Image Analysis: Actively and Incrementally」(用于生物医学图像分析的精细调节卷积神经网络:主动的,增量的)这篇论文,它主要解决了一个深度学习中的重要问题:如何使用尽可能少的标注数据来训练一个效果有潜力的分类器。以下为当天分享的内容总结。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

刘凯博士:大家好,我是深圳市宜远智能科技有限公司的首席科学家刘凯。今天我给大家介绍一下 CVPR 2017 关于医学图像处理的一篇比较有意思的文章,用的是 active Learning 和 incremental learning 的方法。

今天分享的主要内容是,首先介绍一下这篇文章的 motivation,就是他为什么要做这个工作;然后介绍一下他是怎么去做的,以及在两种数据集上的应用;最后做一下简单的总结,说一下它的特点以及还有哪些需要改进的地方。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

其实在机器学习,特别是深度学习方面,有一个很重要的前提是需要有足够量的标注数据。但是这种标注数据一般是需要人工去标注,有时候标注的成本还是挺高的,特别是在医学图像处理上面。因为医学图像处理需要一些 domain knowledge,就是说医生对这些病比较熟悉他才能标,我们一般人是很难标的。不像在自然图像上面,比如ImageNet上面的图片,就是一些人脸、场景还有实物,我们每个人都可以去标,这种成本低一点。医学图像的成本就会比较高,比如我右边举的例子,医学图像常见的两种方式就是X光和CT。X光其实一个人一般拍出来一张,标注成本大概在20到30块钱人民币一张;CT是横断面,拍完一个人大概有几百张图片,标注完的成本就会高一点,标注的时间也会比较长。

举个例子,比如标1000张,这个数据对 deep learning 来说数据量不算太大,X光需要2到3万人民币、3到4天才能标完;CT成本就会更长,而且时间成本也是一个很重要的问题。那要怎么解决深度学习在医学方面、特别是医学图像方面的这个难题呢?就要用尽量少的标注数据去训练一个 promising 的分类器,就是说一个比较好的分类器。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

那我们就要考虑要多少训练数据才够训练一个 promising 的分类器呢?这里有个例子,比如左边这个图,这个模型的 performance 随着数据的增加是一个线性增长的过程,就是说数据越多,它的 performance 就越高。但在实际中,这种情况很少出现,一般情况下都是数据量达到一定程度,它的 performance就会达到一个瓶颈,就不会随着训练数据的增加而增加了。但是我们有时候想的是把这个临界点提前一点,让它发生在更小数据量的时候。比如右边这个图的红色虚线部分,用更小的数据达到了相同的 performance。这篇论文里就是介绍主动学习 active learning 的手段,找到一个小数据集达到大数据集一样的效果。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

怎么样通过 active learning 的方式降低刚才右图里的临界点呢?就是要主动学习那些比较难的、容易分错的、信息量大的样本,然后把这样的样本标记起来。因为这些是比较难分的,容易分的可能几个样本就训练出来了,难分的就需要大量的数据,模型才能学出来。所以模型要先去学这些难的。

怎么去定义这个“难”呢?就是 “难的”、“容易分错”、“信息量大” ,其实说的是一个意思。这个“信息量大”用两个指标去衡量,entropy大和diversity高。entropy就是信息学中的“熵”,diversity就是多样性。这个数据里的多样性就代表了模型学出来的东西具有比较高的泛化能力。举个例子, 对于二分类问题,如果预测值是在0.5附近,就说明entropy比较高 ,因为模型比较难分出来它是哪一类的,所以给了它一个0.5的概率。

用 active learning 去找那些比较难的样本去学习有这5个步骤

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

刚才的文字讲解可能不是很直观,我们用一个图来看一下。这个图从左到右看,一开始灰蒙蒙的意思是都还没有标注,然后用一个pre-trained model去预测一遍都是哪个类。这样每个数据上都有一个概率,可以根据这个概率去选择它是不是难分的那个数据,就得到了中间这个图,上面那一段是比较难的,然后我们把它标注出来。然后用一个 continuous fine-tune 的 CNN,就是在原来的模型上再做一次 fine-tune,因为有了一些标注数据了嘛,就可以继续 fine-tune了。fine-tune后的模型对未标注的数据又有了一个预测的值,再根据这些预测值与找哪些是难标的,把它们标上。然后把这些标注的数据和之前就标注好的数据一起,再做一次continuous fine-tune,就得到 CNN2了。然后依次类推,直到把所有的数据都标完了,或者是在没有标完的时候模型的效果就已经很好了,因为把其中难的数据都已经标完了。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

刚才提到了两个指标来判定一个数据是不是难分的数据。entropy比较直观,预测结果在0.5左右就认为它是比较难分的;但diversity这个值不是很好刻画,就通过> CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

这就会产生一个问题,原始的图像,比如左边这只小猫,经过平移、旋转、缩放等一些操作以后得到9张图,每张图都是它的变形。然后我们用CNN对这9张图求是一只猫的概率,可以看到上面三个图的概率比较低,就是判断不出来是一只猫,我们直观的去看,像老鼠、狗、兔子都有可能。本来这是一个简单的例子,很容易识别出来这是一只猫,但是增强了以后反而让模型不确定了。这种情况是需要避免的。

所以这种时候做一个 majority selection,就是一个少数服从多数的方式,因为多数都识别出来它是一只猫了。这就是看它的倾向性, 用里面的6个预测值为0.9的数据,上面三个预测值为0.1的就不作为增强后的结果了 。这样网络预测的大方向就是统一的了。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

这篇文章的创新点除了active learning之外,它在学习的时候也不是从batch开始,而是sequential learning。它在开始的时候效果就不会特别好,因为完全没有标注数据,它是从一个ImageNet数据库训练出的模型直接拿到medical的应用里来预测,效果应该不会太好。然后随着标注数据的增加,active learning的效果就会慢慢体现出来。这里是在每一次fine-tune的时候,都是在当前的模型基础上的进一步fine-tune,而不是都从原始的pre-train的model做fine-tune,这样就对上一次的模型参数有一点记忆性,是连续的学习。这种思路就跟学术上常见的sequntial learning和online learning是类似的。但是有一个缺点就是,fine-tune的参数不太好控制,有一些超参数,比如learning rate还有一些其它的,其实是需要随着模型的变化而变化的,而且比较容易一开始就掉入local minimal,因为一开始的时候标注数据不是很多,模型有可能学到一个不好的结果。那么这就是一个open的问题,可以从好几个方面去解决,不过解决方法这篇文章中并没有提。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

这个方法在机器学习方面是比较通用的,就是找那些难分的数据去做sequntial的fine-tune。这篇论文里主要是用在了医学图像上面,用两个例子实验了结果,一个是结肠镜的视频帧分类,看看有没有病变、瘤之类的。结论是只用了5%的样本就达到了最好的效果,因为其实因为是连续的视频帧,通常都是差不多的,前后的帧都是类似的,不需要每一帧都去标注。另一个例子也是类似的,肺栓塞检测,检测+分类的问题,只用1000个样本就可以做到用2200个随机样本一样的效果。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

这个作者我也了解一些,他是在 ASU 的PhD学生,然后现在在梅奥,美国一个非常著名的私立医院梅奥医院做实习,就跟需要做标注的医生打交道比较多。这相当于就是一个从现实需求得出来的一个研究课题。

总结下来,这篇文章有几个比较好的亮点。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结

我今天分享的大概就是这些内容。其实这里还有一个 更详细的解释 ,最好还是把论文读一遍吧,这样才是最详细的。

Q:为什么开始的时候 active learning 没有比random selection好?

A:其实不一定,有时候是没有办法保证谁好。active learning在一开始的时候是没有标注数据的,相当于这时候它不知道哪些数据是hard的,在这个医学数据集上并没有受到过训练。这时候跟 random selection 就一样了,正在迁移原来 ImageNet 图像的学习效果。random selection 则有可能直接选出来 hard的那些结果,所以有可能比刚开始的active selecting要好一点,但这不是每次都是 random selection 好。就是不能保证到底是哪一个更好。

(完)

雷锋网 AI 科技评论整理。系列后续的论文解读分享也会进行总结整理,不过还是最希望大家参与我们的直播并提出问题。

中山大学金牌队伍分享获奖经验:如何玩转图像比赛

原创文章,未经授权禁止转载。详情见 转载须知 。

CVPR 2017精彩论文解读:显著降低训练成本的主动增量学习 | 分享总结


本文地址: https://www.gpxz.com/article/3dbcf2257fc77c1955dc.html
全局中部横幅
全局中部横幅
拼多多招商平台

拼多多/商城/入驻/开店/赚钱/招商/电商/商家/登录/pdd/砍价/拼单/京东开店/淘宝开店

火种特训

中山市火种户外运动拓展有限公司是一家从事火种特训,青少年夏令营,企业团建等项目的户外运动拓展公司.我们致力于为客户提供高质量的户外拓展活动,帮助参与者锻炼身体,增强团队合作能力,提升个人自信心.选择我们,您将会获得一次难忘的户外拓展体验.联系方式:18022144944

【云骑士装机大师】简单操作的U盘启动盘制作工具

云骑士是一款集成一键重装系统,是一款绿色、免费的在线重装win7/win10/xp/win11系统的工具,软件自带原版系统下载,0基础的小白也能秒变装机大师,在线极速重装只需简单几步,就能让你的电脑焕然一新,电脑运行慢了,卡了.不求人,轻轻一键,开启电脑小白装机时代,小白也变装机大师!

金属检测机,金属异物检测机,食品金属检测仪【九地金属检测机】

九地金检机厂家,主要销售日本安立品牌金属检测机,食品金属检测机,金属异物检测机,检重秤等产品,解决各个行业的金属杂质检测难题,检测精度高,质量好,价格公道。

淄博金河风机有限公司

淄博金河风机有限公司淄博金河风机有限公司矿用节能风机生产厂,已通过质量体系认证。电话:13506436681

小暖旅游攻略网

旅游是结合自己的喜好,主动挖掘尚未熟知的目的地,获得更独特的体验。旅游是一种情绪消费,远离居住地的旅游愈发成为人们舒缓心境、重获力量的重要目的。旅游赋予身心新能力、新视角、新体会。

广告公司

广告公司-传播易是提供4A广告公司与广告媒体资源整合和广告媒体交易的媒介平台,提供的4A广告公司服务方案是广告主首选的广告公司,4a广告公司排名系统深受广告公司好评!✅

河北工程技术学院

河北工程技术学院是经国家教育部批准成立的全日制普通本科院校。学校成立于1997年,2001年改建为石家庄法商职业学院,2011年学院更名为石家庄城市职业学院,2014年升格为本科院校,更名为河北工程技术学院。

国正联大公共管理研究院

国正联大公共管理研究院(简称研究院)是一家集产学研转化、智力输出、产业孵化器为一体,致力于搭建政校企平台,联动各大高校为全国党政机关和企业经营管理提供培训及咨询服务的综合性研究智库单位。

南京仁康体检

南京仁康体检中心是一家专业的职业、健康体检机构,为您的健康保驾护航

尼尔理财

尔理财是一家专业的财经网站,致力于为用户提供全面、准确的财经资讯和深入的投资分析。我们聚集了一支由行业内顶尖专家组成的团队,为用户提供权威可靠的财经信息和精准的投资建议。

天气预报24小时查询

天气预报30天主要提供最新、准确、今日实时的天气预报30天(一个月)查询服务,通过天气预报30天查询结果可以知道未来30天天气预报、气温、风向,旅游、出差请收藏天气预报30天。


全局底部横幅