对Xception 2017精彩论文解读 一种深度可分离卷积 CVPR 模型的介绍

文章编号:45545 资讯动态 2024-12-09 CVPR 论文

雷锋网 AI 科技评论按:虽然CVPR 2017已经落下帷幕,但对精彩论文的解读还在继续。下文是Momenta高级研究员王晋玮对此次大会收录的 Xception:Deep Learning with Depthwise Separable Convolutions

Inception模块是一大类在ImaGenet上取得顶尖结果的模型的基本模块,例如GoogLeNet、Inception V2/V3和Inception-ResNet。有别于VGG等传统的网络通过堆叠简单的3*3卷积实现特征提取,Inception模块通过组合1*1,3*3,5*5和pooling等结构,用更少的参数和更少的计算开销可以学习到更丰富的特征表示。

通常,在一组特征图上进行卷积需要三维的卷积核,也即卷积核需要同时学习空间上的相关性和通道间的相关性。将这两种相关性显式地分离开来,是Inception模块的思想之一:Inception模块首先使用1*1的卷积核将特征图的各个通道映射到一个新的空间,在这一过程中学习通道间的相关性;再通过常规的3*3或5*5的卷积核进行卷积,以同时学习空间上的相关性和通道间的相关性。

但此时,通道间的相关性和空间相关性仍旧没有完全分离,也即3*3或5*5的卷积核仍然是多通道输入的,那么是否可以假设它们可以被完全分离?显然,当所有3*3或5*5的卷积都作用在只有一个通道的特征图上时,通道间的相关性和空间上的相关性即达到了完全分离的效果。

若将Inception模块简化,仅保留包含3*3的卷积的分支:

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

再将所有1*1的卷积进行拼接:

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

进一步增多3*3的卷积的分支的数量,使它与1*1的卷积的输出通道数相等:

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

此时每个3*3的卷积即作用于仅包含一个通道的特征图上,作者称之为“极致的Inception(Extream Inception)”模块,这就是Xception的基本模块。事实上,调节每个3*3的卷积作用的特征图的通道数,即调节3*3的卷积的分支的数量与1*1的卷积的输出通道数的比例,可以实现一系列处于传统Inception模块和“极致的Inception”模块之间的状态。

运用“极致的Inception”模块,作者搭建了Xception网络,它由一系列SeparableConv(即“极致的Inception”)、类似ResNet中的残差连接形式和一些其他常规的操作组成:

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

作者通过TensorFlow实现了Xception,并使用60块NVIDIA K80分别在Imagenet和JFT(Google内部的图像分类数据集,包含17000类共3.5亿幅图像)上进行训练,并分别在ImageNet和FastEval14k上进行测试。在ImageNet上,Xception的准确率相比Inception V3有一定的提升,并比ResNet-152或VGG-16有较多提升(单个模型,单个crop):

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

在JFT/FastEval14k上,Xception取得了比ImageNet上相比于Inception V3更多的准确率提升:

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

同时,和Inception V3相比,Xception的参数量有所下降,而训练时的迭代速度也没有明显变慢:

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

另外,在ImageNet和JFT上的训练过程都显示,Xception在最终准确率更高的同时,收敛过程也比Inception V3更快:

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

在Xception中加入的类似ResNet的残差连接机制也显著加快了Xception的收敛过程并获得了显著更高的准确率:

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

值得注意的是,在“极致的Inception”模块中,用于学习通道间相关性的1*1的卷积和用于学习空间相关性的3*3的卷积之间,不加入任何非线性单元相比于加入ReLU或ELU激活函数将会带来更快的收敛过程和更高的准确率:

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍

这篇文章中提及的Depthwise Convolution操作,即group数、输入通道数和输出通道数相等的卷积层,在最近一年内被多篇CNN模型结构设计方面的工作所使用,包括Factorized Convolutional Neural Networks,Xception,MobileNet和ShuffleNet等,以及ResNeXt一文中使用的大量分group卷积操作也与之有相似之处。它们有的在ImageNet上取得了非常好的结果,有的大幅降低了模型的理论计算量但损失较少的准确度。本文作者从空间相关性和通道间相关性的角度解释Depthwise Convolution,认为这是将学习空间相关性和学习通道间相关性的任务完全分离的实现方式。

事实上,这一操作也可以从低秩角度理解,即将每个输入通道上可学习的卷积参数的秩限制为1。不过潜在的问题是,虽然Depthwise Convolution可以带来准确率的提升或是理论计算量的大幅下降,但由于其计算过程较为零散,现有的卷积神经网络实现中它的效率都不够高,例如本文中Xception的理论计算量是远小于Inception V3的,但其训练时的迭代速度反而更慢一些。期待后续会出现更加高效的Depthwise Convolution实现。

版权文章,未经授权禁止转载。详情见 转载须知 。

CVPR 2017精彩论文解读:对Xception(一种深度可分离卷积)模型的介绍


本文地址: https://www.gpxz.com/article/c3b100c964587f6cf746.html
全局中部横幅
全局中部横幅
百度安全社区

百度安全社区旨在打造安全行业技术型社区,沉淀最有价值的安全行业资料,帮助企业、个人开发者获取最新安全资讯,学习最前沿的安全技术,了解最酷的安全产品。

上海宣传片制作

上海鸿鹿文化传媒有限公司专业提供上海宣传片制作、广告片、短视频、产品宣传片拍摄、视频拍摄制作、动画视频等服务。拥有宣传片制作、拍摄、策划团队。专业的企业宣传片为您快速提升企业形象,锁住客户!

法律咨询

法律咨询就到找律网-这是一个专业的律师法律咨询网,为需要法律咨询及聘请律师的朋友提供快捷、高效的寻找律师、在线咨询律师、学习法律知识、合同协议范本下载、查询律师、查询律师事务所等服务,是网上找律师的优选网站!

济南工程职业技术学院招生办公室

济南工程职业技术学院,招生办公室,招办

束缚文化馆

束缚文化馆专注分享束缚小说和故事。

易可图

易可图专注融合AI,重塑电商图片编辑体验。提供商品图AI智能换背景、AI模特试衣、一键抠图、图片批量编辑等功能。更有海量电商模版,快速出图,适用各大电商平台,让商品视觉更出众!

青年创业加盟网

中国青年创业加盟网为想创业的您提供,连锁加盟项目,好生意加盟网涵盖:餐饮、酒店、教育、金融、服装、母婴、汽车、家具等行业品牌招商加盟项目,及新闻资讯,加盟指南,加盟常识等信息,愿好青年创业加盟网为您的创业加盟,品牌招商贡献一份力量。

金丰源机械

金丰源机械,青岛金丰源机械制造有限公司

天津普尔兰德旅游装备有限公司

天津普尔兰德旅游装备有限公司是集研发、生产、销售于一体的中国户外品牌公司.企业致力于户外生活的推广,倡导更多的人去体验露营休闲、山野探险等户外活动,放松心情,去感受大自然的种种乐趣。“PURELAND”带给大家的是一种健康向上的生活态度,用我们的专业引领大众享受到休闲、自在、无压力的生活状态,用独特的角度去扩展大众在社会压力下的另一番视野。公司以自身独特的企业文化、高效的运营管理模式,已使公司旗下品牌“PURELAND”成为中国本土户外品牌的中坚力量。

全面战争:幕府将军2

全面战争:幕府将军2游戏专题;提供全面战争:幕府将军2中文版下载,全面战争:幕府将军2攻略大全,全面战争:幕府将军2汉化补丁,全面战争:幕府将军2视频解说,攻略视频,修改器,汉化下载,完美存档,MOD,配置,教学,截图,壁纸等资料。更多《全面战争:幕府将军2》相关内容尽在游侠网。

分板机,苏州分板机,冲床分板机,昆山分板机

苏州市宇顺力电子有限公司智造研发销售分板机苏州分板机在线全自动分板机基板分切机fpc板剪切冲床vcut分板机fpc分切机冲床分板机昆山fpc分板机,江苏上海浙江嘉兴江西安徽分板机...咨询电话:18925724175/13450659407

提取物厂家

赣州佰珍堂香料有限公司专业为您提供提取物厂家,植物提取液厂家,化妆品原料厂家,植物提取液,提取物,提取液,发酵液,中药材,化妆品原料的相关信息,想要了解更多详情,请联系我们.

全局底部横幅