研究院王超岳 优必选悉尼 AI 基于生成对抗网络的图像编辑方法 (中科院王越超)

雷锋网 AI科技评论按,近些年来,生成对抗网络在许多图像生成和图像编辑任务上都获得了很大的成功,并受到越来越多的关注。对于图像编辑任务,现在面临的两个重要的挑战分别是:如何指导网络向目标图像学习(以提升图像编辑的效果)和如何感知输入图像内容(以提升图像编辑的精度)。

悉尼科技大学 FEIT 三年级博士生,优必选悉尼AI研究院访问学生,陶大程教授学生王超岳在雷锋网 AI研习社主办的学术青年分享会上结合他的两篇论文 Tag DisentangLED Generative AdveRSArial Networks for Object Image Re-rendering (IJCAI 2017 Best student paper)和 Perceptual Adversarial Networks for Image-to-Image Transformation (arXiv 2017),分享了对图像编辑做出的相应探索。

分享内容如下:

常见的图像编辑有图像去雨(雪)、图像填充、素描到照片、风格转换、图像超分辨率、图像上色、图像旋转、时间变换等,抽象来说就是给定一张图像以及要求,来生成新的图像。即让机器理解图像和生成图像。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

生成对抗网络是由Goodfellow在2014年提出的,算是一种新的网络架构,可以做有监督或无监督的学习。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

基于GANs的图像编辑框架如下所示:

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

接下来介绍第一篇论文,用于图像转换任务的感知对抗网络(Perceptual Adversarial Network,PAN)。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

近两年基于GANs的框架,有很多不同的优化,下图是对Pixel-wise loss、GANs loss和Perceptual loss的对比工作

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

Pixel loss优点是使用简单、训练速度快、稳定,缺点是输出图像模糊,质量低。

GAN loss优点是能提升生成图像质量,更加真实,锐利,缺点是学习整体生成分布,无法单独使用。

Perceptualloss优点是注重图像包含的高维特征,感知效果,缺点是受限于预训练的其他网络。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是对提升生成图像质量做出的一些研究,引入不同的loss来生成不同的输出图像。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

他们希望有新的loss函数来弥补现有的问题,持续缩小生成图像和真实图像的差距。基于这样的想法提出了感知对抗损失。 优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

使用感知对抗损失的理由如下:

感知:衡量生成图像和真实图像的高维特征的差异,并致力于缩小他们。

对抗:当现有高维特征的差异小于一定数值m ,D网络被更新以寻找新的高维空间,以进一步缩小仍存在的不同。

统一:所有训练统一在一个GAN框架中,无需引入其他预训练网络,且不受任务限制。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

他们引入感知对抗loss加GAN loss的结构,在这里引入GAN loss来让生成图像的整体分布符合真实图像的整体分布。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是针对于这个网络的相关实验,主要有图像的去雨、从分割后的label的图像到街景的重现、卫星图到谷歌地图的转换、图像补全、素描生成真实图像的任务。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是对比图像去雨雪的任务,他们的模型在色差的控制等方面都有所提升。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是图像补全任务,对比CVPR 2016的Context Encoder,PAN能得到更加优化的效果。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

进行Pixel2pixel实验时与pix2pix做了对比,也可以看到明显提升。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

解决图像生成的质量之后,还有一个问题:interpretable。也就是如何解开神经网络的黑箱,并帮助计算机进一步理解图像。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

针对于如何在图像转换过程中理解整个网络,并控制中间层信息的表征,他们提出标签分解生成对抗网络(Tag Disentangled Generative Adversarial Networks, TDGAN),用于进行目标图像的再次渲染(Re-rendering)。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

给定输入图像,里面会包含一系列的输入信息,人脑看到之后很容易分理出这些信息,但之前的网络很难理解这些信息,因此很难对输入图像进行精细编辑,现在他们想要让网络能更进一步理解这些信息。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

他们提出分解表征法。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

解决方案:标签。只要简单的改变标签,就能很容易生成微笑的图像。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

基于此,他们提出TDGAN,包括下图四个子网络。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

网络的框架图如下:

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

主要有f1、f2、f3、f4四个约束项:

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

这四个子网络采用如下交替训练的形式:

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下面是工作相应的实验结果,给定单张椅子,给定一些想要的角度,可以生成不同角度的效果,另外可以生成人在不同光线及表情下的效果。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

下图是他们在两个数据集下做的一些任务。可以通过给定单张椅子照片,生成不同角度的椅子;也可以控制输入人脸图像的多种性质,如改变其角度,光照,表情等。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

总结如下:现有的很多方法都是在GANs的框架下,希望提升现有的图像编辑效果和提升图像编辑的精度,他们做了以下尝试,去让任务表现更好。

第一是从学习的层面,不再只是从像素层面或固定高维空间上去缩小真实图像和转换图像之间的不同,而是利用对抗学习的思想去持续寻找并缩小真实图像和转换图像之间尚存的差异。另一方面,他们希望算法可以更深入的理解图像,并帮助计算机能更加智能,通过提取和分解图像中包含的各种信息,让算法可以更精确的编辑图像,从而得到想要的结果。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结

Perceptual Adversarial Networks for Image-to-Image Transformation

论文地址:

Tag Disentangled Generative Adversarial Networks for Object Image Re-rendering

论文地址:

本次分享的视频如下:

雷锋网 AI科技评论整理编辑。

原创文章,未经授权禁止转载。详情见 转载须知 。

优必选悉尼 AI 研究院王超岳:基于生成对抗网络的图像编辑方法 | 分享总结


本文地址: https://www.gpxz.com/article/03e64c9b9a9fcb2329d2.html
全局中部横幅
全局中部横幅
从松花江到辽河:生态发展新画卷

从松花江到辽河:生态发展新画卷 ---松花江流域和辽河流域土壤肥沃,自然资源丰富。近年来,通过多方位、立体式治理,松花江和辽河水质稳中向好,生态环境持续改善,绿意盎然的生态画卷正徐徐铺展。

hao123

hao123是汇集全网优质网址及资源的中文上网导航。及时收录影视、音乐、小说、游戏等分类的网址和内容,让您的网络生活更简单精彩。上网,从hao123开始。

大德康元

大德康元设立于中国休闲服装名城、著名侨乡—福建省石狮市,座落在商贸繁荣的石狮市区,是集自主研发、制造、销售一体的综合性企业,产品丰富,涵盖了燕窝、人参、冬虫夏草、石斛、海参、鲍鱼等地道产品,代用茶系列、汤包系列等自主研发产品;以制药企业GMP的标准生产,确保产品安全。 公司秉持“厚德载物,悬壶济世”理念,立心为民,以德先行。公司经过几代人的不懈奋斗,已经发展到拥有自主知识产权品牌、独资并通过国家GMP认证的中药饮片生产基地,以及具有自身特色和市场竞争优势的商贸模式。品牌获得了全国质量诚信承诺示范企业、“福建省著名商标”等荣誉。

手机同花顺财经

核新同花顺网络信息股份有限公司(同花顺)成立于1995年,是一家专业的互联网金融数据服务商,为您全方位提供财经资讯及全球金融市场行情,覆盖股票、基金、期货、外汇、债券、银行、黄金等多种面向个人和企业的服务

调节手绳

深圳市永兴盛世实业有限公司是一家专业从事挂绳饰品生产的企业,成立于2015年,我们拥有先进的生产设备和专业的设计团队,致力于为客户提供高质量、个性化的挂绳饰品。

相亲网

相亲网所有用户均通过实名认证,旨在为同城单身男女、中老年、高端白领、大龄青年创造一个真实靠谱的网上相亲平台。相亲网不要钱的同城相亲活动相亲会更让你大胆去爱!

浙江璟恩物联网科技有限公司

浙江璟恩物联网科技有限公司是专业从事燃气行业,智慧燃气解决方案服务商,软硬件研发资深专家组成的强大技术团队.

友友悠游

友友悠游,经验、搜索、网址、导航、软件、干货分享

gm1
gm1

Gm1.Com传奇风云榜,推荐真正的传奇私服品牌大服,GM玩家自由交流,敞开心扉畅所欲言,这里也有最精彩的传奇私服直播,玩传奇,新开传奇就上传奇风云榜!

全局底部横幅