的逼真效果更进一步 ML AR 谷歌 通过引入 实时自拍 ARCore

雷锋网 AI 科技评论按:ARCore 是谷歌于去年 2 月份正式推出的 增强现实(AR)软件开发工具包,给开发者提供了一个开发 AR APP 的平台。不到一个月前,谷歌正式推出 ARCore 1.7 版本,为其添加了前置摄像头 AR 自拍能力以及动画效果支持;而日前,谷歌又为其引入了机器学习技术,使其实时自拍 AR 的逼真效果更进一步,该技术相关的文章发布在谷歌 AI 的官方博客上,雷锋网 AI 科技评论编译如下。

通过将数字内容与信息叠加到物质世界的真实场景中,来让人类实现超越现实的感官体验。例如, 谷歌地图的 AR 功能 ,能够在现实场景中叠加方向信息来为你指路。借助于 Pixel 相机中的 Playground 模式 ,你可以使用 AR 从不同的视角看世界。并且通过借助于最新发布的 「YouTube Stories」 以及 ARCore 全新的面部增强(Augmented Faces)API ,你可以在自拍上添加动画面具、眼镜、帽子、皮肤等特效。

实现这种 AR 功能的关键挑战之一,就是以合适的方式将虚拟内容锚定到现实世界:这一过程需要一套能够追踪到每一次微笑、皱眉或假笑的高动态表面几何结构的独特的感知技术。

通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步

ARCore 的3D 网格以及它能实现的一些特效

为此,我们引入了机器学习(ML)技术来推断近似的 3D 表面几何结构,并且仅需要用到一个单摄像头输入而无需使用专用的深度传感器。这种方法利用面向移动 CPU 界面推断或其可用的全新移动 GPU 功能的 TensorFlow Lite ,实现了逼真的实时 AR 效果。与「 YouTube Stories」 全新的创作者特效所利用的技术一样,这项技术已通过 最新的 ARCore SDK 和 ML Kit Face Contour Detection API 向广泛的开发者社区开放。

用于自拍 AR 的机器学习工作流

我们的机器学习工作流由两个协同工作的实时深度神经网络模型组成:一个是探测器,它在整张图像上运行并计算出面部位置;另一个是通用的 3D 网格模型,它在探测器计算出来的面部位置上运行,并通过回归预测近似的表面几何结构。精确地裁剪面部能够极大地减少对一般的数据增强的要求,例如由旋转、平移和比例变换组成的仿射变换(affine transformations)等,同时让网络将大部分性能投入于预测坐标来提高其准确性——这对于锚定合适的虚拟内容至关重要。

裁剪完所关注的位置后,该网格网络一次仅应用于一个单帧,并利用加窗平滑(windowed smoothing)来减少面部处于静态时的噪音,同时避免在大幅移动期间出现的延迟。

通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步

针对 3D 网格,我们采用了 迁移学习 ,并训练了一个具有多个目标的网络:该网络能够同时地基于合成、渲染的数据预测 3D 网格坐标以及基于类似于所提供的带有注释的、现实世界的数据预测 2D 语义轮廓。最终的网络为我们提供了基于合成数据乃至现实世界数据的合理的 3D 网格预测。所有模型都在源自于地理学多样化的数据集的数据上进行训练,并接着在平衡、多样化的测试集上进行定性和定量性能的测试。

3D 网格网络接收经裁剪的视频帧作为输入。由于它不依赖于额外的深度输入,因而也可以应用于预先录制的视频。该模型不仅输出 3D 点的位置,还输出在输入中存在并合理对齐的面部概率。一种常见的替代方法就是为每个地标预测出 2D 热图,但这种方法并不适用于深度预测,并且对于如此多的数据点来说,使用这种方法耗费的计算成本非常高。

通过迭代自展和精炼预测,我们进一步提高了模型的准确性和鲁棒性,同时也将数据集发展成为愈加具有挑战性的实例,如鬼脸,拍摄角度倾斜以及面部遮挡等。此外,数据集增强技术也扩展了可用的 ground truth 数据,并开发出了对摄像头瑕疵等人工产品问题或极端光照条件具有弹力的模型。

通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步

数据集扩展和改善路径

我们使用 TensorFlow Lite 进行设备内置的神经网络推理。 新推出的 GPU 后端 加速能够有效提升性能,并显著降低功耗。此外,我们还设计了具有不同性能和效率特性的一系列模型架构,来覆盖到更加广泛的消费级硬件。较简单网络之间的最重要的区别就在于残差块(Residual Block)设计和可接受的输入分辨率(最简单模型中的输入分辨率为 128×128 像素,而最复杂模型中的输入分辨率为 256×256)。同时,我们还改变了层数以及子采样率(输入分辨率随网络深度的减少而减少的速度)。

通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步

这一系列的优化的结果就是:使用更简单的模型带来了实质性的加速,同时也将 AR 特效质量的降低幅度最小化。

通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步

最复杂模型(左)和最简单模型(右)的比较:在简单模型上,时序一致性以及对嘴唇、眼睛的追踪稍微降低。

这些成果最终则能够通过以下方式,让用户在 YouTube、ARCore 以及其他客户端体验到更加逼真的自拍 AR 效果:

通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步

另外,我们还通过以下方式实现了逼真的妆容效果:

通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步

案例对比:5 个目标在不同光线下的真实化妆效果以及 AR 化妆效果

我们很高兴将这项新技术分享给创作者、用户以及开发者。感兴趣的读者可以通过下载最新的 ARCore SDK (下载地址:)来将这项技术用起来。未来,我们还计划将这项技术广泛应用到更多的谷歌产品线中。

via:

原创文章,未经授权禁止转载。详情见 转载须知 。

通过引入 ML,谷歌 ARCore 实时自拍 AR 的逼真效果更进一步


本文地址: https://www.gpxz.com/article/68867ff6d1d7db833149.html
全局中部横幅
全局中部横幅
腾讯体育

腾讯体育是全国亿万体育迷喜爱的社区平台,我们提供顶级赛事直播和丰富高燃的精彩视频,还有专业实时的赛场数据、及时权威的热点资讯、懂球有梗的聊球社区。等你一起为热爱加冕!

深圳市阳光博睿教育技术有限公司

深圳市阳光博睿教育技术有限公司,是国内领先的移动数据技术提供商深圳市梦网科技发展有限公司的全资子公司

SEO网站优化

深圳万创科技有限公司是一家专注SEO网站优化,百度优化,外贸网站优化,整站优化,网站优化推广,网站建设,SEO优化为主的一站式营销型网络公司,为数万家企业网站建设提供解决方案。

飞机票查询

飞猪是阿里巴巴旗下的综合性旅游出行服务平台。飞猪整合数千家机票代理商、航空公司、旅行社、旅行代理商资源,直签酒店,客栈卖家等为广大旅游者提供特价机票,酒店预订,客栈查询,国内外度假信息,门票购买,签证代理,旅游卡券,租车,邮轮等旅游产品的信息搜索,购买及售后服务。全程采用支付宝担保交易,安全、可靠、有保证。

遂宁冷库安装,遂宁冻库造价,遂宁冻库安装,遂宁保鲜库设计,遂宁小型冷库安装公司,遂宁气调库建造,遂宁冷藏库价格,遂宁冷库设备,遂宁冷库,遂宁冻库,遂宁气调库,遂宁保鲜库工程

遂宁大洋绿洲制冷工程有限公司,13880221178造价低8%,冷库修建造价合理,专业承接各类大小型冷库、冻库、蔬菜保鲜库,水果保鲜库、气调库、冷藏库、设计安装,专业从事冷库设计、销售、安装8年,服务于上千余客户.

诗词

恒修居为古诗词翻译古诗词朗诵,各类古籍等内容

兆信科技官网

兆信科技是一家专注于一物一码全链路数字化解决方案服务商,基于一物一码的产品数字化身份管理,为每一个产品提供唯一的身份ID。兆信科技六大核心业务品牌防伪、品质溯源、数字化营销、数字化赋码、数字化渠道、数据洞察为企业提供产品全生命周期管理。欢迎电话咨询:400-815-5999

CTFer

CTFer(www.ctfer.com)专注网络安全、信息安全、白帽子技术的在线学习,实训平台。提供优质的赛事及学习服务,拥有完善的题目环境及配套writeup,降低CTF学习入门门槛,快速帮助选手成长,跟随主流比赛潮流

快乐下载

快乐下载是一个安全可靠的绿色软件下载中心,我们致力于为用户打造安全迅捷的软件下载体验,如果我们提供的资源帮到了你,欢迎你向你的朋友们推荐一下本站~

昱唯

昆山昱唯网络科技有限公司成立于2017年,总公司上海昱唯商贸有限公司,成立于1999年,昆山昱唯是一家从事互联网产品销售的公司,公司属于腾讯云代理商,百度云代理商 ,京东云代理商 ,阿里云代理商 ,火山引擎代理商 ,天翼云代理商 ,移动云代理商,华为云代理商 ,法大大代理商 ,知道创宇代理商 ,用友代理商 ,企业微信代理商 ,400电话/1010电话/95/96电话总代,联想T

厦门市佳庆网络科技有限公司

厦门市佳庆网络科技有限公司【咨询电话:18020726693】,公司主营厦门网站优化,厦门站群优化,厦门网站建设,厦门网站推广,厦门小程序开发,厦门谷歌推广,微信朋友圈推广公司已成为腾讯企业邮箱的品牌代理商。

辽宁三三工业有限公司

辽宁三三工业有限公司(三三工业)位于东北老工业基地辽宁省辽阳市。三三工业是辽宁省重点工业企业,国家级高新技术企业、省守合同重信用企业、省诚信示范企业,是中央国债资金重点支持企业。


全局底部横幅