祭出100亿参数的 参数量翻了10倍!Meta AI 新SEER 为元宇宙铺路 (祭献亿万回报)

文章编号:46035 资讯动态 2024-12-09 AI Meta 自监督学习 SEER

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

去年3月提出的10亿参数自监督模型 SEER (SElf-supERvised)又取得了新突破:新的 SEER 参数量翻了10倍,达到了100亿参数,可以取得更优秀、更公平的性能表现!

以下我们暂且称新的 SEER 模型为“SEER 10B”(一个牛逼不足以形容 Meta AI 在行动上落实自监督的野心,手动狗头)。

根据 Meta AI 的团队介绍,他们将 SEER 10B 模型在50+个基准与多个不同未标记数据集上进行了测试。其中,SEER 10B 不仅在 ImaGenet 上取得了高达 85.8% 的准确率(排名第一),与原先只有 10 亿参数量的 SEER (84.2%)相比性能提升了 1.6%。

此外,SEER 10B 在性别、肤色、年龄等三个公平基准上获得了更出色的识别效果,明显优于监督模型。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

留意 Meta AI 的朋友不难发现:最近,Meta AI 首席科学家 yann LeCun 与 Meta 创始人扎克伯格在公开发言中坚持强调自监督学习的优越性。上周, LeCun还提到自监督与世界模型 ,将 AI 最终能学会像人类一样学习与推理的希望寄托在这两个方法上。

所谓“自监督学习”,就是 AI 系统可以直接从文本、图像或其他类型的无标记数据中直接学习,主要针对解决监督学习所需的海量标记数据问题,因为在现实研究中,要获取大量的标记数据难度极高。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

LeCun一直认为,自监督学习是构建具有背景知识或“常识”的机器、以解决远远超出当今 AI 任务的最有前景的方法之一。

但同时,也有读者评价 Meta 倡导的自监督本质上不过是强化学习。不久前,“怼王”Jürgen Schmidhuber 也发表文章,称“All You Need Is Supervised Learning”,重申监督学习在突破 AI 瓶颈中扮演的重要角色。

勿论其他,那么,Meta AI 在自监督学习上有哪些研究实践?参数量翻了10倍的 SEER 模型又有哪些新花样?一起来看看~



SEER 从 1B 到 10B

去年3月初,Meta AI(原 Facebook AI)发布了10亿参数自监督模型 SEER,曾在 AI 领域引起广泛关注。

据 Meta 介绍,这是他们在计算机视觉领域所取得的第一个基于自监督学习方法的成果:它可以直接从互联网的任一随机图像集合中学习,无需详细的数据管理和标记,随后直接输出图像嵌入。

经过一年的提升,如今 Meta 的研究团队将 SEER 的参数量扩大了10倍,在原有的基础上取得了更出色的性能表现:

除了可以在无标记数据上直接学习,SEER 还可以提取更高质量的视觉特征,以及发现现实世界大规模图像数据集中的显著信息,方式与人类分析所观察事物之间的关系的方式来了解世界般相似。

注意:这些数据集的覆盖范围是全球数万亿张随机、未经处理的图像。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

据悉,扩大了10倍密集参数后的 SEER 是当前规模最大的密集计算机视觉模型。

他们在 50 多个基准上检验了 SEER 模型的性能,包括公平性、鲁棒性、细粒度识别,还在医学成像、卫星图像和光学字符识别 (OCR) 等领域的多个图像分类数据集上进行了实验。

不难想象,参数量翻倍后的 SEER 10B模型在一些挑战性较高的任务上也取得了更优秀的表现。

首先,100亿 SEER 在 ImageNet 上获得了高达 85.8% 的准确率,排名第一!

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

除了在标准计算机视觉基准上的优秀表现外,SEER还擅长处理高难度任务,并提高了对域外泛化的鲁棒性。

例如,它可以正确识别素描图和艺术画中的动物,还可以搞定常见的图像问题,例如掩装、模糊、遮挡、运动和怪异视角拍摄等。

SEER 10B 模型还能够捕获大量随机的、未经过滤的互联网图像中存在的显着信息,甚至跨越不同的地理和语言概念。

例如,即使该模型仅在没有位置信息或其他元数据的图像上进行训练,它也能够将全球多种语言的相同概念组合在一起。例如,将来自世界各地的“婚礼”概念嵌入到模型的特征空间中。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

除了性能的突破,Meta AI 还称:SEER 10B 模型能取得更公平的效果。

他们使用 Meta 新开源的 Casual Conversations 数据集以及他们最近为CV模型提出的新公平基准对 SEER 进行测试,发现与较小的 SEER 模型以及 ImageNet 训练的监督和自监督模型相比,SEER 10B 模型能更准确地识别这些社会成员属性,适用于不同性别、肤色和年龄的人。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

图注:该图使用 Casual Conversations 数据集显示了性别检索的准确性

此外,他们使用 Casual Conversations 数据集评估了模型标签的错误率,例如在给定特定的人像中预测“非人类”或“犯罪”等标签。研究表明,SEER 10B 问题不大,但在 ImageNet 上训练的监督模型却产生了大量的错误关联。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

图注:该图显示了 SEER 模型对不同人群的关联预测错误率

SEER 10B模型还不仅适用于欧美国家的图像示例,还适用于全球各地收入水平中下的地区,以前所未有的精度对图像进行地理定位。

通过在 Gapminder 的 Dollar Street 数据集(该数据集收集了世界各地家庭中的物体图像及家庭收入信息)上实验,他们还发现,SEER 10B模型对识别全球中低收入家庭与非西方地区家庭的性能有了大幅提升,且明显优于10亿参数的 SEER 与其他监督方法。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

图注:在 Meta AI 于 2020 年创建的数据集 Hateful Memes 上检测多模态(图像 + 文本)仇恨言论时,SEER 10B 的表现也优于受监督的 ImageNet 训练模型 2 个百分点。




对抗性攻击

Meta AI 的研究团队表示,秉着“负责任地开发 AI 系统”的原则,他们还对 SEER 10B模型进行了对抗性攻击,以保护训练数据的隐私安全。

他们在 Meta 的开源工具 Privacy Linter 上进行了测试,发现攻击的准确度(50.02%)仅略高于完全随机猜测,而随机攻击的准确度对于相同大小的训练集,准确度为 50%。

此外,他们计算了不同召回级别的精度,以确保没有训练图像在低召回级别中暴露——这种情况可能发生在所有得分最高的样本都属于训练集时;同时,精度低于 50.15% 适用于所有级别的召回(包括最低级别)。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

图注:由于 SEER 不依赖于标记数据集,所以它能够在一组比 ImageNet 的地理多样性更优的示例上训练模型

为了测试模型在对抗性攻击中的鲁棒性,他们将模型用于识别模糊、插入、已被裁剪或经过其他编辑的扭曲图像。其中,SEER 10B在 CopyDays 基准测试中实现了 90.6% 的平均精度,提高了 5.1%,超越了之前的最佳结果。

此外,SEER 在域外鲁棒性基准上优于在 ImageNet 上训练的最先进的自监督模型,并且随着规模的增大,鲁棒性也不断提高。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

目前,SEER 10B 的模型权重、实现细节与技术文档都已开放:

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

项目地址:




自监督学习与元宇宙

自监督学习是 Meta AI 首席科学家 Yann LeCun 近年来一直力推的研究方向。早在2018年Lecun就表示,人工智能的下一个发展方向可能是放弃深度学习的所有概率技巧,转而掌握一系列转移能量值的方法。与“常规”的深度学习标记训练方法相比,这一方式无需创建大量带标签的数据集,其基本设想是通过获取一些丰富的原始数据(如大量Facebook Live视频或Instagram照片)并“喂”给机器进行训练,训练的目标是达到能量值越小越好(即预测更为准确,与现实之间实现更好的兼容性)。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

基于能量的学习早就有之。在AI研究中,“能量函数”是一个上世纪80年代一度流行的“上古”概念,由美国生物物理学家霍普菲尔德(John Hopfield)发明的“霍普菲尔德神经网络”(HNN)引入并普及。Lecun认为,监督学习无法获得像人类一样可以泛化的智能,当 AI 系统不再需要监督学习时,下一次 AI 革命就会到来,而基于能量的学习正是“减少监督”的有效实现方式。

Lecun的这一思路,在他上周接受 IEEE Spectrum 的访谈中也可见一斑。他认为AI想要突破现在的瓶颈,必须让机器学习世界模型,从而能够填补缺失的信息,预测将要发生的事情,并预测行动的影响。这种学习范式与预测架构的不同,或许也是不久前Lecun对OpenAI创始人Ilya Sutskever提出的“大型神经网络可能有意识”坚决说不的原因。

ecun的力推下,META围绕自监督模型取得了一系列的研究成果(例如最近推出的多模态自监督学习新架构deta2vec等)。 这种通过自监督学习“观察世界并学习”、最终实现像人类一样泛化的智能的学习方式,一方面可以最大程度利用META丰富的数据资源,同时也是META抢先打造元宇宙世界、加速数字世界与现实世界融合的重要技术手段。

Meta AI ReseARCh 团队也表示,计算机视觉的发展是构建元宇宙的重要步骤,而自监督视觉模型 SEER 的增强无疑为元宇宙的更上一层楼作了铺垫。

举例来说,如果要打造一幅能够帮你导航寻找钥匙或教你如何做饭的 AR 眼镜,那么就需要机器能够像人类一样理解视觉世界。这些机器不单单要能在堪萨斯州和日本京都的厨房中工作,还要在吉隆坡、北京、纽约等等世界各地的厨房中工作,这就需要机器能识别常见物体的多种模样。而 SEER 10B 在多种不同数据集中的强大性能为实现突破提供了可能。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路

原创文章,未经授权禁止转载。详情见 转载须知 。

参数量翻了10倍!Meta AI 祭出100亿参数的“新SEER”,为元宇宙铺路


本文地址: https://www.gpxz.com/article/f0b0997ee3b4a5cd05ff.html
全局中部横幅
全局中部横幅
桥梁声测管厂家

沧州鑫亿呈钢管有限公司【桥梁声测管|桩基声测管|沉降板】厂家,专注于桥梁声测管|桩基声测管|沉降板研发生产,规格型号齐全,咨询热线:18732787027

推荐趣味话题干货和常识见解

挥林网,注重把趣味话题干货和常识见解文章推荐给需要的网友们。

铝格栅厂家

佛山市新景装饰材料有限公司是专业生产雕花铝单板、铝方通、遮阳百叶、铝扣板、金属天花板、铝扣板天花、铝格栅天花、铝挂片天花、铝幕墙、户外遮阳百叶及各类金属雕花板等装饰,物美价廉,欢迎来电洽谈!

商用厨房设备

煮面炉,冰淇淋机,可乐机,汉堡机,蒸烤箱,电炸锅,滤油车,扒炉,陈列保温柜,腌制机,裹粉台,中心岛,工作台,冷饮机,制冰机,冷柜,热饮,咖啡机,厨房配件,链式烤炉,汉堡设备,汉堡店设备,炸鸡店设备,炸鸡设备,汉堡店设备全套,奶茶店设备,奶茶设备厂家,奶茶店设备全套,水吧台定制,万能蒸烤箱,咖啡机,豪华组合炉,热风烤箱,炸炉,扒炉,火山石烧烤炉,中东烧烤炉,保温柜,保温汤池,商用厨房设备

山东振宇厨业有限公司【官网首页】

山东振宇厨业有限公司主要生产销售:厨房设备、厨具设备、餐厅设备、学校食堂设备、学校烹饪设备、商用厨房设备、炊具设备以及各种不锈钢调理设备、炉具,咨询电话:0543-2856122,传真:0543-2856133

四川星路广告传媒有限公司

星路传媒将不断进取开拓,着力打造成全市、全国乃至全世界最好的广告经营平台,为名品名牌广告天下,为社会发展传播能量。

人人BT

人人BT(www.RRBTs.org)是资源多,更新快的百度云网盘资源搜索引擎,BT种子搜索神器,有几千万的影视音乐、软件、电子书等百度云网盘、BT种子资源,本站实时通过DHT网络获取最新百度云盘资源。

郑州网店装修

郑州互淘工作室专业运营郑州淘宝店装修,郑州淘宝店铺装修,郑州淘宝网店装修,郑州淘宝店铺外包,郑州淘宝店宝贝描术图片处理,从根本上解决中小企业个人开网店不盈利的关键问题,已有上百家不同行业的网店受益,被誉为郑州信得过电子商务网络公司!咨询热线:0371-86012559

广州选格企业管理咨询有限公司

选格,选拔人才的标准。 郑观应《致潘兰史征君书》:“须先定人格,有品行,有学问,有历练方合选格,如不合格者不准入选,庶无劣员。”   选格咨询是选格控股旗下机构,中国本土具竞争力咨询公司之一,由国内知名的人力资源管理和组织发展专家创立,拥有一批适应本土咨询需求的顶尖实战派管理咨询专家团队,他们主要来自大型上市公司及知名企业的原高管、组织和人力资源专业领域的专家教授等。 选格咨询秉持着夯实的管理理论基础、先进的咨询方法论,熟知本土企业的文化管理基础与客观情况,确保咨询方案真正落地,并有效协助企业推动实施,取得真正的实效。我们倡导根植一线,咨询成果落地有声,秉承“强交互,简操作,见成效,助成长”的咨询理念,让客户实现高价值回报。 选格咨询聚焦关注人才发展与组织发展,结合国内咨询业发展现状和企业需求,我们倡导“教练式咨询、咨询式培训”等新型咨询方式,强调“互动、实效、易操作、有反馈”的咨询理念,着眼于与客户建立长期战略合作伙伴关系,让高水平的管理专家通过特有的方式使管理专家与客户高度互动、高效运作项目,与客户一起步步为营推进管理变革与管理提升,让客户实现高价值回报。 选格咨询与国内多个大中型企业建立了长期合作伙伴关系;与知名高校、商业协会、知名媒体多方位合作;与咨询业内多家咨询公司结成战略合作伙伴;国内外众多知名教授、学者组成我们的管理专家团队。 选格咨询在杭州、成都、上海等地设有分支机构,杭州选格企业管理咨询有限公司为选格咨询的属下机构。

全局底部横幅