倍 扩散模型是风口 4.5 2022 中国论文数量为美国的 AI 全景报告出炉 剑桥 (倍扩散模型是谁提出的)

近日,剑桥大学的2022年 AI 全景报告(《State of AI Report 》)出炉!

报告汇总和聚焦了过去一年里 AI 行业中炙手可热的事件,援引数据来自知名科技公司和研究小组,由投资者 Nathan Benaich 和 Ian Hogarth 编写,从研究、产业、政策、安全、预测五个维度出发,对最新的 AI 发展现状和未来预期进行深度分析。



扩散模型火热、模型开源提速

从研究领域来看,今年 AI 发展呈现五大趋势:

基于文本到图像的生成能力,扩散模型(Diffusion Models)席卷计算机视觉世界

扩散模型是深度生成模型中新的 SOTA,在一些基准测试中,其图像生成能力超越了 GAN,是当前文本生成图像最火热的模型,并逐渐扩大到文本生成、文本转音频、文本转视频以及分子设计等领域。

今年4月,OpenAI 发布 DALL-E 2,只需要给到寥寥几句文本指示就可以生成全新的图像,刚亮相就在图像生成和图像处理领域引发极大的关注度。不久,谷歌也紧接着推出的 Imagen,基于大型 Transformer 语言模型在理解文本方面的能力和扩散模型在高保真图像生成方面的能力,将文本生成图像的逼真度和语言理解提到了新高度。

而真正将生成式 AI 推向创作高潮的,是 Stability.Ai 在8月份公开发布的 Stable Diffusion 模型,只需输入几行文字描述,几秒钟后,AI 便能生成一幅幻彩斑斓的画作。

可以看到,目前 Stability.ai 和 Midjourney 等公司所创建的文本转图像模型,已经可以跟发展成熟的 AI 实验室的产品相媲美,其中,Midjourney 采用了订阅制的收费模式已经盈利,Stability 的模型则是开源的。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

此外,基于扩散的文本到视频生成的研究也从今年4月左右就展开了。

9月下旬,Meta 发布“Make-a-Video”,宣布了从文本到视频生成的 DELL-E 时刻早于预期,文本转视频的扩散模型首次在业界引起轰动。不到一周后,谷歌也发布了两个模型:基于扩散模型的 Imagen 和非扩散模型的 Phenaki,后者能够通过附加提示动态来调整视频生成。

AI for science,聚焦塑料回收、核聚变反应堆控制和天然产物发现等更多科学问题

在 AI for science 研究中,今年有不少突出的工作。

其中,DeepMind 与悉尼大学、牛津大学合作,将 AI 模型应用到数学领域的拓扑和表示论猜想,提出了一种新的算法,通过研究纽结的结构,发现数学在不同领域中的隐藏联系,该研究发表在《自然》杂志上。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

一年前,DeepMind 发布 AlphaFold2,以原子水平的准确度预测了三分之二的蛋白质结构,并与 EMBL-EBI 共同发布蛋白质结构数据库 AlphaFold DB。

到了今年7月28日,DeepMind 宣布 AlphaFold DB 已从 100 万个结构扩展到超过 2 亿个结构,扩大超过 200 倍,可用于植物、细菌、动物和其他生物的蛋白质预测结构,极大地提升了人们对于生物学的理解。

在塑料回收方面,来自 UT Austin 的研究人员设计了一种能够降解 PET 的酶(PET 是一种占全球固体废物12%的塑料),称为 PET 水解酶( FAST‑PETase),能够在一周内几乎完全降解51种不同产品,并且还可以从回收的单体中重新合成 PET FAST‑PETase。

标度法则重新聚焦数据:模型标度并不是全部都需要的,朝单一模型发展,其核心在于数据

对于通用多任务、多模式模型的尝试,可以追溯到谷歌此前提到的“一个模型来学习”。

此前有研究发现,LLMs 可实现让机器人通过自然语言对每个步骤的解释来完成各种任务,但由于对机器人所处环境和现实能力缺乏认知,LLMs 的解释时常会出现无法被理解的情况。随着 PaLM-SayCan 的出现,这一问题也已经得到解决。

DeepMind 推出的 Gato 将这项工作带到了另一个层次,通过一个1.2B参数转换器,可以实现在机器人、模拟环境、视觉和语言中执行数百项任务。

此外,Transformer 作为一种解码器架构,当前其影响力已经超出 NLP,在计算机视觉上也发挥着重要作用,正在成为真正的跨模态产品。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:与 Transformer 相关的论文占比

社区驱动的大型模型开源速度加快,集合模式可以参与同大型实验室的竞争

OpenAI、DeepMind 旗下有多个模型已被开源社区实现、克隆和改进,进度远超预期。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:社区驱动的 GPT 等开源

尽管 AI 研究将越来越集中于少数大型实验室,但随着计算成本和访问权限的降低,因此也出现了最先进的研究在更小、以前不为人知的实验室得到提出等情况,同时,这些新的独立研究实验室也在迅速开源。

受神经科学的启发,AI 研究方法向认知科学的方向发展
2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:中美 AI 论文数量对比

数据显示,自2010年以来,中国机构撰写的 AI 论文数量是美国的4.5倍,远远超过美国、印度、英国和德国的总和。

同时,中国的论文更关注与监控相关的任务,包括对象检测、跟踪、场景理解、动作和说话者识别等。




AI 初创公司投资放缓
新贵 AI 半导体初创公司与 英伟达 相比是否有作为?

报告显示, 英伟达的芯片在 AI 研究论文中最受欢迎, GPU 的使用率是 ASIC 的131倍,是 Graphcore 、 Habana 、 Cerebras 、 SambaNova 和 Cambricon 的芯片总和的90倍,是谷歌 TPU 的78倍,是 FPGA 的 23 倍。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:英伟达芯片在 AI 论文中的引用数量

招聘冻结和 AI 实验室解散,促使许多初创公司从 等巨头中诞生

DeepMind 和 OpenAI 的校友各自开花,组建了许多新的初创公司,分别研究不同领域的 AI 技术,如:AGI 、人工智能安全、生物技术、金融科技、能源、开发工具和机器人技术。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:由 DeepMind 和 OpenAI 分解出来的初创公司

最新 技术被大型科技公司和初创公司转化为商业开发人员工具

OpenAI 的 Codex 迅速从 2021 年 7 月的研究演变为 2022 年 6 月的开放商业化,微软的 GitHub Copilot 现在以每月 10 美元到每年 100 美元。亚马逊在 2022 年 6 月发布了 CodeWhisperer 预览版。谷歌透露,其内部正在使用以 ML 驱动的代码完成工具,也许几年内会出现在浏览器 IDE 中。同时,拥有 100 多万用户的 Tabnine 筹集了 1500 万美元,承诺有望实现准确的多行代码填写。

人工智能加快药物研发,促进医疗产业发展

人工智能药物发现公司在临床试验中拥有 18 项资产,高于 2020 年的 0 项。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:每家公司各个阶段的资产数量和资产百分比

另外,由于放射科医生的短缺和成影数量的增加,通过评估X光片针对疾病变得更有挑战性。因此立陶宛初创公司 Oxipit 创建了一个名叫 ChestLink 的计算机视觉系统,该系统可以自动报告没有异常的胸部 X 光片,就无需放射科医生来检查,这是业界首个基于计算机视觉的诊断自主认证。

大学是孕育人工智能公司的温床

目前,大学是人工智能公司重要的资源来源,包括> 随着市场的扩大,对AI初创公司的投资速度在放缓

与去年相比, 2022 年预计使用AI的公司融资额将减少36%,但仍有望超过 2020 年的水平,这与全球所有 Start-up 阶段和 Scale-up 阶段的公司投资相当。

VC 投资的下降在 1 亿以上的轮次中最明显,而投资规模较小的轮次预计到 2022 年底全球将达到 309 亿美元,与 2021 年的水平相当。

综合公共企业价值(EV)已经下降到 2020 年的水平。同时,私营企业的估值不断增长,综合企业价值已经达到 2.2 万亿美元,比去年增长 16% 。

图注:对 AI 初创公司的投资(按轮次)以及对所有初创公司的投资(按轮次)

目前美国的AI独角兽公司数量领先,其次是中国和英国。 美国已经创造了 292 家 AI 独角兽公司,企业价值合计 4.6 万亿美元,中国创造了 69 家 AI 独角兽公司,企业价值合计 1.4 万亿美元,英国创造了 24 家 AI 独角兽公司,企业价值合计 2070 亿美元。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:各个国家独角兽企业数量以及独角兽企业

尽管对于美国 AI 初创公司的投资大幅度下降,但它们仍然占全球人工智能总投资的一半以上。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:对 AI 公司的投资金额

企业软件是全球投资最多的类别,而机器人技术占据了 AI 风险投资的最大份额。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:各个领域投资金额

尽管 IPO 和 SPAC IPO 的数量急剧下降,但 AI 公司的收购数量可能会超出 2021 年的水平。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:全球 AI 公司的退出数量,以及 2022 年退出的 AI 企业




对未来一年的预测

在2021年的报告中,曾对2022年 AI 的发展情况做出了8项预测,其中已实现 Transformers 在游戏中超过人类表现,这主要得益于 DeepMind 的 Gato 模型可实现对未来状态和动作的预测,日内瓦大学提出的 IRIS 模型则解决了 Atari 环境下的任务。

未实现的预测中提到,Graphcore、Cerebras、SambaNova、Groq、Mythic 中至少有一家被大型科技公司或者半导体公司收购,在今年也没有实现;ASML 的市值当前仅为1650亿美元,距预期中的5000亿美元还存在很大差距;JAX 框架的使用仍然占 Papers With Code 每月回购的不到1%,未达到预测中的5%。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:2021年预测中共4项实现

还有一些往年的预测在今年实现了,其中,美国 CHIPS 法案在今年禁止接收方在中国扩大业务,原预测中英伟达最终未能完成对 Arm 的收购、该交易也于今年正式取消。在 AI 初创公司方面,Helsing(德国)在今年筹集了1亿美元的A轮融资。

而对于一直备受关注的 AI 治理问题,2019年预测至少有一家主流 AI 公司会对治理及管理模式作出实质性的调整,Anthropic 也在今年成立、作为公益性公司活动。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

图注:2020年及之前的预测在今年实现

报告中也提出了对未来12个月的9项预测,分别是:

你觉得哪些可能会实现呢?

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

版权文章,未经授权禁止转载。详情见 转载须知 。

2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍


本文地址: https://www.gpxz.com/article/277e3348063605fc8ff1.html
全局中部横幅
全局中部横幅
纳米AI

纳米AI,首创多智能体蜂群,一句话生成专家级视频、报告、PPT。纳米AI,集成MCP万能工具箱,打破信息围墙,让搜索更全、更广、更深、更专业。纳米AI,集成DeepSeek,智脑,通义千问等十六家大模型,支持深度推理、个人知识库管理等功能。

传声筒科技

传声筒科技(www.cst21.com.cn)汇聚智能科技前沿资讯,为你提供最新最全的国内外智能领域成果、产品信息!

防黄剂,丁酰肼原药,异戊烯醇321,对苯二酚,异戊醇,异戊烯醛

济南欣烨化工有限公司是一家集科研,销售防黄剂,丁酰肼原药,防黄剂HN-130,防黄剂HN-150,防黄剂,丁酰肼原药,异戊烯醇321,对苯二酚,异戊醇,异戊烯醛,异丙叉丙酮,异丙醚,异己二醇,二甲硫基甲苯二胺,二乙基甲苯二胺,

男人袜

国内首家男袜包年订购服务商,创办11年,品质如一。男人们应该省下买袜子的时间,去做更有挑战的事业!

金蝶云星辰

精斗云是金蝶旗下面向小微企业的SaaS云服务品牌,以财税创新为核心,以全渠道营销为目标,提供金蝶云星辰、云会计、云进销存、云报销、云财贸等云服务。在线使用无需安装及维护,满足管理者随时随地业务处理、财务记账、数据分析与决策的需求。

制管机

双特制管机是一家不锈钢制管机厂家、公司产品有:制管机、焊管机、不锈钢制管设备、不锈钢焊管机、高频焊管机及其它配套设备,以敏锐的市场触觉探索业内最新资讯,以市场需求为导向,以客户为中心,为不锈钢行业的发展和繁荣,做出贡献,并热忱欢迎社会各界人士加盟双特,共创美好明天!

青岛枞木酒业有限公司品牌网站

青岛枞木国际酒业有限公司是一家专业的进口红酒品牌加盟服务商,青岛枞木国际酒庄目前控股枞木国际(智利)酒庄、枞木国际(澳洲)酒庄,并与西班牙的维拉玛利亚酒庄达成深度战略合作。

朗镜科技

朗镜科技是领先的新零售AI和大数据服务平台,为您提供货架图像识别,实体零售图像识别,商品图像识别,消费品图像识别,零售终端货架识别,众包渠道检查,数据化陈列,货架商品识别,神秘访客,渠道终端稽查,门店稽查服务。

考拉游戏网

考拉游戏网是面向手机游戏玩家的综合门户,提供有趣有态度的最新手游内容。汇聚手游社区、热门手游礼包,新游、泛娱乐、手游排行榜等,让你Get最新手游、分享你的热辣点评。

采华科技网

上海倍华文化传播有限公司---以设计、制作、代理、发布各类媒体广告为主的综合性文化传播公司。我公司目前除广告业务外,已与国内多家杂志社合作并担任异地采稿和封面、插页广告采集。


全局底部横幅