如何让AI像人类一样学习自然语言 CMU博士生杨植麟 (ai怎么让图片变成想要的形状)

文章编号:44947 资讯动态 2024-12-09 自然语言处理 人工智能

雷锋网AI科技评论按 :近几年,由于深度神经网络的快速发展,自然语言处理借此取得了重大突破,但同时也达到了它的发展瓶颈期。因此,研究如何让 AI 像人类一样去学习自然语言成为了现在研究者们最关心的问题。

近期,在雷锋网 GAIR 大讲堂上,来自卡内基 · 梅隆大学三年级博士生杨植麟同学分享了无监督学习和情景化学习的一些最新进展,其中包括一篇 ICLR Oral 论文的解读。视频回放地址:

杨植麟,卡内基梅隆大学博士三年级,师从苹果人工智能主任 Ruslan S.,主要研究无监督深度学习及其在自然语言理解的应用;过去两年在 ICLR/NIPS/ICML 等人工智能顶会发表 11 篇文章 (9 篇一作);曾在 Facebook 人工智能实验室从事研究工作,本科以年级第一毕业于清华计算机系。

分享主题 :让人工智能像人类一样学习自然语言:无监督学习和情景化学习的最新进展

分享提纲

分享内容:

近几年,深度神经网络在自然语言学习任务上取得众多突破,但是仍然依赖于大规模静态标注数据。与此相反,人类学习语言的时候并不需要大规模监督信号,并且可通过与环境的交互理解语言。

先来回顾一下近些年 NLP 发展的状况。NLP 发展的黄金时期出现在 2013 年末和 2014 年这段时间。这段时间出现三个非常重要的技术:Word embeddings;Seq2seq;Attention,这三项技术基本奠定了 2014 年之后的 NLP 发展基础。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

从2015年到现在,大家做的主要事情就是把三个技术都用上,做各种各样的变种,用在不同的任务上来检验模型效果。单从效果上来看,还是有到很多突破的。但有两点需要注意,依赖监督学习可能已经做到了极限;监督学习有两个问题,一是依赖大规模标注数据集,二是依赖静态数据集。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

反观人类是如何学习语言的?人类只需要非常少的监督信号,通过动态与环境交互,在环境中执行一些行为,得到一些反馈,进行学习语言。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

如果让机器像人类一样学习,就需要突破监督学习的瓶颈。接下来讲的就是在这一方面的探索,怎样让机器像人类一样学习自然语言。

先看一下这个,Mastering the Dungeon : Grounded Language Learning by Mechanical Turker Descent。其中的

Mastering the Dungeon 是我们创造的一个游戏环境,Mechanical Turker Descent 是我们发明的算法名字。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

图中的两个人(Turker1 和 Turker2)相当于平台上的两个用户。他们每个人负责训练一个 dragon,如果 dragon 赢了,对应的人会获得奖励。这样 Turker 就会受到激励,会给 dragon 更好的样本学习,让它在比赛中击败其他 dragon。

下图反应了 dragon 在游戏环境中具体是如何交互学习的,以及具体的游戏环境是怎么样的。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

这个交互学习算法的名字叫 Mechanical Turker Descent。第一步,每一个 Turker 会给 dragon 一些训练数据,第二步,用数据集训练出一个模型。第三步,这些模型会放在其他数据集上交互验证,每个模型会得到分数,获得高分的 Turker 会获得奖励。第四步,所有的数据将合并起来,进入下一轮,直到训练出比较好的 agent。

这个算法其实既有比赛,又有合作。Turker 为了赢得奖励,所以他们之间相互比赛,促使他们提供更好的数据给 dragon。同时他们又是合作的,在每一轮结束后都会把数据合并起来进入下一轮,这些数据在下一轮都会共享。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

这样的算法有四个优点:

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

实验结果

通过实验得出几点结论,实验中的交互学习算法确实比传统通过标记数据的静态学习效果要好。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

limit 是指限制 Turker 每一轮给的训练数据数量。在给同样奖励的情况下,发现如果不限制 Turker,他会多给 dragon 30% 的数据,最终的模型表现效果也较好。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

在模型有反馈和没有反馈的两种不同情况下,其性能表现也有很大的差别。如果把模型反馈去掉,所有的指标都会下降,说明动态调整训练数据的动态分布是非常重要的。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

接下来为大家介绍一篇 ICLR Oral 论文。论文题目为:Breaking the Softmax BOTTleneck A High-Rank RNN Language Model。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

我们首先证明了softmax存在表达能力上的根本缺陷,继而提出了混合softmax (mixture of softmaxes)的方法,先算K softmaxes,然后用weighted sum得到最后的概率。这个方法在大家常用的语言模型数据集中,取得了当前最好的结果。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

由于篇幅限制,这里就不做文字解读了,大家如果感兴趣可以直接去看这篇论文或者观看视频回放:

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结

未来最重要的两个研究方向,一个是无监督学习,另一个是 language grounding。

无监督学习可以学习有价值的和可传递的特征表示,可以改善低资源和高资源任务; 可以用于监督或无监督任务的元学习。language grounding 可以提供足够复杂的环境,是一种非常有效的学习算法。

以上就是本期嘉宾的全部分享内容。更多公开课视频请到雷锋网 AI 慕课学院观看。

关注微信公众号:AI 科技评论,可获取最新公开课直播时间预告。

原创文章,未经授权禁止转载。详情见 转载须知 。

CMU博士生杨植麟:如何让AI像人类一样学习自然语言?| 分享总结


本文地址: https://www.gpxz.com/article/c88144a1be86ef289a54.html
全局中部横幅
全局中部横幅
网址导航

网址导航――RC0991.COM是最实用的上网导航网站,是方便网民上网的入口平台,及时收录包括网络电视、电景、音乐、视频、小说、游戏等热门分类的优秀网站,与搜索完美结合,提供最简单便捷的网上导航服务,是数千万网民的上网主页。

广西建筑模板厂家

「紫豹木业」是一家贵港超大的生产基地排名前十的广西专业建筑模板厂家,提供优质建筑模板生产批发,价格合理,服务全国,专注建筑模板,覆膜板,清水模板,建筑红板,酚醛面建筑模板,铁红面建筑模板的生产批发,专业生产建筑模板20年!日产40000张!,经过二次成型,板面光滑,胶合力好,远销国内外受到客户的一致好评。

拉丝机,直进式拉丝机,倒立式拉丝机,无锡平盛科技有限公司

拉丝机是无锡平盛科技有限公司主要产品,产品有直进式拉丝机,倒立式拉丝机,水箱式拉丝机.联系电话:0510-85260538

北京保安公司

北京保安公司,北京七兵堂保安服务公司是北京市公安局批准正规资质高端安保服务保安服务公司,军事化管理,安保业务面向北京市及全国各省市,提供北京保安,北京保安公司,北京安保服务,北京保安服务公司,北京七兵堂保安服务有限公司是七兵堂国际安保集团公司旗下全资保安公司,期待您的合作!

潍坊永诚国际劳务有限公司

潍坊永诚国际劳务有限公司是一家专业从事劳务派遣的公司。永诚人坚持“我们多努力,让您更满意”的服务理念,以创新的管理理念,全新的管理模式,优秀的服务水准,形成了独具特色的以“以人为本”为主要内涵的企业文化。展望未来,永诚人人将一如既往地用真心铸造品质,用热忱创造价值,为中国劳务服务行业的发展做出更大贡献。

天津中盛恒智网络科技有限公司

天津中盛恒智网络科技有限公司,中盛恒智,中盛传媒,PR发稿公司,传媒公司,发稿公司

江苏弘盛建设工程集团有限公司江苏弘盛建设工程集团有限公司

江苏弘盛建设工程集团有限公司集研发中心、房地产开发、设计院、检测中心、培训中心、商务会所、专家公寓为一体。

河北香河朋达无纺布厂

河北香河朋达无纺布厂专业生产销售无纺布,可生产1.6m.1.8m,2.4m以及3.2m,8g-200g重的无纺布产品,可以按客户来样生产各种颜色产品,强力指标达到国标,还可按客户要求指标生产,并可以生产高强土工布。公司以“专业品质,诚信服务”,期待与您携手合作,共创辉煌!

新滨网

新滨网是滨州市重点网站之一,读者覆盖了滨州党政机关、企事业单位人员及广大市民,活跃度高。一直以来我们在公益活动和传播正能量。

万物皆可定制

万物皆可定制,一件起定,免费打印照片,照片打印就在印鸽,智能化工厂解决方案,为工厂节省75%人力

未来思路智能化网

智能化是指事物在计算机网络、大数据、物联网和人工智能等技术的支持下,所具有的能满足人的各种需求的属性。


全局底部横幅