是时候放弃循环神经网络了！ (是时候放弃了)

文章编号：45995 资讯动态 2024-12-09 注意力机制卷积网络机器学习

有人说，不同语言之间的翻译，与其说是一门科学，不如说是一门艺术。

NLP 领域的机器学习工程师 Riccardo Di Sipio 日前提出了一个观点：使用卷积网络要比使用循环神经网络来做 NLP 研究，要幸福得多——是时候放弃循环神经网络了！

基于这一观点，他从卷积网络本身的基本原理出发，论述了为什么 NLP 不再需要循环神经网络的原因。

我们来看：

不久前，人工智能科学家侯世达（Douglas Hofstadter）就在The Atlantic上发表的一篇论文中指出，目前机器翻译尚处于「浅薄」的阶段。

尽管机器翻译存在局限性，但难以否认的是，自动翻译软件在许多情况下都有良好的效果，而其背后的技术在任何存在信息从一个领域流动到另一个领域的语境中都具有广泛的应用，例如基因组学中从RNA到蛋白质编码的翻译过程。

直到2015年，序列到序列的映射（或者说翻译）使用的主要方法都是循环神经网络，特别是长短期记忆（LSTM）网络。

我在前一篇文章中介绍了这些网络架构的基础知识，我还谈到了LSTM 被应用于大型强子对撞机的顶部夸克对衰变的运动学重建过程。这篇文章链接如下：

然后，出现了一些新的方法：比如残差网路架构和注意力机制的提出，为针对这类任务的更通用的框架的实现铺平了道路。

值得一提的是，这些新颖的网路架构还解决了另一个问题：事实上，由于RNN 固有的时序性，很难利用这种网络在像 GPU 这样的并行系统上进行训练。而这一点正是卷积神经网络使用起来非常方便的地方。

在数学中，卷积表示的是当函数 f 作用于另一个函数 g 时生成第三个函数的一种运算：

是时候放弃循环了！

不应与调制（例如AM传输中的EM信号）混淆，调制是将两个函数简单相乘。求知欲强的人可能会深究到：时间空间中的卷积傅里叶变换，实质上是频率空间中的调制

是时候放弃循环了！

所以这两种运算虽然密切相关，但切不可被混淆。

在计算机科学的离散世界中，积分被求和取代，两函数之间的乘法由矩阵间的乘法代替。用行话来说，就是将卷积核应用到图像上来生成卷积特征，一次卷积将生成一个新的特征。在下面每一对图像中，当对左边部分发生一次卷积变换，将于右边部分产生一个新的值，如下图所示：

是时候放弃循环了！

在对这个序列的操作中，图像（灰色矩阵）由一个卷积核（橙色矩阵）卷积操作以获得卷积特征（绿色矩阵）。

通常来说，卷积核是一个网络的权值矩阵，必须通过某种算法（如：反向传播）计算，才能得到它的期望输出。

这种操作的一个很好并且非常重要的特性是，一旦「图片」被加载到记忆中，不同的卷积核会对其进行操作，这样就可以减少输入/输出（I/O）次数，从而更好地利用带宽。通常，卷积操作由以下两种方式执行：

在卷积之后，通常会进行池化操作：在每个卷积块中，只将最大值传递到下一层。此操作用于降低图片维数以及过滤噪声。降维的关键是通过信息压缩来寻找更高水平的特征。

常用的做法是，通过将上述两个步骤的板块链合在一起，来构建一个卷积神经网络。一些成功的网络架构案例如下：

既然现在我们已经了解了卷积神经网络的基本知识，那么让我们回到最原始的问题：我们如何使用这样的网络代替循环网络来解析序列呢？

注意力机制背后的主要观点是，网络应该找出输入序列的哪些部分或元素与生给定的输出序列元素具有更强的相关性。它通过为每个输入元素创建一个注意力权重向量（权重介于0和1之间，通过Softmax产生），并使用它们来调整信息流。如果我们首先关注基于RNN的网络，这将变得更容易理解。

对于每个输入元素（时间阶），RNN层会存储一个隐藏状态。所以对于N个输入将会有N个隐藏状态。此时，我们可以通过简单地让注意力权重和隐藏状态逐个元素相乘（也就是哈达玛积）。来生成剩下文向量：

是时候放弃循环了！

例如，当翻译一个句子时，两种语言的专有名词都是一样的，因此相应的权重会非常大（例如0.95）。相邻单词的权重很可能也是比较大的（例如0.55），而相距较远的单词权重则较小（例如0.05）。

最后，信息被压缩成一个注意力向量，并传递到下一层：

是时候放弃循环了！

在解码阶段，则回为每个输入的词计算上下文向量。

现在我们基本掌握和理解了关于如何在机器翻译中摆脱RNN网络的所有要素。

Transformer网络利用注意力机制，但这次使用的是前馈网络。

首先，输入序列被嵌入（即被编码成N维空间中的一个数字）向量作为补充，该向量跟踪每个单词相对于彼此的初始位置。现在我们有了序列中所有单词（K）和一个给定单词（Q）的向量表示。

根据这些材料，我们可以像以前那样计算出注意力权重（代表了维度，它是一个标准化因子）：

是时候放弃循环了！

这个注意力权重决定了其他每个单词对于给定单词的翻译结果的贡献程度。

将这些权重作用于待翻译的给定序列（值V）的过程称为缩放的点积注意力（Scaled Dot-PROduct Attention）。

多头注意力是一种注意力机制的合并方式，被用来将Q、K和V 线性映射到不同维度的空间中。其思想是，不同的映射可以分别从不同方面突出信息编码的方式。其中映射是通过将Q、K和V乘以训练过程中学习到的矩阵W来实现的。

最后值得一提的损失，在论文《Attention Augmented Convolutional Networks》中，作者提出了一种具有多头注意力机制的CNN，该论文链接如下：

而以上，便是为什么我们不再需要循环神经网络的原因～

via:雷锋网AI 科技评论编译。

原创文章，未经授权禁止转载。详情见转载须知。

是时候放弃循环了！

本文地址： https://www.gpxz.com/article/702737ab97624459cac9.html

上一篇：中科曙光全面布局AI将在青岛建全球研发总部

下一篇：杨柘出任小米中国区CMO曾担任魅族高级副总

搜狗PC权重查询

查询搜狗PC权重和搜狗PC的关键字排名

网站模板 2024-03-24 00:18:21

彼岸壁纸

彼岸桌面是早期一家免费壁纸网站,专注提供免费高清壁纸,2K高清壁纸,电脑壁纸高清全屏,壁纸高清全屏电脑,包含日历壁纸,游戏,动漫,风景,美女,动物,汽车,节日,打工人等电脑背景图片,免费壁纸下载

游戏网游 2026-01-21 11:19:32

小狮子赛几动画

故事围绕四个主人公——勇敢热血但过度自信的赛几，脑回路新奇、憨傻可爱的猪王子，生气时会变身的瑞比，智商超群的胖达。在派大陆他们一起经历奇妙的趣事，一起喜怒哀乐，一起成长。

生活常识 2024-07-10 18:31:18

网站帮

网站帮是一家专注于网站托管和数字营销服务的信息科技公司，提供网站维护、网站搭建、网站优化、小程序开发、APP开发等一系列服务，帮助客户实现数字化转型和品牌推广。我们拥有丰富的数字营销经验和专业的团队，通过技术、内容和营销策略的结合，为客户提供最优质的数字营销服务。在网站帮，您可以享受到一站式的数字营销解决方案，让您的品牌更具竞争力，更具影响力。

编程开发 2026-01-25 00:27:27

苏州空压机厂家

苏州玉达压缩机压缩机有限公司是一家集螺杆空压机和活塞空压机专业生产销售及其空压机零部件销售，空压机维修的厂家。主要生产螺杆空压机，活塞空压机和增压机，永磁螺杆空压机行业领先水平，活塞空压机价格低，可为客户节约20-40%的运营成本，免费提供空压机安装维护技术咨询，提供整条空压机线解决方案。

管理咨询 2026-01-25 15:13:52

金洲精工科技（昆山）有限公司

金洲精工科技（昆山）有限公司是一家专业从事研发、生产和销售印制电路及相关行业专用刀具的国家级高新技术企业。

企业品牌 2026-01-25 18:21:15

湖南石雕牌坊

湖南志诚光辉石材有限公司提供：湖南石雕牌坊,湖南石雕栏杆,湖南石亭长廊,湖南浮雕壁画,石雕栏杆厂家电话：13575048633

电影视频 2026-01-25 21:26:09

聊城家教网

聊城家教网提供一对一家教、专职教师和大学生上门家教服务平台，提供数学、英语以及数理化和艺术辅导。

商业服务 2026-01-25 21:33:24

零窕商贸行业动态~

零窕商贸行业动态~：好运道财经网发布股票,基金,理财,股市,期货,信托,贷款,金融等知识，让金融小白也能理解世界财经。

财经金融 2026-01-26 00:15:05

线槽

上海日成电子RCCN为全球需求者提供超过五千种规格以上高质量配线器材:主要以:线槽,无卤配线槽,汽车线束,导轨,电缆接头,尼龙扎带,尼龙扎线带,冷压端子,接线端子,尼龙软管,金属软管等。为您提供方便快捷的网上规格尺寸查询,满足您的不同布线需要,让您的设计方案更完美,达到最佳效果!

设计美化 2026-01-29 13:27:10

学生网页设计代码大全

LLX模板网专注学生网页设计，提供HTML静态网页成品、dreamweaver网页制作、PHP动态网站设计、divcss布局静态网页作品、简单个人网页设计、HTML静态网页模板、phpmysql毕业设计网站源代码下载。

下载资源 2025-02-02 19:09:40

湘湘机电

湘湘机电科技有限公司是一家高科技软件开发定制服务提供商和各类网络平台提供商及工业自动化应用软件开发、软硬件结合研发提供商。

网络应用 2025-02-07 22:40:14

可以自由驾驶汽车的游戏汇总真实的汽车模拟驾驶游戏分享2023 (可以自由驾驶的赛车手机游房)

随着网络的发达，几乎可以在手机上做任何事情，就连我们现实生活中的汽车驾驶在网络上也可以实现，如果想体验这种模拟驾驶的乐趣，那就可以来看真实的汽车模拟驾驶游戏分享2023，这些游戏都可以让玩家在虚拟的网络上体验汽车驾驶，并且有的游戏还可以叫上朋友一起进行汽车竞速，非常推荐大家来尝试这些游戏，这个游戏是曾经风靡网络的一个赛车游戏，主打的就...。

2025-02-11 18:18:08

数码时代的信息安全手册 (数码时代到来)

前阵子，一个AI换脸软件火了，但旋即有人发现，它的条款十分霸道，存在着数据外泄的风险，于是我发了条推送，提醒大家小心，在讨论中，我发现，很多人对信息安全，往往有着这么几个误解，安全是一件很遥远的事情，作为一个普通人，有什么好被人惦记的?这是一个典型的，可得性启发式，我们之所以觉得安全离我们很遥远，只不过是因为我们没有遭遇过危机罢了，...。

2025-01-30 18:40:53

喜悦渔粉加盟费多少钱 (喜悦渔粉加盟电话)

如今，餐饮市场上的项目有很多，同行业中的竞争也很是激烈，所以创业者若想从一个项目中收获成功，那么在项目的选择上是不可疏忽的，喜悦渔粉是很多人看好的项目，因为其不仅有美味的口感，同时还很具营养价值，是个可值得加盟的品牌，那么，喜悦渔粉加盟费多少钱，下面，让我们一起来了解下吧，喜悦渔粉隶属于河北喜悦餐饮管理有限公司，其公司地址在河北省石家...。

2025-01-15 22:17:43

Intel缘何为ARM代工新标准能被广泛接受么

雷锋网按，本文作者铁流，雷锋网首发文章，日前，Intel公开表示将为ARM阵营IC设计厂商代工生产芯片，且还公开叫板，友商，，称Intel的10nm工艺比三星、台积电的10nm工艺更具优势，ARM方面表示很期待与英特尔合作，此外，不知道是否因为台积电和三星制造工艺注水的问题，Intel的专家MarkBohr还发布了一个更合理的衡量半导...。

2024-12-09 21:05:50

海外月访问量达千万级 MiniMax海螺AI加速视频生成行业发展 (海外访问是什么意思)

在全球数字化转型的浪潮中，中国人工智能企业正以其卓越的技术实力在海外市场崭露头角，赢得了广泛的用户口碑，最新数据显示，海螺AI海外版，HailuoAI，登顶10月AI产品榜·全球增速榜，月访问量达1173万，同比增长高达2772.92%，PikaArt、Chaport紧随其后，分别位列第二、第三名，据了解，海螺AI是中国领先的通用人工...。

2024-11-30 17:44:22

公安部异地办案六个规定 (公安部异地办案协作六个严禁)

法律分析，1、严禁未履行协作手续，跨县及以上行政区域执行传唤、拘传、拘留、逮捕；2、严禁未履行协作手续跨县及以上行政区域查封、扣押、冻结与案件有关的财物、文件；3、严禁在管辖争议解决前，擅自派警跨所属公安机关管辖区域办案，依法依规进行先期处置的除外，4、严禁对异地公安机关依法提出且法律手续完备的办案协作请求不予配合、故意阻挠、制造管辖...。

2024-11-29 23:26:03

潮童品牌加盟 (潮童品牌加盟电话)

从规模、健康、高端、个性几个方面来说全球热搜童装品牌，轻奢童装品牌，ArmaniJunior，阿玛尼，、GucciKids、BurberryChildrenswear、BabyDior、IPINCOPALLINO，童装品牌集合店，好孩子星站、ROOKIE、BEBELUX国际高端童装集合店、MINIJOYE国际童品集合店、派克兰帝，知名...。

2024-11-27 14:41:20

英派斯健身俱乐部怎么加盟 (英派斯健身俱乐部西安)

如今，健身已经走入大家的生活之中，于是，健身行业开始展露商机，英派斯健身俱乐部又再次抓住智慧之选者的眼球，不少智慧之选者都在询问英派斯健身俱乐部怎么加盟，下面有具体流程解读，作为英派斯加盟商，需要具备一定条件，有超前的经营理念和热情，认同英派斯产品及经营理念，具备适量资金，具备一定的经营和管理能力，英派斯健身俱乐部怎么加盟，具体流程，...。

2024-11-23 01:31:18

歼 (歼10c)

#总师官宣歼15歼35都上航母#，当天，歼，15总设计师孙聪院士引见，歼，15和歼，35两型飞机都会上航母，总台记者钱江王磊秦祎王居蔚刘姝杉，...。

2024-11-13 08:28:09

4万到5万的皮卡车新车 (4万到5万的车型都有哪些可以推荐?)

皮卡既能卸车又能邀人的作用取得许多客户的认同，尤其是对农用机械消费制作层面做出出色奉献，选购皮卡不用很贵，买一个经久耐用的就可以了，今天就来聊一聊4万到五万的皮卡车新汽车，来几种5万左右皮卡车剧烈介绍，北汽制作越铃指点价，5.1七万，7.5八万北汽制作越铃配用2.8T涡轮增压器发起机，至大功率102大马力，75Kw，，最大扭矩转速22...。

2024-07-07 10:35:53

伊朗总统选举第二轮投票完结 (伊朗总统选举结果)

据新华社德黑兰7月6日电伊朗选举委员会发言人穆赫辛·伊斯拉米6日清晨发表，伊朗第14届总统选举第二轮投票于5日午夜完结，计票上班随即开局，伊朗总统选举第二轮投票于外地期间5日8时开局，在第一轮投票中得票率排在前两名的前卫生部长佩泽什基安和前首席核谈判代表贾利利角逐总统职位，第二轮投票原定今日18时完结，为繁难更多选民投票，投票期间3次...。

2024-07-06 14:17:38

天气预报app排行榜前十名天气预报15天查询当地软件推荐

手机天气预报app哪个最准最好用？天气预报作为我们日常生活中经常用的软件之一，和我们的生活有着息息相关，影响着我们一切的出行行动，那么到底哪些天气预报app最准呢？小编结合市场上的各种平台，为你推荐十款热门好用的比较精准的天气预报app，一起来看看吧！

2023-10-11 01:49:18

文章推荐

2022免广告免vip的影视软件有哪些好用的影视app推荐 (2022免广告逃跑吧少年冲呀版本大全)

近期有大部分的用户都不知道2022免广告免vip的影视软件有哪些，在目前的市面上，能够播放电影或者电视剧的app也确实不在少数，但是下面推荐的这几款，不论是用户体验度还是口碑都是非常不错的，如果小伙伴最近也有在找类似的工具，那么不妨和小编一起来了解下它们到底如何，1、，百搜视频，海量的视频资源，小伙伴们只需要搜索一下，就能够轻松找到，...。

2025-02-11 20:58:40

资讯动态

优质的合成类游戏下载2023 免费的合成车的游戏叫什么 (优质的合成类药物)

手机游戏中有不少合成类型的手游，这些游戏的主要玩法就是把同样的物品进行融合，这样就能合成出更加高级的物品，那么免费的合成车的游戏叫什么?今天小编就给大家介绍五个合成类的游戏，这些游戏中有很多可以合成的东西，合成这些东西的时候玩家也会感觉非常解压，1、，赛车精英，这款游戏中会出现很多型号的赛车哦，玩家们只需要找到两个相同的赛车，然后把两...。

2025-02-10 01:40:58

资讯动态

加盟凉皮店需要考虑些什么事 (加盟凉皮店需要办理消防证吗)

凉皮作为一道深受大众喜爱的传统小吃，具有广泛的消费基础和市场需求，其独特的口感和丰富的口味选择，使其在不同地域和季节都能保持稳定的销量，特别是在夏季，凉皮因其清爽的口感而备受消费者青睐，市场潜力巨大，那么凉皮加盟究竟怎么样呢?市场中凉皮加盟的品牌众多，接下来，我将和大家详细探讨，凉皮加盟品牌不断持续发展，自身也积累了丰富的经营和加盟经...。

2025-01-31 21:54:52

创业加盟

不过似乎对Intel威胁不大 AMD的7nm处理器样品出锅了 (不过似乎有点问题)

雷锋网消息，最近Intel和AMD这对几十年的冤家之间的气氛一直非常微妙，先是AMD多年来的钦命，女友，GF放弃研发7nm制程，AMD所有7纳米产品都将交由台积电代工，紧接着Intel阵营传出了10nm工艺受阻14nm产能告急的消息以示配合；而后前不久Intel称再投10亿美元提升14nm产能，AMD则微微一笑，表示俺们的7nmZen...。

2024-12-09 19:05:52

资讯动态

麻辣烫麻辣烫加盟费多少钱 (麻辣烫麻辣烫重庆的麻辣烫这首歌)

麻辣烫是一种简单方便，口味又好的餐品，常被人们当做正餐食用，近两年是麻辣烫的持续式增长期，麻辣烫麻辣烫品牌的出现更是为行业带来了勃勃的生机，麻辣烫麻辣烫的传播离不开早期加盟商的鼎力相助，很多新智慧之选者也想成为其中的一员，那么麻辣烫麻辣烫加盟费多少钱，麻辣烫麻辣烫的相关介绍，2007年，是哈尔滨一家专门从事麻辣烫售卖及品牌特许经营的大...。

2024-12-02 23:31:51

创业加盟

是时候放弃循环神经网络了！ (是时候放弃了)

相关文章

文章推荐