一场突如其来的讨论到底什么是深度学习 SVM其实也是深度学习吗 (一场突如其来的大雨,让人猝不及防)

文章编号：46431 资讯动态 2024-12-10 François LeCun 深度学习神经网络 SVM 反向传播人工智能 Bengio Chollet Yann Yoshua Pearl Judea

一场突如其来的讨论：到底什么是深度学习？SVM其实也是深度学习吗？

雷锋网 AI 科技评论按：2019 年底、2020 年初，许多机器学习界活跃的教授、研究员们投身参与了一场的突如其来的讨论：深度学习是什么？

在过去十年汹涌而来的深度学习浪潮中，大家对深度学习在应用中体现出的各种特点已经非常熟悉了，但毕竟深度学习的理论仍未建立完善。更重要的是，大家已经意识到了深度学习的种种限制，那么想要破除限制、实现更高级的智慧时，就免不了需要思考，是「继续改进深度学习就可以达到目标」，还是「我们需要在深度学习之外另起炉灶」，这里也就引出了那个看似简单，但大家尚未达成共识的问题「深度学习是什么？」

不少学者最近都参与了这个讨论，雷锋网 AI 科技评论带大家回顾一下各方观点。

Keras作者、谷歌大脑高级研究员François Chollet最先给出了自己的观点：

什么是深度学习？在 2019 年这个时间点，大家经常用到的那种深度学习定义大概是这样的：「它由一连串可微分的参数化的层组成，而且是用反向传播算法端到端地训练的」。不过这个说法在我看来太过狭隘了，它最多是 「我们现在做的深度学习」 的描述，而不是对深度学习本身的定义。

比如说，如果你有一个卷积网络模型，然后你用 ADMM 训练它的权重，它就不是深度学习了吗？一个自己学习特征的 HMAX 模型就不是深度学习了吗？甚至于，用贪婪算法逐层训练的深度神经网络就不是深度学习了吗？要我说的话，它们都是深度学习。

深度学习应该指的是一种表征学习方法，其中的模型是由一连串的模块组成的（一般都会堆成一个多层的或者金字塔形的模型，这也就是「深度」的由来），而其中的每一个模块分别拿出来训练之后都可以作为独立的特征提取器。我在我自己的书里也就是这么定义的。

一场突如其来的讨论：到底什么是深度学习？SVM其实也是深度学习吗？

通过这样的定义，我们也就能明确深度学习不是下面这样的模型：

深度学习的定义里不需要指定固定的某种学习机制（比如反向传播），也不需要指定固定的使用方式（比如监督学习还是强化学习），而且也不是一定要做联合的端到端学习（和贪婪学习相反）。这才是深度学习「是什么」的本质属性、根本结构。这之外的描述仅仅是「我们是如何做深度学习的」。

清晰的定义也就划分出了明确的边界，有的东西是深度学习，有的东西不是。2019 年随处可见的这种深度神经网络自然是深度学习，而用演化策略 ES、ADMM、虚拟梯度之类的反向传播替代方案训练的深度神经网络当然也是深度学习。

基因编程就不是深度学习，快速排序不是深度学习，SVM 也不是。单独一个全连接层不是深度学习，但很多个全连接层堆在一起就是；K-means 算法不是深度学习，但把许多个 K-means 特征提取器堆叠起来就是。甚至我自己在 2011 到 2012 年间，收集视频数据的位置的成对的共同信息矩阵，然后把矩阵分解堆叠在上面，也是深度学习。

一般的人类软件工程师用语言写出的程序不是深度学习，给这些程序加上参数、能自动学习几个常量，也仍然不是深度学习。一定要用成串连起来的特征提取器做表征学习，这才是深度学习。它的本质在于通过深度层次化的特征来描述输入数据，而这些特征都是从数据里学习到的。

根据定义也能看出来， 深度学习是一种逐步完善的、一点点优化的从数据中提取表征的方法 。以深度学习现在的形式来看，它至少是 C1 连续的（甚至到无限阶都是连续的）。这一条可能不那么关键，但「逐步优化」的这一条也是深度学习的固有属性。

所以深度学习和以往的符号运算 AI、常规编程都完全不同，它的基础结构就是离散的、以数据流为核心的，而且通常也不需要任何中间层的数据表征。

想用深度学习做符号运算也不是不可能，但需要引入很多额外的步骤。可话又说回来，深度学习模型也就只能囊括所有程序中的很小很小的一部分而已，没必要做什么都要用深度学习。

还可以再拓展一个问题：大脑是「深度学习」吗？我认可的只有这一种答案：大脑是一个复杂得难以想象的东西，它把许许多多结构不同的东西包括在内，而我们对大脑的了解还太少；大脑是不是深度学习，我们还给不出确定的答案。我有一个直觉是，大脑总体来说不是深度学习，不过其中的某一些子模块可以用深度学习来描述，或者是部分符合深度学习的，比如视觉皮层就有深度层次化的特征表征，即便这些表征不都是学习得到的；视觉皮层也是深度学习的研究中重要的灵感来源。

我可以再补充一句，如果用树形结构来比喻的话，我们对现代的深度学习的理解和使用，主要还停留在早些时候发展的「现代机器学习」的这一枝上，和神经科学之间没多大关系。神经科学带来的影响主要在于高层次的新观念启发，而不是直接的模仿借鉴。

一场突如其来的讨论：到底什么是深度学习？SVM其实也是深度学习吗？

在另一条故事线上，深度学习三驾马车之一的 Yoshua Bengio 和「一直以来的深度学习黑粉」 Gary Marcus 的年度拌嘴留下了一个经典问题：「深度学习是否已经足够了？」（"Is DL enough?"）这也再次引出了「深度学习到底是什么」的讨论。2011 年图灵奖得主、贝叶斯网络之父 Judea Pearl 就表示「因为深度学习没有清晰的定义，所以我没办法回答深度学习是不是已经足够了」。

有一种据说来自Yann LeCun 的定义是这样的：深度学习是一种方法论，是把多个参数化的模块组合成图（可以是动态图），构成模型，然后用基于梯度的方法优化它。LeCun 本人表示，如果这么定义深度学习的话，那深度学习还远远不足以解决目前已经遇到的问题，因为这个定义下的模型架构、优化目标、优化方法都有了具体的限制。

讨论中也有人提出，如果直接给出深度学习的定义有争议，不如我们列一列都有什么东西不是深度学习？LeCun 给出的答案是：逻辑回归、核方法、朴素贝叶斯、树&森林、K-means、K-NN 都不是深度学习，因为它们都不学习数据表征；此外，通过 0 阶方法（非梯度）优化的高度不可微分模型也不是深度学习，即便它们可以学习数据表征。

一两天的讨论之后，学者之间没能立刻形成广泛一致的共识。Judea Pearl 觉得有点失望，他自己做了这样一个总结：

LeCun 在下面和他继续讨论了起来：

Judea Pearl 没有继续参与这个讨论，不过，对比François Chollet 和 Yann LeCun 给出的答案，不难看出他们的大部分意见是一致的，只不过 LeCun 认为基于梯度的优化方法也是深度学习的一部分，而Chollet 认为不用基于梯度的方法也可以 ——Chollet 定义下的深度学习就要更宽一些。

那么回到前面那个问题，即便认可Chollet 的更宽一些的深度学习的定义，那么深度学习就够了吗？按照他的态度来说，也不够；我们有那么多种各式各样的方法，不需要死守深度学习不放。即便只是今天的已经能用深度学习的问题，也不是时时刻刻都需要用一个基于深度学习的解决方案。

从深度学习视角看旧模型

不过站在今天的深度学习的视角来看，一些经典方法看起来也变得有趣了。深度学习研究员、Fast.ai 创始人 Jeremy Howard 也参与了深度学习边界的讨论，他说逻辑回归现在看起来就像深度学习，它是一个一层深度的、参数化的函数模块，可以在数据样本上用基于梯度的方法训练。甚至，以他自己的感受来说，把 SVM 看作用 HingeLoss 损失函数和 L1 正则化的神经网络要好学、好教得多。

LeCun 也表示赞同：「一个 SVM 就是一个两层的神经网络，其中，第一层的每一个神经元都会通过核函数把输入和某个训练样本做对比（所以其实第一层是一种无监督学习的平凡形式：记忆），然后第二层会计算这些输出的（经过训练后的）线性组合。」

很多参与讨论的网友都表示被这一条见解震惊了，其中有个人就说「有一次工作面试的时候他们让我实现 SVM 然后用梯度下降训练它，我心想卧槽这不就是个 Hinge Loss 的神经网络吗。本来这也不算多大的事，但是突然意识到以后觉得真的很神奇。」

也有网友接着追问：「可以不只有两层吧？你可以用很多层学习一个核函数，然后用最后一层计算核方法的预测规则。只要你施加一些规则，保证这个核是 Mercer 核，网络中起到核的作用的层的数量就可以不受限制」。LeCun 回答：「核函数可以任意复杂。但如果核函数是学习得到的，那这就已经是深度学习了…… 其实这就是我们训练 Siamese 网络，也就是度量学习（metric learning）的时候做的事情。这就像是训练一个相似度的核。最后只要你愿意的话，也可以在上面再增加一个线性层。」

祝福深度学习的新十年

文章结尾我想引用李飞飞高徒、特斯拉 AI 负责人 Andrej Karpathy 的一条推特作为结尾。

一场突如其来的讨论：到底什么是深度学习？SVM其实也是深度学习吗？

今天已经有网友会在 Reddit 上提问「想要用神经网络之外的方法做分类任务，理论上有可能吗？」但其实也就大概八年前你更容易看到的问题是「想要用神经网络方法做分目标识别，理论上有可能吗？」这几年的变化可真有意思。

我们乐于看到深度学习继续发展，理论更加完善、应用更加丰富、资源利用更加高效，但同时也希望更多研究人员和开发者可以意识到，深度学习并不是那个唯一的、最终的解决方案。我们期待在 2020 年、在这个新十年里看到更高级的、补充深度学习的不足的新方法。

雷锋网 AI 科技评论报道。

原创文章，未经授权禁止转载。详情见转载须知。

一场突如其来的讨论：到底什么是深度学习？SVM其实也是深度学习吗？

本文地址： https://www.gpxz.com/article/0ab67f0342a033de9c13.html

上一篇：华为5G芯片只能当4G用；滴滴回应私有化华为P5

下一篇：大涨167%英伟达数据中心收入首次超过游戏业

蛋蛋后日常大揭秘H5官网

手机蛋蛋后日常大揭秘H5,蛋蛋后日常大揭秘H5是一款休闲再现测试游戏，根据游戏你可以得知你和蛋蛋后到底有多大的差距，是蛋蛋后的哥哥姐姐还是弟弟妹妹叔叔阿姨呢?快来测试一下吧!;您可以免费在线玩。

游戏网游 2024-01-14 22:46:53

宠物网,宠物猫,宠物狗,波奇宠物网,波奇网

波奇宠物网是属于宠物爱好者的综合型网站.这里是宠物猫，宠物狗等宠物爱好者们的集中地.也是包含宠物商城和宠物百科的专业网站.选择波奇宠物网,健康宠物生活从波奇开始.

网站模板 2026-01-21 13:08:19

中共河南省委宣传部党建网

中共河南省委宣传部党建网！

电影视频 2026-01-24 20:35:19

上海盾旗过滤设备有限公司

上海盾旗过滤设备有限公司是优质的猪粪固液分离机,粪便脱水机,牛粪固液分离机,鸡粪专用固液分离机,养殖废水粪便处理设备供应商，主要经营产品有：猪粪固液分离机,粪便脱水机,牛粪固液分离机,鸡粪专用固液分离机,养殖废水粪便处理设备！

电影视频 2026-01-24 22:42:05

徐州鸥普科医疗科技有限公司

徐州B超机厂家,猪用比超,彩超机,小动物心脏彩超,宠物超声,B超,B超机多少钱,大动物直肠检查,牛用B超机,兽用B超机，小动物超声成像系统

宠物花鸟 2026-01-25 17:47:20

兰睿仪器（上海）有限公司超声波流量计厂家

兰睿仪器是一家集研发、生产、营销、服务为一体的专业超声波流量计专业制造企业。主要产品包括时差系列超声波流量计、多普勒系列插入式/便携式超声波流量计、超声波明渠流量计,超声水表与热量表等系列

网络营销 2026-01-28 15:32:28

电力钢杆

霸州市益明钢杆有限公司生产电力钢杆，钢杆，钢管杆，打桩工程，钢桩基础，品类齐全,库存多,发货快,诚信经营,电力钢杆价格低,有找电力钢杆厂家可联系我们13803162399。

电影视频 2026-01-28 18:28:58

高精度研磨抛光机

我司主要针对硅晶圆、III-V族化合物、氧化物、红外材料衬底、蓝宝石、氮化镓和碳化硅衬底等材料的研磨抛光，纳米级别操作，主营半导体材料研磨抛光设备的研发、生产和销售高精度研磨抛光机、半导体晶圆抛光、CMP设备、粘片机、白光干涉仪，晶圆抛光机，晶圆磨抛设备，晶圆抛光机，精密研磨抛光机，机械化学抛光机，化学机械抛光机，晶圆磨抛机，已与全国多所院校和研究所达成合作！

电影视频 2026-01-29 14:08:38

驻车加热器

想要驾驶舒适、温暖的车辆吗？我们提供各种类型的驻车加热器，包括驻车柴暖加热器和驻车燃油加热器，让您的车辆在寒冷的季节里保持温暖。

汽车一族 2026-01-21 14:53:13

上海疆域达商贸有限公司

上海疆域达商贸有限公司成立于2023年2月13日，注册地址位于中国上海市自由贸易试验区临港新片区云汉路979号2楼。作为德国卡尔蔡司在新疆地区的授权代理商，公司深耕区域眼科医疗领域，专注为新疆各医院提供一站式优质医疗资源与专业服务，是连接国际顶尖医疗品牌与

下载资源 2026-01-28 20:09:54

北京希涛新材料有限公司

北京希涛新材料有限公司成立于1997年，由归国博士唐菲利先生创立。是中国较早生产聚丙烯酰胺高分子聚合物的厂家之一。公司集科研，生产，销售和服务为一体，是北京市的高新技术企业。在油田，选矿和污水处理方面拥有多项专利。

商业服务 2026-01-28 21:30:09

开封市黄河钢结构有限公司

开封市黄河钢结构有限公司成立于2001年，企业注册资金6000万元，占地面积80000余平方米，生产车间56696平方米，坐落于开封市黄龙产业集聚区。

企业品牌 2026-02-03 14:39:11

请别拿理想绑架我降薪疫情下的职场众生相

毕竟没干活，白拿钱也不好，总拿远大理想来绑架员工，让人很反感，他们就是利用现在的形势做一些早就想干的事，理性上觉得公司不容易，感性的话，还是挺抵触的，你在的公司降薪了吗?疫情之下，各行各业都很难，在经营跌至冰点的日子里，员工工资是企业最大的固定支出，要不要降薪节流，企业的不同做法里上演着世间百态，老乡鸡董事长束从轩手撕...。

2025-01-30 23:30:39

黎明练字如何加盟黎明练字招商条件 (黎明练字如何练)

黎明练字是一家致力于，以提升全民书写能力，为宗旨的硬笔练字专业培训机构，致力硬笔练字教育六年，为6—10岁儿童提供硬笔书写能力基础教育，黎明练字历经六年稳步发展，以长沙为大本营，目前拥有直营校区8家，加盟校区100余家，以黎明练字速成法为基础，以分层教学为指导，以师资培养与教学标准化为目标，构建了幼小衔接、低年级楷书基础课程、中高年级...。

2024-12-21 14:25:03

抖金广告联盟站内互动数据分析 (抖音视频广告联盟)

文字链接认证代码普通联盟标志认证代码企业广告联盟标志认证代码广告联盟评测代码说明，本页面的认证代码为抖金广告联盟专用评测代码，站长需懂简单html知识，直接复制代码粘贴到联盟网站相应页面即可使用，本代码不适用于其他广告联盟网站请勿获取！文字认证，文字链接代码认证适用所有类型的广告联盟，复制代码后放在抖金广告联盟网站首页底部或友情链接位...。

2024-12-05 21:47:45

诞生 Bala 康奈尔计算学院院长Kavita 元宇宙算什么上帝之眼或将通过 AI (诞生宝石)

在今年斯坦福HAI实验室的春季会议上，康奈尔计算机学院院长KavitaBala以，视觉外观和理解，从微米分辨率到世界级，为题，就她在数字化现实世界方面的研究进行了精彩的演讲，这几年我的研究主要关注视觉外观和理解，从微米分辨率到世界级，在我开始演讲之前，我先给大家展示一个很有趣的例子，这部电影里主角和世界互动的视觉界面很有意思，大家能够...。

2024-12-03 16:47:09

5G手机的个性化服务有望明年到来 (5g手机的个人热点的网速)

5G已经商用一年多，带来了什么不同的体验，许多人会想到高速率，5G确实带来了更快的下载文件的速度，但显然算不上变革性的体验变化，上周，紫光展锐联合中国移动、中兴通讯等合作伙伴展示了业界首个5G终端切片目标方案，在同一部智能手机中对两个应用进行测试，在模拟的网络拥塞情况下，有切片保障的应用程序的速率是无切片应用程序的30倍，时延降低近5...。

2024-12-01 00:48:08

为何俄军还未在库尔斯克转入反攻十天了 (为何俄军还未撤退)

乌军突然对俄罗斯库尔斯克方向发起的越境攻打曾通过去了十天，战局依然显得虚无缥缈，乌军虽然控制了大片区域，但距离扭转乌东战局与取得谈判筹码的战略指标仿佛仍有点悠远；俄罗斯方面也远未能如外界预料的那样极速将库尔斯克方向的乌军赶走，依然处于主动防卫的形态，虽然俄罗斯总统普京12日向俄军提出明白需要，从咱们的领土上将乌军赶进来，覆灭死敌，确...。

2024-11-12 18:41:56

套装商品发错换发商品以无货拒绝 (套装商品发错了怎么办)

依据，生产者权力包全法，第二十四条规则，运营者提供的商品或许服务不合乎品质需要的，生产者可以依照国度规则、当事人商定退货，或许需要运营者实行改换、修缮等工作，没有国度规则和当事人商定的，生产者可以自收到商品之日起七日内退货；七日后合乎法定解除合同条件的，生产者可以及时退货，不合乎法定解除合同条件的，可以需要运营者实行改换、修缮等工作，...。

2024-07-17 08:39:08

张新年律师 (张新年律师口碑)

2019年11月24日晚，在饿了么每日优鲜南头店购置了提子，送来时拿出局部荡涤启动经常使用，再次想荡涤食用的时刻，发现上方整串提子重大霉变，约了么平台启动揭发，商家仅仅返还订单金额，直到今天，也未对该行为有任何和解的意思，饿了么示意平台不可解决，商家拒绝抵偿，仅抵偿代金券，然而依据食品安保法是须要5，10倍抵偿的...。

2024-07-17 03:01:37

enormous怎样翻译 s 英语He (enormous香水)

Hesenormous的中文翻译是他身体魁梧重点词汇，enormous发音，英[ɪˈnɔːməs]；美[ɪˈnɔːrməs]翻译，极大的；渺小的；庞大的短语搭配双语例句enormous怎样读英[ɪnɔːməs]美[ɪnɔːrməs]副词，enormously名词，enormousnessadj.渺小的；庞大的enormous怎样读音具...。

2024-07-16 04:45:11

官网正版杀毒软件 (官网正版杀毒软件下载)

关于官网正版杀毒软件这个疑问感兴味的好友应该很多，这个也是目前大家比拟关注的疑问，那么上方小好小编就搜集了一些官网正版杀毒软件关系软件，来分享给大家宿愿能够协助到你哦，1.剪辑正版软件类型，安卓APP软件引见，剪辑最新版本是十分运用的手机上视频剪辑app，手机软件还可以协助生产者更好的剪辑自身情愿的产品，客户还能运行手机软件对视频展开...。

2024-07-01 00:00:59

迅捷视频转换器正式版下载-迅捷视频转换器vip正式版下载v3.3.0.36官方版

迅捷视频转换器vip账号正式版是一款为用户提供视频格式转换功能的软件，功能强大，支持多种不同的格式之间的转换，同时还具有视频编辑等等辅助功能，让用户能够轻轻松松制定自己想要的视频，需要的用户快来下载吧！迅捷视频转换器正式版简介：迅捷视频转换器又称迅

2023-11-16 15:46:13

关于告别过去的空间日志_空间日志

关于告别过去的空间日志空间日志我们终于明白不是所有的爱情都能修得白首同心亦不是所有的友情都能盼得天长地久人生就是一场因缘修行无数次的和无数人相遇擦肩别离陌生这些人只是陪我们在人生路上走了万分之一的路程但我们依然应充满感激因为我们人生旅途的绚丽是由这些一小段一小段的记忆拼凑而来的慢慢的才知道并不是所有的真心付出都能换来真...

2023-11-15 11:25:54

文章推荐

2024热门的找茬小游戏推荐耐玩的找茬小游戏有哪些 (2024热门电影有哪些呢)

小伙伴们大家好啊，本次小编为大家带来的推荐内容是有趣的找茬小游戏，在找茬小游戏中，你将寻找游戏画面中的不同之处，每一幅画面都有着细微的变化，通过观察和比对，可以锻炼你的观察力和注意力，挑战各种场景，发现每一个不同之处，体验找茬的成就感，快乐找不同经典的考验眼力的找茬类小游戏，游戏中提供了大量的图画找茬关卡，游戏会给玩家上下两张图，这两...。

2025-02-11 17:55:21

资讯动态

华为生态产品呈现高附加率市场占有率仍保持韧性 (华为生态产品有哪些)

10月4日消息，据Canalys官方公众号发文表示，华为在生态产品市场表现良好，尽管在手机出货量方面，华为严重受限，但其在生态产品市场，仍保持韧性，从Canalys分析中得知，Canalys表示华为凭借，构建万物互联的智能世界，的战略愿景，设计建立了其生态系统的，差异化竞争壁垒，，从而为其，生态产品的可持续发展，打下了基础，Cana...。

2025-02-02 18:52:40

资讯动态

从百度年度搜索热词一窥中国网民心态 (2020百度年度搜索)

美国，纽约时报，记者近日报道称，在2015年，中国网民想要了解关于健康、金钱、法律和爱情婚姻的事情，与此同时，他们也全神贯注于二孩政策、致许多人伤亡的爆炸、飘忽不定的股市等，如果网络搜索可以作为风向标的话，根据中国最受欢迎的搜索引擎百度所做的年终回顾，正是这些话题在今年占据了中国网民的精神世界，虽然这并非一项正式调查，但其结果让人得以...。

2025-01-30 17:24:22

网络百科

东方丽人美甲加盟费多少 (东方丽人美甲培训学校)

说到美甲想必很多的女性群众十分的熟悉，美甲是近年来十分流行的一种行业，在很多城市县城地区都有着大量的美甲门店，美甲一般都伴随着众多的美容业务展开，成为了很多美容机构门店的附加业务，当然也有着很多专业的美甲品牌在国内有着出色的发展，东方丽人美甲品牌发展至今已有多年，品牌的建设以及口碑的塑造都十分的出色，具有众多的品牌消费顾客，在加盟连锁...。

2024-12-22 00:08:45

创业加盟

芯片设计上云投入产出比可提升百倍！或是新入局者实现超越的机会 (芯片设计云豹智能)

近几年，传统行业正在加速上云推进数字化转型，芯片设计虽属于传统行业，但芯片设计上云已经有多年的历史，只是，随着云计算方式的普及和硬件性能的提升，用云的方式设计芯片能够获得几倍到上百倍的投入产出比的提升，因而被越来越多芯片设计公司采用，对于新兴的芯片设计公司而言，这或许是一个超越传统大公司的机会，当然，成熟的芯片设计公司也可以借助云计算...。

2024-12-09 21:23:44

资讯动态

一场突如其来的讨论 到底什么是深度学习 SVM其实也是深度学习吗 (一场突如其来的大雨,让人猝不及防)

从深度学习视角看旧模型

祝福深度学习的新十年

相关文章

文章推荐

一场突如其来的讨论到底什么是深度学习 SVM其实也是深度学习吗 (一场突如其来的大雨,让人猝不及防)