信息瓶颈再解读携手聚焦信息压缩 MIT 理论 IBM (信息瓶颈算法)

文章编号：45569 资讯动态 2024-12-09 信息压缩互信息聚类信息瓶颈理论

深度学习的发展带给人工智能领域的影响可谓是革命性的，然而该领域目前还存在很多未解决的问题，其中就包括不可解释性等问题。而希伯来大学计算机科学家和神经学家Naftali Tishby 等人提出的「信息瓶颈」理论，则尝试来解决神经网络的一系列问题，自提出以来便一直受到 AI 界的广泛关注。IBM 研究院也开展相关研究来分析这一理论，以期能够解决神经网络中的某些问题，相关成果发表在 IBM 研究院官网博客上，雷锋网 AI 科技评论编译如下。

虽然对于神经网络理论的研究工作日趋增多，但我们对于深度学习的宏观行为理解仍存在许多不足之处。例如，训练期间由哪些因素驱动内部表征的演变、学习到的表征属性以及如何充分训练神经网络去处理信息等方面存在的问题，一直都没有得到解决。此外，我们对于神经网络的了解大多数都源于揣测，而缺乏实证。

「信息瓶颈」理论试图解决上述这些问题。作为 mit- IBM Watson AI 实验室双方密切合作的成果，我们在 2019 年国际机器学习大会（ICML）会议论文「深度神经网络中信息流的评估」（Estimating Information Flow in Deep Neural Networks），从数学和经验的角度对「信息瓶颈」理论进行了分析，其中更是特别聚焦于其预测的「信息压缩」现象。

「信息瓶颈」理论（Schwartz-Ziv & Tishby 2017 年论文等，见参考文献）试图解释涉及信息压缩的神经网络泛化问题，这个概念是指在神经网络学习对输入编码时，输入 X 和隐藏层 T（图 1）之间的互信息在训练过程中迅速上升，之后在神经网络学习丢弃与任务无关的非关联信息（图 2）时，该互信息缓慢下降（压缩）。每一个连续的层都被视为在不断压缩输入。最终证明，这种淘汰掉无关信息的方式，可以使分类器的泛化效果更好，因为这样的话，当被给定一种新的此前从未见过的输入，神经网络仅仅提取出相关信息，而不会受到无关信息的误导。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 1：深度神经网络的前馈（假设的）

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 2：信息瓶颈。图中显示了训练过程中 5 个隐藏层中互信息的轨迹

虽然某种程度上这是一个较为诱人的观点，但遗憾的是，当网络是确定性的时候，输入 X 和隐藏层 T 之间的互信息并不依赖于网络参数（而在实践中，几乎所有的神经网络都是确定性的）。为了解决这个问题，先前的工作通过对每个神经元进行分箱处理（量化）和互信息进行计算（成为分箱隐藏层的离散熵），得出互信息的估计值。图 3 表明该计算与分箱大小高度相关，从而证实它并没有对互信息进行计算。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 3：分箱估计的不连续性

噪声神经网络与互信息评估

当网络是确定性的时候，互信息是非信息性的，而当网络是随机性的时候，互信息是富信息性的。因此，我们通过在每个神经元输出中添加高斯噪声 Z 来定义形成的噪声神经网络（图 4）。这种噪声同时存在于神经网络的训练和测试中，从而使相关的互信息评估变得有意义。在这种情况下，我们提出了一种有效的互信息评估方式，它能以极大极小最优速度收敛为真实的互信息（且不依赖于分箱）。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

将聚类作为压缩的驱动因素

我们的论文通过将单神经元分类和噪声通道上的信息传输联系起来，能够开发出一个数学直觉，即信息压缩（在随机网络中严格观察或在确定性网络中使用分箱估计）通常都应该由内部表征聚类引起。具体来说就是，在隐藏表征 T 中，映射同一类 Y 的不同输入 X 的隐藏层与彼此越来越接近。

要从经验上评估这一点，可参考 Schwartz-Ziv、 Tishby 在其 2017 年一篇论文中提出的数据和模型，该模型使用具有双曲正切函数（tanh）激活的全连接 12-10-7-5-5-4-3-2 体系结构对 12 维输入进行二进制分类。图 5 显示了标准偏差 0.005（测试精度 97%）的加性噪声结果，说明了各训练期中互信息估计、训练/测试损失和不断演变的内部表征之间的关系。互信息的上升和下降对应着表征在每一层中的扩展或聚合程度。例如，当高斯函数开始沿着一条曲线彼此偏离时（参见顶部第 5 层隐藏表征的散点图），在 28 epoch 之前，互信息一直呈增长趋势；到 80 epoch 左右，它们开始聚合，互信息随之下降。随着训练的进行，饱和的双曲正切单元将高斯函数推到立方体的相反角落，进一步减少了互信息。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 5：训练过程中的 I(X;Y) 压缩。最上面一行显示的是在选定 epochs 中隐藏表征的最终层的散点图，按颜色进行类标签编码

如图 6 所示，我们使用权重的正交规范化规则（Cisse 等人 2017 年论文），不仅可以消除这种压缩，实际上也改进了泛化。隐藏表征不再聚合在一起，这与信息压缩的缺失是直接对应的。我们在这方面进行了更多的实验，从而有力地证实了信息压缩是由聚类引起的。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

图 6：使用正交规范化消除压缩

由聚类引起的「压缩」概念之所以重要，基于两个原因。首先，它揭开了「信息压缩」的神秘面纱，用一个更具体的公式取而代之。其次，它为直接研究聚类打开了大门，聚类可能不会遭遇源自与互信息估计相关的维数的极端「诅咒」（我们证明了样本复杂度在维数上呈指数级增长）。事实上，我们能够将聚类的若干（初步的）测量方法延展到针对 MNIST 扫描数字任务进行分类的全卷积神经网络上，从而在训练过程中观察到类似的「压缩」行为。

此外，与「信息瓶颈」理论相反，我们发现压缩对于泛化来说并不是必要的，不过，鼓励使用压缩（通过几何聚类）是否能够促进更好的泛化性能仍然是一个有待解决的问题。

参考文献：

[Shwartz-Ziv, R. and Tishby, N. Opening the black box of deep neural networks via information. arXiv:1703.00810, 2017]

[Cisse, M., Bojanowski, P., Grave, E., Dauphin, Y., and Usunier, N. Parseval networks: Improving robustness to adversarial examples. In Proceedings of the International Conference on machine Learning (ICML), 2017]

via：

原创文章，未经授权禁止转载。详情见转载须知。

聚焦「信息压缩」，IBM 携手 MIT 再解读「信息瓶颈」理论

本文地址： https://www.gpxz.com/article/b3f33ee7aa83bb1ff4a0.html

上一篇：不仅是白金赞助商2017的重量级参与者附59篇

下一篇：姚班天才少年鬲融凭非凸优化研究成果获得斯

档案整理服务公司

中博奥技术有限公司专业致力于档案整理服务，档案数字化加工，档案管理系统，档案扫描，具有档案专业加工资质，智慧档案库房建设，数字化档案馆，档案软件开发和档案咨询等项目。

手机软件 2026-01-21 13:56:42

共建智能世界云底座

华为云提供稳定可靠、安全可信、可持续发展的云服务，致力于让云无处不在，让智能无所不及，共建智能世界云底座。助力企业降本增效，全球300万客户的共同选择。7x24小时专业服务支持，5天内无理由退订，免费快速备案。

安全杀毒 2024-07-13 20:00:00

鳄鱼皮带,鳄鱼皮钱包,鳄鱼夹包,鳄鱼皮手袋,鳄鱼皮腰带,鳄鱼皮具,鳄鱼皮皮带,鳄鱼钱包,鳄鱼皮制品,双钲贸易,东莞市法彭皮具有限公司

贸易批发 2026-01-25 18:07:06

我惠云

电影视频 2026-01-25 18:08:36

N08904不锈钢

浙江宏盛特钢有限公司专业生产各种耐磨耐热耐高温不锈钢，主要牌号有N08904、904L不锈钢管及314不锈钢管，公司产品已通过国家A级压力管道认证，欧盟PED认证及英国劳氏质量管理体系认证。产品主要应用于海水热交换器,电厂烟气脱硫装置及耐高温腐蚀工作环境管道。

网络应用 2026-01-25 21:27:23

熊猫商服网络

熊猫商服网络是高端网站建设定制服务平台，为企业提供专业、优质的网站建设解决方案。

行业信息 2026-01-25 21:34:53

联系方式

电影视频 2026-01-28 21:03:57

剑南春集团公司

四川剑南春(集团)有限责任公司,剑南春始于南齐,兴于盛唐,1500年匠心坚持,御酒始终如一.在唐代是皇室贵族钟爱的宫廷御酒,在现代是社会精英首选的中国名酒.

历史文化 2026-01-29 11:58:56

墨迹天气预报

墨迹天气预报app，全球约6.5亿人在使用的天气预报app，支持199个国家20多万个城市及地区的天气查询，精准定位及时推送，实时监测阴晴雨雪，实时空气质量及空气质量等级预报。

手机软件 2026-01-29 13:11:55

永康市丽孜网络科技有限公司

丽孜汽车为您提供最新的汽车资讯,全面的车型导购和实用的行驶技巧,帮助您选择合适的车型、提升驾驶技能

新闻资讯 2025-02-06 00:30:49

企业专线

亿联云(Elinkcloud)专注于企业专线、SDWAN、云专线、IDC托管服务，为企业提供北京、天津、上海、广州、深圳IDC托管，SD-WAN组网、SASE安全方案、云专线、BGP带宽、CN2带宽服务。

安全杀毒 2025-02-06 13:23:19

奇精机械股份有限公司

奇精机械股份有限公司是一家具有持续创新能力的多元化智能制造企业，现已形成家电零部件、汽车零部件及电动工具零部件三大业务的产业格局。总部位于浙江宁波，并在宁波宁海、合肥、上海、泰国等地设立多家子公司...

企业品牌 2025-03-04 21:19:11

解锁雪人宝宝雪人获取秘籍大公开诛仙手游攻略 (解锁雪人宝宝攻略)

在诛仙手游中，雪人宝宝作为一种受欢迎的宠物，不仅外观憨态可掬，还拥有不错的战斗属性，因此深受玩家们的喜爱，然而，如何获得这个可爱的雪人宝宝，却是不少玩家心中的疑问，今天，我们就来分享几种获得雪人宝宝的方法，帮助大家轻松拥有这只萌宠，方法一，参与节日活动在诛仙手游中，雪人宝宝常常作为节日活动的奖励出现，例如，在以往的绚烂烟花庆新年活动中...。

2025-02-02 18:08:14

写公众号不怕白嫖就怕白嫖了还卖乖 (写公众号不怕投诉吗)

最初做公众号是为了记录自己的工作笔记，17年18年只是小打小闹，去年才开始认真写点东西，今年的产量和质量都不如去年，之前7月本来想断更的，后来几个朋友又给我说，希望我能坚持，所以后来又忍不住偶尔更新一下，我自认我的文笔只是一般，从来没有以大神自居，写的东西98%是免费，几乎没有保留，通过写公众号，认识了一些人，也得到了一些好评，当然，...。

2025-01-31 03:01:47

家丑 WHY? 乐视工程师给自家服务器植入木马 (家丑不可外扬是什么意思)

屋漏偏逢连夜雨，乐视又来事儿了，这次还是内部人员搞事儿，工程师阎某与其上家吴某合谋给乐视207台服务器植入木马病毒狠赚一笔，然后被抓了，事情大概是这样发生的，2017年1月吴阎cp宿命般相遇了，哦，还漏了他们的，红娘，阿布小组，网名，阿布小组，可是个厉害人物，煽动指使了吴某结识当时还在乐视云计算有限公司担任工程师的阎某，并向他...。

2025-01-30 18:45:07

收获更快需要选对时机加盟一家火锅店 (收获更快需要多久)

疫情后的餐饮行业，上半年处于一个复苏状态，总体来说，处在一个创业旺潮，想要选择餐饮赛道的创业者们，一定要选对时机！什么时候是好时机，小朝哥告诉你，下半年就是加盟火锅店非常好的时机，下半年加盟火锅店的优势如下，一、下半年节假日多，火锅成为聚会优选众所周知，节假日一到，餐厅的生意非常火，不管是当地消费者外出聚会，还是旅游消费者前来用餐，节...。

2025-01-16 00:47:54

淘宝网上的二手中药一定可靠吗 (淘宝网上的二手手机可靠吗)

20岁女大学生确诊肠癌晚期，医生奉劝，麻辣烫千万要少吃！2018，05，3008，42今天的故事主人公叫幺幺，今年20岁，现在在宁波读大学，幺幺很喜欢美食，可以说刚来宁波上大学一年多，已经对宁波的美食了如指掌了，相当会吃，是个名副其实的小吃货！向左转，向右转幺幺特别喜欢又辣又刺激又冰爽的食物！特别讨厌不温不火的餐食，幺幺吃过几次食堂的...。

2024-12-06 14:40:41

保时捷罗盘有什么功能 (保时捷罗盘有几种)

保时捷罗盘是一款功能强大的车载工具，它可以作为指南针，在行驶过程中为车主提供方向提示，这款罗盘由方位刻度、红色三角标、方位字母和中间液晶显示屏等部分组成，通过这些部分可以清晰地了解当前车辆的方向，其中，E代表东方，ES代表东南方，S代表南方，W代表西方，WN代表西北方，N代表北方，NE代表东北方，要使用保时捷罗盘，需要经过保时捷专用的...。

2024-11-24 16:55:09

出餐快吗一碗鸡动人心的手撕椒麻鸡饭的服务水平如何 (快餐一碗饭多少克)

随着生活节奏的加快，越来越多的白领职场人士会选择快餐做为自己的餐食，快餐的食物丰富多样，有各种鸡排饭、铁板烧、手撕椒麻鸡等，食物花样多，能够满足不同群体的餐食需求，市面上的一碗鸡动人心的手撕椒麻鸡饭就是个不错的品牌，很多网友就想要加入其中，那么，一碗鸡动人心的手撕椒麻鸡饭的服务水平如何，出餐快吗，一碗鸡动人心的手撕椒麻鸡饭的服务水平如...。

2024-11-22 20:16:54

需要退费与成都百合佳缘签署合同一个月未引见资源对方逃避 (退费要手续费)

申明，1.以上内容仅代表揭发者自己，不代表黑猫揭发立场，2.未经授权，本平台案例制止任何转载，违者将被清查法律责任，3.黑猫揭发处置揭发不收取任何费用，凡以黑猫揭发名义不要钱的均为混充、诈骗行为，请及时报警并与黑猫官网反应，揭发邮箱heimaotousu@vip.sina.com，4.请大家选用官网渠道处置生产纠纷，不要轻信第三方机构...。

2024-07-17 19:12:29

八戒传媒电影推行赚钱是真的吗 (八戒传媒电影推广赚钱会不会违法)

八戒传媒电影推行赚钱不是真的，首先，须要明白的是，电影推行自身是一个合法的商业行为，经过推行可以吸引更多的观众，参与电影的票房支出，但是，八戒传媒电影推行赚钱的说法很或许是虚伪的，这理论是一种网络坑骗手腕，这些坑骗者理论会以高额的利润为诱饵，吸引人们投资电影推行名目，但实践上这些名目往往不存在或许基本不可盈利，其次，即使有些电影推行名...。

2024-07-13 21:05:21

离故乡距离什么软件 (离故乡的句子说说或心情)

在户外测距普通都须要专业的测距工具或许很长的卷尺，这些工具不好携带不说经常使用起来还费事，当咱们对数据要求不须要太准确的时刻，可以选用手机步行测量距离软件，经常使用手机步行测量距离软件不只测距繁难，数据也会愈加准确，那么当天小编给大家介绍几款好用的手机步行测量距离软件，1.高德地图高德地图，专业的手机地图，北京MaaS官网平台！20...。

2024-07-08 18:20:03

QMD电脑版下载-QMD音乐电脑版v1.7.2最新版

QMD音乐电脑版是一款非常专业的音乐下载工具，支持一键搜索自己喜欢的音乐，不仅仅可以试听超高品质的音乐，还可以免费下载高品质无损音乐。

2023-11-04 20:48:14

高达370.84亿元三大航上半年大幅减亏|南航|东航|国航|国际航班|国际航线

高达370.84亿元三大航上半年大幅减亏,南航,东航,国航,三大航,国际航班,国际航线

2023-09-02 16:46:53

文章推荐

实体老板怎么获取源源不断的客户 (实体老板怎么赚钱)

2024年想要提升客流量，想要获取源源不断的客户，就一定要懂得做裂变，很多人不懂怎么做流量，怎么做裂变，给你分享一个系统的方法，1.导流量通过诱饵，渠道的方式导流，1，诱饵设计能够吸引客户并且能够带来客户的诱饵，诱饵一定要具备以下几点，①低成本但是这个成本也是相对来讲的，低成本肯定是成本越低越好，还有就是看投入产出比，投入产出越高，...。

2025-01-31 01:46:10

网络百科

揭秘网红经济是什么鬼！一份行业深度报告 (揭秘网红经济乱象)

网红绝非整容后高度相似的高颜值美女那么简单，其生态非常丰富也非常多样化，甚至包括被热搜的网红孵化器，来源，松松科技QQ，微信，lusongsong7本文地址，https，down.lusongsong.com，info，5449.html代理松松云可增加3个业务帮您快速开拓市场，吸引用户了解详情...。

2025-01-30 17:36:50

网络百科

中芯国际与ASML签12亿美元光刻机订单；五家社区团购企业被行政处罚；法国开始拆除华为设备 (中芯国际与ai芯片)

12亿美元买光刻机！中芯国际与阿斯麦签下大单3月3日，中芯国际发公告称，公司根据批量采购协议，已于2020年3月16日至2021年3月2日的12个月期间，就购买阿斯麦产品与阿斯麦集团签订了一份高达12亿美元价格的购买单，签订方是阿斯麦上海，根据公告，该公司是ASMLHoldingN.V.的附属公司之一，公司称，自2018年1月起，公司...。

2024-12-09 21:43:19

资讯动态

如何看待安徽灵璧县渔沟中学校园暴力事件? (如何看待安徽的高铁)

校园暴力事件频发，引发社会广泛关注，青少年时期，本应是充满阳光和梦想的时期，然而，校园霸凌却如同阴云，遮蔽了这一片纯净的天空，未成年人保护法，本应成为保护弱小者的盾牌，却在这场事件中，成为加害者的庇护所，校园霸凌事件，往往以一种固定的模式展开，举报、传播、舆论发酵、惩罚和司法处理，然而，核心问题在于舆论的影响力，一旦事件被关注，就可能...。

2024-11-29 17:20:36

资讯动态

显示器怎么当电视机用 (显示器怎么当监控显示屏)

发表在专业问答2022，4，2717，29展示机型信息，品牌型号，优派VA2478、当贝MAX1系统版本，Linux、当贝OS3.0显示器在外接了智能电视盒子或有线机顶盒以后就可以当做电视使用了，以下是具体的操作步骤，显示器怎么当电视机用外接智能电视盒子，1.连接电视盒子使用HDMI线将显示器和智能电视盒子进行连接；2.识别信号源然后...。

2024-11-28 18:44:10

网络百科

信息瓶颈 再解读 携手 聚焦 信息压缩 MIT 理论 IBM (信息瓶颈算法)

噪声神经网络与互信息评估

将聚类作为压缩的驱动因素

相关文章

文章推荐

信息瓶颈再解读携手聚焦信息压缩 MIT 理论 IBM (信息瓶颈算法)