用限制图机器学习无处不在 Transformer 可缓解 GNN (限制性作图的基本原理和方法)

文章编号：36808 资讯动态 2024-11-30 图机器学习 Face Hugging 异质图

在我们今天的生活中，图的示例包括社交网络、例如Twitter、Mastodon、以及任何链接论文和作者的引文网络，分子，知识图、例如 UML 图、百科全书以及有超链接的网站，表示为句法树的句子以及任何的 3D 网格等，可以说图已经无处不在。

近日，Hugging Face 研究科学家 Clémentine Fourrier 在文章《Introduction to Graph Machine Learning》就介绍了今天这种无处不在的图机器学习。什么是图形？为什么要使用图？如何最好地表示图？人们如何在图上学习？Clémentine Fourrier 指出，图是对由关系链接项目的描述，其中，从前神经方法到图神经网络仍然是目前人们常用的图上学习方法。

此外，有研究人员近期也开始考虑将 Transformers 应用于图中，Transformer 具有良好的可扩展性，可缓解 GNN 存在的部分限制，前景十分可观。

图是对关系链接项目的描述

从本质上来看，图是对由关系链接项目的描述。图（或网络）的项目称为节点（或顶点），由边（或链接）来进行连接。例如在社交网络中，节点是用户，边是用户彼此间的连接；在分子中，节点是原子，边缘是它们的分子键。

可以看到，使用数据必须首先考虑其最佳表示，包括同质/异质、有向/无向等。

在图层面，主要任务包括以下：

节点层通常是对节点属性的预测，例如 Alphafold 使用节点属性预测来预测给定分子整体图的原子 3D 坐标，从而预测分子如何在 3D 空间中折叠，这是一个困难的生物化学问题。

边缘的预测包括边缘属性预测和缺失边缘预测。边缘属性预测有助于对药物副作用的预测，给定一对药物的不良副作用；缺失边预测在推荐系统中则是用于预测图中的两个节点是否相关。

在子图级别中，可进行社区检测或子图属性预测。社交网络可通过社区检测来确定人们的联系方式。子图属性预测多应用在行程系统中，例如谷歌地图，可用于预测预计到达时间。

当要进行预测特定图的演变时，转换设置工作中的所有内容，包括训练、验证和测试等，都可在同一个图上完成。但从单个图创建训练、评估或是测试的数据集并非易事，很多工作会使用不同的图（单独的训练/评估/测试拆分）完成，这被称为归纳设置。

表示图处理和操作的常见方法有两种，一种是作为其所有边的集合（可能由其所有节点的集合补充），或是作为其所有节点之间的邻接矩阵。其中，邻接矩阵是一个方阵（节点大小×节点大小），指示哪些节点直接连接到其他节点。要注意的是，由于大多数图并不是密集连接的，因此具有稀疏的邻接矩阵会使计算更加困难。

图与 ML 中使用的典型对象非常不同，由于其拓扑结构比“序列”（如文本和音频）或“有序网格”（如图像和视频）更复杂：即便可以将其表示为列表或矩阵，但这种表示不可以被视为是有序对象。也即是说，如果打乱一个句子中的单词，就可以创造一个新句子，如果将一个图像打乱并重新排列它的列，就能创建了一个新图像。

图注：Hugging Face 标志和被打乱的 Hugging Face 标志，是完全不同的新形象

但图的情况并非如此：如果我们洗掉图的边缘列表或邻接矩阵的列，它仍然是同一个图。

图注：左边是一个小图，黄色表示节点，橙色表示边；中心图片上的邻接矩阵，列和行按节点字母顺序排列：节点 A 的行（第一行）可以看到其连接到 E 和 C；右边图片打乱邻接矩阵（列不再按字母顺序排序），其仍为图形的有效表示，即 A 仍连接到 E 和 C

通过 ML 的图形表示

使用机器学习处理图的常规过程，是首先为项目生成有意义的表示，其中，节点、边或完整图取决于具体任务需求，为目标任务训练预测器。与其他模式一样，可以通过限制对象的数学表示，以便在数学上与相似对象接近。但在此之中，相似性在图 ML 中很难严格定义：例如，当两个节点具有相同的标签或相同的邻居时，它们是否更相似？

如下面所示，本篇文章重点关注的是生成节点表示，一旦有了节点级的表示，就有可能获得边或图级的信息。对边级信息，可以将节点对的连接起来，或者做点乘；在图级信息中，可以对所有节点级表示的串联张量进行全局池化，包括平均、求和等。但是，它仍然会使整个图的信息变得平滑和丢失——递归的分层集合可能更有意义，或者增加一个虚拟节点，与图中的所有其他节点相连，并将其表示作为整个图的表示。

简单地使用工程特性

在神经网络之前，图形及其感兴趣的项目可以通过特定任务的方式表示为特征的组合。在今天，这些特征仍用于数据增强和半监督学习，尽管存在更复杂的特征生成方法，但根据任务找到如何最好地将这些特征提供给到网络至关重要。

节点级特征可以提供关于重要性的信息以及基于结构的信息，并对其进行组合。

节点中心性可用于衡量图中节点的重要性，通过对每个节点邻居中心性求和直到收敛来递归计算，或是通过节点间的最短距离度量来递归计算，节点度是其拥有的直接邻居的数量；聚类系数衡量节点邻居的连接程度；Graphlets 度向量计算则可计算有多少不同的 graphlets 以给定节点为根，其中，graphlets 可使用给定数量的连接节点来创建的所有迷你图。

边级特征用关于节点连通性的更详细信息补充表示，其中就包括了两个节点之间的最短距离、它们的共同相邻点以及 Katz 指数（指两个节点之间可能走过的一定长度的路径的数量——其可以直接从邻接矩阵中计算出来）。

图级特征包含关于图相似性和特殊性的高级信息，其中，小图计数，尽管计算成本很高，但提供了关于子图形状的信息。核心方法通过不同的 "节点袋 "方法（类似于词袋）来衡量图之间的相似性。

基于行走的方法使用随机行走中从节点 i 访问节点 j 的概率来定义相似性度量，这些方法结合了局部和全局信息。例如，此前 Node2Vec 模拟图形节点之间的随机游走，使用 skip-gram 处理这些游走，就像我们处理句子中的单词一样，以计算嵌入。

这些方法还可用于加速 PageRank 方法的计算，该方法给每个节点分配一个重要性分数，基于它与其他节点的连接，例如通过随机行走来评估其访问频率。但上述方法也存在一定的局限性，它们不能获得新节点的嵌入，不能很好地捕捉节点之间的结构相似性，不能使用添加的特征。

图神经网络如何处理图？

神经网络可以泛化到看不见的数据。考虑到此前提到的表示约束，一个好的神经网络应该如何处理图？

典型的神经网络不是排列不变的，例如 RNN 或 CNN，因此一种新的架构——图神经网络被引入（最初是作为一种基于状态的机器）。

一个 GNN 是由连续的层组成的。GNN 层将节点表示为其邻居的表示和来自上一层（消息传递）的自身组合，通常还会加上激活以添加一些非线性。而与其他模型相比，CNN 可看作是具有固定邻居大小（通过滑动窗口）和排序（非排列等变）的 GNN；而没有位置嵌入的 Transformer 可以看作是全连接输入图上的 GNN。

聚合来自节点邻居的信息有很多方法，例如求和、平均，此前已有的类似聚类方法包括：

选择一个聚合：一些聚合技术（特别是平均/最大集合）在创建精细表示以区分类似节点的不同节点邻居表示时，会遇到失败的情况；例如，通过均值集合，一个有4个节点邻居表示为1、1、-1、-1，平均为0，与一个只有3个节点表示为-1、0、1的邻居是没有区别的。

在每个新层，节点表示包括越来越多的节点。一个节点通过第一层，是其直接邻居的聚合。通过第二层，它仍然是其直接邻居的聚合，但此刻其表示还包括了它们自己的邻居（来自第一层）。在 n 层之后，所有节点的表示成为其距离为 n 的所有邻居的集合，因此，如果其直径小于n，则为全图的聚合。

如果网络层数太多，则存在每个节点成为完整图的聚合的风险（并且节点表示对所有节点收敛到相同的表示），这被称为过度平滑问题，可通过以下方式来解决：

过度平滑问题是图 ML 中的一个重要研究领域，由于它会阻止 GNN 扩大规模，就像 Transformers 在其他模型中被证明的那样。

没有位置编码层的 Transformer 是置换不变的，并且 Transformer 还具有良好的可扩展性，因此研究人员在近期开始考虑将 Transformers 应用于图中。大多数方法的重点是通过寻找最佳特征和最佳方式来表示图形，并改变注意力以适应这种新数据。

下面展示了一些方法，这些方法在斯坦福大学的 Open Graph Benchmark 上取得最先进或接近的结果：

近期有研究“Pure Transformers are Powerful Graph Learners”在方法中引入了 TokenGT，将输入图表示为一系列节点和边嵌入，也即是使用正交节点标识符和可训练类型标识符进行增强，没有位置嵌入，并将此序列作为输入提供给 Transformers，此方法非常简单，同时也非常有效。

此外，在研究“Recipe for a General, Powerful, Scalable Graph Transformer”中，跟其他方法不同的是，它引入的不是模型而是框架，称为 GraphGPS，可允许将消息传递网络与线性（远程）Transformer 结合起来，轻松创建混合网络。该框架还包含几个用于计算位置和结构编码（节点、图形、边缘级别）、特征增强、随机游走等的工具。

将 Transformer 用于图在很大程度上仍处于起步阶段，但就目前来看，其前景也十分可观，它可以缓解 GNN 的一些限制，例如缩放到更大或更密集的图，或是在不过度平滑的情况下增加模型大小。

图机器学习无处不在，用 Transformer 可缓解 GNN 限制

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！

版权文章，未经授权禁止转载。详情见转载须知。

图机器学习无处不在，用 Transformer 可缓解 GNN 限制

本文地址： https://www.gpxz.com/article/a69f1949b2059970567e.html

上一篇：ChatGPTAPI中国厂商往何处去正式发布chatgp

下一篇：李航ACM名单公布恭喜梅宏Fellow俞栋2022邢

ICP备案查询

站长工具ICP备案可通过域名、备案号、公司名称查询备案信息，备案信息有域名、备案主体单位（个人或公司）、备案号等，还展示备案企业工商信息、该单位当前备案、注销备案及备案历史信息。

网站模板 2023-12-12 16:53:50

CCTV

CCTV-5体育频道直播页提供CCTV-5体育频道24小时高清直播信号，是网民全天候收看CCTV-5的最佳平台。

体育竞技 2024-11-13 11:08:17

影视大全

影视大全每天搜集互联网最新电影和电视剧，影视大全高清版为广大用户免费提供无广告在线观看电影和电视剧，影视大全及时收录最新、最热、最全的电影大片,高清正版免费看。

电影视频 2026-01-21 14:53:05

工作服

江西工作服批发厂家【沃克迪威】，中铁工作服定做直供厂家，订购电话17779191800

贸易批发 2026-01-24 23:10:28

安徽省凯宏刷业有限公司

凯宏刷业

电影视频 2026-01-29 13:22:42

儿童安全

vueserversiderender

安全杀毒 2026-01-29 14:26:50

杂粮面粉山珍拾贰农韵

【自有工厂】阿胶糕、阿胶块、阿胶枣、阿胶姜茶、阿胶大礼包【坚果礼盒】三只松鼠良品铺子百草味沃隆甘源三胖蛋臻味鲜品屋好想你洽洽法蒂欧如水稻香村来伊份谛品居京垦鲜物道中粮山萃美蒂斯集味轩【糖果糕点】稻香村、徐福记好丽友华美德芙歌帝梵百事春光广州酒家嘉士利熟食:东来顺紫光园双汇紫燕天福号13326258976

电影视频 2026-01-29 15:15:58

天奇生活网

天奇生活网站为您提供生活百科、生活常识、城市美食、数码科技、女性时尚等多样化信息，以及教学教程，丰富您的生活。

电影视频 2026-01-29 16:20:35

四川省江苏商会

电影视频 2026-01-29 17:57:03

海绵机械

扬州福达海绵机械有限公司专业生产海绵机械,软木机械,软木旋切机，软木平切机等,咨询0514-87513996，主要产品：聚氨酯抛光片平切机、海绵机械（平切机、旋切机、打孔机、立切机），软木机械（平切机、旋切机）橡胶机械（平切机、旋切机、刨切机）压力机（单缸压力机、双缸压力机）等一些列配套设施，另还有火焰复合机、胶粘复合机、搅拌机等。尤其是生产的软木机械和橡胶机械及聚氨酯平切机，拥有多项发明专利的使用权，在软木和橡胶行业深耕多年，拥有良好的口碑，广泛获得客户的认可。通过不断的积累和进步，逐步开发出新的产品提高竞争力，以适应现在的市场环境。

编程开发 2025-02-08 03:32:31

艺考培训

中影人教育，是北京艺考培训教育品牌，建校18年只做艺考培训，宗旨：让每一个艺考生都能上满意的大学。学校开设影视表演艺考培训、影视编导艺考培训、播音主持艺考培训、舞蹈艺考培训、音乐剧艺考培训，艺考专业本科合格率达98%，一本院校合格率达79%

音乐歌曲 2026-01-31 15:43:28

沧州市圣渤实业有限公司

沧州市圣渤实业有限公司，是我国电采暖领域中集科研、开发、制造、销售、安装于一体的高科技技术公司诚信为本欢迎来电咨询。咨询热线：13473702226

编程开发 2026-02-17 21:11:34

ICCV 2021放榜！发现一篇宝藏论文 (iccv2024截稿日期)

经过漫长的等待，ICCV2021终于迎来放榜时刻！最终1617篇论文被接收，接收率为25.9%，相比于2017年，约29%，，保持了和2019年相当的较低水平，而投稿量则依旧逐年大幅增长，从2017年的2143篇，到2109年的4328篇，再到如今的6236篇，相比上一届多了50%左右，你看邮件的时候是这表情吗，官方皮起来也是接地气、...。

2024-12-09 22:40:05

东软医疗黄峰 AI助力解决医疗痛点问题的路径探索 (东软医疗黄峰)

近日，第六届全球人工智能与机器人大会，GAIR2021，在深圳正式闭幕，140余位产学领袖、30位Fellow聚首，从AI技术、产品、行业、人文、组织等维度切入，以理性分析与感性洞察为轴，共同攀登人工智能与数字化的浪潮之巅，在医疗科技高峰论坛上，东软医疗人工智能研究院院长，MDaaS事业群总经理黄峰博士以，AI助力解决医疗痛点问题的路...。

2024-12-09 18:34:04

奇安信再获CNNVD多项重磅大奖奋楫争先 (奇安信再获北京市隐形冠军)

5月24日，国家信息安全漏洞库，CNNVD，2022年度工作总结暨优秀支撑单位表彰大会在中国信息安全测评中心隆重举行，奇安信作为CNNVD一级技术支撑单位，凭借在漏洞报送数量和质量等方面的突出贡献，在167家技术支撑单位中脱颖而出，荣获，优秀技术支撑单位，、，高价值漏洞优秀贡献单位，、，高价值通报优秀贡献单位，三项大奖，优秀技术支撑单...。

2024-12-09 15:07:58

牛杂加盟 (牛杂加盟店十大品牌)

吃饭需要下饭菜，牛杂就是一个很美味而且很受欢迎的下饭菜，据互动百科介绍，牛杂源于老岭南地区，是用牛肉和牛的别的内脏熬上几个小时做成的一种食品，可以吃的方法有很多，比如牛杂火锅，牛杂海鲜，牛杂串，牛杂碎等，牛杂有牛肚，牛有四肚均可入馔，但蜂窝肚是好吃的，、牛膀、牛肠、牛横利和牛肺等，吃的时候来点辣椒油再加点胡椒粉，味道可口，营养价值高，...。

2024-12-04 15:14:13

加盟自助烧烤哪家好水晶烧烤加盟多少钱 (加盟自助烧烤店)

韩国烧烤在的餐饮市场上，有着充足的发展势头，这与他特殊的口味，和自主化饮食模式的全面提供，是有深切的关系，尤其是如今的水晶烧烤，在提供水晶烧烤盘作为烹饪工具的基础上，进行了烹饪手法的全面创立，让整个食材的搭配有着诱人的口感，也有着绿色安全营养健康的饮食价值体现，这些都带来了成功创业的优佳标准，那么，加盟自助烧烤哪家好，水晶烧烤加盟多少...。

2024-12-02 21:27:25

英特尔的雄心壮志 (英特尔xehpg)

当年英特尔联合创始人戈登·摩尔说出了著名的摩尔定律，芯片的晶体管密度会每2年翻一番，半导体行业大致按照摩尔定律发展了半个世纪，从逻辑上它不可能一直持续下去，但芯片界一直在努力为摩尔定律，续命，拥有最先进制程技术的企业，肯定会最早遇到瓶颈，当英特尔在计划2年完成的事情上花了超过5年的时候，业界都以为摩尔定律要终结了，毕竟，自从50年前...。

2024-11-30 22:00:22

当大模型升级速度变缓 Infra AI 创业还是一门好生意吗 (当大模型升级后会怎样)

作者丨朱可轩编辑丨陈彩娴时至今日，如果说清华系撑起了中国大模型创业的半壁江山，那AIInfra这条赛道绝对是清华系，上阵师徒兵，的又一波创业豪赌，媒体所实验室孵化的清昴智能、高性能计算机研究中心牵头的清程极智、NICS，EFC实验室孕育出的无问芯穹......AIInfra赛道的明星创企几乎都来自清华各大实验室，而硅基流动和潞晨科技的...。

2024-11-30 17:40:14

伊思坦纳换多少升机油? (伊思坦纳多少钱)

关于伊思坦纳车型，2.0的发起机大概须要5升机油，而1.5的发起机则倡导减少4升左右的机油，倡导您查阅汽车维护手册以失掉更准确的加注量，维护名目包含改换机油和机油滤清器，普通状况下，每行驶5000公里须要启动一次性维护，此外，空气过滤器须要内行驶，公里时改换，火花塞每公里改换一次性，在日常维护中，还须要检测制动液、变速箱油、蓄电池、节...。

2024-07-02 14:23:11

itunes怎样下载装置到电脑 (itunes传照片到电脑上)

在Windows高低载和装置iTunes，在哪里下载itunes在苹果官方可以下载到，以下为操作步骤，以Windows764位、Chrome阅读器为例，1.阅读器输入，cn，itunes，，进入苹果官方，2.点击页面右上角蓝底白字，下载，，进入iTunes下载页，3.在弹出的页面中点击立刻下载，4.点击后稍等片刻，阅读器会智能开局下...。

2024-07-01 15:32:12

收费看电视剧软件 (收费看电视剧的软件)

我给大家介绍几款收费看电视剧软件，1、今天影视，今天影视领有丰盛的剧集资源，笼罩了国际外的抢手精品资源，2、腾讯视频，腾讯视频是一款领有海量收费视频资源的软件，包含电影、电视剧、综艺、动漫等外容，3、优酷视频，优酷视频是一款十分好用的收费看电视剧软件，用户可以收费观看高清流利的电视剧、电影等，4、西瓜视频西瓜视频是一款由字节跳动开发的...。

2024-06-30 23:52:41

中小企业在未来应该如何发展呢?

以下是个判断标准中小企业在未来应该如何发展呢第一将公司做小而美集中战略重在细节船小好调头因此将公司规模缩小专注于更精细化的经营即使已经扩大规模也应将公司划分为多个小单元来经营第二将市场做得更大不要将未来的发展寄托在极少数的客户身上而是要通过多样化的客户获取渠道系统应覆盖海陆空等不同领域第三将员工培养得更加专业化重用有能...

2024-01-08 06:45:12

向世界讲述中国故事“普洱景迈山古茶林文化景观”列入遗产名录|世界遗产|茶文化

向世界讲述中国故事“普洱景迈山古茶林文化景观”列入遗产名录,古茶林,普洱景,中国故事,世界遗产,茶文化,迈山

2023-09-19 01:00:42

文章推荐

中国元宇宙游戏有哪些2021 好玩的元宇宙游戏排行榜 (中国元宇宙游戏有哪些)

所谓的元宇宙游戏其实目前还是一个概念，而手机游戏中拥有开放世界设定的游戏就有雏形了，中国元宇宙游戏有哪些2021也是大家十分关注的问题，元宇宙游戏最基础的条件就是要支持一个大型的开放世界，随后在VR技术的支撑之下能够给玩家们带来更大的沉浸感，今天小编为大家带来的就是好玩的元宇宙游戏排行榜，感兴趣的小伙伴一起来看看吧，1、，我的世界，提...。

2025-02-11 23:56:39

资讯动态

加盟要多少钱重庆小面加盟排行榜 (一鸣零食加盟要多少钱)

重庆小面是一个热衷于传承小面文化的时尚品牌，已经打造了独特的品牌优势和品牌知名度，加盟费用大概在5，10万元，品理念等都是绿色环保的追求细节，铸造品牌知名度和品牌优势，采用好的原材料加工爱喝美味的小面，并且追求更好的服务宗旨，营造温馨的环境，提供贴心的服务，为每一个顾客的都提供很好的小面环境，让每一个顾客如是在查宾至如归，使小面品牌和...。

2024-12-21 19:37:44

创业加盟

孩子在游泳池发生溺亡游泳池方面该不该赔? (孩子在游泳池内划伤赔偿标准)

在游泳池发生溺亡事故时，适用过错责任原则，即如果游泳池提供服务存在缺陷，对溺水死亡存在过错的，应对损害的发生承担责任，如果溺亡人一方本身也存在过错的，亦应承担一定的责任，处理此类案件，主要涉及以下3个问题，一、游泳池一方在主观上是否存有过错及其责任承担问题，公共游泳场馆系人身危险多发区，国家有关管理机关颁布有相关的强制性经营、管理规章...。

2024-11-29 14:55:55

资讯动态

中国互联网创业者的困境 (中国互联网创始人徐金)

在硅谷的投资人、分析师看来，中国对他们来说，首先想到的可能就是十几亿人的大市场，每个有手机的人安装一个他们的App，那就是绝对海量的用户群，每个人点击一下他们的广告，他们就赚翻了，每家公司买他们一台设备，他们就可以IPO了，除此之外，他们不会比中国这些已经刺刀见红的创业者更理解中国市场，硅谷的大佬们怕是很少有人关注中国互联网创业者们面...。

2024-11-21 23:13:03

好文分享

介绍对象成功，奖励2000元！乡镇书记朋友圈替村民征婚引热议|红娘|大龄未婚

介绍对象成功，奖励2000元！乡镇书记朋友圈替村民征婚引热议,红娘,征婚,朋友圈,大龄未婚,乡镇书记

2024-09-03 13:57:42

资讯动态

用 限制 图机器学习无处不在 Transformer 可缓解 GNN (限制性作图的基本原理和方法)

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！

相关文章

文章推荐

用限制图机器学习无处不在 Transformer 可缓解 GNN (限制性作图的基本原理和方法)