自动调整超参数 谷歌 图表示学习最新成果 解决重叠区域描述难题 AI (超参数调节)

文章编号:43941 资讯动态 2024-12-09 图表示学习 谷歌

雷锋网 AI 科技评论按,表示实体之间关系的关系数据在网络(如在线社交网络)和物理世界(如蛋白质交互网络)中随处可见。这些数据可以表示为一个带有节点(如用户、蛋白质)和连接它们的边(如社交网络中的朋友关系、蛋白质之间的相互作用)的图。

不久前,谷歌 AI 发布了一篇博文,介绍了他们在图 embedding 上面的两篇论文成果。其中,其中一篇论文解决了如何更好地描述具有重叠区域的网络,第二篇论文解决了图 embedding 中超参数调整的基本问题。雷锋网 AI 科技评论将他们的博文编译如下。

考虑到图的广泛流行,图分析在机器学习中起着基础性的作用,在集群、关系预测、隐私和其他方面都有应用。要将机器学习方法应用于图(例如,预测新的友谊,或发现未知的蛋白质相互作用),需要学习一种可用于 ML 算法的图形表示。

然而,图本质上是由离散部分(如节点和边)组成的组合结构,而许多常见的 ML 方法(如神经网络)更倾向于连续结构,特别是向量表示。矢量表示在神经网络中特别重要,因为它们可以直接用作输入层。为了解决在 ML 中使用离散图表示困难的问题,图嵌入方法为图学习一个连续的向量空间,将图中的每个节点或边分配给向量空间中的特定位置。在这一领域,一种流行的方法是基于随机移走的表示学习,正如在 DeepWalk 中引入的一样。

谷歌 AI 图表示学习最新成果:解决重叠区域描述难题,自动调整超参数

左图:代表社交网络的著名 Karate 图表。右图:使用 DeepWalk 在图中连续嵌入节点的空间。

在这里,我们展示了最近两篇关于图 embedding 的论文的结果:The web conference 2019 会议论文「 Is a Single Embedding Enough? Learning Node Representations that Capture Multiple SoCIAl ConTexts 」和 Neurips' 2018 论文「 Watch Your Step: Learning Node Embeddings via Graph Attention 」。第一篇文章介绍了一种新颖的技术来学习每个节点的多个嵌入,从而能够更好地描述具有重叠区域的网络。第二个问题解决了图嵌入中超参数调整的基本问题,使人们可以轻松地部署图嵌入方法。我们也很高兴地宣布,我们已经在 Google Research Github 图嵌入库中发布了这两篇论文的代码。

学习节点表示,捕获多个社交背景

在几乎所有情况下,标准图嵌入方法的关键假设是必须为每个节点学习单个嵌入。因此,嵌入方法的作用可以认为是识别在图的几何图形中,表征每个节点的单个角色或位置。然而,最近的研究发现,真实社区中的节点属于多个重叠的区域,扮演着多个角色。想想你的社交网络,在那里你既参与到你的家庭社区中,又参与到你的工作社区中。这引发了以下问题:是否有可能开发将节点嵌入多个向量中,表示它们参与重叠的区域的方法?

在我们的 The web conference 2019 论文中,我们开发了 Splitter,这是一种无监督的嵌入方法,允许图中的节点具有多个嵌入,以便更好地表示它们在多个社区中的参与。我们的方法是基于最近在基于 ego-network 分析的重叠聚类中的创新,特别是使用了人物图概念。该方法获取一个图 G,并创建一个新的图 P(称为角色图),其中 G 中的每个节点都由一系列称为角色节点的副本表示。节点的每个角色表示它所属的本地社区中节点的实例。对于图中的每个节点 U,我们分析节点的 ego-network(即连接节点与其邻居的图,在本例中是 A、B、C、D),以发现节点所属的本地社区。例如,在下图中,节点 U 属于两个社区:集群 1(与 A 和 B 一起,表示 U 的家人)和集群 2(与 C 和 D 一起,表示 U 的同事)。

谷歌 AI 图表示学习最新成果:解决重叠区域描述难题,自动调整超参数

节点 U 的 ego-net

然后,我们使用这些信息将节点 U「分割」为两个角色 U1(家庭角色)和 U2(工作角色)。这将两个社区分离开来,使它们不再重叠。

谷歌 AI 图表示学习最新成果:解决重叠区域描述难题,自动调整超参数

ego-splitting 将两个角色中的 U 节点分离

该技术已被用于改善图形嵌入方法中的最新结果。这种改进的关键原因是该方法能够消除社交网络和其他现实世界的图中高度重叠的社区的歧义。我们进一步通过对作者所属的重叠研究群体(如机器学习和数据挖掘)的合作关系图的深入分析来验证这一结果。

谷歌 AI 图表示学习最新成果:解决重叠区域描述难题,自动调整超参数

左上角:具有高度重叠社区的典型图。右上角:使用 node2vec 在左侧 embedding 图的传统方法。左下角:上图中的角色图。右下角:角色图的拆分器 embedding。

通过图注意力自动调整超参数

图 embedding 方法在各种基于 ML 的应用程序上表现出了突出的性能,但它们有许多必须手动设置的超参数。例如,在学习 embedding 时,附近的节点比远处的节点更重要吗?即使专家可以微调这些超参数,但他们必须对每个图单独进行调整。为了避免这种手工操作,在第二篇论文中,我们提出了一种自动学习最优超参数的方法。

具体来说,许多图 embedding 方法,如 DeepWalk 等,都采用随机移走来探索给定节点周围的上下文(即直接邻居、邻居的邻居等)。这样的随机移走可以有许多超参数,允许调整图的局部搜索,从而调节 embedding 到附近节点的注意力。不同的图可能会呈现不同的最佳注意力模式,因此会呈现不同的最佳超参数(见下图,其中我们展示了两种不同的注意力分布)。

谷歌 AI 图表示学习最新成果:解决重叠区域描述难题,自动调整超参数

我们的新方法自动进行超参数调整,注意你的步骤,使用注意力模型来学习不同图的上下文分布。上面显示的是两个关于中心节点(黄色)和上下文分布(红色渐变)的示例,由模型学习得来。左边的图显示了一个更分散的注意力模型,而右边的分布显示了一个集中在直接邻居上的模型。

这项工作属于日益壮大的 AutoML 家族,我们希望减轻优化超参数的负担,这是实际机器学习中的一个常见问题。许多 AutoML 方法都使用神经结构搜索。本文给出了一个变量,我们使用 embedding 中超参数与图论矩阵公式之间的数学关系。「Auto」部分对应于通过反向传播学习图的超参数。

我们相信,我们的贡献将进一步推进图 embedding 的研究现状。我们学习多节点 embedding 的方法在丰富和深入研究的重叠社区检测领域中起到了一定的作用。我们相信后一种图 embedding 方法将为今后的研究带来丰硕的成果。这一领域的一个开放性问题是使用多种 embedding 方法进行分类。此外,我们在学习超参数方面的贡献将减少昂贵的手动调优工作,促进图 embedding 的研究。我们希望这些论文和 代码 的发布将有助于推动这些研究。

如果想要了解更多信息,请访问我们的主页!

via:

版权文章,未经授权禁止转载。详情见 转载须知 。

谷歌 AI 图表示学习最新成果:解决重叠区域描述难题,自动调整超参数


本文地址: https://www.gpxz.com/article/e4d49590a70b85182803.html
全局中部横幅
全局中部横幅
番茄表单

番茄表单-简洁易用的在线表单设计、数据管理工具,提供海量模板、即时统计、移动办公、团队协作等功能。适配在线报名、满意度调查、产品反馈、信息登记、预约订购、行政财务等各种需要收集信息的场景,还可嵌入至微信公众号、企业网站等多种渠道,后台生成的报表让数据分析更简单,帮助你轻松完成客户管理和营销工作。

海瑟成语网

无论老师、学生或是文化爱好者,位峡成语网在为所有对中华语言充满热情的朋友们提供一个互动、学习和分享的平台。

北京二手房

北京链家网是提供北京二手房买卖、北京新房、北京租房、北京房价查询等业务的专业房产网站,可为您买卖北京二手房提供帮助,链家网北京站同时具有北京二手房、北京租房及购房问答和百科等频道,还可以在线查询北京二手房价格.买房卖房上北京链家网,让房产交易不再难.

江苏金通环境科技有限公司

江苏金通环境科技有限公司成立于2017年,是一家专注于环保产品研究、开发、生产及销售的高科技企业,公司坐落于风景秀丽的江南水乡江苏金坛。 公司自成立以来,始终坚持以人才为本、诚信立业的经营原则,荟萃业界精英,将先进的信息技术、管理方法及企业经验与企业的具体实际相结合,使企业在激烈的市场竞争中始终坚持着较强竞争力,实现企业快速、稳定地发展。 公司人才结构合理,拥有多名高新技术骨干,多支经验丰富的安装队伍,保证公司在各个项目中出色完成各项工作内容,并得到甲方的一致好评。 雄厚的技术力量,优质低价的产品,精湛的安装工艺,一流的营销售后服务,是您最佳的选择,也愿意成为您最可信赖的长期合作伙伴。

郑州农业规划设计院

河南赛雅园林景观设计有限公司专业从事河南农业规划设计院,郑州农业规划设计院,河南现代农业规划设计,郑州现代农业规划设计,河南休闲农业规划设计,河南田园综合体规划设计,郑州田园综合体规划设计,是一家策划规划运营为一体的综合服务商,公司始终本着高标准设计水准和与时俱进的设计方法,追求策划规划设计的精髓。公司成立以来,始终本着“诚信为本、共同繁荣”的服务经营理念,多年来以为众多客户提供了优质的设计服务,得到客户一致好评。

易企秀

易企秀-免费H5页面制作工具-微信H5页面,微信朋友圈会议邀请函,电子贺卡,动态音乐相册,电子微杂志,节日贺卡等,易企秀提供海量H5微场景模板,轻松制作一键生成H5页面,为您助力移动自营销,酷炫展示H5企业自营销页面-易企秀官网

无锡宏创电子

家用电器微电子控制器、暖通空调智能控制系统、楼宇自控等系列智能化产品的应用和发展。主要产品有:即热式热水器恒温控制器、智能马桶瞬时加热模块、智能马桶控制器、集成环保灶控制器、家用及中央空调控制系统、变频多联中央空调控制系统、新风换气机控制器、智能开关控制器、电子式漏电保护器

上海艺术合子美术学校

上海虹口区艺术合子美术进修学校自办校以来,一直致力于推动全人发展的艺术教育,专攻“美术高考”、“艺术留学”和“美术基础”;是为报考中国顶尖艺术设计院校、留学海外艺术名校、培养艺术基础的学生提供专业教育的美术学校,是广大学子成就梦想的起点。

生物除臭设备,一体化地埋式污水处理设备,一体化净水器设备,

江苏通特环保科技有限公司是生产生物除臭设备,一体化地埋式污水处理设备,一体化净水器设备,膜精密过滤器等系列成套水处理设备及废气净化设备的专业生产厂家。

得到App

超过3500万用户使用得到App。这里有罗振宇,薛兆丰,武志红,香帅,何帆等100位专家学者的独家课程,也有专业说书人为你解读好书,更有上万本电子书等你任意试读


全局底部横幅