KDD2021 实验室AutoML团队开源高效的通用黑盒优化系统OpenBox DAIR 北大 (KDD2025)

文章编号:40715 资讯动态 2024-12-03 DAIR OpenBox
北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

北京大学崔斌教授数据与智能实验室(> 相比于SMAC3,Hyperopt等现有开源系统, OpenBox支持更通用的黑盒优化场景,包括多目标优化,带约束优化场景等。在25个LightGBM调参任务上,OpenBox在7个对比系统中取得了平均1.25名(average rank)的优异成绩。


近年来,人工智能与机器学习备受关注,越来越多企业使用机器学习模型解决实际问题,如人脸识别、商品推荐等。在应用机器学习模型的过程中,模型超参数的选择对模型性能有着至关重要的影响,因此超参数优化问题成为了机器学习的重要挑战之一。超参数优化作为典型的黑盒优化问题,对于优化目标不存在具体表达式或梯度信息,且验证代价较大。其目标是在有限的验证次数内,尽快找到全局最优点。除超参数优化外,黑盒优化还拥有着广泛的使用场景,如自动化A/B测试、数据库参数调优、处理器架构和芯片设计等。

现有开源的黑盒优化系统往往存在以下问题:

由于系统基于某个特定算法,一些系统只能支持单目标或是无约束的优化问题;

基于优化问题中 “no Free lunch”定理,现有系统中特定的算法无法在所有任务中表现出色;

现有系统无法有效利用历史任务的结果以及分布式的验证资源。

针对这些问题,北京大学DAIR实验室AutoML项目组开发了一个名为 的轻量级黑盒优化系统,针对通用的黑盒优化场景,内置丰富的优化算法,并提供高效的并行支持,帮助用户“open the box”,解决棘手的黑盒优化问题。


为了解决现有系统上述的问题,OpenBox在设计上支持以下系统特性,包括:

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

作者将现有系统对上述特点的支持情况总结如上(其中△表示不支持通 用场景)。从表格中不难看出,现有开源黑盒优化系统无法支持特定的使用场景,而 OpenBox 能够提供完整的支持。

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

上图展示了 OpenBox 的并行架构,包含五个主要组件。服务主机(ServiceMaster)负责节点管理、负载均衡和错误恢复。任务数据库(Task> OpenBox内置大量优化组件,其中优化算法包括贝叶斯优化,遗传算法等,如下图所示:

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

为简化用户的使用门槛以及提高系统在各问题上的性能,OpenBox 默认采用一种自动选择优化算法的策略,根据输入参数类型,目标个数,约束个数选择合适的优化算法。用户也可基于自身需求,在系统推荐的基础上自行选择优化策略。更多OpenBox的特性请参考开源文档:

目前OpenBox已在快手、阿里巴巴集团等企业落地部署与使用。


为体现OpenBox在通用黑盒优化问题上的性能,系统针对单/多目标,无/有约束,共4种场景对比OpenBox与现有算法与系统在优化数学函数上的效果,实验效果如下四图所示。可以看出 在不同的优化场景中,OpenBox相较现有系统都有较为显著的收敛效果提升。

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)
北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

针对实际场景,Openbox以表格分类的机器学习任务为例,与现有开源系统BoTorch,GPGlowOpt,Spearmint,HyperMapper,SMAC3,Hyperopt进行对比。为保证公平性,Openbox使用串行方式执行任务,并汇报调参结果在测试集上的准确率。以下展示使用LightGBM与LibSVM两个模型在25个OpenML公开数据集上的调参结果平均排名。值得注意的是,由于LibSVM的搜索空间复杂且包含条件选择,OpenBox仅与支持复杂空间定义的SMAC3以及Hyperopt进行对比。

可以观察到OpenBox在两个模型调参中均获得了优异的性能。具体来说,OpenBox在Lightgbm调参中排名中位数为1.25,在LibSBM调参中为1.50,体现了OpenBox相比其它开源系统在超参数优化任务中的优势。

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

OpenBox 支持高效的并行优化算法,使得在达到相同的优化效果的前提下,所需要的时间代价大幅降低。下图展示了使用 OpenBox 中并行优化算法在 LightGBM 调参任务上的提升,使用的数据集为公开数据集 optdigits 。其中“Sync”表示同步并行,“Async” 表示异步并行,“-n” 表示并发度。

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

可以观察到,相比串行优化(Seq-1),并行能够带来很大程度上提升搜索效率。其中最显著的提升来自于并发度为8的异步优化算法,在达到与串行方法相同的优化结果时 仅使用1/80的时间预算,也即实现7.5×的加速比。

更多关于OpenBox的实验结果,请参考OpenBox论文:


目前OpenBox支持主流平台(Linux、macOS、Window)使用。用户只需在代码中定义空间,给出目标函数,构造优化器即可运行。以下以一个简单的多目标带约束问题为例:

首先,我们需要import必要的组件:

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

接下来,我们定义一个包含两个连续变量的搜索空间:

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

随后,我们给出一个简单的以上述两个变量为输入的目标函数。这个目标函数包含两个目标以及两个约束:

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

最后我们定义一个优化器,传入指定的参数后,只需调用run()即可开始优化。

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

除了上述包调用的方法,OpenBox还支持用户通过接口访问服务,从服务端获取推荐的参数配置,在本地执行参数性能验证,并通过访问网站页面,可视化监视与管理优化过程。

完整的示例以及更多的使用场景,欢迎参考OpenBox官方文档:

讲座预约丨权威专家再谈AlphaFold 2:AI是否会带来结构生物学的“大革命”?
为了更加深入、系统地讨论近期AlphaFold的系列成果, ,雷锋网将举办主题为《权威专家再谈AlphaFold2:AI是否会带来结构生物学的“大革命》的线上圆桌论坛。
本次主题论坛由图像计算与数字医学国际研讨会(ISICDM)主办,雷锋网、医健AI掘金志协办。
想要提问的读者可扫描下方海报二维码,进入专家社群,我们会将您的问题收集、汇总后,反馈给参会嘉宾,并在讨论环节一一进行解答。

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)

特约稿件,未经授权禁止转载。详情见 转载须知 。

北大 DAIR 室AutoML团队开源高效的通用黑盒系统OpenBox (KDD2021)


本文地址: https://www.gpxz.com/article/82d9b0f72fc07cc4a1e6.html
全局中部横幅
全局中部横幅
通义tongyi.ai

通义是一个通情、达义的国产AI模型,可以帮你解答问题、文档阅读、联网搜索并写作总结,最多支持1000万字的文档速读。通义tongyi.ai_你的全能AI助手

大智慧

大智慧-中国深具影响力的证券投资服务品牌。大智慧官方网站旗下软件大智慧365、财富版、专业版、港股通、期货投资终端、大数据终端、策略投资终端和大智慧电脑版/手机版股票软件为亿万金融投资者提供高速的证券、基金、港股、期货、股票行情及金融数据分析。

坦克小游戏,坦克大战小游戏,双人坦克小游戏,坦克小游戏大全,4399小游戏

4399坦克小游戏大全收录了国内外坦克类小游戏、坦克大战小游戏、双人坦克小游戏、经典90坦克大战小游戏、坦克小游戏下载。好玩就拉朋友们一起来玩吧!

机械密封

河南先锋科技发展有限公司

全关注在线,北京社保,北京医保,北京住房公积金,北京旅游,北京招聘

北京全关注记录北京本地城市生活,提供北京地区交通、旅游、房地产、美食、教育、医疗、便民服务等生活服务实用信息。

郁清叔叔

郁清叔叔专业提供情感培训,情感导师解决约会学,恋爱技巧等技能培训

赛鸽资讯网

赛鸽资讯网是汇集全球信鸽赛鸽资讯,赛鸽公棚,信鸽协会,赛鸽俱乐部,信鸽视频,信鸽交易,铭鸽展示,鸽舍,鸽业,免费建站为一体的专业信鸽网站,为鸽友提供及时,全面,丰富的赛鸽资讯。

华夏致富网

华夏致富网为创业加油,为梦想导航!广罗各行业创业资讯、创业故事、如何创业、创业加盟、加盟费、创业政策、防骗知识等信息,让创业者更快捷地了解最新动态,更多精彩创业内容尽在华夏致富网!

i许昌

“i许昌”APP是许昌市政府便民服务移动端统一平台,旨在为许昌市居民、企业提供全天候、一站式政务民生服务。

广州粤华物业有限公司

广州粤华物业有限公司,成立于1994年,全国一级资质物业管理企业,中国物业服务综合实力百强企业。坚持“客户需求为导向,实现持续改进”服务理念,凭借着对行业细分领域的深耕积累和创新进取,形成了以公建物业为核心,涵盖居住物业、商业物业、工业物业和办公物业等多业态服务领域布局,涉及金融、能源、通讯、制造、科技、物流等行业,以及教育、民生、公共服务等政府、企事业单位。

做网站需要多少钱

遨游公司提供:免费做网站,免费seo网站推广,400电话办理预存话费即可!公司从营销角度立意而进行一个建设网站的全程完整过程,其中包括了前期网站定位、内容差异化、页面沟通等战略性调研等。业务含南京,成都,哈尔滨,武汉,长沙,贵阳,昆明,南宁,杭州,南昌,广州,雄安,深圳。

武汉程序开发

武汉盛世互联专注技术开发板块,网络营销解决方案让您的网站脱颖而出,量身定制属于您的完美网络营销体验。服务咨询:189-9551-9993;网站设计、小程序开发、平台系统开发

全局底部横幅