live 大模型时代的强化学习丨GAIR 讲座预约丨四位专家大论道 (livemos)

文章编号:36630 资讯动态 2024-11-30 强化学习 研讨会 大模型

站在科技创新的浪潮之巅,我们见证了人工智能领域的巨大飞跃,尤其是大模型技术与强化学习中的结合和突破性应用,正在引领我们进入一个全新的智能时代。

在过去几年中,强化学习作为人工智能的一个重要分支,已经从理论研究的深奥殿堂走向了实践应用的广阔天地,从实验室的封闭空间走向了我们日常生活的各个角落。在自动驾驶、游戏AI、机器人控制等领域,强化学习的身影无处不在,它们正逐步成为我们生活中不可分割的一部分。

而当我们展望未来时,大模型技术将在强化学习领域扮演何种角色?它们将如何进一步联动,推动强化学习和大模型技术的发展,使其更加智能、高效,并更好地服务于人类社会?

这些问题不仅激发了科技界的无限遐想,也引领着我们不断探索和前进。随着大模型技术的不断进步,我们有理由相信,未来的强化学习将更加贴近人类的需求,成为我们生活中更加紧密的合作伙伴。

为了深入剖析这一话题,将于8月28日(周三)晚间8点~10点,举办一场主题为「大模型时代的强化学习」的线上圆桌论坛。

讲座预约丨四位专家大论道 :大模型时代的强化学习丨<a href=gair live" src="https://www.gpxz.com/zdmsl_image/article/20241130173641_18632.jpg" loading="lazy">

本次论坛荣幸邀请到了:新加坡南洋理工大学校长讲席教授,人工智能系主任安波教授、南京大学人工智能学院俞扬教授、天津大学智能与计算学部、华为诺亚决策推理实验室主任郝建业副教授、清华大学交叉信息研究院许华哲助理教授,将分享他们的深刻见解和最新研究成果。

在这场论坛中,我们将深入探讨以下几个核心议题:

全球视野下的突破: 在国内外,哪些学术团队和工业团队在强化学习领域取得了显著成就?他们的研究成果如何推动了这一领域的发展?

大模型的融合与创新: 如何利用大模型技术提升强化学习的效率和智能性?在这一过程中,我们面临哪些技术难题,又是如何一一克服的?

强化学习的实际应用: 强化学习技术在自动驾驶、游戏AI、机器人控制等领域有哪些成功的应用案例?这些应用如何改变了我们的生活?

未来趋势与挑战: 随着技术的不断进步,强化学习将面临哪些新的挑战和机遇?我们应该如何准备迎接这些变化?

技术与伦理的平衡: 在强化学习技术快速发展的同时,我们应该如何确保技术的伦理性和可持续性?

添加策划人 岑峰 微信(微信号:8019788),备注“姓名+职位”,即可邀请进入专家群,实时交流与提问。

嘉宾介绍

讲座预约丨四位专家大论道 :大模型时代的强化学习丨GAIR live

安波,南洋理工大学计算机科学与工程学院校长讲习教授、人工智能系主任

安波博士现任南洋理工大学计算机科学与工程学院校长讲席教授、人工智能系主任,人工智能研究院联席院长。主要研究领域包括人工智能、多智能体系统、算法博弈论、强化学习及优化。他是国际人工智能顶级期刊 AIJ、JAIR、JAAMAS 等副主编,有 150 余篇论文发表在人工智能领域的国际顶级会议 AAMAS、IJCAI、AAAI、ICAPS、KDD、UAI、EC、WWW、ICLR、NeurIPS、ICML,先后多次获得会议杰出论文奖,在国际评测比赛中也屡获佳绩。他在人工智能领域内有重要影响力和专业认可度,2018 年入选 IEEE Intelligent Systems 杂志评选的“AI’s 10 to watch”。他将担任IJCAI’27的程序委员会主席。

讲座预约丨四位专家大论道 :大模型时代的强化学习丨GAIR live

俞扬,南京大学人工智能学院教授

俞扬博士现任南京大学人工智能学院教授,博士生导师。主要研究领域为人工智能、机器学习、强化学习、演化学习。共同出版专著《Evolutionary Learning: Advances in Theories and Algorithms》(2019)及其中文版本《演化学习:理论与算法进展》(2021)。在Artificial Intelligence、TPAMI、TKDE、TNNLS、NeurIPS、ICML、IJCAI、AAAI、KDD等人工智能、机器学习和数据挖掘国际顶级期刊和顶级会议发表多篇论文,研究成果获得DAI'23 Best Paper、IDEAL'16 Best Paper、KDD'12 Best Poster、GECCO'11 Best Theory Paper、PAKDD'08 Best Paper等论文奖,获得ICAPS'21 L2RPN with Trust冠军、OpenAI RetroContest 2018冠军、PAKDD’06数据挖掘竞赛冠军等竞赛奖。

讲座预约丨四位专家大论道 :大模型时代的强化学习丨GAIR live

郝建业,华为诺亚决策与推理实验室主任,天津大学智算学部副教授

郝建业博士,华为诺亚决策推理实验室主任,天津大学智算学部副教授。主要研究方向为深度强化学习、多智能体系统。发表人工智能领域国际会议和期刊论文100余篇,专著2部。 主持国家科技部2030人工智能重大项目课题、基金委人工智能重大培育项目、国防科技创新重点项目课题等项目10余项,研究成果荣获国际会议最佳论文奖3次,NeurIPS20-22大会竞赛冠军4次。相关成果在工业基础软件智能化、自动驾驶、游戏AI、广告及推荐、5G优化、物流调度等领域落地应用。

讲座预约丨四位专家大论道 :大模型时代的强化学习丨GAIR live

许华哲,清华大学交叉信息研究院助理教授

许华哲博士现任清华大学交叉信息研究院助理教授,博士后就读于斯坦福大学,博士毕业于加州大学伯克利分校。其研究领域是具身人工智能(Embodied AI)的理论、算法与应用,具体研究方向包括深度强化学习、机器人学、基于感知的控制(Sensorimotor)等。其科研围绕具身人工智能的关键环节,系统性地研究了视觉深度强化学习在决策中的理论、模仿学习中的算法设计和高维视觉预测中的模型和应用,对解决具身人工智能领域中数据效率低和泛化能力弱等核心问题做出多项贡献。其发表顶级会议论文四十余篇,代表性工作曾被MIT Tech Review,Stanford HAI等媒体报道。

讲座信息

主题: 大模型时代的强化学习

时间: 8月28日(周三),北京时间20:00-22:00

观看方式: 「」视频号 与 「AI科技评论」 视频号同步直播

参考资料:

1,TWOSOME: An Efficient Online Framework to Align LLMs with Embodied Environments via Reinforcement Learning

2,《对话南洋理工大学安波教授:如何让大语言模型适应动态环境?丨IJAIRR》

IJAIRR正在邀约论文和专题

《International Journal of Artificial Intelligence and Robotics Research》(简称IJAIRR),是由新加坡GAIR研究院与世界科技出版社(WSP)联合出版的国际学术期刊。

作为全球首本专注于人工智能(AI)、机器人技术(Robotics)以及基础科学交叉研究(Research)的期刊,IJAIRR致力于成为AI与机器人领域研究的权威发布平台。

IJAIRR欢迎各类研究论文、评论文章、短篇论文、书评以及专题(Special Issue)形式的投稿。我们特别关注那些在顶级AI会议上发表并现场展示,但缺乏长期沉淀平台的优秀论文。为了给这些论文及其作者提供一个更广泛的发表和推广渠道,IJAIRR现正积极邀约相关论文投稿。

如果您在本领域顶级会议上发表的文章(或即将发表)不超过一年,我们将协助您稍作修改后在IJAIRR期刊上发表。

如果您领导的团队在顶级会议上有多篇论文发表,并希望在IJAIRR上围绕特定主题策划一个专题(Special Issue),我们诚挚邀请您深入讨论合作事宜。

如果您是顶级会议的组织者,并有意与IJAIRR合作,针对特定会议策划一个专题(Special Issue),我们也期待与您具体商讨合作细节。

IJAIRR期待与您携手,共同推动人工智能与机器人研究的发展。

联系人:IJAIRR创刊主编朱晓蕊博士,xiaorui_zhu@gair.sg

关于期刊创刊主编等更多信息,可点击

关于(公众号:)、GAIR大会、GAIR研究院(期刊和在线社区)的详细介绍,请阅读朱晓蕊教授的专访:

IJAIRR期刊的主页链接为:

原创文章,未经授权禁止转载。详情见 转载须知 。

讲座预约丨四位专家大论道 :大模型时代的强化学习丨GAIR live


本文地址: https://www.gpxz.com/article/3d61b127204230a7126d.html
全局中部横幅
全局中部横幅
腾讯网

腾讯网从2003年创立至今,已经成为集新闻信息,区域垂直生活服务、社会化媒体资讯和产品为一体的互联网媒体平台。腾讯网下设新闻、科技、财经、娱乐、体育、汽车、时尚等多个频道,充分满足用户对不同类型资讯的需求。同时专注不同领域内容,打造精品栏目,并顺应技术发展趋势,推出网络直播等创新形式,改变了用户获取资讯的方式和习惯。

数英网

数英网DIGITALING是大中华区数字媒体及职业招聘社交平台,内容涵盖市场营销、广告传媒、创意设计、电商、移动互联网等各数字相关领域.致力于整合数字业界信息,受益于访问者数英网@DIGITALING

唐山金属材料检测

唐山无损探伤、唐山焊接检测、唐山金属材料检测就选唐山戊戌无损检测有限公司!唐山戊戌无损检测公司专业从事压力管道、锅炉、金属材料、金属结构等无损检测、理化试验及技术咨询的第三方特种设备检测机构,主要服务于电力、石油、金属结构等领域。如有需要,欢迎联系我们

天津微信开发

微企赢家是天津开发区沃思电子商务有限公司旗下的网站,专注于为企业提供一流的微平台解决方案,包括微网站,微信商城,微分销系统,以及微信平台的运营和维护

中科(辽宁)实业有限公司

中科(辽宁)实业有限公司成立于2014年1月,原名辽宁中科环境监测有限公司,注册资金4000万元,公司总部座落于辽宁省鞍山市高新区越岭路257号,建筑面积2400平方米,其中实验室面积1800平方米。公司旨在致力于环境检测,包括地表水、地下水、生活饮用水、生活污水、工业废水、环境空气、污染源废气、环境噪声、社会生活噪声、工业企业噪声、铁路噪声、建筑施工噪声、公共场所卫生、土壤等权威的第三方专业环境检测机构。公司具有专业的技术服务团队,公司现有员工11人,中级工程师共7名,技术人员大多毕业于环境工程、应用化学

网商联

网商联是香港惠客实业有限公司自2012年底启动,斥巨资打造,倾力推出的一款全新的网络销售平台。伴随着网商联的问世,一种崭新的三位一体化网销模式逐渐暂露头脚,并随着这种新思潮的引领,惠客人秉持着“智慧、博大、引领未来”的经营理念,立志将网商联建设成为“全国乃至全球最大的化妆品销售王国”,向着“中国第一,世界第一”的目标不断迈进。,喷雾,面膜,奇丝颜,碧丝兰卡,水美姿

线槽

上海日成电子RCCN为全球需求者提供超过五千种规格以上高质量配线器材:主要以:线槽,无卤配线槽,汽车线束,导轨,电缆接头,尼龙扎带,尼龙扎线带,冷压端子,接线端子,尼龙软管,金属软管等。为您提供方便快捷的网上规格尺寸查询,满足您的不同布线需要,让您的设计方案更完美,达到最佳效果!

【湖北碧辰科技股份有限公司官网】

碧辰科技研发、生产、销售pcb,led背光产品;PCB制造为核心的背光源产业链一体化生产,灯具、灯条、灯饰产品及背光产品、背光膜材、液晶广告机、触控一体机、液晶拼接墙的销售;形成了TV(电视及商用显示器)及Monitor(电脑显示器)背光源全制程EMS生产服务(ElectronicManufacturingServices的缩写,即电子制造服务)及自主品牌的广告显示光源产品的研发、生产、销售两大事业群,为客户提供一站式、到家式全方位服务。

舞台灯光,广州壹帆灯光设备有限公司

广州壹帆灯光设备有限公司是一家集舞台灯光及配套设备研发、生产、销售、工程服务为一体的科技型企业。本公司产品以卓越的品质,稳定的性能和优质的服务备受国内外用户的青睐,树立了良好的口碑。

小浩科技

小浩科技是一家专注于AI智能产品研发的科技公司,提供智能金融风控、智能医疗、智能能源等解决方案。

七大罪:起源好玩吗

  《七大罪:起源》游戏为开放世界动作类型,计划登陆PC、手机和主机,售价和支持语言都暂未公布。玩家将一边收集漫画原作中的各种人物,通过强化星辰之座和魔导遗物增强实力,一边施展各种绝招击败敌人,探索广袤的世界。

全局底部横幅