ASSIA (assiassion什么意思)

文章编号:46230 资讯动态 2024-12-10 ASSIA

雷锋网 AI 科技评论按:2018 年 5 月 31 日-6 月 1 日,中国自动化学会在中国科学院自动化研究所成功举办第 5 期智能自动化学科前沿讲习班,主题为「深度与宽度强化学习」。

如何赋予机器自主学习的能力,一直是人工智能领域的研究热点。在越来越多的复杂现实场景任务中,需要利用深度学习、宽度学习来自动学习大规模输入数据的抽象表征,并以此表征为依据进行自我激励的强化学习,优化解决问题的策略。深度与宽度强化学习技术在游戏、机器人控制、参数优化、机器视觉等领域中的成功应用,使其被认为是迈向通用人工智能的重要途径。

本期讲习班邀请有澳门大学讲座教授,中国自动化学会副理事长陈俊龙,清华大学教授宋士吉,北京交通大学教授侯忠生,国防科技大学教授徐昕,中国中车首席专家杨颖,中科院研究员赵冬斌,清华大学教授季向阳,西安交通大学教授陈霸东,浙江大学教授刘勇,清华大学副教授游科友等十位学者就深度与宽度强化学习技术在游戏、机器人控制、参数优化、机器视觉等领域中的成功应用进行报告。

雷锋网 AI 科技评论在本文中将对 6 月 1 日杨颖、赵冬斌、刘勇、游科友、徐昕的 5 场精彩报告进行介绍。

杨颖:轨道交通车辆预测与健康管理(PHM)技术应用

杨颖是中国中车首席专家,教授级高级工程师,中车株洲电力机车有限公司副总工程师。

本报告专注于相关内容,中国的轨道交通发展迅猛,列车数量在过去六年里几乎翻了两番。传统的定期保养模式现在问题重重,且这种模式花费不菲。在该背景下急需一个新的车辆保养方案。中国中车株洲和深圳铁路公司联合开发了一个轨道交通车辆预测与健康管理系统来降低车辆保养所需的人工费用以及其他费用。借助 PHM 系统,可以把定期保养模式转换为有条件保养模式,这样就可以延长检查保养周期,从而延长列车在安全健康状态下的运营时间。

赵冬斌:深度强化学习算法及应用

赵冬斌是中国科学院自动化研究所研究员、博导,中国科学院大学岗位教授。

本报告专注于深度强化学习算法的应用。将具有「决策」能力的强化学习 (RL: Reinforcement Learning) 和具有「感知」能力的深度学习 (DL: Deep Learning) 相结合,形成(DRL: Deep RL) 方法,成为人工智能 (AI: Artificial Intelligence) 的主要方法之一。2013 年,谷歌 DeepMind 团队提出了一类 DRL 方法,在视频游戏上的效果接近或超过人类游戏玩家,成果发表在 2015 年的《Nature》上。2016 年,相继发表了所开发的基于 DRL 的围棋算法 AlphaGo,以 5:0 战胜了欧洲围棋冠军和超一流围棋选手李世石,使围棋 AI 水平达到了一个前所未有的高度。2017 年初,AlphaGo 的升级程序 Master,与 60 名人类顶级围棋选手比赛获得不败的战绩。2017 年 10 月,DeepMind 团队提出了 AlphaGo Zero,完全不用人类围棋棋谱而完胜最高水平的 AlphaGo,再次刷新了人们的认识。并进一步形成通用的 Alpha Zero 算法,超过最顶级的国际象棋和日本将棋 AI。DRL 在视频游戏、棋类博弈、自动驾驶、医疗等领域的应用日益增多。本报告介绍了强化学习、深度学习和深度强化学习算法,以及在各个领域的典型应用。

刘勇:正则化深度学习及其在机器人环境感知中的应用

刘勇是浙江大学教授、博导,浙江大学求是青年学者。

本报告专注于正则化深度学习方法。近年来,随着人工智能技术的飞速发展,深度神经网络技术在图像分析、语音识别、自然语言理解等难点问题中都取得了十分显著的应用成果。然而该技术在机器人感知领域的应用相对而言仍然不够成熟,主要源于深度学习往往需要大量的训练样本来避免过拟合、提升泛化能力,从而降低其在测试样本上的泛化误差,而机器人环境感知中涉及的任务与环境具有多样化特性,且严重依赖于机器人硬件平台,因而难以针对机器人各感知任务提供大量标注样本;其次,对于解不唯一的病态问题,即使提供大量的训练数据,深度学习方法也难以在测试数据上提供理想的估计,而机器人感知任务中所涉及的距离估计、模型重构等问题就是典型的病态问题,其输入中没有包含对应到唯一输出的足够信息。针对上述问题,本报告以提升深度学习泛化能力为目标、以嵌入先验知识的正则化方法为手段、以机器人环境感知为应用背景进行了介绍。

总体上看目前刘勇教授研究内容共有四项,分别是:

就目前的研究结果来说,正则化统一框架下深度学习性能有明显的提升,在一系列机器人环境感知应用上取得当前领先表现。在接下来的工作中,刘勇教授团队将专注于无监督学习,定性与定量感知任务相结合,结合机器人声学、触觉等传感器等内容。

游科友:分布式优化算法与学习

游科友是清华大学副教授、博导,国家优青,国家青年千人。

本报告专注于分布式优化算法等问题,随着训练参数与样本规模的的急激增长,深度学习在实际应用系统中显示出了巨大的应用前景。分布式与并行优化是指通过多求解器起来协作求解的一类优化问题,其在大规模数值计算、机器学习、资源分配、传感器网络等有重要的研究意义和应用价值,并成为了大规模优化与学习中最具挑战性的问题之一。本报告首先讨论了分布式优化的几个典型难题;其次。以鲁棒性凸优化为例,提出了分布式原-对偶求解算法与分布式 Polyak 算法,并以严格证明了算法的有效性。

游科友老师团队的在本报告中提到的主要内容包括:

徐昕:自评价学习控制中的特征表示与滚动优化

徐昕是国防科技大学教授、博导,国防科技卓越青年人才。

本报告专注于强化学习的优化方法。以强化学习 (reinforcement learning) 为代表的自主学习技术对于提升各类机器人系统的优化决策与控制性能具有重要意义。在复杂不确定环境中机器人系统面临诸多优化决策与控制问题。面对这些问题,徐昕教授介绍了自评价学习在控制系统中的应用,自评价学习控制中的特征表示方法,以及滚动优化的方法。

以上是雷锋网 AI 科技评论全部报道,中国自动化学会第 5 期智能自动化学科前沿讲习班。两天时间,十位专家为大家带了十分精彩又干货十足的报告,对深度与宽度强化学习技术在游戏、机器人控制、参数优化、机器视觉等领域中的成功应用进行了深入介绍。

原创文章,未经授权禁止转载。详情见 转载须知 。

ASSIA | 中国自动化学会「深度与宽度强化学习」智能自动化学科前沿讲习班(二)


本文地址: https://www.gpxz.com/article/e79667f64ee7095fd383.html
全局中部横幅
全局中部横幅
新平之窗

新平之窗(www.xinping.cc),玉溪市新平第一人气社区,提供玉溪新平生活资讯,城市信息,新平吃喝玩乐,新平旅游,婚恋交友,消费购物,打折促销,新平房产家装等信息服务,打造新平最成熟、网友活跃度最高的网上交流家园。

四川锐孚制冷工程有限公司

业务涉及冰箱、冷冻、空调设备及配件的批发和销售,高低温试验箱、冷库工程、中央空调工程的设计和安装。根据市场竞争的需求,更好的为西部地区广大用户服务业务涉及冰箱、冷冻、空调设备及配件的批发和销售,高低温试验箱、冷库工程、中央空调工程的设计和安装。根据市场竞争的需求,更好的为西部地区广大用户服务.

报修管理平台

智能报修系统是专业的售后服务管理系统,针对家用电器和家用电器行业的售后服务管理,电脑和手机微信同步使用,实现微信报修、工单派工、定位签到、评价、到期预警、项目管理、备件管理等功能,关注“易报修系统”公众号免费试用,专注定制各种售后服务管理系统。

瑞傲历史网

瑞傲历史网带您穿越时空回顾关键的历史时刻和人物,提供详尽的历史分析,洞悉过去对当下的深远影响。无论您是历史学者还是爱好者,这里都是您获取可靠历史资讯的宝库。

安徽网信网

中共安徽省委网络安全和信息化委员会办公室安徽省互联网信息办公室安徽网信办安徽网信网网络安全信息化网络治理。

国产PLC

联诚科技集团股份有限公司是一家专业从事国产PLC控制器生产的厂家,专注高品质PLC控制器研发生产销售。作为国产PLC品牌之一,我们提供全面的自动化控制解决方案,助力工业智能化升级。

全自动平面贴标机,半自动平面贴标机,全自动卡片贴标机,全自动袋子分页贴标,全自动圆瓶贴标机,半自动圆瓶贴标机,贴标机,不干胶贴标机,线材对折贴标机,打印贴标机,贴标头,方瓶贴标机,扁瓶贴标机,纸箱贴标机,盒子贴标机

东莞市圣坤自动化设备有限公司专业生产不干胶贴标机、平面贴标机、圆瓶贴标机、打印贴标机、方扁圆瓶多功能贴标机、流水线贴标头、等。座落于全国轻工设备制造业最发达的东莞地区,致力于贴标机自动化技术的发展,专业、专注于自动贴标机及配套设备的研发、设计、生产、销售和服务。

登陆

组织管理后台1.0登陆页面

轻松下载

讯维网络官方网站,集常用软件下载,实用教程分享等综合技术网站

奇辉生物科技

奇辉生物致力于打造肠道微生态一体化产业平台.公司专注于肠道微生态菌群精准提取技术及肠道微生态分布式AI系统,包括全自动化,标准化的肠道全菌群提取设备,远程交互式后台质量管理系统,与临床相结合的人工智能分析系统.同时提供肠道菌群功能分析服务,通过采集和分析粪便样本,为个体化健康管理和精准医疗提供有力支持.我们还提供设备租赁和销售,以满足不同客户的需求.

全局底部横幅