雷锋网公开课 机器人聊天的秘密 (雷锋网公开课震撼来袭)

文章编号:38341 资讯动态 2024-12-01 三角兽 亓超 微软 锤子 小冰 张丹 度秘

语义理解简单来说,就是让计算机听懂用户说了什么,然后可以进一步回答用户的问题或与用户对话。这类技术在现实场景中的应用有大家比较熟知的微软小冰与百度度秘。锤子手机中 Bigbang 功能也是基于语义理解技术中的语义分析功能进行的创新。本期公开课请到了开放域聊天和 chatbot 顶尖专家——三角兽科技的 CTO 亓超,为大家揭开机器人聊天的秘密。

嘉宾介绍:

亓超,自然语言处理方向硕士,AI领域开放域聊天和chatbot顶尖专家,10年科研与工程经验。

曾在佳能、腾讯、阿里负责推荐算法和人机对话系统研发;2014年微软小冰开放域聊天技术创始人;百度T8Lead;度秘聊天技术负责人;从零写了微软小冰和百度度秘唯一两款目前有实际应用的交互系统。

机器人聊天的秘密|雷锋网公开课

雷锋网:可以简单介绍下三角兽吗?

亓超: 三角兽科技成立于今年年初,核心技术方向是人工智能交互系统,目标成为智能生活软硬件背后的主流交互系统,团队现接近三十人,以BAT微软乐视等一线AI团队为主。

CEO王卓然,University College London PhD,在英国10年,从事理论机器学、统计机器翻译,自然语言处理、语音聊天系统、统计对话系统、 多模态人与机器人交互、水下无人艇人机交互等多方向研究和实践。在顶级国际会议与期刊上发表多篇论文,曾是百度T8Lead,度 秘App/小度机器人中控策略技术负责人。

COO马宇驰,中国传媒大学新闻媒体管理方向学士,10年市场和品牌经验,连续创业者,曾做过微信微博营销公司,2014年O2O厨师上门公司由 徐小平投资。曾在Viacom集团中国区CBSOut door服务可口可乐、统一、爱国者3年。曾在奥美公关任Intel笔记本处理器公关经 理,主推“酷睿”两个字。曾在Amway China负责企业品牌和广告投放工作。

技术合伙人陈华荣,中国科学院计算机软件与理论专业硕士,在微软工作11年,2013-16年Bing和Office的Exchange部门高级Lead,2005-10年在微软亚 洲研究院研制Exchange12和14,2010-13年,微软西雅图总部研发Exchange15。

技术合伙人王宝勋,哈尔滨工业大学计算机科学博士,微软小冰首席机器学习科学家,发表多篇国际学术论文,学术经验积累深厚。第二到第四代核心高级 研发工程师,负责小冰智能对话引擎、图像智能对话引擎、垂直领域对话引擎等核心技术。

技术合伙人李彦,上海复旦大学计算机科学专业硕士,前乐视推荐算法高级Lead,曾在阿里、人民搜索担任推荐算法方向工程师,后在百度联盟事业部、 360商业产品事业部任高级研发工程师。

战略合伙人何晋,北京科技大学设备工程学士,厨临门战略合作合伙人,灵境VR渠道总监,前百度和美团外卖全国连锁餐饮大客户部项目负责人

技术上,在开放领域聊天系统,任务驱动的人机对话系统,搜索及推荐引擎技术等方面有深厚的积累,商业客户,IoT行业标杆客户,如Rokid,锤子,威马汽车,腾讯等,另外为这些客户提供的支持也是不一样的,开放域聊天,锤子领域应用,多轮对话,语义技术都有,证明了我们技术实力和技术到产品落地的能力

资本融资4月份洪泰和天善1000万天使,8月君联和赛富2000万preA,目前正在A轮的路上,计划春节前close。

锤子新一代手机Big Bang功能的核心算法模块,Rokid机器人聊天系统,威马汽车车载前装的音乐和导航模块,此外,还有一些推进中的项目,其中包括3家巨头公司,4家手机,2家车载后装,和一些机器人公司,以及为消费者提供信息和提供服务的企业客户。

雷锋网:在您看来,目前语义理解技术主要用在哪些场景和应用里?

亓超: 语义技术是自然语言处理(NLP)方向很重要的一个部分,三角兽科技优势和积累也主要在NLP方向。

自然语言处理(NLP) 的研发有很久的历史,特别是在互联网发展起来后, 在很多场景里都有应用例如:

这些系统的背后都会涉及到NLP问题。

雷锋网:国内语义理解技术的现状是怎样的呢?

亓超: 国内NLP及相关的技术目前BAT,360等互联网大企业都有不错的积累。其他互联企业也有非常好的算法团队, 例如今日头条等等。

很多产品线,例如百度度搜索,都会有各自的算法团队在支持, 其中NLP的算法支持占了比较大的比例,单从NLP基础技术本身, 百度和MSRA的NLP团队无论从规模和深度上都有强大优势,国内的大学里哈工大在这个方向有强大的实力和积累,创业公司在这方面会面临人才稀缺的压力, 比较难形成一个很好的算法团队。

雷锋网:相比做语音识别的公司,提供语义理解的团队看似要少一些,其中的难点是什么?

亓超: 两者在各自方向上都有各自的难点。

语音识别和合成相对语义理解来说, 技术上相对成熟。并且很早就作为相对独立的服务进行包装, 较为容易进行产品的落地。 例如,地图服务的导航功能 包含了识别与合成两部分。另一方面从事语音技术的公司起步都比较早, 例如科大讯飞, 云知声, 思必驰等, NLP相关技术落地到具体产品也非常依赖于应用场景,相关团队多在大公司里作为某个产品线的算法团队来进行支持

虽然越来越受到关注, 但NLP及相关算法人才特别是有经验的从业者仍然非常稀缺, 促使从业者的收入水平较高, 人力成本占了比较大的比例。另外如果是ToC的商业模式, 那么运营成本也会占去较大比例

雷锋网:理解中的语义理解公司往往需要大量标记好的语料数据,这些数据如何形成?

亓超:

雷锋网:就三角兽而言,我们目前有多少这样的数据?

亓超: 数据是我们的核心资源,数据抓取及建设会是我们长期的重点。以我们开放领域聊天系统依赖的数据举例:

雷锋网:无论小冰还是度秘,都在最初注入了大量关联业务或者公开的数据(据说小冰是微博、度秘是贴吧),三角兽怎么解决冷启动的数据问题的?

主持人: 小冰及度秘使用的大部分数据都是互联网公开可见的数据(例如BBS或社区等人与人间的对话数据), 这些数据无论是大公司还是小公司都是可以公平获取的。三角兽成立之初便已开始在各大bbs和社区进行大量的数据的抓取及语料的清洗。

雷锋网:一个完整的聊天机器人或者多轮对话系统,应该包含哪些技术模块?

亓超: 聊天系统及对话系统是个庞杂的系统模块 有张技术分解图share给大家来参考

机器人聊天的秘密|雷锋网公开课

雷锋网:看到图片中对不同的模块进行了颜色区分,可以详细介绍下吗?

亓超: 最下面这一层是依赖的基础技术系列 上面蓝色这层是利用基础技术构造的基础技术模块,中间橙色是利用基础技术模块构造的子系统,上面两层是将子系统进行封装 对外提供打包服务api应用层。

雷锋网: 多轮对话系统开发起来,与单轮对话系统的差异主要是哪些?

亓超: 其实严格来讲, 没有单纯的单轮对话系统 涉及对话系统一定是要考虑上下文的处理, 例如订票场景下,用户与机器之间需要进行多次的需求描述、澄清及确认过程来完成订票任务。单轮更偏向于信息获取的系统, 例如搜索引擎及问答系统。

雷锋网:您当时是小冰团队唯一负责核心算法的工程师,开创了开放域聊天系统。可以详细介绍下什么是开放域聊天技术吗?开放域聊天技术与传统用关键字、模板或者人工参与的聊天技术的不同之处是什么?

亓超: 开放领域聊天中的开放是指对用户不限定领域, 不会出现像Siri发布之初只能回复特定问题, 超出范围的返回搜索引擎结果, 另一方面聊天以一种模拟人类日常对话的方式进行自然的人机对话, 不同于一个冷冰冰的工具。

开放域聊天系统中也有关键词及模板的方法作为辅助,我们主打的两个技术方向是:

这两种方法的基础都是统计和机器学习, 关键词及模板的基础是NLP方向中常用的另一种方法规则系统。

无论是检索式还是生成式, 相对于纯规则的聊天系统来讲:

雷锋网:在情绪、情感识别一块,国内相对薄弱,我们有哪些技术储备?

亓超: 在文本内容中进行情感或观点分类,国内这块其实也不弱。在百度等大的互联网企业这部分也有不少产品点已经商用, 例如百度搜索结果中的观点抽取及聚合。情绪的处理是我们聊天系统中非常重要的模块,目前主流的方法会使用到DNN相关的技术对文本进行表示并进行分类任务, 这块我们也早已用到我们对外的聊天商用服务中, 并会在将来继续扩大这部分的使用场景。例如,情绪分类触发回复中加入表情 及 针对用户情绪分类的结果进行回复的筛选。

雷锋网:Bigbang以及Rokid的产品投入应用之后,有没有发现一些不满意的地方,可否展开讲讲?

亓超: Big Bang发布后, 我们受启发和鼓励很大, 后续我们会进一步将对话系统中成熟的模块及技术, 拆解出来, 与手机系统绑定, 实现更多更好的手机体验, 同时也能将真实场景下技术迭代带来的收益反馈到对话系统里。

Rokid与我们的合作在三角兽成立之初的4月份便开始合作,一直非常愉快, 后续我们会进一步加大在儿童及家庭场景下聊天及对话系统的研发投入

雷锋网:感谢亓超老师的精彩分享,以上是雷锋网准备的所有问题,本次课程主干部分结束,亓超老师还有什么要分享的吗?

亓超: 我补充两张聊天系统架构图给大家参考。

机器人聊天的秘密|雷锋网公开课 机器人聊天的秘密|雷锋网公开课

第一张图是我们服务整体架构的示意图 解释依赖的模块以及服务间的关系,另一张图分别介绍了检索式聊天和生产式聊天的原理。

听众问答整理

Q:“语义理解有很多公司再做,图灵,讯飞等,三角兽跟他们有什么不同呢?”

讯飞的在语音技术方面,有绝对领先的优势,我们目前主要焦点在文本内容的处理,语义技术是其中核心技术之一,我们颇为互补,目的是做整套自然语音交互系统。图灵跟我们的业务有较大重叠,三角兽科技的团队成员在之前经历并打磨出市面上两款较为成熟的产品,小冰和度秘在对人机交互系统的理解上相对较深 并由此也有很多应用与基础技术的积累。

Q:设计聊天机器人最重要的因素是什么?to b 端和to c 端的有什么区别?

聊天机器人要体现智能的特点:死板一问一答,缺少变化,只能回答特定问题等等都会体验很差。另一方面,要有“学习”能力,通过人机对话数据的积累和反馈得到能力的提升。额外,在不同场景下,聊天机器人的角色也要实时发生转变 提供服务功能。这好比,餐厅服务员在上班的时候要提供点餐的功,下班后角色发生转变,会跟朋友一起聊天分享。

对语义理解是基于大量的语料,而互联网词汇翻新速度这么快,并且有大量矛盾的语义理解,这些要如何判断处理?

互联网数据的大量更新累计是我们能做好聊天机器人的基础。好比是招待客人,没有菜,就算厨艺再好,也没办法做一桌菜出来。我们在数据处理上已经建立起了一套数据处理的系统 能很快消化新的语料和数据 。

在industry中,比较热门的NLP算法有哪些?有什么优点和缺点?

目前比较热门的方法大多是统计机器学习的方法 其中近几年逐渐兴盛的DNN相关技术 (在文本上长使用 CNN 和 RNN)占了主导。主流学术会议上 DNN 相关的论文,占了非常大比例。另一方面,在之前里,规则专家系统占主导,一个完整的系统两种方法都需要用到,一般情况是用统计机器学习的方法,砍大刀处理大部分问题,规则的方法作为补充,来剃小刀,处理一些exception的问题。

机器学习用到的数据来源,有分人工标注的和非人工标注的数据,机器学习的方法也会分为有监督的和无监督的,数据准备并没有特定统一的原则和标准要根据任务情况来定。举例说明,我们在训练用于判断两句话是否在语义一致的模型上(例如不客气 是否能回答 谢谢),用大量的人与人之间的真实对话,去除掉含有对话背景(例如具体人名 具体时间),后拿了训练 RNN 和 CNN 模型 。

Q:请问嘉宾,对模型进行训练的数据准备方面,能否介绍一下?

机器学习用到的数据来源,有分人工标注的和非人工标注的数据,机器学习的方法也会分为有监督的和无监督的,数据准备并没有特定统一的原则和标准,要根据任务情况来定 举例说明 我们在训练用于判断两句话是否在语义一致的模型上(例如不客气 是否能回答 谢谢)用大量的人与人之间的真实对话 去除掉含有对话背景 (例如具体人名 具体时间)后拿了训练 RNN 和 CNN模型

我一直很好奇微软小冰的开放式回答结果该如何调教,比如对某个答案不满意,要怎样让她修改?

小冰目前应该不支持来自用户的调教。研发的调教会从两个方面进行:语料扩充,模型迭代。

在车载的语音交互的使用场景中,您认为是开放式的交互比较好,还是封闭式的交互比较好。开放式指的是随便用户怎么说,封闭式指的是用户只能说固定的指令。

指令性式必须的。例如导航、音乐这些主功能。从我们跟车载设备商的沟通中反应,其实司机在开车过程中,还挺爱聊的。所以,只有指令性的功能,无法满足这个场景下的所有需求。我们也在跟车载设备的合作伙伴合作打磨开放式的交互系统。

最后亓超老师说:“智能交互系统技术的广度与深度方面都比较复杂。以上单纯一个点展开来讲,也都需要很长时间,在这里 抛砖引玉,详细细节也希望在今后能跟大家经常一起讨论。”

原创文章,未经授权禁止转载。详情见 转载须知 。


本文地址: https://www.gpxz.com/article/01a141f362088dd6c914.html
全局中部横幅
全局中部横幅
zhihu.com

站长之家Alexa排名查询工具提供zhihu.com网站alexa排名查询,特别是能够对网站预估收入以及网站价值进行评估的功能,帮助用户更好的提升alexa排名。

果蔬

山东川泰机械设备有限公司主营:固液分离机、果蔬垃圾处理设备、油水分离器、餐厨垃圾一体机、餐厨垃圾一体化设备,是一家致力于环境污染治理产业的企业,专业从事有机废弃物(餐厨和厨余、污泥、畜禽粪污、中药等)的全套处理工艺,包括规划、设备研发、设计、工程建设。

天气预报查询一周

天气史网:提供未来一周的天气预报,遍及全国3181个县市,国外知名城市及国内外重要景区景点,做到天气预报一周查询最准确。

迪普视智能

湖南迪普视智能科技有限公司以成为国内领先国际知名的机器视觉公司作为愿景,通过挖掘机器视觉领域的新材料、新工艺、新方法,以科技创新为动力,提升机器智能、系统智能;以客户需求为第一,为客户提供一流的服务和产品,为人类创造出更安全美好的生活而努力。

三源电力(辽宁)有限公司

三源电力(辽宁)有限公司_辽宁三源电力坐落于有“共和国骄子”之称的辽宁抚顺。公司成立于2014年,主营业务已覆盖辽宁省内多个城市。企业现已具备电力行业咨询、设计及工程施工多项资质;公司拥有电力工程相关各专业人才近百人,设置总经办、工程部、安全部、技经部、设计部、新能源部、财务部、行政部、人事部、运维部、采购部,11大职能部门。

上海昌茂泵业有限公司

上海昌茂泵业有限公司是一家专业生产各类化工泵的企业。公司集销售、服务为一体,产品设计合理、高效节能、按装维修方便,为石油、化工、冶金、农药、印染、电镀、电子、稀土分离、环保污水处理等服务。

东莞大朗叉车培训,东坑焊工考证,横沥电工培训,黄江氩弧焊,大岭山叉车培训,常平电焊工培训考证,叉车证年审复审

诚材培训学校开设常平,横沥,东坑,大朗叉车培训,叉车证复审,挖掘机培训,电工培训考证,焊工培训,氩弧焊工培训,气体保护焊培训,挖土机培训,电工证年审,焊工证叉车证年审培训课程,电话13316639363。

四川渝三峡新材料有限公司

公司采用目前国内新工艺、设备,自动化程度高,是一家现代化的工业涂料生产企业。废水、废气治理采用最新工艺和设备,排放浓度优于国家标准。

led显示屏

郑州天彩电子产品有限公司主要产品有:led显示屏,led电子屏,led舞台屏,led广告屏,led租赁屏,led移动屏,小间距led屏。是LED显示屏,LED光源研发、生产、销售、工程、维护一体化专业性公司,是LED产品从原材料到售后维护“一条龙”配套服务的厂商。

等车网

等车网-掌上公交,全国公交车查询,手机掌上公交官网,最好的公交查询网站。等车网(dengche),等汽车、等公交、等火车。

招远晋怡文化传媒有限公司

招远晋怡文化传媒有限公司置身于招远市,因为我们专注,所以我们追求更好!

氟塑料磁力泵,氟塑料离心泵,不锈钢磁力泵,不锈钢离心泵,自吸泵,耐腐耐磨砂浆泵,化工泵,安徽泾县天和泵阀有限公司

安徽泾县天和泵阀拥有近二十多年氟塑料泵阀的生产经验,主要生产各种氟塑料离心泵、化工磁力泵、自吸泵、耐磨耐腐砂浆泵、不锈钢泵耐酸泵及阀门。产品型号有CQB型磁力泵、新型CQTH系列衬氟磁力泵、IHF型离心泵、FSB型离心泵、FZB型自吸泵、UHB-ZK型砂浆泵、FYH型液下泵、CQ型磁力泵、ZCQ型磁力自吸泵及氟塑料球阀截止阀放料阀等系列产品。


全局底部横幅