AlphaGo表现出了哪些计算和智能两场比赛 (alphago是什么人工智能)

文章编号：36748 资讯动态 2024-11-30 李理 AlphaGo 出门问问李世石深度学习硬创公开课 NLP

雷锋网按：本文来自硬创公开课 | AlphaGo专场的分享。分享嘉宾，出门问问NLP工程师，李理。

两场比赛，AlphaGo表现出了哪些计算和智能 | 雷锋网公开课

一、到底什么是深度学习？

我认为深度学习相对于传统的机器学习，最大的特点就是不需要（太多）的feature engineering。

在机器学习流行之前，都是基于规则的系统，因此做语音的需要了解语音学，做自然语言处理（NLP）的需要很多语言学知识，做深蓝需要很多国际象棋大师。而到后来统计方法成为主流之后，领域知识就不再那么重要，但是我们还是需要一些领域知识或者经验来提取合适的feature，feature的好坏往往决定了机器学习算法的成败。

对于NLP来说，feature还相对比较好提取，因为语言本身就是高度的抽象；而对于Speech或者Image来说，我们人类自己也很难描述我们是怎么提取feature的。比如我们识别一只猫，我们隐隐约约觉得猫有两个眼睛一个鼻子有个长尾巴，而且它们之间有一定的空间约束关系，比如两种眼睛到鼻子的距离可能差不多。但怎么用像素来定义”眼睛“呢？如果仔细想一下就会发现很难。当然我们有很多特征提取的方法，比如提取边缘轮廓等等。

但是人类学习似乎不需要这么复杂，我们只要给几张猫的照片给人看，他就能学习到什么是猫。人似乎能自动“学习”出feature来，你给他看了几张猫的照片，然后问题猫有什么特征，他可能会隐隐预约的告诉你猫有什么特征，甚至是猫特有的特征，这些特征豹子或者老虎没有。

深度学习为什么最近这么火，其中一个重要的原因就是不需要（太多）提取feature。

从机器学习的使用者来说，我们以前做的大部分事情是feature engineering，然后调一些参数，一般是为了防止过拟合。 而有了深度学习之后，我们似乎什么也不用干！给它标注足够多的训练数据就行了。

具体的应用比如语音识别，图像识别，自然语言处理，这是比较成熟的一些领域。在一些其它领域，比如杀毒，天气预测。只要需要用机器建模，特征比较难以描述，而且又有足够多标注数据的地方都可以试一试深度学习。

二、同样是与人类对战，AlphaGo和深蓝的区别

深蓝的主要技术有两个：alpha-beta搜索和估值模型。搜索，大家应该都明白，机器学习就是更加领域专家（国际象棋大师）提取的特征（比如棋子的价值，位置的作用，棋子的保护和威胁关系等等），然后建立一个复杂的模型来判断局面（不太清楚是否用了机器学习）。

而AlphaGo的核心技术是：MCTS搜索和CNN神经网络。CNN使得机器可以学习人类的“棋感”，从而在开局和中局不落下风，然后残局凭借强大的计算能力战胜人类。

因为深度神经网络非常火，大家可能觉得它是AlphaGo能赢的关键，其实我觉得不是这样。

根据Tian yuandong（田渊栋）和AlphaGo的论文，如果不做任何搜索，只是根据“棋感”（其实就是估值函数），CNN最好能达到KGS 3d的水平，我估计也就业余1段的水平。而MCTS算法在没有Value Network的情况下在9 x 9的棋盘上能战胜人类高手，其实这也间接印证了AlphaGo在残局的实力是搜索(计算）起重要作用。原来基于搜索的软件在开局和中局就崩盘或者亏太多了，所以就不能体现搜索的优势了。另外AlphaGo使用了Value Network，这保证即使搜索有一些小问题，从人类学来的棋感也能保证不至于偏差太大。

AlphaGo的特点是：开局和中局依靠人类的棋盘学习棋感（可以理解为背棋盘，不过比死记硬背好一点，有一定的泛化能力），然后残局的计算能力碾压人类，就好像以前的李昌镐，前面看不出什么好来，但官子你就是下不过他，没办法，不服不行。

三、在比赛前，很多人都判断AlphaGo会输，这种判断偏差在哪里？

之前我们都太多关注AlphaGo的神经网络部分，其实它赢棋的关键可能在于残局的计算上。我们没有想到。

四、整个比赛的输赢对人工智能研究意味着什么？

作为对人工智能感兴趣的工程师，我既感到高兴又不免有些伤感。

高兴是因为我们可以“创造”出比我们自己“聪明”的机器，伤感就像教拳击的师傅看到徒弟的水平已然超过自己，不免有“老了，不中用了”的感叹。但这是大势所趋，不可避免，人工智能会在很多领域超过人类。

五、首场比赛，AlphaGo为什么在后半程越走越慢？

这是计算机用时的策略问题，因为根据前面的分析，后面的残局才是AlphaGo赢棋的关键，所以它把更多的时间放在残局是合理的策略。

六、如果计算性能够强大，AlphaGo能否直接得出最优解？

从数学上来讲，围棋有个最优的走法，也就是用mini-max搜索到游戏结束时的一条最优路径（也许有多条，但至少有一条），然后就能知道最优的情况下黑棋胜白棋多少目。

我认为AlphaGo离最优解其实还是差得老远的，尤其是开局和中局。其实这也间接的说明人类在开局上其实也离最优解差得太远。人类几千年也下不了多少盘棋（而且水平越差的人的棋对整个人类围棋没有太大帮助）。我们认为一个开局是否好，只能根据水平相似的高手下这个布局的胜率来推测它的好坏。但如果我们在最后50步的时候误差就很大，那么往前传播时积累的误差就更大了，我们可能经常忽略了一个看起来不好的走法，而这个走法可能就是“支持”这个开局的关键。

当然AlphaGo的残局比人厉害，那么就可以通过自己对弈来学习，然后往前传播误差。 但是由于这个问题本质是NP的，即使它用了MCTS的方法来避免“明显不好”的走法。但是由于围棋的复杂性，可能某个“看起来不好”的走法可能恰恰是一个关键的胜负手呢？另外根据之前的分析，即使每步都能99%的准确，那么往前推100步准确的可能性也基本是0了。

因此如果人类不能解决NP问题，不能提出计算能力超过图灵机的计算模型，那么人类制造的机器也是不太可能解决这个问题的（当然这只是我的直觉，不知道能不能数学上证明）。

不过即使这样，能制造和人类一样，虽然在质上不能超越人类，但在量上能超越人类的机器也是很有意义的。

七、AlphaGo在学习什么，是如何学习的？

AlphaGo是通过人类高手的对局作为训练数据来训练的，也就是给定一个局面，用人类高手的下一步棋做完这个局面的最优走法。通过大量的这样的数据，使用CNN自动学习出类似人类的”棋感“。当然虽然说CNN不需要太多的feature，其实AlphaGo也是用了一些围棋的知识的，比如征子。我虽然比较业余，也知道征子能否成功要看那六线上是否有对手的接应，另外更棋的高低也有关系，即使有接应，如果棋太低，可能也能征子成功，这个就要计算了。

另外，AlphaGo也通过自己和自己对弈的强化学习来改进它”棋感“。我个人觉得为什么要强化学习的原因可能是：之前那些棋谱学习出来的是很多人的”棋感“，通过强化学习，AlphaGo能选择更适合自己的“棋感”。

这样的”棋感“更能适应它的后阶段的计算能力。就好像如果我下棋计算能力不行，我就走一些比较稳的开局。我计算力超强，我就和你搏杀，走复杂的变化。

AlphaGo一晚上的学习大概能达到什么样的效果？

这个很难说，我个人觉得他们应该不会再训练新的模型，因为即使是深度神经网络，调参也是很tricky的事情。而且他们现在领先，应该不会冒险更新模型。

八、除了围棋，AlphaGo还可以用在什么领域？

AlphaGo本身的技术是MCTS和CNN，MCTS其实是属于强化学习这个领域的。

深度学习可以用在很多领域，前面说过了，只要这个领域需要构建一个模型来预测，而且有大量标注的训练数据。

强化学习是非常关键，我觉得强化学习才是人类社会学习的过程，通过行为改变世界，然后从反馈中学习。虽然人类也有一些监督学习，比如学校的教育，把前人的结论作为训练数据。但大部分的创新（获取新知识或者修正旧知识）都是靠强化学习。之前学校学到的可以认为是先验知识，但还是要自己的行为和尝试。纸上得来终觉浅，绝知此事要躬行。

比如我们要让机器人在火星生存，火星的环境我们是不太清楚的，只能根据地球的数据训练一个基本的先验的模型。到了火星之后机器人就必须能通过强化学习来学习新的知识来适应新的环境。

题图来自： theconversation.com

欢迎扫描二维码，加入硬创公开课的公开分享群，我们也期待在后续的直播中继续切磋交流。也欢迎推荐和自荐分享嘉宾。

两场比赛，AlphaGo表现出了哪些计算和智能 | 雷锋网公开课

原创文章，未经授权禁止转载。详情见转载须知。

两场比赛，AlphaGo表现出了哪些计算和智能 | 雷锋网公开课

本文地址： https://www.gpxz.com/article/4e4347d2ae6c3affd294.html

上一篇：语音识别技术并非高不可攀人才为王语音识别

下一篇：什么样的机器翻译比Google还要占优什么样的

旅游

hao123旅游频道为您提供最全的旅游攻略，旅游景点推荐，特价机票、酒店等信息。找旅游信息，上hao123旅游。

网址导航 2026-01-20 22:15:42

微信社交小程序

本站提供市面上最新最全的微信社交小程序资源，您可以免费获取这些应用资源。

社交直播 2024-01-14 23:46:59

宠物网,宠物猫,宠物狗,波奇宠物网,波奇网

波奇宠物网是属于宠物爱好者的综合型网站.这里是宠物猫，宠物狗等宠物爱好者们的集中地.也是包含宠物商城和宠物百科的专业网站.选择波奇宠物网,健康宠物生活从波奇开始.

网站模板 2026-01-21 13:08:19

遇见开发技术经验分享

博客日志 2026-01-24 22:52:59

张家口市净有林业设备有限公司

张家口市净有林业设备有限公司www.qyml222.com经营范围含:消防车、毛衣、钟表、茶艺、农作物、发电机、汽车用品、有色金属制品、泻洪工程、金银器（依法须经批准的项目,经相关部门批准后方可开展经营活动）。

汽车一族 2026-01-25 19:06:22

深圳市中珀电子有限公司

zonpo,ZONPO材质，ZONPO材质导电布，中珀，中珀电子，中珀胶带，zonpo胶带

电影视频 2026-01-25 19:07:45

玻璃钢化粪池,混凝土化粪池,化粪池,化粪池厂家,安阳化粪池,玻璃钢化粪池厂家,混凝土化粪池厂家

安阳鑫晟玻璃钢复合材料有限公司是一家集研发、设计、制作、销售、安装、服务于一体的国内大型成品化粪池专业制造商。

设计美化 2026-01-25 19:46:46

台州船用螺旋桨

台州市椒江永固船舶螺旋桨厂主要从事船用螺旋桨,铜套的生产与销售,拥有多年的生产经验,产品规格齐全,质量可靠,厂家直接发货,价格合理,如需采购船用螺旋桨,铜套,欢迎来电咨询:0576-88511211.

管理咨询 2026-01-26 00:21:52

河北君昊管件制造有限公司

电影视频 2025-02-07 17:02:33

线报圈

线报圈是一个专注于生活领域的知识平台,提供全面的生活百科知识大全,包括美食、娱乐、家居、时尚、旅游与网络知识等,让生涩的知识简单易懂。

明星娱乐 2026-01-24 13:46:17

湖南文津津味餐饮管理有限公司

湖南文津津味餐饮管理有限公司始终致力于为企事业单位、学校等提供一站式餐饮解决方案，公司拥有多年的团餐运营经验、智能化的中央厨房以及完善的食材供应链，能为客户提供专业的团餐制作、食材配送等服务。

商业服务 2026-02-28 22:02:37

石家庄泰斯特仪器设备有限公司

石家庄泰斯特仪器设备有限公司是国内知名的实验、科学仪器的制造、供应商,产品包括智能型系列超纯水机,创新型PLUS系列超纯水机,创新型系列超纯水机等，欢迎选购

科技创新 2026-03-06 17:08:30

拼多多回应被薅200亿多名用户称被强制退款；苹果高通分手另有内幕 (拼多多回应被诉事件)

拼多多被曝现重大BUG后，官方回应1月20日，拼多多被曝出现重大BUG，用户可领100元无门槛券，于是，大批用户开始‘薅羊毛，，一晚上200多亿都是话费充值，拼多多新浪官方微博随即进行声明，1月20日晨，有黑灰产团伙通过一个过期的优惠券漏洞盗取数千万元平台优惠券，进行不正当牟利，针对此行为，平台已第一时间修复漏洞，并正对涉事订单进行...。

2024-12-10 01:22:19

谷歌AI大一统 AI 升级为 Google Google Research (谷歌的ai)

谷歌也知道大家定会这样疑惑，就干脆在这篇，IntroducingGoogleAI，的开头，调皮，了一番，以下是谷歌昨日在原GoogleResearchBlog，现GoogleAIBlog，发布的这篇，IntroducingGoogleAI，内容，雷锋网AI科技将其内容编译如下，在过去的几年里，谷歌一直未忘记，让AI为所有人可用，的承诺...。

2024-12-09 23:36:09

Facebook工程师文件泄露或将面临全球收入4%的罚款承认违法使用用户数据 (facebook)

Facebook正面临一场世界各地隐私法规，海啸，，这将迫使该公司大幅改变处理用户个人数据的方式，根据外媒获得的一份从Facebook泄露的文件，Facebook这场，劫难，的根源在于，他们自己都搞不清楚用户数据的用途和去向，这份泄露的文件是由Facebook广告和商业产品团队的隐私工程师去年撰写的，该团队的任务是，在人与企业之间建立...。

2024-12-03 23:25:18

芯翌科技进击的刀枪剑戟星河算法仓库平台 (芯翌科技企业)

一个城市，如画的城市环境为，表，，居民的生活品质、工作状态为，里，如何让城市的表里为一，让城市生活、工作、生产有质有量，需要精细化管理做到，精中有细，是屋外没有废品满溢的异味，小区安全整洁，街道整洁美观，道路通行顺畅，港口生产安全高效......城市是有机生命体，是富有温度的公共空间，城市的精细化管理，上下左右，皆是诉求，面对与日...。

2024-11-30 22:51:07

坚果j7镜头进灰怎么清理 (坚果j7镜头上怎么没有j7标志)

发表在坚果投影仪2019，12，313，28前些天，有用户反馈家里的投影仪坚果j7，没有用多少时间镜头就进灰了，由于镜头对于投影仪来说非常重要，也不敢轻举妄动所以就反馈到了投影网，希望能给出一个较好的解决方法，其实关于坚果j7镜头进灰，可以分为两种情况，一种是镜头表面吸灰尘，那么这种就比较好清理，另一种是镜头内部进灰，这个就有点难度了...。

2024-11-28 18:10:54

迪丽热巴绿野仙踪裙清新脱俗

近日，迪丽热巴工作室发布了一组迪丽热巴活动造型图。绿色眼影清新甜美，羽毛流苏增添一丝俏皮，一抹绿意仿佛步入自然仙境。

2024-09-03 14:17:31

美方应摒弃零和博弈执念林剑中止侵害中国利益 (我们希望美方摒弃零和博弈的陈旧思维)

外交部发言人办公室，信息，在7月12日外交部例行记者会上，中新社记者提问，日前，美国众议长约翰逊在美智库哈德逊钻研所优惠上宣称，中国是美，繁多最大要挟，，将在本届国会残余会期内，动用一切手腕反抗中国，众院将在年底前推进一揽子涉华法案，包含制裁向俄罗斯及伊朗提供物质允许的中国军工企业、限度美对华投资和无关美中经贸协作等，请问中方对此...。

2024-07-13 02:04:36

木字旁的字都有哪些 (木字旁的字都与什么有关)

1、本、棋、木、果、来、杏、森、概、梢、枝、柳、梁2、机、柱、架、村、杆、相、梳、植、椿、楼、根、柔3、棉、李、枪、栽、查、朵、板、橱、染、朽、橙、柏4、杂、模、橘、枫、核、渠、极、棱、枣、棵、样、术5、杯、柴、案、棚、株、榻、松、椅、校、树、桃、桥带木字旁的字有哪些以及木字旁的词语带木字旁的字，材、树、梳、村、林、檩、杜、朴、札、机...。

2024-07-09 13:13:38

西风标致5008怎样样 (东风标致50)

2022年11月25日，西风标致经过线上模式发表，旗下的新款西风标致5008正式上市作为改款车型，新款西风标致5008换装了标致全新的盾型LOGO，全系共推出四款车型，其售价区间为1787万至2337万元全系四款车型，买哪款更，不错标致5008操控性可以和德系车相媲美，小巧的方向盘转向精准很轻捷，只管车大，然而开起来很灵巧，转弯也很小...。

2024-07-07 22:55:02

纸醉金迷为什么说酒是绿色的成语 (纸醉金迷为什么抗战胜利四奶奶破产)

中华成语中有，纸醉金迷，一成语，是描画美妙的生存，现代人的夜生存青睐在门前挂上红灯笼，叫上三俩朋友，开怀畅饮，饮的是略带点绿色的酒，这一成语也是依据现代的特色构成的，宋人朱翌诗中既有，雨脚雪花方间作，纸醉金迷正争光，之句，可以为证，很多酒友就该疑惑了，见过微黄的酒，见过白色的酒，见过透明的酒，还真没见过绿色的酒，这绿色的酒又是怎样酿进...。

2024-07-01 01:27:04

仙剑奇侠传5下载免费-仙剑奇侠传五下载官方简体中文版-ChinesePaladin5数字版

仙剑奇侠传5（pal5）是《仙剑》系列的第六部作品，最经典国产仙侠题材RPG游戏。游戏画面精美，完美展现仙侠风；超炫酷的技能，还有多种合体技，特效精良。永恒的仙剑，仙剑迷们不容错过啊！游戏介绍《仙剑奇侠传五》是由大宇资讯旗下软星科技（北京）有限公司所制作

2023-11-15 22:30:27

大智慧软件官方免费下载-大智慧股票软件下载v8.43.0.21885免费版-

大智慧股票软件,大智慧股票软件是官方网站最新版，是一套用来进行证券行情显示、行情分析、外汇及期货信息，并同时进行信息即时接收的超级证券信息平台,您可以免费下载。

2023-08-11 17:47:21

文章推荐

微信小程序流量主是如何被动躺赚的? (微信小程序流量主赚钱是真的吗)

小程序相信大家都不陌生，搭建一个小程序，然后进行推广，获取流量和用户，就可以产生收益，大概形式就是和公众号流量主类似，别人点击广告就可以获取收益，比公众号好的一点是，小程序可以引导点击广告，收益也更高，点击进入小程序，浏览广告，点击任何广告页面，都有佣金，相当客户只要进小程序就有钱赚，小程序搭建流程1.搭建小程序大家如果会搭建，可以去...。

2025-01-30 23:17:30

网络百科

实操干货分享知乎小说推文项目 (实操视频)

知乎是一个比较高质量的平台，我经常会跟大家讲，做内容，做引流，一定离不开知乎这个平台，因为上面的粉丝极其精准，我们要的是精准粉，而不是泛粉，所以知乎对于每一个自媒体人而言，是必须要充分利用起来的平台，说到知乎，今天要跟大家分享的项目是跟知乎相关，叫知乎小说推文，今年很多人都跟我说了这个项目，包括在一些社群，我也看到很多人在操作，收益也...。

2025-01-28 23:30:12

好文分享

宇视真的不算什么张鹏国 (宇视真的不算国企吗)

出场太晚的，年轻后生，宇视，在同城两强的夹击中，从籍籍无名冲到全球第四中国第三，生生给这个行业造了个新词，海大宇，故事本身也够波折，脱离母体独立运营、英特尔，宇视商标案、手握香港上市门票时放弃、并入A股上市公司、果断进入新赛道，2017年，当AI企业姿态高贵地在安防行业招兵买马，媒体渲染下的海大宇危机重重，张鹏国高声提醒大家，我们安...。

2024-11-30 22:43:41

资讯动态

父亲称后悔在女儿说被欺负时劝她要想开点陕西一高三女生坠楼身亡 (后悔的父亲)

问题就出在我们只看到了父母，应该教育，的角度，却没有从孩子的角度去思考问题，孩子想要的是，父母和他们分享故事，父母看到他们渴望亲昵的期待，如果父母看不到孩子真实的需求，听不到真实的声音，那孩子就像进入了无人之境，孤单又寒冷，高三女孩被欺负后坠楼，爸爸最后悔生前说的这句话在网上看到过一段话，低谷时，家人甚至会给予更大的压力，很多年轻人...。

2024-11-29 16:14:17

资讯动态

瓦罐汤加盟怎么样 (瓦罐汤加盟店)

瓦罐是大众耳熟能详的快餐食品，以瓦罐烹调的方式能够牢牢锁住食材中的营养成分不流失，对人体健康而言十分有利，因此前往各家快餐店体验的顾客接踵而至，不少经营者从中受益匪浅甚至开出分店经营，那么从开店角度来看瓦罐汤加盟怎么样，文章将给出清晰的解答，江南瓦罐从事瓦罐快餐销售已有多年之久，公司推出的餐品分量足、味道好，受到消费者的肯定与好评，品...。

2024-11-22 22:27:02

创业加盟

AlphaGo表现出了哪些计算和智能 两场比赛 (alphago是什么人工智能)

二、同样是与人类对战，AlphaGo和深蓝的区别

三、在比赛前，很多人都判断AlphaGo会输，这种判断偏差在哪里？

四、整个比赛的输赢对人工智能研究意味着什么？

五、首场比赛，AlphaGo为什么在后半程越走越慢？

六、如果计算性能够强大，AlphaGo能否直接得出最优解？

七、AlphaGo在学习什么，是如何学习的？

八、除了围棋，AlphaGo还可以用在什么领域？

相关文章

文章推荐

AlphaGo表现出了哪些计算和智能两场比赛 (alphago是什么人工智能)