谷歌搜索也是拼了!为上马神经网络 PhD人工处理数据 百名 (谷歌搜索也是免费的吗)

编者按:近日,谷歌把神经网络算法加入手机端搜索。为了让搜索更智能,谷歌在全世界聘用了百名语言学博士,夜以继日地标注文本数据,来训练神经网络。虽然无监督学习成为热点已有些时日,谷歌还未能摆脱人工处理数据的困境。

也是拼了!为上马神经网络,百名 PhD人工处理数据iPhone.com/uploads/new/article/740_740/201611/583e7f0755255.jpg" src="http://www.gpxz.com/zdmsl_image/article/20241209231630_38558.jpg" loading="lazy">

搜索“世界上最快的鸟是什么?”

谷歌会告诉你:“游隼。根据 Youtube,游隼被记录下最高 389 km/h 的时速。”

这的确是正确答案,但它并非来自于谷歌的数据库。当你输入这个问题的时候,谷歌搜索引擎找出了一个描述世界上五种最快鸟儿的 Youtube 视频。然后它只把最快的“一种”鸟儿的信息提取出来,不提及另外四种。

这是谷歌搜索最新的技术进展。为了回答这些问题,谷歌需要借助深度神经网络。 作为 AI 技术之一,它不仅正在重塑谷歌搜索引擎,还在革新谷歌全套人工智能服务。其它互联网巨头当然也受到波及,例如 Facebook 和微软。

深度神经网络是一种模式识别系统。它能通过分析海量数据,学习如何处理特定任务。这个例子中,它学会了怎么在网络上的长篇文字中找出相关的一句或一段话,然后提取其中的要点呈现给你。

移动端谷歌搜索刚刚上线这种“句子压缩算法”(sentence compression algorithms)。这个对人类来说很简单,但对传统的机器来说很难的任务,终于能被 AI 系统完成。这说明,深度学习正在促进自然语言理解这门艺术(理解并回应人类语言)的发展。

为了训练神经网络算法,谷歌在全世界聘用了约百名语言学博士处理数据,对它们人工筛选。 事实上,谷歌的系统是从人类那里学习,怎么在大段文字中提取有用信息。而这过程需要一遍遍地重复——这是深度学习一个很大的限制。雇佣大批语言学家不停地筛选数据既麻烦又极其昂贵,但短期内谷歌没有别的办法。

也是拼了!为上马神经网络,百名 PhD人工处理数据

谷歌也使用过期的新闻来训练 AI 问答系统。这使 AI 逐渐理解,新闻标题是如何对文章主体进行归纳的。但这并不意味着谷歌不需要成批语言学家了。他们不仅示范句子压缩,还要对语句的不同部分做标记,以帮助神经网络理解人类语言是如何工作的。David Orr 把谷歌语言学家团队处理的数据称为“黄金数据”,过期新闻则是“白银数据”。“白银数据”作用不小,因为它的体量很大。但价值最大的还是“黄金数据”,它们是 AI 训练的核心。语言学家团队的负责人 Linne Ha 透露,在可见的将来,语言学家队伍仍会继续扩大。

也是拼了!为上马神经网络,百名 PhD人工处理数据

这类需要人工辅助的 AI 学习便是“监督学习”(supervised learning),目前,神经网络都是这么运作的。 有时候公司会把这个业务进行众包,有时候它会自发地进行。比方说,全世界的网民已经为数百万的猫咪照片添加了“猫咪”标签,这会让神经网络学习识别猫咪变得很简单——训练数据已经处理好了。但很多情况下,研究人员们别无选择,只能自己一次次为数据添加标签。

深度学习初创公司Skymind 的创始人 Chris Nicholson 认为, 长远来看,人工标注数据是不可行的。 他说:“将来一定不会是这样。这是极度枯燥的活儿。我想不出比这更无聊的 PhD 工作了。”

监督学习的缺陷远不止如此: 除非谷歌聘请所有语言的语言学家,否则这个系统无法在其他语言中运转。 现在,语言学家团队的工作横跨了 20 至 30 种语言。谷歌必须在将来的某一天,采取更自动化的 AI 训练方式,即“无监督学习”(unsupervised learning)。

到了那时,机器将能够从未经人工标注的数据中学习。互联网上海量的数字信息可以被直接用于神经网络学习。 Google、Facebook 和 OpenAI这样的巨头们已经开始这个领域的研究,但它的实际应用仍然非常遥远。现在,AI 学习仍然需要幕后的大批语言学家队伍。

【招聘】雷锋网坚持在人工智能、无人驾驶、VR/AR、Fintech、未来医疗等领域第一时间提供海外科技动态与资讯。我们需要若干关注国际新闻、具有一定的科技新闻选题能力,翻译及写作能力优良的外翻编辑加入。工作地点深圳。简历投递至 guoyixin@leiphone.com 。兼职及实习均可。

Facebook Yann LeCun一小时演讲: AI 研究的下一站是无监督学习(附完整视频)

专访 Jeff Dean丨谷歌战神谈增强学习和无监督学习

AI 黑箱难题怎么破?基于神经网络模型的算法使机器学习透明化

回顾Google神经网络机器翻译上线历程 | 深度

原创文章,未经授权禁止转载。详情见 转载须知 。

也是拼了!为上马神经网络,百名 PhD人工处理数据

全局中部横幅
山工阀门(山东)有限公司

山工阀门(山东)有限公司专业对山东地区生产销售阀门成套产品,是山东闸阀、截止阀、球阀、止回阀、蝶阀、水力控制阀、调节阀、旋塞阀、给排水消防阀门、脱硫脱硝阀门,衬四氟阀门等多个系列通用阀门的生产厂家、供应商。

玻璃钢标示牌里程碑,玻璃钢储罐,玻璃钢电缆沟盖板

河北万晴环保设备有限公司----中国大型玻璃钢供应商,是从事玻璃钢标示牌里程碑、玻璃钢储罐、玻璃钢电缆沟盖板、玻璃钢电缆桥架、玻璃钢电缆支架、玻璃钢防眩板等玻璃钢产品制造、销售、安装及服务于一体的现代化企业。

苏州科联盈自动化系统有限公司

苏州科联盈公司作为中国氦检设备制造技术领先企业,长期以来主要为汽车行业客户提供专业的氦气泄漏检测设备。目前是上汽大众、蔚来、马自达、特斯拉等汽车主机厂体系内一级供应商。科联盈氦检设备已被法雷奥、马勒等客户列为氦检设备首选推荐供应商。

学习中的南桅

超级外链发布工具收集了几千个网址,其中包括IP查询、SEO综合信息查询、Alexa排名查询以及PR值查询等等网站,由于这些网站大多有查询记录显示功能,SEO外链工具利用各种查询网站留下你的链接,达到自动发外链的效果,可以被百度、谷歌、搜狗等搜索引擎快速收录,本站共为你推广9603条外链。

微信公众号代运营推广

微信代运营服务平台汇集全国微信公众号代运营公司,提供微信公众号代运营,腾讯企业微信代运营,微信小程序代运营,微信公众号代运营推广等专业服务.带你了解微信代运营哪家好,微信公众号代运营价格等信息。

黄页网

拥有全国各地上千万家企业信息,找企业信息就到黄页网。目前网站服务免费,并支持动态发布,实时更新,现在加入免费得到首页推荐,每天十万次的显示机会让给你。

灵智天成

灵智天成科技有限公司专注于产品设计与研发,为客户提供产品定位、设觉设计、程序开发、产品上线、营销推广及seo优化等一站式服务。主营业务有:各类APP开发、小程序开发、软硬件开发、物联网开发、技术咨询、大数据营销、营销推广及seo优化等。

中华家长网校

中华家长头条网是一个专为家长打造的家庭教育头条知识分享平台。我们致力于提供最新、最全面的家庭教育资讯、教育理念、亲子沟通技巧等,帮助家长更好地理解和指导孩子,促进家庭和谐与孩子的全面发展。在这里,您可以轻松获取家庭教育相关的头条知识,与其他家长交流心得,共同成为孩子成长路上的引路人。

浙江大学留学预科,浙大留学预科,浙江大学留学预科班,浙江留学预科网

浙江留学预科网提供浙江大学出国留学预科课程,全国免费咨询电话400-6887-125

送菜app

菜咚咚咚咚买菜App,不仅是购物,更是对广东菜热爱的表达!丰富的品种,高效的配送,让您在繁忙的生活中依然能够尽情品味家的味道。下载App,即刻开启美食之旅!

CAD派客云图

无论在现场还是办公室,你都可以使用CAD派客云图对DWG图纸进行快速看图、编辑绘制和测量批注,还能对PDF图纸在线查看、审阅批注和沟通讨论。

长沙润凯环境科技有限公司

长沙润凯环境科技有限公司公司的主要产品有:UV光解净化器、低温等离子净化器、活性炭净化(及吸附脱附)设备、湿式洗涤塔、布袋除尘器、净化与治理。电话:18573102388

全局底部横幅