效率提高1000倍 Deepmind语音生成模型WaveNet正式商用 (效率提高10%)

雷锋网消息:2017年10月4日,Deepmind发表博客称,其一年前提出的生成原始音频波形的深层神经网络模型WaveNet已正式商用于Google Assistant中,该模型比起一年前的原始模型效率提高1000倍,且能比目前的方案更好地模拟自然语音。

以下为Deepmind博客所宣布的详细信息,雷锋网摘编如下

一年之前,我们提出了一种用于生成原始音频波形的深层神经网络模型WaveNet,可以产生比目前技术更好和更逼真的语音。当时,这个模型是一个原型,如果用在消费级产品中的计算量就太大了。

在过去12个月中,我们一直在努力大幅度提高这一模型的速度和质量,而今天,我们自豪地宣布,WaveNet的更新版本已被集成到Google Assistant中,用于生成各平台上的所有英语和日语语音。

新的WaveNet模型可以为Google Assistant提供一系列更自然的声音。

为了理解WaveNet如何提升语音生成,我们需要先了解当前文本到语音(Text-to-Speech,

TTS)或语音合成系统的工作原理。

目前的主流做法是基于所谓的拼接TTS,它使用由单个配音演员的高质量录音大数据库,通常有数个小时的数据。这些录音被分割成小块,然后可以将其进行组合以形成完整的话语。然而,这一做法可能导致声音在连接时不自然,并且也难以修改,因为每当需要一整套的改变(例如新的情绪或语调)时需要用到全新的数据库。

另一方案是使用参数TTS,该方案不需要利用诸如语法、嘴型移动的规则和参数来指导计算机生成语音并进行语音拼接。这种方法即便宜又快捷,但这种方法生成的语音不是那么自然。

WaveNet采取完全不同的方法。在原始论文中,我们描述了一个深层的生成模型,可以以每秒处理16000个样本、每次处理一个样本党的方式构建单个波形,实现各个声音之间的无缝转换。

Deepmind语音生成模型WaveNet正式商用:效率提高1000倍

WaveNet使用卷积神经网络构建,在大量语音样本数据集上进行了训练。在训练阶段,网络确定了语音的底层结构,比如哪些音调相互依存,什么样的波形是真实的以及哪些波形是不自然的。训练好的网络每次合成一个样本,每个生成的样本都考虑前一个样本的属性,所产生的声音包含自然语调和如嘴唇形态等参数。它的“口音”取决于它接受训练时的声音口音,而且可以从混合数据集中创建任何独特声音。与TTS系统一样,WaveNet使用文本输入来告诉它应该产生哪些字以响应查询。

原始模型以建立高保真声音为目的,需要大量的计算。这意味着WaveNet在理论上可以做到完美模拟,但难以用于现实商用。在过去12个月里,我们团队一直在努力开发一种能够更快地生成声波的新模型。该模型适合大规模部署,并且是第一个在Google最新的TPU云基础设施上应用的产品。

Deepmind语音生成模型WaveNet正式商用:效率提高1000倍

(新的模型一秒钟能生成20秒的音频信号,比原始方法快1000倍)

WaveNet团队目前正在准备一份能详细介绍新模型背后研究的论文,但我们认为,结果自己会说话。改进版的WaveNet模型仍然生成原始波形,但速度比原始模型快1000倍,每创建一秒钟的语音只需要50毫秒。该模型不仅仅速度更快,而且保真度更高,每秒可以产生24,000个采样波形,同时我们还将每个样本的分辨率从8bit增加到16bit,与光盘中使用的分辨率相同。

这些改进使得新模型在人类听众的测试中显得发声更为自然。新的模型生成的第一组美式英语语音得到的平均意见得分(MOS)为4.347(满分5分),而真实人类语音的评分只有4.667。

Deepmind语音生成模型WaveNet正式商用:效率提高1000倍

新模式还保留了原始WaveNet的灵活性,使我们能够在训练阶段更好地利用大量数据。具体来说,我们可以使用来自多个语音的数据来训练网络。这可以用于生成高质量和具有细节层次的声音,即使在所需输出语音中几乎没有训练数据可用。

我们相信对于WaveNet来说这只是个开始。我们为所有世界语言的语音界面所能展开的无限可能而兴奋不已。

原创文章,未经授权禁止转载。详情见 转载须知 。

Deepmind语音生成模型WaveNet正式商用:效率提高1000倍


本文地址: https://www.gpxz.com/article/1874fcd40591a8068958.html
全局中部横幅
全局中部横幅
舒式®易装【装修设计家具定制】龙岩新罗区橱柜衣柜沙发床垫厂家翻新改造家居全屋舒呆子舒有朋赤乍设计排名最大

龙岩市舒式舒适家居系统设计有限公司|舒式家具制造|全屋定制|整体烤漆家具|实木系列橱柜|衣柜|榻榻米|护墙板|木地板|墙布|墙面|防盗门|房间门|木门|家具|家居|背景墙|瓷砖|卫浴|淋浴房|防水|吊顶|沙发|餐桌|茶几|电视柜|窗帘布艺|移门壁橱|办公酒店家具|品牌|厨房地砖|建材|宿舍公寓家具|休闲吧餐厅家具|龙岩家具定制|工厂厂家|沙发|百得胜|舒琦仕|舒呆子

网站首页

浙江永联汽车配件有限公司

芜湖房产抵押贷款

芜湖房产抵押贷款公司(15395378008)作为本地专业贷款服务公司为您提供房子房屋抵押贷款、银行抵押贷款、信用贷款等业务。

无锡金铜电炉有限公司

无锡金铜电炉有限公司,成立于2004年,在金属铸造行业已有5年的历史。公司主要生产工频感应熔化炉及相关生产线。我公司对黄铜棒水平连铸,铝杆水平连铸,紫铜上引连铸,铜排水平连铸,锌锭锌杆连铸都有着丰富的经验.公司制造的生产线远销俄罗斯,泰国,越南,菲律宾,埃及,阿尔及利亚,乌干达,印度,孟加拉国,哈萨克斯坦,乌兹别克斯坦,蒙古等国家。

提取浓缩设备

浙江森博机械科技有限公司专业生产及销售配液罐,浓缩器,提取浓缩设备等产品,是一家经验丰富的生产厂家。产品质量可靠,价格实惠,欢迎来电咨询:0577-86831555

开心精准时间网

北京时间现在几点几分几秒?开心精准时间网告诉你!为您提供现在北京时间校对,农历查询,现在中国标准时间,当前北京时间校准对时等服务。

杭州立钢锚具有限公司

杭州立钢锚具有限公司(原富阳市富春江锚具厂),位于浙江杭州富阳市灵桥工业园区,杭州——千岛湖高速公路(富阳灵桥)出口处下即到,交通十分便利。公司占地8000平方米,固定资产达1000多万,所使用的预应力锚具及配套金属波纹管等适用于公路、高速公路、大中型桥梁生产和销售的企业。

深圳鼎晟丰科技

深圳市鼎晟丰科技有限公司专注于工业照明领域,为客户制定照明方案,提供1区2区使用的各类型防爆灯具及其他专业类的照明产品.

金张科技

金张科技,专注于功能性膜材料的开发及应用,专业的膜材料专家

浙江九宏电力工程有限公司

浙江九宏电力工程有限公司业务范围涉及电力总承包服务,电力工程施工,售电业务,主网业扩服务等,我司从事电力工程行业多年,积累了丰富的经验,企业实力雄厚,业务熟练,服务热情.如有合作需求,欢迎来电详谈18857781369.

地下室堵漏

涌达建工堵漏公司技术人员20多年专业从事地下室堵漏,水池堵漏,隧道堵漏,涵洞堵漏,管道堵漏,地铁防水堵漏,电缆沟堵漏,伸缩缝堵漏等各类疑难复杂高难度防水堵漏工程施工。24小时免费为您提供防水堵漏解决方案。

天气预报24小时查询

天气预报30天主要提供最新、准确、今日实时的天气预报30天(一个月)查询服务,通过天气预报30天查询结果可以知道未来30天天气预报、气温、风向,旅游、出差请收藏天气预报30天。


全局底部横幅