百度发布DeepVoice最终版：模仿万人、半小时学会一种口音

行业资讯 cnBeta 2017-10-25 09:56

今年早些时候，搜索巨头百度推出了一个名叫 DeepVoice 的全新人工智能系统，借助热门的深度学习技术，它能够实现文本到语音（TTS）的转换。初版 DeepVoice 可以产生较短的语句，不仔细听还以为是个真人在说话。该系统还可以每次学习一种声音，在数小时后即可掌握。而今年 5 月份推出 DeepVoice 2，可以在一小时内模仿出一种口音，单系统就可以学习数百种不同的口音。

现在，百度推出了 DeepVoice 的“最终版”，声称可以在每半个小时内完成对 10000 种语音的数据学习。这种高效生成各种各样声音的技术，为许多用例打开了大门。

例如，在有声书或视频游戏中，每个角色都可以有自己独特的声音，以获得更强的用户体验。不过与真人配音相比，百度 DeepVoice 产出的口音，其合成感还是很明显的。

对此，百度表示这并不是他们的目标：“如果只生成一两种口音的话，我们的系统早已证实能够合成相当自然的、接近真人的口音，且可以轻易将它用作数字助理”。

百度所要尝试的，是制造出一种能够掌握多种口音或字符间细微差别的系统：

这只是最初的工作，展示了可伸缩的可能性。我们的系统成功地量训练扩大了一个规模，此前发表的 TTS 模型中尚未达到过。
我们相信，通过使用大型高质量数据集、和额外的机器学习工程训练，其质量可在不久的将来大幅提升。

需要指出的是，百度并不是唯一一家从事计算机语音合成工作的搜索巨头，Google 旗下的 DeepMind 部门也一直在进行一个名叫 WaveNet 的类似项目。
在最新的版本中，WaveNet 已经能够在掌握口音方面做到更好，甚至像真人那样产生“唇音”。现在，它已经被用到了英语和日语版本的 Google Assistant 上。

VPA之家

语音助手&智能生活

百度发布DeepVoice最终版：模仿万人、半小时学会一种口音

谷歌宣布Google Assistant智能音箱已可使用Apple Music

Alexa能学你教的东西了，这是迈向通用人工智能的第一步

谷歌将关闭Android Things，一款从未成功的智能家居操作系统

继美国后，Fitbit将支持谷歌助手推广到更多英语国家

三星新概念AI助手NEON有望随Galaxy S21 Ultra一起发布

Google Assistant推出类似Siri Shortcuts的新功能

苹果推出全新AirPods Pro 售价1999元 10月30日起发售

微软正式宣布以197亿美元收购AI语音技术公司Nuance

Google Assistant将通过联合学习来提高听力水平

研究人员设计出一种智能音箱监测心律的方法

亚马逊Vesta家用机器人项目更多细节曝光

官方禁用所有智能功能：哈曼卡顿Invoke Cortana音箱变“哑巴”

Alexa for Xbox发布：替代Cortana为玩家提供语音助手服务

苹果正改进Siri等语音助手对非典型语言模式的识别

随机新闻标签

VPA之家

联系方式

语音助手&智能生活

百度发布DeepVoice最终版：模仿万人、半小时学会一种口音

本文标签：

分享本文:

随机新闻标签