Google拥有的人工智能公司DeepMindpressented一个深层神经网络产生了惊人的人类语音。称为wavenet,这个人工智能对现有s有了重大进步
Google拥有的人工智能公司DeepMindpressented一个深层神经网络产生了惊人的人类语音。这个AI被称为Wavenet,对现有的语音合成器取得了重大进步。更重要的是,它可以写得很好的古典音乐。
DeepMind是一家英国公司,以前以创建机器学习的AI软件而闻名,该软件击败了臭名昭著的游戏冠军。机器学习使计算机系统可以根据收集的数据进行教学并进行预测。
该公司声称其Wavenet会创建言语,可以模仿任何人类的声音,并以人类的言语表现缩小差距超过50%。 Google的500人盲目测试研究发现,人们在4.21(5是现实的人类演讲)上对WaveNet的英语演讲进行评分,而Convenate Speak的评价为3.86,并且参数更差3.67。
Wavenet还以普通话的形式产生了语音,结果相似。
他们通过重新想象当前使用文本到语音(TTS)过程来做到这一点。最常见的两个是由Apple Siri使用的串联TT,其中涉及预录的语音片段和参数TTS,听起来甚至不太自然,从而通过计算机算法生成语音。
WaveNet的不同之处在于,它可以直接建模音频信号的原始波形,这是一项非常复杂的任务,需要新的神经网络。 Wavenet从语音录音中学习,然后自行创建语音。这种独立性还允许该程序生成其他类型的音频,例如音乐。
为了提高他们的主张,DeepMind发布了一些样品,将它们的波纳特与由连接酸盐和参数TTS制成的样品进行了比较。你是法官。
参数:
parametric-1.wav
参数-2.WAV
现在,这就是Wavenet产生的:
vavenet-1.wav
vavenet-2.wav
在经过古典钢琴音乐的数据集中进行了训练之后,Wavenet制作了这些有趣的音乐创作:
sample_1.wav
sample_2.wav
sample_3.wav
这项新技术的含义是什么?虽然这也意味着我们最终的机器人霸主应该更容易与之交谈,但像Siri或Cortana这样的虚拟AI助手可能会更快受益。 Google并不承诺直接进入此类应用程序,但是,由于Wavenet需要严重的计算能力。
这项成就再次显示了DeepMind神经网络的潜力,该网络可以并且正在用于欺诈和垃圾邮件检测,手写识别,图像搜索,翻译和其他任务。
DeepMind还使许多Google的数据中心更有效地使用能源,从而削减了电费。以前,DeepMind训练其AI击败了数十个视频游戏。
在Google Move中,WaveNet上的论文可在此处的Google Drive上找到。
想进一步了解DeepMind吗?查看此视频:
原创文章,作者:互联世界,如若转载,请注明出处:http://www.dsonekey.com/3551.html