听新的Google AI程序像人一样谈论并写音乐

Google拥有的人工智能公司DeepMindpressented一个深层神经网络产生了惊人的人类语音。称为wavenet,这个人工智能对现有s有了重大进步

Google拥有的人工智能公司DeepMindpressented一个深层神经网络产生了惊人的人类语音。这个AI被称为Wavenet,对现有的语音合成器取得了重大进步。更重要的是,它可以写得很好的古典音乐。

DeepMind是一家英国公司,以前以创建机器学习的AI软件而闻名,该软件击败了臭名昭著的游戏冠军。机器学习使计算机系统可以根据收集的数据进行教学并进行预测。

该公司声称其Wavenet会创建言语,可以模仿任何人类的声音,并以人类的言语表现缩小差距超过50%。 Google的500人盲目测试研究发现,人们在4.21(5是现实的人类演讲)上对WaveNet的英语演讲进行评分,而Convenate Speak的评价为3.86,并且参数更差3.67。

Wavenet还以普通话的形式产生了语音,结果相似。

他们通过重新想象当前使用文本到语音(TTS)过程来做到这一点。最常见的两个是由Apple Siri使用的串联TT,其中涉及预录的语音片段和参数TTS,听起来甚至不太自然,从而通过计算机算法生成语音。

WaveNet的不同之处在于,它可以直接建模音频信号的原始波形,这是一项非常复杂的任务,需要新的神经网络。 Wavenet从语音录音中学习,然后自行创建语音。这种独立性还允许该程序生成其他类型的音频,例如音乐。

为了提高他们的主张,DeepMind发布了一些样品,将它们的波纳特与由连接酸盐和参数TTS制成的样品进行了比较。你是法官。

参数:

parametric-1.wav

参数-2.WAV

现在,这就是Wavenet产生的:

vavenet-1.wav

vavenet-2.wav

在经过古典钢琴音乐的数据集中进行了训练之后,Wavenet制作了这些有趣的音乐创作:

sample_1.wav

sample_2.wav

sample_3.wav

这项新技术的含义是什么?虽然这也意味着我们最终的机器人霸主应该更容易与之交谈,但像Siri或Cortana这样的虚拟AI助手可能会更快受益。 Google并不承诺直接进入此类应用程序,但是,由于Wavenet需要严重的计算能力。

这项成就再次显示了DeepMind神经网络的潜力,该网络可以并且正在用于欺诈和垃圾邮件检测,手写识别,图像搜索,翻译和其他任务。

DeepMind还使许多Google的数据中心更有效地使用能源,从而削减了电费。以前,DeepMind训练其AI击败了数十个视频游戏。

在Google Move中,WaveNet上的论文可在此处的Google Drive上找到。

想进一步了解DeepMind吗?查看此视频:

原创文章,作者:互联世界,如若转载,请注明出处:http://www.dsonekey.com/3551.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息