Google的“ Translatotron”翻译了您的演讲,同时保持声音的声音

Google的Translatotron是一个新的翻译系统,很快就可以将您的语音转换为另一种语言而不会失去您的语音和语气的关键方面。该系统仍在

Google的Translatotron是一个新的翻译系统,很快就可以将您的语音转换为另一种语言而不会失去您的语音和语气的关键方面。该系统仍处于早期阶段,但是您可以通过聆听下面的音频样本(约1:00标记)来了解技术的声音。

看一下翻译

YouTube

这并不是一个完美的复制品,但Google建议其新系统可能很快提供了比当前翻译人员更加无缝的翻译体验。

像Google翻译一样,这样的系统将翻译过程分为三个步骤,正如Google在博客文章中写道的:“自动语音识别以将源语音抄录为文本,机器翻译以将抄写的文本翻译成目标语言,并 – 言语综合(TTS)从翻译文本中以目标语言生成语音。”结果是您的口语单词被转换为文本,该文本被转换为另一种语言,然后机器智能以不同的语言说明您的单词。

Translatotron是不同的,因为它绕过了中间文本表示步骤。 Google通过使用神经网络将语音频谱从一种语言转换为另一种语言来实现这一目标。 (频谱图是声音中频率频谱的视觉表示。)

“它利用了另外两个单独训练的组件:一种神经声码器,将输出频谱图转换为时域波形,并且可以选择地使用扬声器编码器,可用于在合成的翻译语音中维护源扬声器声音的性格, Google在其博客文章中写道。

Google补充说,其新方法带来了一些优势,包括:“。。。更快的推理速度,自然地避免了识别和翻译之间的复杂错误,使得在翻译后保持直接保留原始扬声器的声音,以及更好地处理不需要翻译的单词(例如,名称和专有名词)。”

Google仍在浏览Translatotron中的扭结(您可以在这里查看一些令人印象深刻的翻译工作。)但是,不难看到翻译很快能否使外语互动更加顺利地进行,通过捕获和再现一些来进行外语互动。当机器人声音将文本综合为语音时,丢失的细微差别。

原创文章,作者:互联世界,如若转载,请注明出处:http://www.dsonekey.com/3389.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息