微软发布 AI 声音克隆工具 VALL-E,只需 3 秒音频即可模仿人说话

微软发布 AI 声音克隆工具 VALL-E,只需 3 秒音频即可模仿人说话

该工具经过 60000 小时英语语音数据的训练,并使用特定语音的 3 秒剪辑来生成内容。与目前的许多人工智能工具不同,VALL-E 可以复制说话者的情绪和语气,即使说话者本人从未说过的单词也可以模仿。

800_auto

康奈尔大学的一篇论文使用 VALL...

点击查看剩余70%

{{collectdata}}

网友评论