IndexTTS 2 开源:ai语音克隆+情绪控制进入影视级别,真假难分

IndexTTS 2 开源:ai语音克隆+情绪控制进入影视级别,真假难分

800_auto

B站技术团队今日在 GitHub 与 Hugging Face 同步开源 IndexTTS 2(7 B & 32 B 双版本)。

该模型首次在零样本条件下实现 “时长-情感-音色”三重独立控制,并放出《后宫佳丽》第 8 集“惊鸿舞”示范工程,供开发者一键复现影视级配音。

1. 技术亮点

毫秒级时长控制:通过显式 token 数或自由生成两种模式,可将 4.8 秒原台词压缩至 3.6 秒或拉伸至 6 秒,误差 < 0.02 %。

情...

点击查看剩余70%

{{collectdata}}

网友评论