FlashLabs发布开源端到端语音模型 Chroma1.0，语音克隆相似度超人类基线?-BFW编程笔记

FlashLabs发布开源端到端语音模型 Chroma1.0，语音克隆相似度超人类基线?

800_auto

近日，AI 研发团队 FlashLabs 正式推出开源端到端实时语音对语音模型 Chroma1.0，该模型突破传统语音交互的级联架构限制，实现从语音到语音的直接处理，同时支持高保真个性化语音克隆，相关代码、权重及基准测试已全面开源。?

与传统 “语音转文本→LLM 处理→文本转语音” 的三段式流程不同，Chroma1.0 采用原生语音 Token 闭环处理架构，无需中间文本转换，端到端延迟低于 150ms。仅...

点击查看剩余70%

打赏博主×