FlashLabs发布开源端到端语音模型 Chroma1.0,语音克隆相似度超人类基线?

近日,AI 研发团队 FlashLabs 正式推出开源端到端实时语音对语音模型 Chroma1.0,该模型突破传统语音交互的级联架构限制,实现从语音到语音的直接处理,同时支持高保真个性化语音克隆,相关代码、权重及基准测试已全面开源。?
与传统 “语音转文本→LLM 处理→文本转语音” 的三段式流程不同,Chroma1.0 采用原生语音 Token 闭环处理架构,无需中间文本转换,端到端延迟低于 150ms。仅...
点击查看剩余70%
网友评论