树莓派等端侧多语言离线 TTS 模型Supertonic 3开源了,支持 31 种语言与声音克隆

超音速(Supertone)公司近日推出 Supertonic 3,一款完全运行于设备本地的轻量级文本转语音系统,现已登陆 GitHub。
该基于 ONNX Runtime 构建的系统,模型参数仅约 9900 万,无需联网即可在个人电脑、浏览器乃至树莓派等边缘设备上实时合成语音,彻底消除数据隐私顾虑。
Supertonic 3 将语言支持从上一版的 5 种扩展至 31 种,涵盖英、日、韩、德、阿拉伯语等主流语言,并在阅读准确性、稳定性上显著提升。它尤为擅长解析自然文本中的复杂表达,能准确朗读财务数字、电话号码及技术单位缩写。
开发方面,Supertonic 提供 Python SDK,...
点击查看剩余70%
网友评论