树莓派等端侧多语言离线 TTS 模型Supertonic 3开源了,支持 31 种语言与声音克隆

树莓派等端侧多语言离线 TTS 模型Supertonic 3开源了,支持 31 种语言与声音克隆

800_auto

超音速(Supertone)公司近日推出 Supertonic 3,一款完全运行于设备本地的轻量级文本转语音系统,现已登陆 GitHub。

该基于 ONNX Runtime 构建的系统,模型参数仅约 9900 万,无需联网即可在个人电脑、浏览器乃至树莓派等边缘设备上实时合成语音,彻底消除数据隐私顾虑。

Supertonic 3 将语言支持从上一版的 5 种扩展至 31 种,涵盖英、日、韩、德、阿拉伯语等主流语言,并在阅读准确性、稳定性上显著提升。它尤为擅长解析自然文本中的复杂表达,能准确朗读财务数字、电话号码及技术单位缩写。

开发方面,Supertonic 提供 Python SDK,...

点击查看剩余70%

{{collectdata}}

网友评论