类似chatgpt的语音聊天对话框架Moshi开源了

类似chatgpt的语音聊天对话框架Moshi开源了

800_auto

Moshi 是一个全双工的语音对话框架,它包括两个主要组件:Mimi 音频编解码器和 Moshi 模型。

800_auto

Mimi 能够以 80ms 的延迟处理音频流,并将其压缩到 1.1kbps 的比特率,同时保持与 WavLM 非因果表示的匹配。

Mosh...

点击查看剩余70%

{{collectdata}}

网友评论