Moonshot开源支持语音识别与语音生成的模型Kimi-Audio-7B-Instruct

Moonshot开源支持语音识别与语音生成的模型Kimi-Audio-7B-Instruct

800_auto

Moonshot AI 正式发布了全新的开源音频基础模型 Kimi-Audio-7B-Instruct,这是一款在音频理解、生成和对话方面表现出色的模型。

核心功能

多功能性:Kimi-Audio-7B-Instruct 基于 Qwen2.5-7B 架构并结合 Whisper 技术,支持多种音频相关任务,包括语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分...

点击查看剩余70%

{{collectdata}}

网友评论