Moonshot开源支持语音识别与语音生成的模型Kimi-Audio-7B-Instruct
Moonshot AI 正式发布了全新的开源音频基础模型 Kimi-Audio-7B-Instruct,这是一款在音频理解、生成和对话方面表现出色的模型。
核心功能
多功能性:Kimi-Audio-7B-Instruct 基于 Qwen2.5-7B 架构并结合 Whisper 技术,支持多种音频相关任务,包括语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分...
点击查看剩余70%
网友评论