腾讯开源声音克隆的音乐生成大模型SongGeneration

腾讯开源声音克隆的音乐生成大模型SongGeneration

800_auto

腾讯 AI Lab 开源了其音乐生成大模型 SongGeneration。以下是该模型的详细介绍:

模型功能

SongGeneration 支持多项核心功能,包括:

文本控制:用户输入关键词文本(如“开心 流行”、“激烈 摇滚”)即可生成风格与情绪相匹配的完整音乐作品。

风格跟随:用户上传 10 秒以上的参考音频,模型会生成风格一致的全长新曲,涵盖多种音乐流派。

多轨生成:自动生成分离的人声与伴奏轨道,保证旋律、结构、节奏与配器的高度匹配。

音色跟随:基于参考音频的音色跟随功能,生成歌曲具备“音色克隆”级别的人声表现,音质出众且情感表现力强。

技术方案

SongGeneration 的训练架构包含数据管线和生成模型两部分:

800_auto

数据管线:包括音伴分离、结构分析、歌词识别等模块,从原始音频中提取准确的歌词数据及结构、曲风、音质等标签数据。

800_auto

生成模型:总...

点击查看剩余70%

{{collectdata}}

网友评论