腾讯开源声音克隆的音乐生成大模型SongGeneration
腾讯 AI Lab 开源了其音乐生成大模型 SongGeneration。以下是该模型的详细介绍:
模型功能
SongGeneration 支持多项核心功能,包括:
文本控制:用户输入关键词文本(如“开心 流行”、“激烈 摇滚”)即可生成风格与情绪相匹配的完整音乐作品。
风格跟随:用户上传 10 秒以上的参考音频,模型会生成风格一致的全长新曲,涵盖多种音乐流派。
多轨生成:自动生成分离的人声与伴奏轨道,保证旋律、结构、节奏与配器的高度匹配。
音色跟随:基于参考音频的音色跟随功能,生成歌曲具备“音色克隆”级别的人声表现,音质出众且情感表现力强。
技术方案SongGeneration 的训练架构包含数据管线和生成模型两部分:
数据管线:包括音伴分离、结构分析、歌词识别等模块,从原始音频中提取准确的歌词数据及结构、曲风、音质等标签数据。
生成模型:总...
点击查看剩余70%
网友评论