Meta继视觉分割一切后开源音频分离SAM-Audio模型

Meta继视觉分割一切后开源音频分离SAM-Audio模型

800_auto

近日,Meta正式推出音频分割模型SAM-Audio,可通过文本、视觉、时间跨度三种多模态提示,从复杂音频混合中精准分离任意声音,彻底改变传统音频处理方式。

该模型搭载Perception Encoder Audiovisual(PE-AV)核心技术引擎,融合先进视听感知能力,实现业界领先...

点击查看剩余70%

{{collectdata}}

网友评论