阿里开源视频生成音效技术PrismAudio

阿里开源视频生成音效技术PrismAudio

3 月 24 日,阿里云通义实验室正式发布并开源PrismAudio,这是全球首个融合强化学习与思维链的视频生成环境音框架,专攻马蹄声、风雨声等与画面同步的音效合成,而非人物配音。

800_auto

PrismAudio 采用 “先写笔记、再发声” 的分解式推理流程,先分析视频内容、声音类型与时间节...

点击查看剩余70%

{{collectdata}}

网友评论