字节开源多参考主体一致性视频生成模型Phantom

字节开源多参考主体一致性视频生成模型Phantom

800_auto

Phantom 是由字节跳动智能创作团队推出的一种新型视频生成框架,专注于通过跨模态对齐技术生成主题一致的视频。该框架通过文本、图像和视频的三元组数据进行学习,能够从参考图像中提取主体元素,并根据文本提示生成与主体一致的视频内容。

核心功能

主体一致性:Phantom 能够严格保留参考图像中主体的身份特征,无论是人物面部、服装还是其他物体,确保生成的视频与参考图像高度一致。

800_auto

单参考图像生成:仅需一张参考图像,即可...

点击查看剩余70%

{{collectdata}}

网友评论