腾讯开源多主体参考视频生成框架HunyuanCustom
HunyuanCustom 是由 Tencent 开发的一个多模态驱动的自定义视频生成架构,支持图像、音频、视频和文本等多种类型的条件输入。该模型通过引入文图融合模块和图像 ID 增强模块,提高了主体一致性和生成质量。
同时,HunyuanCustom 通过 AudioNet 模块和基于视频的注入机制,实现了更好的音频和视频驱动的自定义视频生成。与现有的开源和商业模型相比,HunyuanCustom 在面部一致性、文视频对齐和视频质量方面表现出色。
核心功能
单主体视频生成:用户只需提供一张人物或物体的图片,并输入一段文本描述,HunyuanCustom就能生成连贯自然的视频,且人...
点击查看剩余70%
网友评论