Genmo开源100亿参数的文生视频 AI 模型Mochi-1

Genmo开源100亿参数的文生视频 AI 模型Mochi-1

800_auto

Genmo 公司推出了一个名为 Mochi-1 的开源 AI 视频生成模型,它是一个基于 Apache 2.0 许可证的免费模型,允许用户自由修改和使用。

Mochi 1 的架构包括一个 AsymmVAE,它使用不对称的编码器 - 解码器结构来压缩视频,以及一个 AsymmDiT,后者有效地处理用户提示和压缩视频令牌,并专注于视觉推理。该模型使用单个 T5-XXL 语言模型来编码提示,而不是多个预训练的语言模型。

模型运行配置:至少需要 4 个 H100 GPU 来运行模型。

800_auto

Mochi-1 专注于视...

点击查看剩余70%

{{collectdata}}

网友评论