阿里巴巴开源消费级显卡可运行的视频生成与编辑AI模型Wan2.1-VACE

阿里巴巴开源消费级显卡可运行的视频生成与编辑AI模型Wan2.1-VACE

800_auto

近日,阿里巴巴正式开源了其最新研发的AI视频生成与编辑模型——Wan2.1-VACE,这一举措在AI视频领域引起了广泛关注。

该模型以其强大的多模态视频生成和编辑能力,为视频创作和编辑带来了全新的可能性,有望成为创意视频制作、视频内容编辑、虚拟现实与增强现实等领域的强大工具。

一、模型简介

Wan2.1-VACE 是阿里巴巴推出的一款AI视频生成与编辑模型,具备多种基础生成和编辑能力。该模型能够同时支持文生视频、图像参考视频生成、视频参考生成视频等多种输入方式,还涵盖了视频重绘、视频局部编辑、视频背景延展以及视频时长延展等功能。本次开源的版本包括1.3B和14B两个版本,其中1.3B版本可在消费级显卡上运行,极大地降低了使用门槛,使更多的开发者能够轻松上手。

二、主要功能

(一)多模态视频生成

800_auto

Wan2.1-VACE 支持文本、图像、视频等多种输入方式,能够根据用户提供的不同输入生成高质量的视频内容。此外,该模型还可以通过局部区域生成或修改视频,实现视频的局部编辑和内容重塑,为视频创作提供了更高的灵活性和创造性。

(二)视频编辑与重绘

800_auto

该模型支持视频的背景扩展、局部编辑、视频重绘等功能,用户可以通过深度图、光流...

点击查看剩余70%

{{collectdata}}

网友评论