阿里开源统一多模态图片理解与生成编辑模型Ovis-U1

阿里开源统一多模态图片理解与生成编辑模型Ovis-U1

800_auto

阿里巴巴AIDC团队开源的Ovis-U1-3B模型是一个具有30亿参数的多模态统一模型,它集成了多模态理解、文本到图像生成和图像编辑三大功能。

功能特点

多模态理解:Ovis-U1能够精准解析图文关联,理解图像中的物体、场景以及文本描述。

文本到图像生成:根据文本描述生成高质量图像,支持多种风格和场景的图像生成。

图像编辑:通过自然语言指令对...

点击查看剩余70%

{{collectdata}}

网友评论