港大发布一个基于LLaVA的开源多模态视觉语言模型Mini-Gemini

港大发布一个基于LLaVA的开源多模态视觉语言模型Mini-Gemini

Mini-Gemini 是一个多模态视觉语言模型,支持一系列从 2B 到 34B 的密集和 MoE 大语言模型(LLMs),具有同时理解、推理和生成图像的能力。

800_auto

该框...

点击查看剩余70%

{{collectdata}}

网友评论