分享一款基于qwen2的开源多模态ai模型Molmo

分享一款基于qwen2的开源多模态ai模型Molmo

800_auto

Molmo 是一系列开源的前沿多模态 AI 模型,Molmo 模型能够通过指向技术,以非言语的方式与环境进行丰富的交互,这为未来的虚拟和物理世界交互开辟了新的可能性。

Molmo基于 Qwen2-7B 模型,并采用 OpenAI CLIP 作为视觉后端。

Molmo 的关键技术创新在于收集了一个详尽的图像描述数据集 PixMo,该数据集包含了 100 万张精选的图像 - 文本对。这个数...

点击查看剩余70%

{{collectdata}}

网友评论