苹果低调开源了多模态视觉语言模型4M-2

苹果低调开源了多模态视觉语言模型4M-2

800_auto

该模型具备 Apache-2.0 许可证。该模型能够进行图像描述、深度估计、目标检测、实例分割和图像生成等多项功能。

800_auto

800_auto

...

点击查看剩余70%

{{collectdata}}

网友评论