Hugging Face开源世界上最小的视觉语言模型SmolVLM

Hugging Face开源世界上最小的视觉语言模型SmolVLM

Hugging Face 近日发布了两款多模态模型 SmolVLM-256M 和 SmolVLM-500M。

800_auto

SmolVLM-256M 被宣称为世界上最小的视觉语言模型,它能够处理图片和文本的任意序列输入,生成文字输出,功能包括描述图片内容、为短视频生成字幕、处...

点击查看剩余70%

{{collectdata}}

网友评论