阿里开源全球首个多模态推理模型QVQ-72B-Preview,视觉推理与OpenAI o1相当
2024 年 12 月 25 日,阿里云通义千问宣布发布了业界首个开源多模态推理模型 QVQ-72B-Preview。
该模型在视觉理解和推理方面展现出超预期的能力,特别是在解决数学、物理、科学等领域的复杂推理问题上表现突出。
QVQ 模型在多项评测中超越了之前的视觉理解模型「开源王者」Qwen2-VL,其整体表现与「满血版」OpenAI o1、Claude3.5 Sonnet 等推理模型相当。
开发者可以在魔搭社区和 HuggingFace 平台上体验 QVQ 模型。
阿里云通义团队在一个月前已经发布了 AI 推理模型 QwQ...
点击查看剩余70%
网友评论