Mistral推出超越gpt4o的1240亿参数开源多模态模型 Pixtral Large 和 Mistral Large,并更新了Le Chat

Mistral推出超越gpt4o的1240亿参数开源多模态模型 Pixtral Large 和 Mistral Large,并更新了Le Chat

800_auto

Pixtral Large,该模型拥有 1240 亿参数,能够支持 128K 上下文窗口,并支持中文、法文、英文等多种语言。

Pixtral Large 在多个基准测试中,如 MMMU、MathVista、ChartQA、DocVQA、VQAv2 等,表现超越了 GPT-4o、Gemini-1.5 Pro、Claude-3.5 Sonnet、Llama-3.2 90B 等竞争模型,成为目前最强的开源多模态模型。

800_auto

该模型由一个有 1230 亿参数的多模态解码器和一个有 10 亿参数的视觉编码器组成,能够处理不同分辨率和宽高比的图像,并结合文本数据进行高质量的图像描述、视觉问答和文档理解。

800_auto

同时,Mistral.ai 还推出了一个基于 Pixtral Large 的多模态 AI 助手 ——le Chat,该助手支持网络搜索、PDF 理解、图片生成、Canvas 功能和 AI Agent 功能,能够提高创意工作的效率,并支持从模型到输出的完全集成平台。

点击查看剩余70%

{{collectdata}}

网友评论