阿里开源发布Qwen2.5-VL视觉语言模型和一百万上下文模型Qwen2.5-1M

阿里开源发布Qwen2.5-VL视觉语言模型和一百万上下文模型Qwen2.5-1M

800_auto

Qwen2.5-VL 是一款多模态视觉语言模型,提供3B、7B和72B三种不同规模的版本。

其中,旗舰版本Qwen2.5-VL-72B在多项权威评测中表现优异,全面超越了GPT-4o和Claude3.5等知名模型。该模型不仅能够精准解析图像内容,还支持长达一小时的视频理解,无需微调即可执行复杂的多步...

点击查看剩余70%

{{collectdata}}

网友评论