阿里发布成本更低支持100万上下文的新一代大语言模型 Qwen2.5-Turbo

阿里发布成本更低支持100万上下文的新一代大语言模型 Qwen2.5-Turbo

800_auto

阿里云正式发布了新一代大语言模型 Qwen2.5-Turbo,其核心特点是能够处理长达 100 万 Token 的超长文本,这相当于 10 部《三体》小说的文本量。

800_auto

该模型在 Passkey Retrieval 任务中达到了 100% 的准确率,并在 RULER 长文本基准测试中得分 93.1,超越了 GPT-4 的 91.6 分。

800_auto

同时,Qwen2.5-Turbo 在短文本处理方...

点击查看剩余70%

{{collectdata}}

网友评论