阿里开源文本嵌入向量和排序模型Qwen3-Embedding系列和Qwen3-Reranker
阿里巴巴云Qwen团队最新发布的Qwen3-Embedding系列和Qwen3-Reranker系列模型,为文本嵌入和排序任务树立了新的行业标杆。
以下是这两个系列模型的详细介绍:
Qwen3-Embedding系列
功能与特点:
强大的文本表征能力:能够将文本转化为高维向量,捕捉语义信息,适用于信息检索、文本分类、聚类等多种任务。
卓越的泛化性:在多个下游任务评估中达到行业领先水平。8B参数规模的模型在MTEB多语言Leaderboard榜单中位列第一,得分70.58,超越众多商业API服务。
灵活的模型架构:提供0.6B、4B、8B三种参数规模的模型配置,满足不同场景下的性能与效率需求。支持表征维度自定义和指令适配优化,以降低应用成本并提升特定任务、语言或场景下的性能表现。
全面的多语言支持:支持119种语言,涵盖主流自然语言及多种编程语言,具备强大的多语言、跨语言及代码检索能力。
技术架构:
双编码器结构:分别处理查询与文档内容,提取高质量的语义向量,提高大规模文本匹配任务的效率和泛化能力。
多阶段训练架构:包括超大规模弱监督数...
点击查看剩余70%
网友评论