谷歌开源0.2g内存就能运行的离线3b参数端侧ai小模型EmbeddingGemma
9 月 5 日,谷歌开源开放式嵌入模型 EmbeddingGemma,以 3.08 亿参数实现 “以小博大”,专为端侧 AI 设计,可在笔记本、手机等设备部署 RAG(检索增强生成)、语义搜索等应用,为端侧智能发展提供新选择。?

性能上,该模型基于 Gemma 3 架构,能生成高质量嵌入向量,断网可运行,性能接近参数翻倍的 Qwen-Embedding-0.6B。在 MTEB(海量文本嵌入基准)测试中,它在 500M 以下开放式多语言文本嵌入模型中排名首位,支持超 100 种语言,量化后内存占用不足...
点击查看剩余70%
网友评论