谷歌推出可供机器人本地运行的端侧视觉-语言-动作VLA模型Gemini Robotics On-Device-BFW编程笔记

谷歌推出可供机器人本地运行的端侧视觉-语言-动作VLA模型Gemini Robotics On-Device

800_auto

近日，谷歌 DeepMind 正式发布了 Gemini Robotics On-Device 模型，这一开创性的成果标志着机器人 AI 技术迈向了更高效、更独立的全新阶段。

技术突破：本地运行与多模态融合

Gemini Robotics On-Device 是一款基于视觉 - 语言 - 动作（VLA）架构的机器人 AI 模型，其最大特点是能够完全在机器人设备本地运行，无需依赖云端计算资源。

这一突破解决了传统云端机器人系统在网络不稳定环境下延迟和可靠性的问题，确保了机器人在离线环境下的稳定表现。

该模型继承了 Gemini 2.0 的强大多模态推理能力，能够同时处理视觉输入、自然语言指令和动作输出，实现了复杂的 “思考” 过程在机器人自身计算单元上的集成。

强大性能：高精度操作与快速任务适应

Gemini Robotics O...

点击查看剩余70%

打赏博主×