沒網也能用!谷歌發布離線機器人AI模型:具備視覺識別、語言理解能力

神马作文网 教育资讯 1

快科技6月26日消息,據媒體報道,Google DeepMind推出革命性機器人控制模型Gemini Robotics On-Device。

該模型的核心突破在於能在機器人本地離線運行,無需依賴雲端連接,即可同時處理視覺識別、語言理解與動作執行任務,流暢響應人類指令完成任務。

作為專為雙臂機器人設計的VLA(視覺-語言-動作)基礎模型,Gemini On-Device 能直接解析自然語言指令並驅動機器人執行相應動作。

其本地運行特性在醫療操作、災難救援、工廠自動化等對實時性和穩定性要求高的場景中優勢顯著,有效避免了雲端傳輸的延遲和潛在風險。

該模型還具備較強的平台適應性,通過少量學習即可適配不同機器人硬體,有望加速機器人技術的普及。不過,其在複雜環境下的安全策略和高級邏輯規劃方面仍需完善。

目前發布的模型基於Gemini 2.0架構,尚未集成最新的 Gemini 2.5 特性,產業化應用處於測試階段。Gemini Robotics On-Device的推出是谷歌在通用機器人AI領域的關鍵布局,將與英偉達GR00T、OpenAI RT-2等競爭對手展開角逐。


抱歉,评论功能暂时关闭!