
Google DeepMind 近日推出兩款全新人工智慧模型,這些模型將協助機器人使用網路來執行特定任務。這兩款模型分別為 Gemini Robotics 1.5 和 Gemini Robotics-ER 1.5,能夠讓機器人在實體環境中進行思考、規劃並作出合理決策。這些進展將有助於開發者打造更具能力與多功能的機器人,讓它們能夠主動理解環境,完成複雜的多步驟任務。
Gemini Robotics 1.5 模型提升機器人思考能力
Gemini Robotics 1.5 是一個結合視覺、語言與行動的模型。根據 Google DeepMind 的部落格文章,這個模型在採取行動前會先進行思考,並展示其過程,幫助機器人更透明地評估並完成複雜任務。此外,該模型還能跨不同實體學習,加速技能習得。
Gemini Robotics-ER 1.5 模型改善機器人任務執行
Gemini Robotics-ER 1.5 模型則專注於視覺與語言的結合,能夠對物理世界進行推理,並原生調用數位工具,創建詳細的多步驟計劃以完成任務。這款模型可將機器人的活動整合起來,類似於大腦,幫助機器人執行如查詢 Google 搜尋以獲取資訊等任務。
Alphabet CEO 對新模型的展望
Alphabet 執行長 Sundar Pichai 表示,這些新模型將幫助機器人從一種類型的機器人學習轉移到另一種,這是 Alphabet 邁向真正有用的通用機器人的下一大步。Gemini Robotics-ER 1.5 模型已透過 Google AI Studio 的 Gemini API 提供給開發者,而 Gemini Robotics 1.5 模型則已開放給部分合作夥伴。
發表
我的網誌