7:00 AM PDT · 24. lipnja 2025.
Google DeepMind je u utorak predstavio novi jezični model pod nazivom Gemini Robotics On-Device koji može lokalno izvršavati zadatke na robotima bez potrebe za internet vezom.
Ovaj model nadograđuje prethodni model Gemini Robotics koji je predstavljen u ožujku. Gemini Robotics On-Device može kontrolirati pokrete robota. Programeri mogu prilagoditi model svojim potrebama koristeći prirodne jezične naredbe.
Prema benchmark testovima, Google tvrdi da model ostvaruje performanse blizu modela Gemini Robotics temeljenog na oblaku. Tvrtka navodi da nadmašuje druge modele koji rade lokalno u općim benchmark testovima, iako nije imenovala te modele.

U demonstraciji, tvrtka je pokazala robote kako koriste ovaj lokalni model za obavljanje zadataka poput otvaranja torbi i preklapanja odjeće. Google navodi da je model prvotno treniran za ALOHA robote, a kasnije je prilagođen za rad na bi-rukama Franka FR3 robotu i humanoidnom robotu Apollo tvrtke Apptronik.
Google tvrdi da je bi-ruka Franka FR3 uspješno rješavala scenarije i objekte koje nije „vidjela“ prije, poput sklapanja na industrijskom traku.
Google DeepMind također objavljuje Gemini Robotics SDK. Tvrtka je izjavila da programeri mogu pokazati robotima između 50 i 100 demonstracija zadataka kako bi ih obučili za nove zadatke koristeći ove modele na MuJoCo fizičkom simulatoru.
Ostali razvijači AI modela također se uključuju u robotiku. Nvidia razvija platformu za stvaranje temeljnih modela za humanoidne robote; Hugging Face ne samo da razvija otvorene modele i skupove podataka za robotiku, već također radi na robotima; a korejski startup pod pokroviteljstvom Mirae Asset RLWRLD radi na stvaranju temeljnih modela za robote.



