Meta je u srijedu predstavila svoj novi V-JEPA 2 AI model, “world model” koji je osmišljen kako bi pomogao AI agentima da razumiju svijet oko sebe.
V-JEPA 2 je proširenje V-JEPA modela koji je Meta objavila prošle godine, a koji je treniran na više od 1 milijun sati videa. Ovi podaci o treningu trebali bi pomoći robotima ili drugim AI agentima da djeluju u fizičkom svijetu, razumijevajući i predviđajući kako će koncepti poput gravitacije utjecati na ono što se događa u slijedu događaja.
Ovo su vrste uobičajenih veza koje mala djeca i životinje uspostavljaju dok se njihovi mozgovi razvijaju — kada igrate donesi s psom, na primjer, pas će (nadamo se) razumjeti kako će odskakanje lopte na tlu uzrokovati da se ona odbije prema gore, ili kako bi trebao trčati prema mjestu gdje misli da će lopta sletjeti, a ne prema mjestu gdje se lopta trenutno nalazi.
Meta prikazuje primjere gdje se robot može suočiti, na primjer, s perspektivom držanja tanjura i lopatice te hodanja prema pećnici s kuhanim jajima. AI može predvidjeti da bi vrlo vjerojatna sljedeća akcija bila koristiti lopaticu za premještanje jaja na tanjur.
Prema Meti, V-JEPA 2 je 30 puta brži od Nvidia-inog Cosmos modela, koji također pokušava poboljšati inteligenciju u vezi s fizičkim svijetom. Međutim, Meta možda procjenjuje svoje modele prema različitim kriterijima od Nvidije.
„Vjerujemo da će svjetski modeli otvoriti novo doba za robotiku, omogućujući AI agentima u stvarnom svijetu da pomažu u kućanskim poslovima i fizičkim zadacima bez potrebe za astronomski velikim količinama podataka o robotizaciji“, objasnio je glavni AI znanstvenik Mete, Yann LeCun, u videu.



