Svi smo koristili Street View na Google Maps kako bismo prijatelju pokazali kako je izgledala naša kuća iz djetinjstva ili smo povukli ikonu na ulice Pariza da provjerimo je li naš hotel u cool kvartu. Zamislite da to možete učiniti na interaktivniji način koji omogućuje simulaciju ulice i njezine okoline, pa čak i prilagodbu vremena ili gledanje kako bi izgledalo u scenariju “Dan poslije sutra”.
To je jedan od ciljeva najnovije integracije Googlea. Od danas, Google DeepMind povezuje Street View s Projektom Genie, općim modelom svijeta koji može generirati raznolike, interaktivne okoline. Nova funkcija pokrenuta je tijekom Google I/O konferencije za developere.
“Izuzetno je moćno i za upotrebu s robotikom i za ljude, a to je uvijek bila teza Genie,” rekao je Jack Parker-Holder, istraživač iz DeepMindovog tima za otvorenost. Primjerice, novi robot koji se koristi u Londonu rijetko vidi sunce. Genie bi mogao simulirati one rijetke trenutke kada sunčeve zrake obasjaju viktorijanske kuće, tako da robot ne bude iznenađen kada se to dogodi.
“Istovremeno, možete reći: ‘Idem u New York, ali ne u ovo doba godine,’” nastavio je. “‘Bit će snijega. Želim vidjeti kako taj blok izgleda pod snijegom.’”
Google prikuplja podatke o Street Viewu već 20 godina putem automobila s kamerama i pojedinaca s “rančevima za praćenje”. Tech div prikupio je više od 280 milijardi slika iz 110 zemalja i sedam kontinenata.
“Sa Street Viewom imamo slike iz velikog dijela svijeta,” rekao je Jack. “Možete zamisliti koliko je potencijalno moćno kombinirati ovaj bogat izvor informacija iz stvarnog svijeta s sposobnošću simulacije svjetova.”
Google je prošlog kolovoza objavio najnoviji model svijeta Genie 3 za istraživački pregled i otvorio pristup alatu korisnicima Google AI Ultra u SAD-u u siječnju, omogućujući korisnicima stvaranje interaktivnih igara iz tekstualnih uputa ili slika. Cilj je koristiti Genie za obrazovne iskustva, igranje i obuku robota.
Genie 3 već pomaže u pokretanju jednog od Waymovih simulacija za obuku samovozećih automobila o “izuzetno rijetkim događajima” poput tornada ili slučajnih susreta s slonovima. Dodavanjem podataka iz Street Viewa, Waymo bi mogao biti spreman za lansiranje u više gradova širom svijeta.
Waymo ima svoj simulator koji koristi za proširenje na 11 američkih gradova i testiranje svog AI vozača u još nekoliko. Razlika s Genie je, kako kaže Parker-Holder, u tome što su svi ti podaci s perspektive automobila. Street View omogućuje ne samo simulaciju svijeta vezanog uz stvarno mjesto, već i promjenu perspektive na druge vrste agenata, poput čovjeka ili robota.
Google pokreće Street View u Genie za neke Ultra korisnike u Sjedinjenim Državama od danas, s pristupom koji će se postupno širiti. Globalni Ultra korisnici dobit će pristup tijekom sljedećih nekoliko tjedana, prema najavama kompanije.
Cilj istraživača je staviti ovu novu mogućnost u što više ruku, prema Diegu Rivasu, upravitelju proizvoda u DeepMind-u. Napomenuo je da je Street View posebno, a Genie općenito još uvijek eksperiment, pa ima mnogo prostora za poboljšanje u pogledu točnosti.
U uzorcima koje mi je Google tim pokazao — uključujući podvodnu simulaciju susjedstva u kojem sam nekad živio — rezultati su impresivni i prepoznatljivi, ali još uvijek su na razini video igara, a ne fotorealistični. Modeli također još nisu svjesni fizike, što znači da još ne razumiju uzrok i posljedicu. Na primjer, u simulaciji žene koja trči kroz snježni Joshua Tree, prošla je kroz kaktuse i grmlje.
U usporedbi s, recimo, Googleovim generatorom slika Nano Banana — koji sada može generirati savršen tekst u infografikama — ili njegovim generatorom videa Veo — koji razumije da papirnate čamce plove na vodenim strujama, dim se raspršuje u zrak, a tkanina se obavija oko formi.
Fizika nije ugrađena u ove modele; oni je intuitivno uče tijekom vremena kroz pasivno promatranje, kao što bi to činilo živo biće.
“Mislim da je za ovaj tip modela možda šest do 12 mjeseci iza videa u pogledu točnosti i kvalitete, tako da mislim da ćemo to riješiti,” rekao je Parker-Holder.
Jonathan Herbert, direktor Google Mapsa koji je započeo na timu Street View kao pripravnik prije 12 godina, rekao je da Genie još ne može stvoriti vjernu rekonstrukciju ulice. Misli da je pravi proboj kontinuitet prostora AI-a. Ako se okrenete 360 stupnjeva, AI ispravno pamti i simulira okolinu iza vas. Od tog trenutka, model može izgraditi novu okolinu iznad toga.
“Dugo smo razmišljali o tome kako možemo izgraditi najbolji i najbogatiji model svijeta na osnovu podataka iz Street Viewa,” rekao je Herbert. “Definitivno je bila ideja koristiti podatke iz karata na nove načine i za nove vrste AI istraživanja već dugo vremena.”



