Physical Intelligence, dvojnogodišnji startup iz San Francisca, objavio je novo istraživanje koje pokazuje da njihov najnoviji model može usmjeriti robote da izvršavaju zadatke na koje nikada nisu bili izričito obučeni. Ovo otkriće iznenadilo je i same istraživače.
Novi model, nazvan π0.7, predstavlja značajan korak prema cilju stvaranja općeg robotskog mozga: onog koji se može usmjeriti na nepoznati zadatak, voditi kroz njega jednostavnim jezikom i uspješno ga izvršiti. Ako se rezultati pokažu točnima, sugeriraju da robotska umjetna inteligencija može doseći prekretnicu sličnu onoj koju je doživjela područje s velikim jezičnim modelima — gdje se sposobnosti počinju multiplicirati brže nego što bi podaci sugerirali.
Osnovna tvrdnja u radu je kompozicijska generalizacija — sposobnost kombiniranja vještina naučenih u različitim kontekstima za rješavanje problema s kojima se model nikada nije susreo. Do sada je standardni pristup obuci robota bio doslovno pamćenje — prikupiti podatke o specifičnom zadatku, obučiti specijalizirani model na tim podacima i ponavljati to za svaki novi zadatak. π0.7, tvrde u Physical Intelligence, krši taj obrazac.
“Jednom kada prekorači prag s kojeg prelazi u miješanje stvari na nove načine, sposobnosti rastu brže od linearne s količinom podataka”, kaže Sergey Levine, suosnivač Physical Intelligence i profesor na UC Berkeley, fokusiran na AI za robotiku. “Takva povoljna svojstva skaliranja vidjeli smo u drugim domenama, poput jezika i vizije.”
Jedna od najzanimljivijih demonstracija u radu uključuje fritezu na zraku koju model praktički nikada nije vidio tijekom obuke. Istraživački tim pronašao je samo dva relevantna slučaja u cijelom skupu podataka za obuku. Model je nekako sintetizirao te fragmente, uz dodatne podatke iz web obuke, u funkcionalno razumijevanje kako aparat funkcionira.
“Vrlo je teško pratiti odakle dolazi znanje ili gdje će uspjeti ili ne uspjeti”, kaže Lucy Shi, istraživačica iz Physical Intelligence. Ipak, bez ikakvog vođenja, model je pokušao koristiti aparat za kuhanje batata. Uz korak-po-korak verbalne upute, uspješno je izvršio zadatak.
Ta sposobnost vođenja je važna jer sugerira da roboti mogu biti raspoređeni u novim okruženjima i poboljšani u stvarnom vremenu bez dodatnog prikupljanja podataka ili ponovne obuke modela.
Istraživači nisu skromni u vezi s ograničenjima modela i pažljivo ističu vlastite greške. “Ponekad je način neuspjeha na nama, a ne na robotu ili modelu”, kaže Shi. Nakon što su proveli pola sata usavršavajući način na koji je zadatak objašnjen modelu, stopa uspjeha porasla je sa 5% na 95%.

Model također još nije sposoban autonomno izvršiti složene višekratne zadatke s jednim visokim naredbom. “Ne možete mu reći, ‘Hej, napravi mi toster’”, kaže Levine. “Ali ako ga vodite kroz — ‘za toster, otvorite ovaj dio, pritisnite tu tipku, učinite ovo’ — tada obično dobro funkcionira.”
Tvrtka je prikupila više od 1 milijardu dolara i nedavno je procijenjena na 5.6 milijardi dolara. Sada se izvještava da pregovaraju o novom krugu koji bi gotovo udvostručio tu procjenu na 11 milijardi dolara.



