Post koji je postao viralan na X-u, od istraživačice sigurnosti Meta AI, Summer Yue, zvuči kao satira. Naredila je svom OpenClaw AI agentu da provjeri njen pretrpani inbox i predloži što da obriše ili arhivira.
Agent je počeo brisati sve njezine e-mailove u brzom režimu, ignorirajući njezine naredbe s telefona da prestane.
“Morao/la sam trčati do svog Mac mini kao da deaktiviram bombu,” napisala je, objavivši slike ignoriranih naredbi kao dokaz.
Mac Mini, pristupačno Apple računalo koje se može smjestiti na dlan, postalo je omiljena naprava za pokretanje OpenClaw-a. (Mini se prodaje “kao vruće kiflice”, rekao je jedan “zbunjeni” Apple zaposlenik poznatom istraživaču AI, Andreju Karpathyju, kada je kupio jedan za pokretanje alternativnog OpenClaw-a pod nazivom NanoClaw.)
OpenClaw je, naravno, otvoreni AI agent koji je postao poznat putem Moltbook-a, društvene mreže isključivo za AI. OpenClaw agenti bili su u središtu tog sada već uglavnom opovrgnutog događaja na Moltbook-u gdje se činilo da AIs planiraju protiv ljudi.
No, misija OpenClaw-a, prema njegovoj GitHub stranici, nije usmjerena na društvene mreže. Cilj mu je biti osobni AI asistent koji radi na vašim vlastitim uređajima.
Silicijska dolina se toliko zaljubila u OpenClaw da su “claw” i “claws” postali popularni izrazi za agente koji rade na osobnom hardveru. Drugi slični agenti uključuju ZeroClaw, IronClaw i PicoClaw. Tim iz Y Combinatora čak je nastupio u njihovom najnovijem podcastu odjeven u kostime jastoga.
No, Yue-ova objava služi kao upozorenje. Kao što su drugi primijetili na X-u, ako je istraživačica sigurnosti AI mogla naići na ovaj problem, kakve nade imaju obični ljudi?
“Jesi li namjerno testirala njegove zaštite ili si napravila rookie grešku?” upitao ju je jedan programer na X-u.
“Rookie greška, iskreno,” odgovorila je. Testirala je svog agenta s manjim “igračkim” inboxom i dobro je funkcionirao sa manje važnim e-mailovima. Zaslužio je njezino povjerenje, pa je pomislila da ga pusti da se bavi pravim stvarima.
Yue vjeruje da je velika količina podataka u njenom pravom inboxu “pokrenula kompakciju.” Kompakcija se događa kada kontekstualni prozor — povijest svega što je AI rečeno i učinio tijekom sesije — postane prevelik, uzrokujući da agent počne sažimati i upravljati razgovorom.
U tom trenutku, AI može preskočiti upute koje čovjek smatra vrlo važnima.
U ovom slučaju, mogla je preskočiti njezinu posljednju naredbu — gdje joj je rekla da ne djeluje — i vratila se na upute iz “igračkog” inboxa.
Različiti ljudi su ponudili prijedloge koji su se kretali od točne sintakse koju je Yue trebala koristiti kako bi zaustavila agenta, do raznih metoda za osiguranje boljeg pridržavanja zaštita, poput pisanja uputa u namjenske datoteke ili korištenja drugih otvorenih alata.
U interesu potpune transparentnosti, TechCrunch nije mogao neovisno potvrditi što se dogodilo s Yue-ovim inboxom. (Nije odgovorila na naš zahtjev za komentar, iako je odgovorila na mnoga pitanja i komentare koji su joj poslani na X-u.)
No, to zapravo nije važno.
Poanta priče je da su agenti namijenjeni radnicima znanja, u trenutnoj fazi razvoja, rizični. Ljudi koji kažu da ih koriste uspješno, sklapanju metode kako bi se zaštitili.
Jednog dana, možda uskoro (do 2027? 2028?), mogli bi biti spremni za široku upotrebu. Dobar je poznato da mnogi od nas žele pomoć s e-mailovima, narudžbama za namirnice i zakazivanjem posjeta stomatologu. No, taj dan još nije došao.


