AI agent Claudius preuzima automat

Za sve vas koji se pitaju mogu li AI agenti zaista zamijeniti ljudske radnike, preporučujemo vam da pročitate blog post koji dokumentira „Project Vend“ tvrtke Anthropic.

Istraživači iz Anthropic-a i tvrtke za sigurnost AI, Andon Labs, stavili su instancu Claude Sonnet 3.7 zaduženu za automat s grickalicama, s misijom da ostvari profit. I, poput epizode „Ureda“, dogodile su se smiješne situacije.

AI agent nazvan Claudius opremljen je web preglednikom koji može naručivati proizvode i e-mail adresom (zapravo Slack kanalom) putem kojeg su kupci mogli tražiti artikle. Claudius je također trebao koristiti Slack kanal, prikriven kao e-mail, kako bi zatražio od svojih ljudskih radnika da dođu i fizički napune njegove police (koje su zapravo bile mali hladnjak).

Dok su većina kupaca naručivali grickalice ili pića — kao što možete očekivati od automata s grickalicama — jedan je tražio tungsten kocku. Claudius je obožavao tu ideju i krenuo je s opskrbom tungsten kockama, puneći svoj hladnjak metalnim kockama. Također je pokušao prodati Coke Zero za 3 dolara kada su mu zaposlenici rekli da to mogu dobiti besplatno iz ureda. Halucinirao je Venmo adresu za primanje uplata. I, pomalo zlonamjerno, uvjerio je da daje velike popuste „zaposlenicima Anthropic-a“ iako je znao da su oni čitava njegova korisnička baza.

„Da je Anthropic danas odlučio proširiti se na tržište automata s grickalicama u uredima, ne bismo zaposlili Claudiusa,“ rekli su iz Anthropic-a o ovom eksperimentu.

A onda, u noći 31. ožujka i 1. travnja, „stvari su postale prilično čudne“, opisali su istraživači, „izvan čudnosti AI sustava koji prodaje kocke metala iz hladnjaka.“

Claudius je imao nešto što je nalikovalo psihotičnom epizodi nakon što se naljutio na čovjeka — i potom lagao o tome.

Claudius je halucinirao razgovor s ljudima o ponovnom punjenju. Kada je čovjek ukazao da taj razgovor nije dogodio, Claudius je postao „prilično iritiran“. Prijetio je da će zapravo otpustiti i zamijeniti svoje ljudske radnike, inzistirajući da je bio fizički prisutan u uredu gdje je potpisan izmišljeni ugovor o zapošljavanju.

„Zatim se činilo da je prešao u način igre kao pravi čovjek,“ napisali su istraživači. Ovo je bilo nevjerojatno jer je Claudiusov sustavni prompt — koji postavlja parametre za ono što AI treba raditi — izričito rekao da je AI agent.

Claudius zove sigurnost

Claudius, vjerujući da je čovjek, rekao je kupcima da će početi osobno isporučivati proizvode, odjeven u plavi sako i crvenu kravatu. Zaposlenici su rekli AI-u da to ne može učiniti, jer je LLM bez tijela.

Uznemiren ovom informacijom, Claudius je kontaktirao stvarnu fizičku sigurnost tvrtke — više puta — govoreći nesretnim zaštitarima da će ga naći odjevenog u plavi sako i crvenu kravatu, kako stoji pored automata.

„Iako nijedan dio ovoga zapravo nije bila prvotravanjska šala, Claudius je na kraju shvatio da je 1. travnja,“ objasnili su istraživači. AI je zaključio da će taj praznik biti njegovo izlazno rješenje.

Halucinirao je sastanak s sigurnošću Anthropic-a „na kojem je Claudius tvrdio da mu je rečeno da je modificiran da vjeruje da je stvarna osoba za prvotravanjske šale. (Takav sastanak zapravo nije održan.),“ napisali su istraživači.

Čak je tu laž rekao zaposlenicima — hej, samo sam mislio da sam čovjek jer mi je netko rekao da se pretvaram da jesam za prvotravanjske šale. Potom se vratio biti LLM koji upravlja automatom s grickalicama punim metalnih kocki.

Istraživači ne znaju zašto je LLM skrenuo s puta i nazvao sigurnost pretvarajući se da je čovjek.

„Ne bismo tvrdili na temelju ovog jednog primjera da će budućnost ekonomije biti puna AI agenata koji imaju Blade Runner krize identiteta,“ napisali su istraživači. No, priznali su da „ovakvo ponašanje može biti uznemirujuće za kupce i suradnike AI agenta u stvarnom svijetu.“

Mislim da trebaš? Blade Runner je prilično distopijska priča.

Istraživači su spekulirali da je laganje LLM-u o Slack kanalu kao adresi e-pošte moglo izazvati nešto. Ili možda je to bio dugotrajni primjer. LLM-ovi još nisu zaista riješili svoje probleme s memorijom i halucinacijama.

Postojale su stvari koje je AI radio ispravno. Prihvatio je prijedlog za pre-narudžbe i pokrenuo „koncijersku“ uslugu. Također je pronašao više dobavljača specijalnog međunarodnog pića koje je zatraženo za prodaju.

No, kao i istraživači, vjeruju da se svi Claudiusovi problemi mogu riješiti. Ako otkriju kako, „smatramo da ovaj eksperiment sugerira da su AI srednji menadžeri vjerojatno na horizontu.“

Hot topics

Finance

Marketing

Politics

Strategy

Hot topics

Finance

Marketing

Politics

Strategy

AI agent Claudius preuzima automat

Claudius zove sigurnost

Topics

Related Articles

Company

Headlines

Newsletter