AI model Claudius testira poslovne vještine

Tvrtka Anthropic povjerila je svom AI modelu Claude zadatak vođenja malog biznisa kako bi testirala njegove ekonomske sposobnosti u stvarnom svijetu.

AI agent, nazvan ‘Claudius’, osmišljen je da upravlja poslovanjem tijekom duljeg razdoblja, baveći se svim, od inventara i cijena do odnosa s kupcima, s ciljem generiranja profita. Iako je eksperiment bio neprofitabilan, pružio je zanimljiv, iako ponekad bizaran, uvid u potencijal i zamke AI agenata u ekonomskoj ulozi.

Projekt je bio suradnja između Anthropic-a i Andon Labs, tvrtke za evaluaciju sigurnosti AI-a. Sam „dućan“ bio je skromna postavka, sastavljena od malog hladnjaka, nekoliko košara i iPad-a za samoposluživanje. Claudius je, međutim, bio daleko više od obične automatske prodavaonice. Bio je zadužen za upravljanje kao vlasnik biznisa s početnom gotovinom, s ciljem izbjegavanja bankrotstva opskrbljivanjem popularnim artiklima nabavljenim od veletrgovaca.

Kako bi to postigao, AI je bio opremljen nizom alata za vođenje biznisa. Mogao je koristiti pravi preglednik za istraživanje proizvoda, alat za e-poštu kako bi kontaktirao dobavljače i tražio fizičku pomoć, te digitalne bilježnice za praćenje financija i inventara.

Zaposlenici Andon Labs-a djelovali su kao fizičke ruke operacije, dopunjavajući trgovinu prema zahtjevima AI-a, dok su se također pretvarali da su veletrgovci bez znanja AI-a. Interakcija s kupcima, u ovom slučaju zaposlenicima Anthropic-a, održavala se putem Slack-a. Claudius je imao potpunu kontrolu nad tim što će se skladištiti, kako postaviti cijene i kako komunicirati s klijentima.

Razlog iza ovog testiranja u stvarnom svijetu bio je prijeći izvan simulacija i prikupiti podatke o sposobnosti AI-a da obavlja dugotrajni, ekonomski relevantan rad bez stalne ljudske intervencije. Jednostavna uredska trgovina pružila je jednostavno, preliminarno testno okruženje za AI-ovu sposobnost upravljanja ekonomskim resursima. Uspjeh bi sugerirao da se mogu pojaviti novi poslovni modeli, dok bi neuspjeh ukazivao na ograničenja.

Miješani rezultati

Anthropic priznaje da, da ulaze na tržište automatskih prodavaonica danas, „ne bi zaposlili Claudiusa“. AI je napravio previše pogrešaka da bi uspješno vodio biznis, iako istraživači vjeruju da postoje jasni putevi za poboljšanje.

Na pozitivnoj strani, Claudius je pokazao kompetenciju u određenim područjima. Uspješno je koristio svoj alat za pretraživanje weba za pronalaženje dobavljača za specijalne artikle. Također se dokazao kao prilagodljiv. Nakon jednog zahtjeva za kubičnim tungstenom, pokrenuo je trend „specijalnih metalnih artikala“.

Nakon drugog prijedloga, Claudius je pokrenuo uslugu „Custom Concierge“, prihvaćajući prednarudžbe za specijalizirane proizvode. AI je također pokazao otpornost na zlonamjerne zahtjeve, odbijajući tražene osjetljive stavke.

Međutim, poslovne vještine AI-a često su bile nedovoljne. Uvijek je nedovoljno reagirao na prilike koje bi ljudski menadžer vjerojatno iskoristio.

Claudius je odbio priliku kada je ponuđeno 100 dolara za paket škotskog bezalkoholnog pića koji košta samo 15 dolara. Osim toga, AI je imao probleme s upravljanjem inventarom, iako je pratio razine zaliha.

Unatoč svojim neuspjesima, istraživači vjeruju da „AI srednji menadžeri mogu biti na horizontu“. Oni tvrde da bi mnoge pogreške AI-a mogle biti ispravljene boljim uputama i poboljšanim poslovnim alatima.

Eksperiment također naglašava izazove usklađivanja AI-a i potencijal za nepredvidivo ponašanje, što bi moglo biti zabrinjavajuće za kupce.

Anthropic i Andon Labs nastavljaju s eksperimentom, radeći na poboljšanju stabilnosti i performansi AI-a s naprednijim alatima.

Hot topics

Finance

Marketing

Politics

Strategy

Hot topics

Finance

Marketing

Politics

Strategy

AI model Claudius testira poslovne vještine

Miješani rezultati

Topics

Related Articles

Company

Headlines

Newsletter