Ponedjeljak, 11 svibnja, 2026
8.7 C
London

Napredak AI agenta izaziva zabrinutost među pravnicima

Prošli mjesec pisao sam o novom standardu Mercora koji mjeri sposobnosti AI agenata u profesionalnim zadacima poput pravne i korporativne analize. U to vrijeme, rezultati su bili prilično loši, s gotovo svim većim laboratorijima koji su postigli ispod 25%, što je značilo da su pravnici za sada sigurni od zamjene AI-jem.

No, sposobnosti AI mogu se značajno promijeniti u samo nekoliko tjedana.

Ove sedmice predstavljena je nova verzija Opus 4.6 tvrtke Anthropic koja je uzburkala ljestvice, pri čemu je novi model Anthropic postigao gotovo 30% u jednom pokušaju, a prosječno 45% kada je imao nekoliko prilika za rješavanje problema. Zanimljivo je da je izdanje uključivalo niz novih značajki, uključujući ‘agente jata’, što je moglo pomoći u rješavanju složenih problema.

Bez obzira na to, rezultat je veliki skok u odnosu na prethodni najbolji rezultat, i znak je da napredak u temeljim modelima ne usporava. CEO Mercora, Brendan Foody, koji je bio posebno impresioniran, izjavio je: ‘Preskočiti s 18.4% na 29.8% u nekoliko mjeseci je nevjerojatno.’

APEX-Agents Leaderboard
APEX-Agenti Ljestvica.Izvori slika:Mercor (snimka ekrana)

Trideset posto je još uvijek daleko od 100%, tako da se pravnici ne trebaju brinuti da će ih strojevi zamijeniti sljedeći tjedan. No, trebali bi biti daleko manje sigurni nego što su bili prošli mjesec!

Hot this week

Kako će se radna okruženja mijenjati s tehnologijom

Kako će se radna okruženja promijeniti ako sve više...

Utjecaj fiktivnih prikaza umjetne inteligencije

Fiktivni prikazi umjetne inteligencije mogu imati stvaran učinak na...

Anthropic i xAI sklapaju značajno partnerstvo

Ove je tjedne Anthropic i xAI objavili veliko partnerstvo,...

Wispr Flow širi AI glasovne usluge u Indiji

Korisnici interneta u Indiji već se oslanjaju na glasovne...

Rječnik pojmova umjetne inteligencije

Umjetna inteligencija mijenja svijet, istovremeno izmišljajući novi jezik za...

Topics

Kako će se radna okruženja mijenjati s tehnologijom

Kako će se radna okruženja promijeniti ako sve više...

Utjecaj fiktivnih prikaza umjetne inteligencije

Fiktivni prikazi umjetne inteligencije mogu imati stvaran učinak na...

Anthropic i xAI sklapaju značajno partnerstvo

Ove je tjedne Anthropic i xAI objavili veliko partnerstvo,...

Wispr Flow širi AI glasovne usluge u Indiji

Korisnici interneta u Indiji već se oslanjaju na glasovne...

Rječnik pojmova umjetne inteligencije

Umjetna inteligencija mijenja svijet, istovremeno izmišljajući novi jezik za...

Nvidia ulaže više od 40 milijardi dolara u AI

Nvidia nastavlja biti veliki investitor u AI ekosustav, obvezavši...

Suđenje između Muska i OpenAI: Osvrt na svjedočenja

U drugom tjednu povijesnog suđenja između Elona Muska i...

Oracle otpustio tisuće radnika bez upozorenja

Kako je široko izvještavano, Oracle je otpustio između 20,000...
spot_img

Related Articles

Popular Categories

spot_imgspot_img