Ponedjeljak, 18 svibnja, 2026
14 C
London

Anthropic se suočava s problemom procjene kandidata

Od 2024. godine, tim za optimizaciju performansi u Anthropicu daje kandidatima za posao test koji moraju riješiti kod kuće kako bi provjerili svoje znanje. No, kako su alati za kodiranje temeljeni na AI postali bolji, test se morao znatno promijeniti kako bi se ispredio AI-pomoćnom varanju.

Vođa tima Tristan Hume opisao je povijest ovog izazova u blog objavi u srijedu. “Svaki novi Claude model prisilio nas je da redizajniramo test”, piše Hume. “Kada su imali istu vremensku ograničenost, Claude Opus 4 nadmašio je većinu ljudskih kandidata. To nam je još uvijek omogućilo da razlikujemo najsnažnije kandidate – ali tada je Claude Opus 4.5 izjednačio i s njima.”

Rezultat je ozbiljan problem u procjeni kandidata. Bez nadzora uživo, ne postoji način da se osigura da netko ne koristi AI za varanje na testu – a ako to učine, brzo će napredovati. “Pod ograničenjima testa kod kuće, više nismo imali način da razlikujemo između izlaza naših najboljih kandidata i našeg najnaprednijeg modela”, piše Hume.

Pitanje varanja uz pomoć AI već stvara probleme u školama i sveučilištima širom svijeta, što je ironično jer se i AI laboratoriji moraju nositi s tim. No, Anthropic je također jedinstveno opremljen za suočavanje s ovim problemom.

Na kraju je Hume dizajnirao novi test koji je imao manje veze s optimizacijom hardvera, čineći ga dovoljno novim da zbuni suvremene AI alate. No, kao dio objave, podijelio je izvorni test kako bi vidio može li netko tko čita doći do boljeg rješenja.

“Ako možete nadmašiti Opus 4.5”, stoji u objavi, “radosni bismo čuli od vas.”

Hot this week

Pametne naočale budućnosti

Zamislite da vozite motocikl brzinom od 160 kilometara na...

Amazon predstavlja Alexa za kupovinu

Amazon je predstavio Alexa za kupovinu, kombinirajući svoj Rufus...

Appleova nova verzija Siri naglašava privatnost

UkratkoObjavljeno:1:15 PM PDT · 17. svibnja 2026.Privatnost će biti...

Završne riječi u suđenju OpenAI-u

Odvjetnici Elona Muska i OpenAI-a iznijeli su svoje završne...

Problemi s umjetnom inteligencijom na svečanostima

Sezona diplomiranja ponovno je stigla — a ove godine,...

Topics

Pametne naočale budućnosti

Zamislite da vozite motocikl brzinom od 160 kilometara na...

Amazon predstavlja Alexa za kupovinu

Amazon je predstavio Alexa za kupovinu, kombinirajući svoj Rufus...

Appleova nova verzija Siri naglašava privatnost

UkratkoObjavljeno:1:15 PM PDT · 17. svibnja 2026.Privatnost će biti...

Završne riječi u suđenju OpenAI-u

Odvjetnici Elona Muska i OpenAI-a iznijeli su svoje završne...

Problemi s umjetnom inteligencijom na svečanostima

Sezona diplomiranja ponovno je stigla — a ove godine,...

AI transformira industriju, ali donosi i gubitke radnih mjesta

Dobrodošli natrag u TechCrunch Mobility — vašu središnju točku...

Atmosfera u tech industriji nije najbolja

Prema dugom objavi na društvenim mrežama partnera firme Menlo...

ArXiv pojačava kontrolu nad korištenjem AI u istraživanju

ArXiv, široko korištena otvorena baza podataka za preprint istraživanje,...
spot_img

Related Articles

Popular Categories

spot_imgspot_img