Usred porasta interesa za AI agente, Anthropic je predstavio svoje najnovije eksperimente u kodiranju umjetne inteligencije. U četvrtak je istraživač Nicholas Carlini objavio blog post u kojem opisuje kako je 16 instanci AI modela Claude Opus 4.6 pustio na zajedničku bazu koda s minimalnim nadzorom, zadajući im zadatak da izgrade C kompajler od nule.
Tijekom više od dva tjedna i gotovo 2,000 Claude Code sesija, koje su koštale oko 20,000 dolara u API naknadama, AI modeli su proizveli kompajler temeljen na Rustu koji ima 100,000 linija koda i sposoban je izgraditi pokrenuti Linux 6.9 kernel na x86, ARM i RISC-V arhitekturama.
Carlini, istraživač iz Anthropicove Safeguards tima, koji je prethodno proveo sedam godina u Google Brain i DeepMind, koristio je novu značajku nazvanu “timovi agenata” koja je predstavljena s Claude Opus 4.6. U praksi, svaka Claude instanca radila je unutar vlastitog Docker kontejnera, klonirajući zajedničko Git spremište, preuzimajući zadatke pisanjem zaključanih datoteka, a zatim vraćajući gotov kod natrag. Nije bilo nikakvog orkestražnog agenta koji bi upravljao prometom. Svaka instanca neovisno je identificirala problem koji se činilo najobviousnijim za rješavanje i počela ga rješavati. Kada su se pojavili sukobi pri spajanju, AI modeli su ih samostalno riješili.
Rezultirajući kompajler, koji je Anthropic objavio na GitHubu, može kompajlirati niz značajnih open-source projekata, uključujući PostgreSQL, SQLite, Redis, FFmpeg i QEMU. Postigao je 99 posto prolaznosti na GCC torture test suite, a u onome što je Carlini nazvao “konačnim testom za programere”, uspio je kompajlirati i pokrenuti Doom.
Važno je napomenuti da je C kompajler gotovo idealan zadatak za poluautonomno kodiranje AI modela: specifikacija je stara desetljećima i dobro definirana, postoje sveobuhvatni testni paketi, a postoji i poznati referentni kompajler za provjeru. Većina stvarnih softverskih projekata nema ni jednu od ovih prednosti. Težak dio većine razvoja nije pisanje koda koji prolazi testove; to je utvrđivanje što bi testovi trebali biti na prvom mjestu.



