AI već značajno utječe na način na koji se piše softver, s tim da se veliki dio rutinskog programiranja sada obavlja uz pomoć mnoštva agenata. Kako programeri eksperimentiraju s novim sučeljima i oblicima suradnje između čovjeka i AI, postalo je teško čak i najnaprednijim AI laboratorijima držati korak.
Trenutni trend je agentički razvoj softvera — sustavi gdje AI agenti mogu neovisno raditi na zadacima kodiranja — što najbolje prikazuju aplikacije Claude Code i Cowork. U međuvremenu, OpenAI je postupno razvijao svoj alat Codex, koji je lani u travnju lansiran kao alat za naredbeni red te se proširio na web sučelje mjesec dana kasnije.
OpenAI sada poduzima značajan korak prema dostizanju konkurencije. U ponedjeljak je tvrtka predstavila novu macOS aplikaciju za Codex, koja integrira mnoge agentičke prakse koje su postale popularne u prošloj godini. Nova aplikacija osmišljena je za rad s više agenata paralelno, integrirajući vještine agenata i druge vrhunske radne tokove. Lansiranje dolazi manje od dva mjeseca nakon lansiranja GPT-5.2-Codex, OpenAI-ovog najmoćnijeg modela kodiranja, za koji se nadaju da će privući korisnike Claude Code.
“Ako stvarno želite raditi sofisticirane stvari na nečemu složenom, 5.2 je najjači model do sada,” rekao je CEO Sam Altman novinarima na press konferenciji. “Međutim, teže ga je koristiti, pa smatramo da će stavljanje tog nivoa mogućnosti modela u fleksibilnije sučelje značajno utjecati.”
Dok je Altmanovo povjerenje u GPT-5.2 razumljivo, benchmarkovi kodiranja govore složeniju priču. GPT-5.2 drži prvo mjesto na TerminalBench, barem do trenutka pisanja ovog članka. No, agenti iz Gemini 3 i Claude Opus ostvarili su otprilike jednake rezultate — nešto niže, ali unutar margine pogreške benchmarka. Rezultati iz SWE-bench, još jednog benchmarka koji ispituje sposobnost AI-a da ispravlja stvarne softverske greške, su slični, ne pokazujući jasnu prednost za GPT-5.2. Međutim, agentički slučajevi korištenja bili su teški za učinkovito ocjenjivanje, a vrhunski modeli mogu značajno varirati u korisničkom iskustvu.
Codex aplikacija također dolazi s nizom novih značajki koje OpenAI kaže da će joj pomoći da postigne paritet ili, u nekim slučajevima, nadmaši razne Claude aplikacije. Codex aplikacija omogućit će automatske procese koji se mogu postaviti da se pokreću u pozadini prema automatskom rasporedu, s rezultatima koji će biti u redu za pregled kada se korisnik vrati. Korisnici također mogu odabrati različite osobnosti za agenta — od pragmatičnih do empatičnih — ovisno o svom stilu rada.
No, za tvrtku, najveća prednost je brzina razvoja koju omogućava AI. “Možete koristiti ovo s čistim listom papira, potpuno novim, da napravite zaista prilično sofisticiran komad softvera u nekoliko sati,” rekao je Altman. “Koliko brzo mogu unositi nove ideje, to je limit onoga što se može izgraditi.”



