Zanimljivo je napomenuti da OpenAI objavljuje svoj CLI klijent za kodiranje na GitHubu, omogućujući programerima da izravno pregledaju implementaciju, dok isto ne čine za ChatGPT.
Objava Bolina fokusira se na ono što on naziva “petlja agenta”, koja je osnovna logika koja orkestrira interakcije između korisnika, AI modela i softverskih alata koje model koristi za obavljanje programerskog posla.
Kao što smo pisali u prosincu, u središtu svakog AI agenta nalazi se ponavljajući ciklus. Agent uzima ulaz od korisnika i priprema tekstualni upit za model. Model zatim generira odgovor, koji ili daje konačan odgovor korisniku ili traži poziv alata (kao što je izvršavanje shell naredbe ili čitanje datoteke). Ako model zahtijeva poziv alata, agent ga izvršava, dodaje izlaz originalnom upitu i ponovno konzultira model. Ovaj proces se ponavlja sve dok model ne prestane zahtijevati alate i umjesto toga ne generira poruku asistenta za korisnika.
Ovaj proces petljanja mora negdje započeti, a Bolinova objava otkriva kako Codex konstruira inicijalni upit poslan OpenAI-ovom Responses API-ju, koji upravlja inferencijom modela. Upit se sastoji od nekoliko komponenti, svaka s dodijeljenom ulogom koja određuje njezin prioritet: sustav, programer, korisnik ili asistent.
Polje uputa dolazi ili iz konfiguracijske datoteke koju je naveo korisnik ili iz osnovnih uputa integriranih s CLI-jem. Polje alata definira koje funkcije model može pozvati, uključujući shell naredbe, alate za planiranje, mogućnosti pretraživanja interneta i sve prilagodljive alate koje pružaju poslužitelji Model Context Protocol (MCP). Polje ulaza sadrži niz stavki koje opisuju dozvole sandboxa, opcionalne upute za programere, kontekst okruženja poput trenutnog radnog direktorija i konačno, stvarnu poruku korisnika.



