Michael Gerstenhaber, potpredsjednik proizvoda u Google Cloud-u, radi na Vertexu, jedinstvenoj platformi za implementaciju AI-a u poduzećima. Njegov rad mu omogućuje uvid u to kako tvrtke koriste AI modele i što još treba učiniti kako bi se iskoristio potencijal agentnog AI-a.
Jedna zanimljiva ideja koju je iznio tijekom našeg razgovora je da AI modeli istovremeno gura prema tri granice: sirova inteligencija, vrijeme odgovora i treća kvaliteta koja se više odnosi na troškove nego na sposobnosti — može li se model implementirati dovoljno jeftino za rad u velikim, nepredvidivim razmjerima. Ovaj pristup razmišljanju o sposobnostima modela je posebno vrijedan za svakoga tko pokušava pomaknuti granice AI modela.
Ovaj intervju je skraćen radi duljine i jasnoće.
Možete li nam reći o svom iskustvu u AI-u i o tome što radite u Googleu?
U AI-u sam već oko dvije godine. Radio sam u Anthropic-u godinu i pol, a u Googleu sam skoro pola godine. Vodim Vertex, Googleovu platformu za developere. Većina naših korisnika su inženjeri koji razvijaju vlastite aplikacije i žele pristup agentnim obrascima i platformi, te inferecijama najpametnijih modela na svijetu. Mogu im to pružiti, ali ne pružam same aplikacije — to je posao za Shopify, Thomson Reuters i naše razne klijente u njihovim domenama.
Što vas je privuklo Googleu?
Google je jedinstven jer imamo sve, od korisničkog sučelja do infrastrukture. Možemo graditi podatkovne centre, kupovati električnu energiju i graditi elektrane. Imamo vlastite čipove i modele, te kontroliramo inferencijsku i agentnu razinu. Imamo API-je za pohranu i pisanje interleaved koda, a tu je i agentni motor koji osigurava usklađenost i upravljanje. Također imamo chat sučelje s Gemini enterprise i Gemini chat za potrošače. Dio razloga zašto sam došao ovdje je jer smatram da je Google jedinstveno vertikalno integriran, što je naša snaga.
Čini se da su tri velika laboratorija jako blizu po mogućnostima. Je li to samo utrka za većom inteligencijom ili je to složenije?
Vidim tri granice. Modeli poput Gemini Pro su podešeni za sirovu inteligenciju. Razmislite o pisanju koda — želite samo najbolji kod, bez obzira na to koliko vremena traje. Zatim postoji granica s latencijom. Ako radim u korisničkoj podršci i trebam primijeniti neku politiku, potrebna vam je inteligencija za to. Ali nije važno koliko ste u pravu ako odgovor traje 45 minuta. U tom slučaju, želite najinteligentniji proizvod unutar tog vremenskog okvira, jer više inteligencije ne pomaže kad se korisnik dosadi i prekine poziv.
Na kraju, postoji situacija gdje tvrtke poput Reddita ili Mete žele moderirati cijeli internet. Imaju velike budžete, ali ne mogu preuzeti rizik s nečim ako ne znaju kako će se to skalirati. Moraju ograničiti svoj budžet na model s najvišom inteligencijom koju si mogu priuštiti, ali na način koji se može skalirati na beskonačan broj tema. U tom slučaju, trošak postaje vrlo važan.
Zašto agentni sustavi toliko sporo postaju popularni? Čini se da modeli postoje, ali ne vidimo velike promjene koje smo očekivali.
Ova tehnologija je stara samo dvije godine i još uvijek nedostaje mnogo infrastrukture. Nemamo obrasce za reviziju onoga što agenti rade. Trebamo raditi na tome kako bi se ti obrasci mogli implementirati u proizvodnju. Mislim da se u inženjeringu softvera brzo razvija jer se uklapa u životni ciklus razvoja softvera. Proces pisanja koda u Googleu zahtijeva dva čovjeka da reviziraju kod i potvrde da je dovoljno dobar za naš brand i naše korisnike.



