Google Cloud je u srijedu najavio da će njegova osma generacija prilagođenih AI čipova, ili jedinica za obradu tenzora (TPU), biti podijeljena na dva dijela. Jedan čip, nazvan TPU 8t, bit će usmjeren na obuku modela, dok je drugi, TPU 8i, namijenjen inferenciji.
Inferencija označava kontinuiranu upotrebu modela, odnosno što se događa nakon što korisnici unesu upite.
Kao što se može očekivati, tvrtka ističe impresivne performanse ovih novih TPU-a u usporedbi s prethodnim generacijama: do 3 puta brža obuka AI modela, 80% bolja izvedba po dolaru, i mogućnost povezivanja više od 1 milijun TPU-a u jedinstveni klaster. Rezultat bi trebao biti mnogo više računalne snage uz znatno manje energije — i troškova za korisnike — nego kod prethodnih verzija. Ove čipove naziva TPU-ima, a ne GPU-ima, jer su njihovi prilagođeni čipovi niske potrošnje prvotno nazvani Tenzor.
No, Googleovi čipovi nisu izravni napad na budućnost Nvidije, barem ne još. Kao i drugi veliki pružatelji oblaka, uključujući Microsoft i Amazon, Google koristi ove čipove kao dopunu sustavima temeljenim na Nvidiji koje nudi u svojoj infrastrukturi. Nije ih potpuno zamijenio. U stvari, Google obećava da će njegov oblak imati najnoviji Nvidijin čip, Vera Rubin, dostupan kasnije ove godine.
Jednog dana, tvrtke koje grade vlastite AI čipove (među kojima su Amazon, Microsoft i Google) možda će sve više smanjivati svoju ovisnost o Nvidiji, kako poduzeća premještaju svoje AI potrebe u svoje oblake i prilagođavaju svoje aplikacije tim čipovima.
Ipak, prema trenutnom stanju stvari, nije isplativo kladiti se protiv Nvidije. Kao što je popularni analitičar tržišta čipova Patrick Moorhead duhovito napisao na X-u, predvidio je da bi Googleov TPU mogao biti loša vijest za Nvidiju (i Intel) još 2016. kada je pretraživački div lansirao svoj prvi čip. Nvidija je sada tvrtka s gotovo 5 trilijuna dolara tržišne kapitalizacije, što znači da ta predikcija nije baš izdržala test vremena.
Ako sve prođe prema Nvidijinom planu, Googleov rast kao pružatelja AI oblaka rezultirat će većim poslovanjem za proizvođača čipova, a ne manjim, čak i ako se mnogi poslovi obavljaju na Googleovim čipovima.
U stvari, Google također tvrdi da je pristao surađivati s Nvidijom kako bi inženjerirali računalne mreže koje omogućuju Nvidijinim sustavima da rade još učinkovitije u njegovom oblaku. Konkretno, dva tehnološka diva rade na poboljšanju softverske mrežne tehnologije pod nazivom Falcon, koju je Google stvorio i otvorio 2023.



