Microsoft je najavio lansiranje svog najnovijeg čipa, Maia 200, koji tvrtka opisuje kao silikonskog radnika dizajniranog za skaliranje AI inferencije.
Maia 200, koji slijedi čip Maia 100 predstavljen 2023. godine, tehnički je opremljen za pokretanje moćnih AI modela bržim brzinama uz veću učinkovitost. Maia dolazi s više od 100 milijardi tranzistora, isporučujući preko 10 petaflopsa u 4-bitnoj preciznosti i otprilike 5 petaflopsa performansi u 8-bitnom režimu — što predstavlja značajno povećanje u odnosu na prethodnika.
Inferencija se odnosi na proces računanja pokretanja modela, za razliku od izračuna potrebnog za njegovu obuku. Kako AI tvrtke sazrijevaju, troškovi inferencije postali su sve važniji dio njihovih ukupnih operativnih troškova, što je dovelo do ponovnog interesa za načine optimizacije tog procesa.
Microsoft se nada da će Maia 200 biti dio te optimizacije, omogućujući AI poslovanjima da rade s manje prekida i manjom potrošnjom energije. “U praktičnom smislu, jedan Maia 200 čvor može bez napora pokretati najveće modele današnjice, s dovoljno prostora za još veće modele u budućnosti,” navela je tvrtka.
Novi čip Microsofta također je dio rastućeg trenda tehnoloških divova koji se okreću vlastitim dizajniranim čipovima kako bi smanjili svoju ovisnost o Nvidiji, čiji su napredni GPU-ovi postali sve ključniji za uspjeh AI kompanija. Google, na primjer, ima svoje TPU-ove, jedinice za obradu tenzora — koje se ne prodaju kao čipovi, već kao računalna moć dostupna kroz njegovu cloud uslugu. Tu je i Amazon Trainium, vlastiti AI akcelerator čip e-trgovinskog giganta, koji je nedavno predstavio svoju najnoviju verziju, Trainium3, u prosincu. U svakom slučaju, TPU-ovi se mogu koristiti za prebacivanje dijela izračuna koji bi inače bio dodijeljen Nvidia GPU-ima, smanjujući ukupne troškove hardvera.
S Maia, Microsoft se pozicionira da konkurira tim alternativama. U svom priopćenju za medije u ponedjeljak, tvrtka je istaknula da Maia isporučuje 3x FP4 performanse treće generacije Amazon Trainium čipova, te FP8 performanse iznad Googleovog sedmog naraštaja TPU-a.
Microsoft tvrdi da Maia već aktivno podržava AI modele tvrtke iz tima Superintelligence. Također podržava rad Copilota, njihovog chatbota. Od ponedjeljka, tvrtka je pozvala različite strane — uključujući programere, akademike i laboratorije za frontier AI — da koriste njen Maia 200 softverski razvojni set u svojim radnim opterećenjima.



