Izlaz modela umjetne inteligencije (AI) iz Indije bio je sporiji u usporedbi s SAD-om, Europom i Kinom. Samo nekoliko startupova objavljuje modele, a većina njih su veliki jezični modeli ili modeli za glas. Kako bi potaknula daljnji razvoj, vlada je pokrenula Indijski AI projekt, inicijativu vrijednu otprilike 1,2 milijarde dolara koja, među ostalim, omogućuje odabranim startupovima pristup subvencioniranim GPU resursima u zamjenu za javno objavljivanje njihovih modela. Jedan od 12 odabranih startupova, Avataar AI, lansirao je novi video model pod nazivom Varya koji je dizajniran za razumijevanje lokalnog konteksta — poput prepoznavanja različitih festivala, hrane i odjeće.
Startup koji podržava Peak XV, fokusiran na izradu video alata za e-trgovinu, nije izgradio Varyu od nule. Počeli su s Wan 2.2, javno dostupnim modelom za generiranje videa koji je objavio Alibaba, i koristili tehniku nazvanu destilacija — u osnovi komprimirajući sposobnosti modela u mršaviju, bržu verziju optimiziranu za specifične slučajeve korištenja Avataara. Rezultat je model koji radi u četiri koraka umjesto 50 koliko je potrebno za Wan 2.2, proizvodeći video 10 puta brže i po znatno nižoj cijeni.
U konkretnim terminima: koristeći NVIDIA H200 GPU, Varya može generirati 5-sekundni 720p isječak za 45 sekundi, dok je za Wan 2.2 potrebno 1.230 sekundi.
Najistaknutiji aspekt Varye može biti njena cijena. Tvrtka planira naplaćivati ₹0.48 (0.005 USD) po sekundi videa na svojoj usluzi — daleko jeftinije od modela poput Veo, Kling, Luma i Runway, koji obično naplaćuju 0.10 USD ili više po sekundi. To je otprilike 20 puta razlika u cijeni.
„Indija je tržište orijentirano na video. To vidimo u svakom velikom potrošačkom internetskom proizvodu u Indiji: video pobjeđuje tekst. Trenutni AI video modeli su preskupi za korištenje na razini populacije u Indiji. Ako AI video želi doći do studenata, učitelja, MSME-a, stvaratelja, poduzeća i javnih usluga, troškovi moraju drastično opasti. Trošak je najveća prepreka za usvajanje AI u Indiji”, rekao je Rajan Anandan, izvršni direktor Peak XV-a.
Modeli za generaciju slika i videa često propuštaju kulturne nijanse i proizvode stereotipne ili generičke rezultate — problem o kojem je TechCrunch prije izvijestio. Avataar AI tvrdi da je koristio odabrane podatke za obuku Varye kako bi prepoznala kulturne nijanse, uključujući hranu, odjeću, arhitekturu i festivale.
Varya će biti objavljena kao model otvorenih težina na Indijskom AI Kosh portalu — centraliziranom repozitoriju indijske vlade za javno dostupne AI modele i skupove podataka — zajedno s podacima za obuku, što znači da developeri mogu samostalno hostati ili modificirati model prema vlastitim potrebama. Avataar također planira učiniti model dostupnim svojim poslovnim kupcima i otvoren je za partnerstva s video alatima uključujući Higgsfield i Adobe Firefly. Svi mogu isprobati model sada na njihovoj web stranici koristeći tekstualne upute ili referentne slike.
Lansiranje Varye odražava temeljni kompromis u indijskim ambicijama vezanim uz AI. Iskusni ljudi iz industrije napomenuli su da Indija može ostaviti svoj trag u AI stvaranjem aplikacija i robusnog ekosustava developera umjesto da se natječe na razini osnovnih modela. I ima razloga za taj pragmatizam: razvoj modela bio je sporiji u Indiji nego kod globalnih konkurenta zbog nedostatka računalnih resursa i ograničene dostupnosti kvalitetnih podataka.
Indijski AI projekt također je dio šireg vladinog nastojanja da zatvori taj razmak. Prošle godine, odabrano je 12 startupova — među kojima je i Avataar AI — za razvoj AI modela i osigurani su im troškovno učinkoviti računalni resursi. Početkom ove godine, ministar IT-a Ashwini Vaishnaw izjavio je da Indija planira privući 200 milijardi dolara u AI investicije do 2028. i više od dvostruko povećati svoju GPU kapacitetu unutar šest mjeseci.



