U petak je kineska tvrtka za umjetnu inteligenciju DeepSeek objavila pregled svog dugo očekivanog novog vodećeg modela V4. Ovaj model može obraditi znatno duže unose nego njegova prethodna generacija, zahvaljujući novom dizajnu koji mu pomaže učinkovitije obraditi velike količine teksta. Kao i prethodni modeli DeepSeek-a, V4 je otvorenog koda, što znači da je dostupan svima za preuzimanje, korištenje i modifikaciju.
V4 predstavlja najznačajnije izdanje DeepSeek-a otkako je R1, model za rasuđivanje koji su pokrenuli u siječnju 2025. R1 je, treniran na ograničenim računalnim resursima, zapanio globalnu industriju umjetne inteligencije svojom snažnom izvedbom i učinkovitošću, pretvarajući DeepSeek iz malo poznatog istraživačkog tima u najpoznatiju AI tvrtku u Kini gotovo preko noći. Također je pokrenuo val objava modela otvorenog koda od strane drugih kineskih AI tvrtki.
DeepSeek je od tada zadržao relativno nisku profil, no ranije ovog mjeseca su gotovo najavili izdanje V4 kada su dodali “stručni” i “brzi” mod na online verziju svog modela, što je potaknulo spekulacije da su ti ažuriranja povezana s većim nadolazećim izdanjem. Iako je tvrtka postala snažan simbol kineskih ambicija u AI, njen veliki povratak na cutting-edge modele dolazi nakon mjeseci ispitivanja—uključujući velike odlazeće kadrove, kašnjenja prethodnih modela i rastući nadzor od strane američkih i kineskih vlada.
Hoće li V4 uzdrmati polje umjetne inteligencije kao što je to učinio R1? Gotovo sigurno ne, ali evo tri glavna razloga zašto je ovo izdanje važno.
1. Postavlja nove standarde za modele otvorenog koda. Kao i R1 prije njega, DeepSeek tvrdi da performanse V4 rivaliziraju najbolje modele dostupne po djeliću cijene. To je izvrsna vijest za programere i tvrtke koje koriste ovu tehnologiju, jer im omogućuje pristup vrhunskim AI mogućnostima na vlastitim uvjetima, bez brige o naglom povećanju troškova. Novi model dolazi u dvije verzije, obje dostupne na DeepSeekovoj web stranici i u aplikaciji, s API pristupom također otvorenim za programere.
2. Donosi novi pristup učinkovitosti memorije. Jedna od ključnih inovacija V4 je njegov dugi kontekstualni prozor—količina teksta koju model može obraditi odjednom. Obje verzije mogu obraditi 1 milijun tokena, što je dovoljno da stane svih tri sveska Gospodara prstenova i Hobita zajedno. Tvrtka tvrdi da je ova veličina kontekstualnog prozora sada standardna za sve DeepSeek usluge i odgovara onome što nude cutting-edge verzije modela poput Gemini i Claude.
3. Označava prve korake na teškom putu od Nvidije. V4 je prvi model DeepSeek-a optimiziran za domaće kineske čipove, poput Huawei-ovih Ascend—što je lansiranje pretvorilo u svojevrsni test može li kineska domaća AI industrija početi smanjivati svoju ovisnost o američkom čip divu Nvidiji.



