Kineski AI laboratorij DeepSeek predstavio je dvije preview verzije svog najnovijeg velikog jezičnog modela, DeepSeek V4, koji se dugo iščekivao kao nadogradnja na prošlogodišnji model V3.2, uz prateći R1 model za zaključivanje koji je osvojio AI svijet.
Tvrtka navodi da su modeli DeepSeek V4 Flash i V4 Pro modeli mješavine eksperata s kontekstualnim prozorima od 1 milijun tokena, što je dovoljno za korištenje velikih kodnih baza ili dokumenata u upitima. Pristup mješavini eksperata uključuje aktiviranje samo određenog broja parametara po zadatku kako bi se smanjili troškovi inferencije.
Pro model ima ukupno 1,6 trilijuna parametara (49 milijardi aktivnih), što ga čini najvećim modelom s otvorenim težinama koji je dostupan, premašujući Moonshot AI-ev Kimi K 2.6 (1,1 trilijuna), MiniMaxov M1 (456 milijardi) i više nego dvostruko DeepSeek V3.2 (671 milijarda). Manji model, V4 Flash, ima 284 milijarde parametara (13 milijardi aktivnih).
DeepSeek tvrdi da su oba modela učinkovitija i performatnija od DeepSeek V3.2 zahvaljujući arhitektonskim poboljšanjima, te su gotovo “zatvorili razmak” s trenutnim vodećim modelima, otvorenim i zatvorenim, na benchmark testovima zaključivanja.
Tvrtka tvrdi da njezin novi V4-Pro-Max model nadmašuje svoje otvorene konkurente u benchmark testovima zaključivanja, te premašuje OpenAI-ev GPT-5.2 i Gemini 3.0 Pro u nekim zadacima. U benchmark testovima kodiranja, DeepSeek je izjavio da je performansa oba V4 modela “usporediva s GPT-5.4”.

Ipak, čini se da modeli malo zaostaju za vrhunskim modelima u testovima znanja, posebno OpenAI-evim GPT-5.4 i Googleovim najnovijim Gemini 3.1 Pro. Ova razlika sugerira “razvojnu putanju koja zaostaje za najmodernijim vrhunskim modelima otprilike 3 do 6 mjeseci”, navodi laboratorij.
Oba modela V4 Flash i V4 Pro podržavaju isključivo tekst, za razliku od mnogih zatvorenih konkurenata koji nude podršku za razumijevanje i generiranje zvuka, videa i slika.
DeepSeek V4 je znatno povoljniji od bilo kojeg vrhunskog modela dostupnog danas. Manji model V4 Flash košta $0.14 po milijun ulaznih tokena i $0.28 po milijun izlaznih tokena, što je jeftinije od GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini i Claude Haiku 4.5. Veći model V4 Pro, s druge strane, košta $0.145 po milijun ulaznih tokena i $3.48 po milijun izlaznih tokena, također jeftinije od Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7 i GPT-5.4.
Lansiranje dolazi dan nakon što su SAD optužile Kinu za krađu američkih IP-a u AI laboratorijima na industrijskoj razini koristeći tisuće proxy računa. DeepSeek je također bio optužen od strane Anthropic i OpenAI za “destilaciju“, što suštinski znači kopiranje njihovih AI modela.



