Kineski DeepSeek objavio je danas dva nova open-weights modela: V4-Pro i V4-Flash. V4-Pro ima 1.6 triliona parametara (od kojih je samo 49 milijardi aktivno zahvaljujući Mixture of Experts arhitekturi) i kontekst od milion tokena.

Prema prvim rezultatima, V4-Pro parira zatvorenim modelima poput GPT-5.4 i Gemini-3.1-Pro. Ovo je prvi veliki model DeepSeeka od R1 koji je početkom 2025. izazvao paniku na berzama i pokazao da kineska firma sa delićem resursa može da napravi konkurentan model.

Specifikacije i cena

V4-Flash je manji model sa 284 milijarde ukupnih i 13 milijardi aktivnih parametara, namenjen brzini i niskoj ceni. Oba modela za sada rade samo sa tekstom — DeepSeek kaže da radi na multimodalnim mogućnostima.

Sajmon Vilison je uporedio cene:

Model Input ($/M tokena) Output ($/M tokena)
DeepSeek V4-Pro $1.74 $3.48
GPT-5.4 $2.50 $15.00
Claude Opus 4.7 $5.00 $25.00

V4-Pro je ujedno i najveći open-weights model na svetu, veći od Kimi K2.6 (1.1T) i GLM-5.1 (754B). DeepSeek u svom tehničkom dokumentu tvrdi da V4-Pro koristi samo 27% računarskih operacija i 10% keš memorije u poređenju sa prethodnim V3.2.

Gde stoji u odnosu na konkurenciju

Na MMLU-Pro testu, V4-Pro je izjednačen sa GPT-5.4, a blago zaostaje za Gemini-3.1-Pro i Claude Opus 4.6. U agentic coding testovima, V4-Pro je postigao najbolji rezultat među svim open-weights modelima.

Sam DeepSeek u tehničkom dokumentu priznaje da zaostaje za vodećim zatvorenim modelima za otprilike tri do šest meseci. Ako pogledamo cene, V4-Flash output token košta $0.28, dok isti token kod GPT-5.5 košta $30 — razlika od stotinak puta.

Modeli su od danas dostupni na Hugging Face pod MIT licencom, a DeepSeek API je već aktivan.

Huawei je u posebnom saopštenju objavio da će njegovi Ascend 950 čipovi u potpunosti podržavati V4 modele — još jedan signal odvajanja kineskog AI ekosistema od američkog hardvera.