Kineski DeepSeek objavio je danas dva nova open-weights modela: V4-Pro i V4-Flash. V4-Pro ima 1.6 triliona parametara (od kojih je samo 49 milijardi aktivno zahvaljujući Mixture of Experts arhitekturi) i kontekst od milion tokena.
Prema prvim rezultatima, V4-Pro parira zatvorenim modelima poput GPT-5.4 i Gemini-3.1-Pro. Ovo je prvi veliki model DeepSeeka od R1 koji je početkom 2025. izazvao paniku na berzama i pokazao da kineska firma sa delićem resursa može da napravi konkurentan model.
Specifikacije i cena
V4-Flash je manji model sa 284 milijarde ukupnih i 13 milijardi aktivnih parametara, namenjen brzini i niskoj ceni. Oba modela za sada rade samo sa tekstom — DeepSeek kaže da radi na multimodalnim mogućnostima.
Sajmon Vilison je uporedio cene:
| Model | Input ($/M tokena) | Output ($/M tokena) |
|---|---|---|
| DeepSeek V4-Pro | $1.74 | $3.48 |
| GPT-5.4 | $2.50 | $15.00 |
| Claude Opus 4.7 | $5.00 | $25.00 |
V4-Pro je ujedno i najveći open-weights model na svetu, veći od Kimi K2.6 (1.1T) i GLM-5.1 (754B). DeepSeek u svom tehničkom dokumentu tvrdi da V4-Pro koristi samo 27% računarskih operacija i 10% keš memorije u poređenju sa prethodnim V3.2.
Gde stoji u odnosu na konkurenciju
Na MMLU-Pro testu, V4-Pro je izjednačen sa GPT-5.4, a blago zaostaje za Gemini-3.1-Pro i Claude Opus 4.6. U agentic coding testovima, V4-Pro je postigao najbolji rezultat među svim open-weights modelima.
Sam DeepSeek u tehničkom dokumentu priznaje da zaostaje za vodećim zatvorenim modelima za otprilike tri do šest meseci. Ako pogledamo cene, V4-Flash output token košta $0.28, dok isti token kod GPT-5.5 košta $30 — razlika od stotinak puta.
Finally @deepseek_ai V4 is there. The result is mind blowing and on par with top frontier models!
Amazing result! pic.twitter.com/pEq1IGCd41
— Tiezhen WANG (@Xianbao_QIAN) April 24, 2026
Modeli su od danas dostupni na Hugging Face pod MIT licencom, a DeepSeek API je već aktivan.
Huawei je u posebnom saopštenju objavio da će njegovi Ascend 950 čipovi u potpunosti podržavati V4 modele — još jedan signal odvajanja kineskog AI ekosistema od američkog hardvera.