DeepSeek heeft zaterdag grote prijsverlagingen aangekondigd voor zijn API-service, waarbij de kosten voor invoercachehits worden verlaagd tot een tiende van de oorspronkelijke prijs en een tijdelijke korting van 75% wordt aangeboden op zijn vlaggenschip V4-Pro-model tot en met 5 mei.
De nieuwe promotieprijs voor de invoercache van V4-Pro bedraagt nu 0,025 yuan, ongeveer $ 0,0036, per miljoen tokens. De standaardprijs van het model tijdens deze promotieperiode is vastgesteld op 3 yuan voor input en 6 yuan voor output per miljoen tokens. Deze tarieven ondermijnen aanzienlijk de westerse concurrenten, wier productieprijzen variëren van $12 tot $25 per miljoen tokens, volgens gegevens van OpenRouter.
DeepSeek heeft op 24 april de V4-Pro- en V4-Flash-modellen uitgebracht als preview-versie, wat de eerste belangrijke modellancering van het bedrijf sinds december vorig jaar markeerde. V4-Pro beschikt over 1,6 biljoen parameters, met 49 miljard actieve parameters per inferentiepassage, waardoor het het grootste open-gewichtmodel is dat momenteel beschikbaar is. V4-Flash biedt daarentegen een kleinere optie met 284 miljard parameters.
Vóór deze kortingen was de standaardprijs van V4-Pro van $1,74 voor input en $3,48 voor output per miljoen tokens al ongeveer 98% lager dan OpenAI’s GPT-5.5 Pro-tarieven. De jongste bezuinigingen vergroten dit prijsverschil nog verder.
De prijsstrategie van DeepSeek is een reactie op de stijgende kosten van rekenkracht binnen de AI-sector. Wei Sun, hoofd AI-analist bij Counterpoint Research, vertelde CNN dat het bedrijf “het concept van ‘AI-prijsverlaging'” heeft geïmplementeerd te midden van de algemene stijgingen van de industriële kosten.
De V4-modellen van DeepSeek werken op Huawei Ascend-hardware in plaats van op Nvidia-chips. Deze transitie wordt gezien als belangrijk voor de ontwikkeling en implementatie van AI-systemen vanwege de verminderde afhankelijkheid van Nvidia-technologie. Sun benadrukte dat deze verschuiving de binnenlandse adoptie en de mondiale vooruitgang op het gebied van AI kan versnellen.
Bovendien heeft V4-Pro slechts 27% van de rekenkracht nodig die zijn voorganger, V3.2, nodig heeft voor een contextvenster van één miljoen tokens. DeepSeek heeft erkend dat V4-modellen momenteel ongeveer drie tot zes maanden achterlopen op grensmodellen als GPT-5.4 en Gemini 3.1 Pro wat betreft prestatiemogelijkheden.





