De Chinese AI-eenhoorn DeepSeek houdt de industrie in onzekerheid over de release van zijn volgende generatie modellen. V4 en R2. Ondanks intense speculaties over een mogelijke lancering tijdens het komende nieuwe maanjaar, het bedrijf heeft geweigerd commentaar te geven op specifieke data.
In plaats van, het bedrijf laat zijn onderzoek voor zich spreken. De afgelopen weken is DeepSeek heeft meerdere technische artikelen gepubliceerd waarin nieuwe methoden worden beschreven om de huidige hardwarebeperkingen te omzeilen. Met Amerikaanse sancties die de toegang van China tot geavanceerde Nvidia GPU's beperken, Het nieuwste onderzoek van DeepSeek richt zich op algoritmische efficiëntie.
Op dinsdag, het bedrijf introduceerde “Engram,“een voorwaardelijke geheugentechniek die is ontworpen om GPU-geheugentekorten met hoge bandbreedte op te lossen – een cruciaal knelpunt bij het opschalen van AI. Dit volgt op een paper, mede geschreven door CEO Liang Wenfeng, over ‘manifold-constrained hyper-connections’ (mHC), een raamwerk gericht op het kosteneffectiever trainen van enorme systemen.
Analisten zijn van mening dat deze innovaties strategische stappen zijn om het momentum te behouden ondanks geopolitieke tegenwind. “DeepSeek wil alleen maar bewijzen dat AI-infrastructuurinnovatie de efficiëntie zou bevorderen,' zei Zhang Ruiwang, een in Beijing gevestigde architect van informatiesystemen.
Hoewel de releasedatum voor de opvolgers van de V3- en R1-modellen een mysterie blijft, het bedrijf bevestigde dat het kernteam intact blijft. In een bijgewerkt artikel over het R1-model wordt opgemerkt dat alle 18 oorspronkelijke kernwetenschappers nog steeds bij het bedrijf werken. waarmee de hoge omzetcijfers van de Chinese industrie worden getrotseerd.





