Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
No Result
View All Result

DeepSeek onthult MODEL1-architectuur in GitHub-update voorafgaand aan V4

byKerem Gülen
21 januari 2026
in Kunstmatige Intelligentie, Nieuws
Home Nieuws Kunstmatige Intelligentie
Share on FacebookShare on Twitter
Google Preferred Source

DeepSeek heeft details onthuld van een nieuw model genaamd “MODEL1” via recente updates van de FlashMLA-codebasis op GitHub. De identificatie “MODEL1” verschijnt 28 keer in 114 bestanden in de repository, wat de openbaarmaking markeert op de eenjarige verjaardag van de R1-release van het bedrijf. Deze ontwikkeling volgt op berichten dat DeepSeek van plan is zijn volgende generatie V4-model rond midden februari 2026 uit te brengen, samenvallend met het nieuwe maanjaar. Analyse van de bijgewerkte codebase door ontwikkelaars geeft aan dat MODEL1 een andere architectuur heeft dan DeepSeek-V3.2, met de codenaam “V32” in de repository. Discrepanties in de codelogica suggereren veranderingen in de lay-out van de sleutelwaardecache, de verwerking van sparsity en de decodering van FP8-dataformaten, wat wijst op herstructurering voor geheugenoptimalisatie en rekenefficiëntie. Onderzoekers van de LocalLLaMA-gemeenschap van Reddit opgemerkt de FlashMLA-broncode-update voegde uitgebreide MODEL1-ondersteuning toe, inclusief compatibiliteit met Nvidia's aanstaande Blackwell-architectuur (SM100) en de huidige Hopper-chips. De veranderingen laten naar verluidt zien dat MODEL1 terugkeert naar een uniforme 512-standaarddimensie en “Value Vector Position Awareness” -functies introduceert, naast mogelijke implementaties van DeepSeeks onlangs gepubliceerde “Engram” voorwaardelijke geheugensysteem. De FlashMLA-repository, die de Multi-Head Latent Attention-decoderingskernel van DeepSeek huisvest, geoptimaliseerd voor Nvidia Hopper GPU's, was de bron van de technische aanwijzingen. Verwacht wordt dat het V4-model van DeepSeek de Engram-architectuur zal integreren, wat het efficiënt ophalen van contexten van meer dan een miljoen tokens mogelijk maakt door gebruik te maken van een opzoeksysteem voor fundamentele feiten in plaats van ze opnieuw te berekenen door middel van berekeningen. Interne tests door DeepSeek-medewerkers suggereren dat V4 beter zou kunnen presteren dan concurrerende modellen van Anthropic en OpenAI op codeerbenchmarks, vooral met lange codeprompts. De MODEL1-onthulling vindt plaats nu DeepSeek een jaar na zijn R1-debuut in januari 2025 nadert. De R1-release resulteerde volgens ITPro in een daling van de marktwaarde van Nvidia met $ 593 miljard op één dag. Het R1-model van DeepSeek kostte naar verluidt minder dan $ 6 miljoen om te trainen en behaalde prestaties die vergelijkbaar waren met of zelfs beter dan OpenAI's o1-model op het gebied van wiskunde en coderen. Het bedrijf bracht vervolgens V3.1 uit in augustus en V3.2 in december, waarbij van V3.2 werd beschreven dat het prestaties bood die gelijkwaardig waren aan die van OpenAI's GPT-5. DeepSeek heeft geen officieel commentaar gegeven op MODEL1 of een specifieke releasetiming voor V4 bevestigd.


Uitgelicht beeldtegoed

Tags: diep zoekenmodel1

Related Posts

Amazon voegt door AI gegenereerde productvoorbeelden toe aan zoekresultaten

Amazon voegt door AI gegenereerde productvoorbeelden toe aan zoekresultaten

4 juni 2026
Google Wallet voegt deze zomer digitale ID’s uit geselecteerde EU-landen toe

Google Wallet voegt deze zomer digitale ID’s uit geselecteerde EU-landen toe

4 juni 2026
Google rolt Ask Gemini in Drive uit voor in aanmerking komende Workspace-gebruikers

Google rolt Ask Gemini in Drive uit voor in aanmerking komende Workspace-gebruikers

4 juni 2026
Nintendo gaat een reparatievriendelijke Switch 2 uitbrengen in Europa

Nintendo gaat een reparatievriendelijke Switch 2 uitbrengen in Europa

4 juni 2026
Meta lanceert AI-bedrijfsagenten op WhatsApp, Instagram en Messenger

Meta lanceert AI-bedrijfsagenten op WhatsApp, Instagram en Messenger

4 juni 2026
Sony onthult God of War: Laufey voor PS5

Sony onthult God of War: Laufey voor PS5

3 juni 2026

Recent Posts

  • Amazon voegt door AI gegenereerde productvoorbeelden toe aan zoekresultaten
  • Suno haalt 400 miljoen dollar op tegen een waardering van 5,4 miljard dollar, ondanks toenemende rechtszaken over auteursrechten
  • Lovable en Google breiden meerjarige AI- en cloud-samenwerking uit
  • Onderzoekers creëren een AI-worm die aanvallen aanpast zonder menselijke inbreng
  • Google Wallet voegt deze zomer digitale ID’s uit geselecteerde EU-landen toe

Recent Comments

Geen reacties om weer te geven.
Dataconomy NL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.