Deepseek v3.1 rivalen GPT-5 met 685B parametermodel

In januari 2025 lanceerde Deepseek, een Chinese AI-startup, R1, een AI-model dat de top LLM’s van Openai en Anthropic hield. Deepseek is gebouwd voor een fractie van de kosten met minder Nvidia-chips en heeft nu v3.1 uitgebracht, een update van zijn vlaggenschip V3-model, geprijsd om OpenAI te ondercuteren, en geoptimaliseerd voor Chinees gemaakte chips.

Deepseek’s V3.1 werd stilletjes gelanceerd via een bericht over WeChat, een prominente Chinese berichten en sociale toepassing, en op het knuffelende gezichtsplatform. Deze ontwikkeling onderstreept verschillende belangrijke verhalen in het huidige AI -landschap. De inspanningen van Deepseek staan centraal in de ambitie van China om geavanceerde AI -systemen te ontwikkelen en te beheersen, onafhankelijk van buitenlandse technologie.

Het nieuwe Deepseek V3-model is specifiek geoptimaliseerd om effectief te presteren op Chinese chips, wat de strategische stap van China naar technologische zelfredzaamheid weerspiegelt. Hoewel Amerikaanse bedrijven de terughoudendheid hebben getoond om DeepSeek’s modellen aan te nemen, hebben ze in China aanzienlijk grip geworden en worden ze in toenemende mate in andere regio’s wereldwijd gebruikt. Sommige Amerikaanse bedrijven hebben zelfs het R1 -redeneermodel van Deepseek geïntegreerd in hun toepassingen. Onderzoekers waarschuwen echter dat de output van deze modellen vaak nauw aansluiten bij verhalen die zijn goedgekeurd door de Chinese Communistische Partij, waardoor ze bezorgdheid uiten over hun neutraliteit en betrouwbaarheid.

De AI -ambities van China reiken verder dan Deepseek, met andere opmerkelijke modellen, waaronder Qwen van Alibaba, Moonshot Ai’s Kimi en Baidu’s Ernie. De recente release van Deepseek, die nauwl nader is gevolgd Openai’s GPT-5 lanceringbenadrukt de toewijding van China om het tempo te handhaven met of te overtreffen, die ons AI -laboratoria leidt. De uitrol van GPT-5 viel tekort aan de verwachtingen van de industrie, wat verder de betekenis van Deepseek’s vorderingen benadrukt.

Openai CEO Sam Altman erkende dat concurrentie van Chinese open-source-modellen, inclusief Deepseek, de beslissing van Openai om zijn eigen open gewichtsmodellen uit te brengen, beïnvloedde. Tijdens een recente discussie met verslaggevers verklaarde Altman dat als Openai deze stap niet had gezet, het AI-landschap waarschijnlijk zou worden gedomineerd door Chinese open-source modellen. Hij benadrukte dat deze overweging een belangrijke factor was in hun besluitvormingsproces.

De Amerikaanse regering heeft NVIDIA en AMD -licenties verleend om specifieke AI -chips naar China te exporteren, inclusief H20 van NVIDIA. Deze licenties zijn afhankelijk van de bedrijven die overeenkomen 15% van de inkomsten van deze omzet aan de Amerikaanse overheid over te dragen. In reactie daarop is Beijing verhuisd om aankopen van NVIDIA -chips te beperken. Dit volgde op de verklaring van de handelssecretaris Howard Lutnick over CNBC Dat de VS China niet zijn beste, op een tweede beste of zelfs derde beste technologie verkoopt.

De diepte-optimalisatie van Deepseek voor Chinese chips duidt op een strategische stap om de exportcontroles van de VS tegen te gaan en de afhankelijkheid van NVIDIA te verminderen. Het bedrijf verklaarde in zijn WeChat-aankondiging dat het nieuwe modelformaat is geoptimaliseerd voor “binnenkort binnenlandse chips van de volgende generatie.”

Altman heeft zijn bezorgdheid geuit dat de VS de complexiteit en het belang van de Chinese vooruitgang in AI kunnen onderschatten. Hij waarschuwde dat exportcontroles alleen misschien niet voldoende zijn om de uitdagingen van de snelle vooruitgang van China aan te pakken. Hij uitte zijn bezorgdheid over de groeiende capaciteiten van China op het gebied van kunstmatige intelligentie.

Het Deepseek v3.1 -model bevat technische vooruitgang die voornamelijk gunstig zijn voor ontwikkelaars. Deze innovaties zijn gericht op het verlagen van de operationele kosten en het verbeteren van de veelzijdigheid in vergelijking met veel gesloten en duurdere concurrerende modellen. V3.1 heeft 685 miljard parameters en plaatst het in de topmodellen “Frontier”. Het ontwerp van “mengsel-van-experts” activeert slechts een fractie van het model voor elke query, waardoor de computerkosten voor ontwikkelaars worden verlaagd. In tegenstelling tot eerdere Deepseek-modellen die taken scheidden die onmiddellijke antwoorden vereisen van degenen die stapsgewijze redenering nodig hebben, integreert v3.1 beide mogelijkheden in één systeem.

GPT-5, samen met recente modellen van Anthropic en Google, hebben ook deze geïntegreerde mogelijkheden. Er hebben echter maar weinig open-gewicht modellen dit integratieniveau bereikt. Ben Dickson, oprichter van het TechTalks -blog, beschrijft de hybride architectuur van v3.1 als ‘de grootste functie verreweg’.

William Falcon, oprichter en CEO van Lightning AI, merkte op dat de voortdurende verbeteringen van Deepseek opmerkelijk zijn, zelfs als V3.1 niet zo belangrijk is als het eerdere R1 -model. Hij verklaarde dat het bedrijf ‘niet-marginale verbeteringen’ blijft aanbrengen, wat indrukwekkend is. Falcon verwacht dat Openai zal reageren als het open-source model aanzienlijk begint te blijven. Hij wees er ook op dat het DeepSeek -model voor ontwikkelaars uitdagender is om in de productie in te zetten in vergelijking met de versie van Openai, die relatief eenvoudig te implementeren is.

De release van Deepseek benadrukt de toenemende perceptie van AI als een belangrijk onderdeel van een technologische concurrentie tussen de VS en China. Het feit dat Chinese bedrijven beweren superieure AI -modellen te bouwen tegen een lagere kosten, biedt ons concurrenten reden om hun strategie zorgvuldig te evalueren voor het handhaven van leiderschap in het veld.

Uitgelichte afbeeldingskrediet