Deepseek zal de lancering van zijn nieuwe AI-model, R2, versnellen na het succes van zijn vorige model, R1, dat onlangs een uitverkoop van $ 1 biljoen in wereldwijde aandelenmarkten heeft aangevoerd vanwege zijn concurrentieprestaties tegen westerse tegenhangers.
Deepseek versnelt de lancering van het R2 AI -model na R1 -succes
De op Hangzhou gevestigde startup was oorspronkelijk om begin mei R2 uit te brengen, maar dringt nu aan op een versnelde uitrol, volgens drie bronnen die bekend zijn met het bedrijf. Het nieuwe model zal naar verwachting de coderingsmogelijkheden verbeteren en redeneren ondersteunen in meerdere talen buiten het Engels. Deepseek heeft geen commentaar gegeven op deze ontwikkelingen.
R1, ontwikkeld met minder krachtige NVIDIA -chips, blijft concurrerend met modellen die zijn gemaakt door grote Amerikaanse technologiebedrijven die honderden miljarden hebben geïnvesteerd in AI -technologieën. Vijayasimha Alilughatta, COO van Zensar, verklaarde dat de release van R2 de AI -industrie aanzienlijk zou kunnen beïnvloeden, wat de dominantie van bestaande marktleiders uitdaagt.
Oprichter en operationeel ethos
Liang Wenfeng, oprichter van Deepseek en een miljardair van zijn kwantitatieve hedgefonds high-flyer, heeft sinds juli 2024 een laag profiel gehouden. Voormalige werknemers beschrijven Deepseek als meer als een onderzoekslaboratorium dan een conventionele activiteiten, gekenmerkt door een platte managementstijl die contrasteert met de hiërarchische structuur die veel voorkomt in de technische sector van China.
Liang, die zijn carrière begon in Smart Imaging en later een onderzoeksteam leidde, werd geprezen voor het inhuren van topalgoritme -ingenieurs en het bevorderen van een samenwerkingsomgeving. Medewerkers merkten op dat velen acht uur durende dagen werkten en zich gemachtigd voelen om bij te dragen aan belangrijke projecten. Liang benadrukt de kwaliteit van uitgebreide app -ontwikkeling, nadat hij heeft gereageerd op het vermijden van zware uitgaven voor het verfijnen van AI -modellen.
Compensatie bij Deepseek en High-Flyer is naar verluidt genereus; Senior datawetenschappers bij High Flyer kunnen jaarlijks tot 1,5 miljoen yuan verdienen, aanzienlijk hoger dan concurrenten. High-Flyer zelf wordt erkend als een van de belangrijkste kwantfondsen van China, waardoor tientallen miljarden yuan worden beheerd, ondanks de regelgevingsdruk op de sector.
Deepseek wiegde de markt een keer en hier is waarom het opnieuw zou kunnen gebeuren
Het concurrentievoordeel van Deepseek komt voort uit de belangrijke investeringen van High-Flyer in onderzoeks- en rekenkracht. Het bedrijf heeft 70% van zijn inkomsten toegewezen aan AI -onderzoek en bouwde twee supercomputerende AI -clusters, waaronder een die bestond uit 10.000 NVIDIA A100 -chips in 2020 en 2021. De Chinese overheid bracht in eerste instantie bezorgdheid uit over de massale chip -acquisitie, maar stond uiteindelijk de operaties toe, die later was ingehaald toen de US A100 Chip exports in 2022 had.
Met beperkte concurrentie voor dergelijke middelen heeft Deepseek toonaangevende onderzoekers aangetrokken. De toepassing van kosteneffectieve technieken, zoals mengsel-van-experts (MOE) en multihead latente aandacht (MLA), heeft het bedrijf in staat gesteld de rekenkosten te verlagen en tegelijkertijd concurrerend te blijven. De prijzen van Deepseek worden geschat op 20 tot 40 keer goedkoper dan vergelijkbare modellen van OpenAI, volgens Bernstein -analisten.
Sinds de introductie van R1 hebben westerse technische reuzen hun strategieën aangepast, weerspiegeld in prijsverlagingen van OpenAI en de introductie van kortingsniveaus door Google. Benchmark-testen van UST merkten op dat R1 vaak drie keer de tokens nodig had voor redenering in vergelijking met de verkalde modellen van Openai.
Overheidssteun
Deepseek heeft de gunst gekregen bij de Chinese regering, zoals blijkt uit Liang bij het bijwonen van een spraakmakende ontmoeting met Premier Li Qiang als vertegenwoordiger van de AI-sector. Lokale overheden en verschillende staatsbedrijven zijn begonnen met het integreren van de modellen van Deepseek, wat duidt op een sterke goedkeuring van Chinees leiderschap, dat tot doel heeft superioriteit te tonen over de Amerikaanse technologie.
Deze stijging komt op een moment dat de modellen van Deepseek worden verwijderd van app -winkels in sommige landen, waaronder Zuid -Korea en Italië, vanwege de privacyproblemen. Experts waarschuwen dat als Deepseek het voorkeurs -AI -model wordt voor Chinese staatsentiteiten, westerse toezichthouders kunnen reageren met verhoogde beperkingen op de export en samenwerkingen van AI -technologie.
Liang heeft de uitdagingen van het embargo op geavanceerde AI -chips erkend, en benadrukt dat financiering niet het primaire probleem is geweest voor Deepseek.
Uitgelichte afbeeldingskrediet: Matheus Bertelli/Pexels