Nvidia’s Blackwell GPU’s worden geconfronteerd met oververhittingsproblemen die gevolgen hebben voor grote technologieklanten. De processors van de volgende generatie hebben moeite om effectief te presteren in serverracks met 72 GPU’s, wat zorgen baart bij bedrijven als Google, Meta en Microsoft over tijdige implementatie. Uit rapporten blijkt dat Nvidia zijn rackontwerpen meerdere keren opnieuw evalueert vanwege deze oververhittingsproblemen, die het risico met zich meebrengen dat componenten worden beschadigd en de GPU-prestaties worden beperkt. Het verwachte stroomverbruik voor deze configuraties bedraagt maximaal 120 kW per rack.
Insiders geïnformeerd De informatie dat Nvidia’s Blackwell GPU’s voor AI en high-performance computing (HPC) oververhit zijn geraakt op servers met hoge capaciteit, wat de lanceringstijdlijnen beïnvloedt voor klanten die op deze technologieën vertrouwen. In een poging de complicaties als gevolg van deze oververhittingsproblemen aan te pakken, heeft Nvidia haar leveranciers herhaaldelijk gevraagd de rackontwerpen aan te passen. Een woordvoerder van Nvidia benadrukte hun gezamenlijke aanpak met clouddiensten en beschreef de ontwerpwijzigingen als een routinematig onderdeel van het ontwikkelingsproces.
Aanpassingen in het ontwerp om problemen met oververhitting tegen te gaan
Voorheen werden vertragingen bij de productie in Blackwell toegeschreven aan een “opbrengst-dodende” ontwerpfout. De Blackwell B100- en B200-GPU’s maak gebruik van TSMC’s CoWoS-L-verpakkingstechnologie, die twee chiplets integreert voor verbeterde gegevensoverdrachtsnelheden tot 10 TB/s. Een discrepantie in de thermische uitzettingskarakteristieken van de GPU-chiplets en andere componenten leidde echter tot kromtrekken en systeemfouten. Om dit op te lossen heeft Nvidia wijzigingen aangebracht in de metaallagen en bultstructuren van het GPU-silicium.
Het resultaat van deze verbeteringen kwam pas eind oktober in massaproductie, waarbij de verwachte verzenddata werden uitgesteld tot eind januari. Deze vertraging is van cruciaal belang voor klanten van Nvidia Googlen, MetaEn Microsoftdie afhankelijk zijn van deze GPU’s om hun krachtigste AI-modellen te verbeteren. Nvidia prees de Blackwell-chips eerder aan als 30 keer sneller voor taken zoals het reageren op vragen van chatbots in vergelijking met eerdere modellen.
De omzet uit Blackwell-chips van Nvidia zou in het volgende kwartaal naar verwachting 6 miljard dollar bedragen, wat de grote vraag onderstreept ondanks de aanhoudende aanbodbeperkingen. Nvidia, dat onlangs Apple voorbijstreefde, is nu het meest waardevolle bedrijf ter wereld, met een marktkapitalisatie die stijgt naar $3,482 biljoen. De voortdurende tegenslagen met betrekking tot de Blackwell-processors dreigen echter de geplande vooruitgang in AI-mogelijkheden te verstoren die essentieel zijn voor grote technologiespelers.
Uitgelichte afbeeldingscredits: Nvidia