Mede-oprichter en CEO van Nvidia, Jensen Huang, onthulde de Vera Rubin AI Superchip op de GPU Technology Conference in Washington, waarmee de overstap van het bedrijf naar AI-hardware werd gemarkeerd te midden van de AI-hausse, waardoor de marktwaarde steeg tot bijna $ 5 biljoen. Het Vera Rubin-platform richt zich op generatieve AI-workloads met hoge intensiteit. Het integreert een enkele Vera CPU uitgerust met 88 aangepaste ARM-kernen die 176 threads ondersteunen. Deze CPU wordt gecombineerd met twee Rubin GPU’s om tot 100 petaFLOPS aan FP4-rekenprestaties te bereiken. Als Nvidia’s derde generatie NVLink 72 rack-scale computer volgt Vera Rubin de GB200- en GB300-modellen op. Het systeem maakt gebruik van vloeistofkoeling en bevat zes biljoen transistors. Het bevat ook 2 TB SOCAMM2-geheugen met lage latentie om veeleisende AI-verwerkingstaken efficiënt af te handelen. In de basisconfiguratie biedt Vera Rubin grofweg 100 keer de ruwe rekenprestaties vergeleken met de op Volta gebaseerde DGX-1. Dat eerdere platform, Nvidia’s initiële deep learning-systeem, leverde 170 teraflops aan FP16-piekprestaties. Deze substantiële stijging onderstreept de evolutie in de rekencapaciteit voor AI-toepassingen door de jaren heen. Nvidia is van plan Vera Rubin in verschillende configuraties uit te brengen om aan diverse behoeften te voldoen. De NVL144-opstelling omvat twee GPU’s ter grootte van een dradenkruis, die tot 3,6 exaflops aan FP4-inferentie en 1,2 exaflops aan FP8-trainingsprestaties mogelijk maken. Voor verbeterde mogelijkheden bereikt de NVL144 CPX-configuratie 8 exaflops, wat neerkomt op 7,5 keer het vermogen van de huidige generatie GB300 NVL72-systemen. Om tegemoet te komen aan de vereisten in hyperscale datacenters voor het verwerken van grotere werklasten in modelcontext, introduceert Nvidia het Rubin Ultra NVL576-systeem. Deze variant maakt gebruik van vier GPU’s ter grootte van een dradenkruis en tot 365 TB supersnel geheugen. Het levert tot 15 exaflops aan FP4-inferentie en 5 exaflops aan FP8-trainingsprestaties, wat neerkomt op een achtvoudige toename ten opzichte van de GB300. Elke Rubin GPU bestaat uit twee rekenchiplets en acht HBM4-geheugenstacks, waardoor de gegevensdoorvoer en de berekening worden geoptimaliseerd. Het GPU-bord is voorzien van vijf NVLink-backplane-connectoren. Twee connectoren aan de bovenkant verbinden de GPU’s met de NVLink-switch voor snelle interconnectiviteit. De drie onderste connectoren beheren de stroomvoorziening, PCIe-interface en CXL-connectiviteit om integratie binnen bredere systemen te ondersteunen. Huang verwacht dat Rubin GPU’s in de tweede helft van 2026 in massaproductie zullen gaan. De lancering van de NVL144-systemen staat gepland voor later in 2026 of begin 2027. Ondertussen zullen de NVL576-systemen naar verwachting in de tweede helft van 2027 beschikbaar komen, in lijn met Nvidia’s routekaart voor het bevorderen van de AI-infrastructuur. https://www.youtube.com/watch?v=lQHK61IDFH4





