Orakel heeft aangekondigd zijn OCI Zettascale10, een cloudgebaseerd AI-supercomputer het beweert dat het 16 zettaFLOPS aan topprestaties biedt. Het systeem, dat gebruik maakt van 800.000 Nvidia GPU’s, is ontworpen om grootschalige AI-workloads te ondersteunen die zijn ontwikkeld door partners, waaronder OpenAI. Het bedrijf beweert dat het systeem een topprestatie van 16 zettaFLOPS kan behalen, verdeeld over zijn 800.000 Nvidia GPU’s. Dit outputniveau, berekend per GPU, komt overeen met ongeveer 20 petaflops voor elke eenheid. Deze individuele prestatiemaatstaf is vergelijkbaar met de output van de Grace-Blackwell GB300 Ultra-chip, een component die wordt gebruikt in geavanceerde desktopsystemen die speciaal zijn ontworpen voor taken op het gebied van kunstmatige intelligentie. Het totale cijfer positioneert de Zettascale10 als een belangrijke intrede in grootschalige computerinfrastructuur. Oracle heeft het platform geïdentificeerd als de fundamentele infrastructuur voor OpenAI’s Stargate-cluster, dat zich in Abilene, Texas bevindt. Deze faciliteit wordt gebouwd om enkele van de meest veeleisende AI-werklasten te beheren die momenteel voortkomen uit zowel onderzoeksinitiatieven als commerciële toepassingen. Peter Hoeschele, vice-president van Infrastructure and Industrial Compute bij OpenAI, verklaarde: “Het zeer schaalbare, op maat gemaakte RoCE-ontwerp maximaliseert de fabrieksbrede prestaties op gigawatt-schaal, terwijl het grootste deel van de kracht gericht blijft op computing.” Centraal in het Zettascale10-systeem staat de Oracle Acceleron RoCE-netwerkarchitectuur, die is ontworpen om de schaalbaarheid en betrouwbaarheid voor data-zware AI-operaties te verbeteren. Dit ontwerp maakt gebruik van netwerkinterfacekaarten die functioneren als miniatuurschakelaars, waardoor directe verbindingen tussen GPU’s over verschillende geïsoleerde netwerkvlakken worden gecreëerd. Deze configuratie is bedoeld om de latentie in de communicatie tussen GPU’s te verminderen. Het biedt ook redundantie, waardoor computertaken zonder onderbreking kunnen worden verwerkt, zelfs als een van de netwerkpaden een storing ondervindt. De rol van Nvidia in het systeem werd benadrukt door Ian Buck, vice-president van Hyperscale bij het bedrijf. “Met de full-stack AI-infrastructuur van Nvidia biedt OCI Zettascale10 het computerweefsel dat nodig is om state-of-the-art AI-onderzoek te bevorderen en organisaties overal ter wereld te helpen de overstap te maken van experimenten naar geïndustrialiseerde AI”, aldus Buck. Oracle beweert ook dat zijn netwerkstructuur de kosten kan verlagen door de lagen binnen het netwerkweefsel te vereenvoudigen en tegelijkertijd consistente prestaties op alle knooppunten te leveren. Het systeem introduceert Linear-Pluggable en Receiver Optics-technologieën, gericht op het verminderen van zowel het energieverbruik als de koelingsvereisten zonder dat dit ten koste gaat van de bandbreedte. De prestatieclaim van 16 zettaFLOPS van Oracle is niet onafhankelijk geverifieerd. Prestatiestatistieken voor cloudsystemen kunnen verschillen op basis van de methodologie die voor de berekening wordt gebruikt, en het cijfer van het bedrijf kan gebaseerd zijn op theoretische topprestaties in plaats van op aanhoudende operationele tarieven. Omdat de geadverteerde totale output van het systeem gelijk is aan de som van de 800.000 GPU’s die op hun maximale potentieel werken, zal de efficiëntie in de echte wereld aanzienlijk afhangen van factoren als netwerkontwerp en software-optimalisatie. Van analisten wordt verwacht dat ze zullen afwachten of de configuratie prestaties levert die vergelijkbaar zijn met gevestigde AI-clusters van andere grote cloudproviders. Het Zettascale10-systeem is ontworpen om klanten in staat te stellen grote AI-modellen te trainen en te implementeren in de gedistribueerde cloudomgeving van Oracle, inclusief maatregelen voor datasoevereiniteit. Mahesh Thiagarajan, executive vice-president bij Oracle Cloud Infrastructure, merkte op: “Met OCI Zettascale10 combineren we OCI’s Oracle Acceleron RoCE-netwerkarchitectuur met de volgende generatie Nvidia AI-infrastructuur om multi-gigawatt AI-capaciteit op ongeëvenaarde schaal te leveren.” Hij voegde eraan toe dat klanten modellen kunnen bouwen en trainen met minder stroom en kunnen werken met ‘sterke data en AI-soevereiniteit’. Het systeem biedt ook operationele flexibiliteit door middel van onafhankelijk onderhoud op vliegtuigniveau, waardoor updates met minder downtime mogelijk zijn. Waarnemers hebben opgemerkt dat andere grote cloudproviders tegelijkertijd hun eigen grootschalige GPU-clusters bouwen en geavanceerde cloudopslagsystemen ontwikkelen, wat het concurrentievoordeel van Oracle zou kunnen verkleinen. Het Zettascale10-systeem zal volgend jaar worden uitgerold. Het vermogen ervan om te voldoen aan de groeiende vraag naar schaalbare, efficiënte en betrouwbare AI-berekeningen zal na de implementatie ervan worden geëvalueerd.





