Mijn collega Bunyamin Furkan Demirkaya heb een e-mail ontvangen van Stability AI waarin Stable Diffusion 3.5 Medium wordt geïntroduceerd, een open model dat gratis is voor commercieel en niet-commercieel gebruik. Dit model, met 2,5 miljard parameters, is ontworpen om efficiënt te werken op consumentenhardware en biedt bredere toegang tot geavanceerde AI-beeldgeneratie. Laten we eens kijken wat dit nieuwe model te bieden heeft en wat de compatibiliteit ervan is met verschillende GPU’s.
Ontworpen voor consumentenhardware
Stable Diffusion 3.5 Medium is gemaakt met toegankelijkheid in gedachten. In tegenstelling tot veel geavanceerde modellen die gespecialiseerde, kostbare hardware vereisen, kan dit model op de meeste consumenten-GPU’s werken zonder noemenswaardige prestatie-inbreuken. Volgens de e-mail van Stability AI: “Dit model heeft slechts 9,9 GB VRAM nodig (exclusief tekst-encoders) om de volledige prestaties te ontgrendelen”, waardoor het een van de meest toegankelijke opties is voor hobbyisten, makers en kleine startups die niet over het budget beschikken voor high-end GPU’s.
De hardwarecompatibiliteitsgrafiek gedeeld door Stability AI illustreert dit punt duidelijk. GPU’s zoals de NVIDIA RTX 3080 en hoger kunnen bijvoorbeeld Stable Diffusion 3.5 Medium draaien zonder prestatieverlies. Zelfs meer betaalbare GPU’s, zoals de NVIDIA RTX 4060 of RTX 3060, kunnen dit model beheren, zij het met bepaalde optimalisaties zoals kwantisering of sequentiële ontlading.
Een uitgebreide gids voor Flux NF4 in stabiele diffusie
Hardware-compatibiliteit
De grafiek categoriseert verschillende GPU’s op VRAM-capaciteit en geeft inzicht in welke modellen worden ondersteund. Hier is een gedetailleerd overzicht:
- 8 GB VRAM (NVIDIA GeForce RTX 4060): Modellen zoals Stable Diffusion 3.5 Medium kunnen worden uitgevoerd met enkele prestatiecompromissen, aangegeven door een oranje symbool in de grafiek. Optimalisaties zoals kwantisering zijn vereist om het beperkte VRAM effectief te beheren.
- 10 GB VRAM (NVIDIA GeForce RTX 3080): Volledige compatibiliteit zonder compromissen, zoals weergegeven door een groen vinkje. Dit houdt in dat het model soepel draait en het beschikbare VRAM gebruikt om efficiënt beelden van hoge kwaliteit te genereren.
- 12-16 GB VRAM (NVIDIA GeForce RTX 4070, 4060 Ti, 4080, enz.): GPU’s met meer VRAM, zoals de NVIDIA RTX 4070 en AMD Radeon RX 7700 XT, hebben geen problemen met het draaien van Stable Diffusion 3.5 Medium en soortgelijke modellen. Deze GPU’s zijn krachtig genoeg om het model “out of the box” zonder enige aanpassingen te laten werken.
- 20 GB+ VRAM (AMD Radeon RX 7900 XT, NVIDIA GeForce RTX 3090): Grotere modellen, waaronder FLUX.1 en Playground v2.5, kunnen efficiënt worden uitgevoerd op deze GPU’s met een hogere capaciteit. Deze categorie is over het algemeen bedoeld voor ervaren gebruikers of professionals die op zoek zijn naar meer veelzijdigheid in het gebruik van modellen.
- 32 GB of meer (NVIDIA H100): Deze hoogwaardige GPU’s kunnen met gemak alle open-image-basismodellen uitvoeren, waardoor zelfs de grootste modellen zonder beperkingen kunnen functioneren.

Geavanceerde mogelijkheden voor meerdere resoluties
Stability AI beschrijft Stable Diffusion 3.5 Medium als “het leveren van de beste beeldgeneratie in zijn klasse voor zijn formaat.” Dankzij de geavanceerde multi-resolutiemogelijkheden van het model onderscheidt het zich van andere middelgrote modellen. Voor makers betekent dit duidelijkere beelden en een hoog detailniveau, zonder de noodzaak van een krachtig werkstation.
De grafiek voor snelle hechting en esthetische kwaliteit vergelijkt Stable Diffusion 3.5 Medium met verschillende andere modellen en biedt meer perspectief. Met name de Elo-scores voor snelle hechting en esthetische kwaliteit laten zien dat Stable Diffusion 3.5 Medium vergelijkbaar of beter presteert dan de meeste modellen van vergelijkbare grootte.
Prestatievergelijking
De grafiek evalueert meerdere open modellen op snelle therapietrouw en esthetische kwaliteit, met behulp van een Elo-scoresysteem. De volgende inzichten kunnen worden getrokken:
- Stabiele diffusie 3,5 groot (8,1B): Stabiele verspreiding 3,5 Grote rangschikkingen aan de top voor snelle naleving, wat betekent dat het model nauwkeurig de gebruikersinvoer volgt. Dit is van cruciaal belang voor gebruikers die een hoge nauwkeurigheid nastreven bij het genereren van afbeeldingen op basis van aanwijzingen.
- FLUX.1 [dev] (12B): Het model met de hoogste esthetische kwaliteitsbeoordeling. De superieure scores weerspiegelen het vermogen om visueel aantrekkelijke afbeeldingen te produceren die goed aansluiten bij de gebruikersaanwijzingen. Het vereist echter aanzienlijk meer hardwarebronnen dan middelgrote modellen zoals Stable Diffusion 3.5 Medium.
- Stabiele diffusie 3,5 gemiddeld (2,5B): Als efficiënt model met een sterke balans tussen snelle therapietrouw en beeldkwaliteit, biedt het uitstekende resultaten zonder de zware eisen die grotere modellen aan middelen stellen. Dit maakt het ideaal voor gebruikers die beperkte hardware hebben, maar toegang willen tot geavanceerde mogelijkheden voor het genereren van afbeeldingen.
- Speeltuin v2.5 (3.5B) en AuraFlow v0.2 (6.8B): Deze modellen bieden weliswaar behoorlijke prestaties, maar schieten tekort bij Stable Diffusion 3.5 Medium als het gaat om evenwichtige, snelle therapietrouw en kwaliteit. Dit maakt ze minder geschikt als precisie en esthetische kwaliteit voorop staan.

Met 2,5 miljard parameters neemt Stable Diffusion 3.5 Medium een unieke positie in in het AI-modellandschap. De combinatie van hoge prestaties, lagere hardwarevereisten en mogelijkheden voor meerdere resoluties maakt het een aantrekkelijke keuze voor een breed scala aan gebruikers. Stability AI heeft tot doel de toegangsbarrière voor op AI gebaseerde creativiteit te verlagen en richt zich op iedereen, van startups tot gevestigde makers die misschien niet over de infrastructuur beschikken om grote, resource-intensieve modellen in te zetten.
De directe verklaring van het bedrijf luidt: “Of het nu een startup of een maker is, de toegang tot deze technologie mag niet worden beperkt door hardwarebeperkingen.” Dit weerspiegelt de nadruk die Stability AI legt op het democratiseren van AI-tools door de hardware-uitdagingen aan te pakken die traditioneel beperkt toegankelijk zijn.
Wat dit betekent voor makers en startups
Een van de belangrijkste punten waarop Stability AI zich richt, is ervoor zorgen dat de tools beschikbaar zijn voor een zo breed mogelijk publiek. De nadruk op hardware op consumentenniveau weerspiegelt een strategie om een bredere gebruikersbasis aan te boren. Door Stable Diffusion 3.5 Medium geschikt te maken om op betaalbare GPU’s te draaien, pakken ze een aanzienlijk gat in de markt aan: ze overbruggen de kloof tussen ervaren gebruikers en enthousiaste gebruikers.
Een blik op de hardwarecompatibiliteitstabel toont de opzettelijke focus op populaire grafische consumentenkaarten. De NVIDIA RTX 3060, een vrij veel voorkomende GPU onder videomakers, is compatibel, zij het met enkele compromissen. Dit soort veelzijdigheid opent deuren voor gebruikers die voorheen mogelijk geen toegang hadden tot AI-tools vanwege hardwarebeperkingen.
De implicaties van de lancering van dit model zijn aanzienlijk. Voor kleine videomakers en startups zorgt de mogelijkheid om een krachtig model voor het genereren van afbeeldingen te gebruiken zonder hoge hardwarekosten vooraf voor een gelijk speelveld. Concurrenten die beperkt zijn door beperkte middelen hebben nu een haalbaar toegangspunt tot AI-ondersteund creatief werk.
De vergelijking met andere modellen in de grafiek laat zien hoe deze release aanzienlijke waarde biedt. In tegenstelling tot modellen zoals AuraFlow of PixArt-Σ, die uitgebreide hardware vereisen of geen beeldkwaliteit leveren, streeft Stable Diffusion 3.5 Medium naar een balans tussen prestaties en toegankelijkheid.
Beeldkwaliteit, snelle naleving en praktisch gebruik
De prestaties van Stable Diffusion 3.5 Medium strekken zich ook uit tot de kwalitatieve aspecten van het genereren van afbeeldingen. Een goede balans tussen snelle naleving en esthetische kwaliteit is cruciaal in praktische scenario’s, vooral voor gebruikers die illustraties moeten maken of inhoud moeten genereren op basis van specifieke, gedetailleerde input.
De door Stability AI gedeelde Elo-scoregrafiek laat zien dat het middelgrote model goed kan concurreren met grotere tegenhangers, terwijl het minder middelen nodig heeft. Het komt bijvoorbeeld bijna overeen met de SD 3.5 Large Turbo (8.1B) wat betreft snelle naleving en esthetische kwaliteit, maar kan toch worden ingezet op minder krachtige GPU’s.
Hoe u Stabiele Diffusie 3.5 Medium kunt proberen
Voor gebruikers die dit model willen testen, biedt Stability AI een eenvoudig traject. De gewichten zijn beschikbaar om te downloaden op Knuffelend gezichten de gevolgtrekkingscode is te vinden op GitHub. Deze directe toegang zorgt ervoor dat ontwikkelaars en makers Stable Diffusion 3.5 Medium gemakkelijk kunnen gaan gebruiken, het kunnen integreren in bestaande workflows of helemaal nieuwe projecten kunnen bouwen.
Naast het kernmodel zijn de volledige details ook beschikbaar op de blog van Stability AI, die inzicht bieden in de onderliggende technologie en verdere richtlijnen voor het optimaal benutten van de functies ervan.
Uitgelichte afbeeldingscredits: Kerem Gülen/Ideogram