In machine learning zijn er maar weinig ideeën erin geslaagd om complexiteit te verenigen zoals het periodieke tabel ooit deed voor chemie. Nu, Onderzoekers van MIT, Microsoft en Google proberen dat precies te doen met i-con of informatiecontrastief leren. Het idee is bedrieglijk eenvoudig: vertegenwoordigen de meeste machine learning -algoritmen – classificatie, regressie, clustering en zelfs grote taalmodellen – als speciale gevallen van één algemeen principe: de relaties tussen gegevenspunten leren.
Net zoals chemische elementen in voorspelbare groepen vallen, beweren de onderzoekers dat machine learning -algoritmen ook een patroon vormen. Door die patronen in kaart te brengen, verduidelijkt I-CON niet alleen oude methoden. Het voorspelt nieuwe. Een dergelijke voorspelling? Een state-of-the-art beeldclassificatie-algoritme dat nul menselijke labels vereist.
Stel je een balzaaldiner voor. Elke gast (gegevenspunt) vindt een stoel (cluster) idealiter nabij vrienden (vergelijkbare gegevens). Sommige vrienden zitten samen, anderen verspreiden zich over tafels. Deze metafoor, het clustering Gala genoemd, legt vast hoe I-Con clustering behandelt: optimaliseren hoe nauwlettend datapuntengroep op basis van inherente relaties. Het gaat niet alleen om wie naast wie is, maar welke soorten obligaties ertoe doen; Of het nu visuele gelijkenis, gedeelde klassenlabels of grafiekverbindingen is.
Deze analogie van de balzaal strekt zich uit tot alle machine learning. Het I-CON-raamwerk laat zien dat algoritmen vooral verschillen in hoe ze die relaties definiëren. Wijzig de gastenlijst of stoelenlogica en u krijgt dimensionaliteitsvermindering, zelf-supervised leren of spectrale clustering. Het komt allemaal neer op het behoud van bepaalde relaties, terwijl het anderen vereenvoudigt.
De architectuur achter i-con
In de kern is I-CON gebouwd op een informatietheoretische basis. Het doel: minimaliseer het verschil (KL -divergentie) tussen een doelverdeling, wat het algoritme vindt dat relaties moeten zijn, en een geleerde verdeling, de werkelijke modeloutput. Formeel wordt dit geschreven als:
L (θ, ϕ) = ∑ dKL(pθ (· | i) || qϕ (· | i))
Verschillende leertechnieken komen voort uit hoe de twee distributies, Pθ en Qϕ, zijn geconstrueerd. Wanneer pθ afbeeldingen groepeert door visuele nabijheid en Qϕ groeit ze door labelovereenkomst, is het resultaat begeleid classificatie. Wanneer Pθ afhankelijk is van de grafiekstructuur en QZ een door clusters benadert, krijgen we spectrale clustering. Zelfs taalmodellering past in en behandelt co-optreden van token als een relatie die moet worden bewaard.
De tafel die alles organiseert
Geïnspireerd door het periodieke tabel van de chemie, bouwde het I-CON-team een rastercategoriserende algoritmen op basis van hun verbindingstypen. Elk vierkant in de tabel vertegenwoordigt een unieke manier waarop gegevenspunten betrekking hebben in de invoer versus uitvoerruimte. Zodra alle bekende technieken waren geplaatst, bleven er verrassende gaten over. Deze hiaten wezen niet op ontbrekende gegevens – ze lieten doorschemeren op methoden die konden bestaan, maar nog niet waren ontdekt.
Om dit te testen, vulden de onderzoekers een dergelijke leemte op door clustering te combineren met debaseerd contrastief leren. Het resultaat: een nieuwe methode die overstuurde niet -gecontroleerde beeldclassificaties op ImageNet met 8%overtroffen. Het werkte door een kleine hoeveelheid ruis te injecteren – “universele vriendschap” tussen gegevenspunten – waardoor het clusteringsproces stabieler en minder bevooroordeeld werd voor overdreven opdrachten.
Debiasing speelt een centrale rol in deze ontdekking. Traditioneel contrastief leren bestraft te hard verschillend, zelfs wanneer die monsters misschien niet echt niet gerelateerd zijn. I-CON introduceert een betere aanpak: het mengen in een uniforme verdeling die overdreven rigide veronderstellingen over gegevensafscheidingen verzacht. Het is een conceptueel schone tweak met meetbare winst in prestaties.
Een andere methode omvat het uitbreiden van de definitie van de buurt zelf. In plaats van alleen te kijken naar directe dichtstbijzijnde buren, verspreidt I-CON zich door de buurtgrafiek-met “wandelingen” om meer wereldwijde structuur vast te leggen. Deze wandelingen simuleren hoe informatie zich over knooppunten verspreidt en het clusteringproces verbetert. Tests op Dino Vision Transformers bevestigen dat kleinschalige verspreiding (looplengte van 1 of 2) de meeste winst oplevert zonder het model te overweldigen.
Onderzoek: Google’s AI eet uw klikken op
Prestaties en uitbetaling
Het I-CON-raamwerk is niet alleen theorie. Op ImageNet-1K versloeg het eerdere state-of-the-art clusteringsmodellen zoals Temi en Scan met behulp van eenvoudigere, zelfveranderend verliesfuncties. In tegenstelling tot zijn voorgangers heeft I-CON geen handmatig afgestemde boetes of maatbeperkingen nodig. Het werkt gewoon-Across Dino Vit-S, VIT-B en VIT-L-backbones.
Debiased Infonce Clustering (I-CON) Verbeterde Hongaarse nauwkeurigheid door:
- +4,5% op VIT-B/14
- +7,8% op Vit-L/14
Het presteerde ook beter dan K-middelen, contrastieve clustering en scannen consequent. De sleutel ligt in zijn schone eenwording van methoden en aanpassingsvermogen – clusterkansen, buurgrafieken, klassenlabels, vallen allemaal onder één paraplu.
I-con is niet alleen een unifier; Het is een blauwdruk voor uitvinding. Door aan te tonen dat veel algoritmen gewoon verschillende manieren zijn om buurtdistributies te kiezen, stelt het onderzoekers in staat nieuwe combinaties uit te vinden. Verwissel het ene verbindingstype voor het andere. Mix in debiasing. Stem de diepte van de buurt af. Elke tweak komt overeen met een nieuwe invoer in de tabel – een nieuw algoritme dat klaar is om te worden getest.
Zoals MIT’s Shaden Alshammari het uitdrukte, begint machine learning minder te aanvoelen als een kunst van giswerk en meer als een gestructureerde ontwerpruimte. I-con verandert leren in verkenning-minder alchemie, meer engineering.
Wat ik echt biedt, is een diepere filosofie van machine learning. Het onthult dat onder de enorme diversiteit van modellen en methoden een gemeenschappelijke structuur kan bestaan - een die niet is gebouwd op rigide formules, maar op relationele logica. In die zin lost i-CON geen intelligentie op. Het brengt het in kaart. En net als het eerste periodieke tafel, geeft het ons een glimp van wat nog wacht om ontdekt te worden.