Denkmachines lab onthult onderzoek naar het elimineren van willekeur in AI -modelreacties

Denkmachines lab, ondersteund door $ 2 miljard aan zaadfinanciering en bemand bij voormalige Openai -onderzoekers, heeft zijn eerste gedetailleerde onderzoeksinzichten gedeeld. Het lab heeft woensdag een blogpost uitgebracht waarin wordt onderzocht hoe AI -modellen kunnen worden gemaakt die meer consistente en reproduceerbare reacties produceren en een fundamentele uitdaging aangaan in de ontwikkeling van kunstmatige intelligentie.

AI Model Consistentieonderzoek richt zich op niet -determinisme in grote taalmodellen

Het blogbericht, getiteld “Het verslaan van niet -determinisme bij LLM -inferentie“onderzoekt waarom AI -modellen vaak verschillende antwoorden op identieke vragen genereren. Hoewel deze variabiliteit is geaccepteerd als een inherent kenmerk van grote taalmodellen, beschouwt het laboratorium van de denkmachines dit niet -determinisme als een oplosbaar probleem in plaats van een onvermijdelijke beperking.

GPU -kernelorkestratie veroorzaakt willekeur

Onderzoeker Horace schreef hij de functie en beweerde dat willekeur in AI -modellen voortkomt uit hoe GPU -kernels worden georkestreerd tijdens het verwerking van inferenties. Inferentieverwerking verwijst naar de rekenstappen die plaatsvinden nadat gebruikers vragen hebben ingediend, zoals op enter drukken in chatgpt. GPU -kernels zijn gespecialiseerde programma’s die worden uitgevoerd op NVIDIA -computerchips. Hij gelooft dat een zorgvuldige beheer van deze orkestratielaag AI -modellen in staat kan stellen om meer voorspelbare en consistente output te genereren.

Consistente reacties verbeteren de training voor het leren van versterkingen

Naast het verbeteren van de betrouwbaarheid voor ondernemingen en wetenschappelijke toepassingen, suggereert hij dat reproduceerbare reacties de training voor versterking (RL) kunnen stroomlijnen. Versterkingsleerbeloningen AI -modellen voor correcte antwoorden, maar inconsistente antwoorden introduceren ruis in trainingsgegevens. Meer consistente antwoorden zouden het RL -proces kunnen verbeteren, dat aansluit bij de eerdere rapportage van de informatie dat het lab van Thinking Machines van plan is RL te gebruiken om AI -modellen aan te passen aan specifieke zakelijke behoeften.

Eerste productlancering gepland voor de komende maanden

Voormalig Openai Chief Technology Officer Mira Murati kondigde in juli aan dat Thinking Machines Lab binnenkort zijn eerste product zal uitbrengen. Ze gaf aan dat het product “nuttig zal zijn voor onderzoekers en startups die aangepaste modellen ontwikkelen”, hoewel specifieke details en of het de reproduceerbaarheidstechnieken bevat, blijven niet bekendgemaakt.

Open onderzoeksbesteding weerspiegelt de vroege openai -aanpak

Denkmachines Lab Aangekondigde plannen om regelmatig blogberichten, code en onderzoeksuitgangen te publiceren om ‘het publiek ten goede te komen, maar ook onze eigen onderzoekscultuur te verbeteren’. Het recente bericht lanceert een nieuwe serie genaamd “Connectionism”, die deze transparantie -engagement weerspiegelt. Deze aanpak weerspiegelt de vroege open onderzoeksbelofte van Openai, hoewel Openai minder transparant werd naarmate deze groeide. De onderzoeksblog biedt zeldzaam inzicht in de activiteiten van Thinking Machines Lab en geeft aan dat het bedrijf aanzienlijke AI -onderzoeksuitdagingen aanpakt, terwijl hij werkt aan producten die de waardering van $ 12 miljard rechtvaardigen.

Denkmachines lab onthult onderzoek naar het elimineren van willekeur in AI -modelreacties

Related Posts

TikTok test AI-tool om deepfake-nabootsing te detecteren

Alibaba onthult Qwen3.8 AI-model met 2.4T-parameters

Google hernoemt NotebookLM naar Gemini Notebook

Suno brengt AI-muziekgeneratie naar iMessage

Netflix heeft dit jaar AI in bijna 300 titels gebruikt

Roblox brengt het maken van AI-games naar mobiele apparaten

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Denkmachines lab onthult onderzoek naar het elimineren van willekeur in AI -modelreacties

AI Model Consistentieonderzoek richt zich op niet -determinisme in grote taalmodellen

GPU -kernelorkestratie veroorzaakt willekeur

Consistente reacties verbeteren de training voor het leren van versterkingen

Eerste productlancering gepland voor de komende maanden

Open onderzoeksbesteding weerspiegelt de vroege openai -aanpak

Related Posts

TikTok test AI-tool om deepfake-nabootsing te detecteren

Alibaba onthult Qwen3.8 AI-model met 2.4T-parameters

Google hernoemt NotebookLM naar Gemini Notebook

Suno brengt AI-muziekgeneratie naar iMessage

Netflix heeft dit jaar AI in bijna 300 titels gebruikt

Roblox brengt het maken van AI-games naar mobiele apparaten

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us