Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
No Result
View All Result

Denkmachines lab onthult onderzoek naar het elimineren van willekeur in AI -modelreacties

byKerem Gülen
11 september 2025
in Kunstmatige Intelligentie
Home Nieuws Kunstmatige Intelligentie
Share on FacebookShare on Twitter
Google Preferred Source

Denkmachines lab, ondersteund door $ 2 miljard aan zaadfinanciering en bemand bij voormalige Openai -onderzoekers, heeft zijn eerste gedetailleerde onderzoeksinzichten gedeeld. Het lab heeft woensdag een blogpost uitgebracht waarin wordt onderzocht hoe AI -modellen kunnen worden gemaakt die meer consistente en reproduceerbare reacties produceren en een fundamentele uitdaging aangaan in de ontwikkeling van kunstmatige intelligentie.

AI Model Consistentieonderzoek richt zich op niet -determinisme in grote taalmodellen

Het blogbericht, getiteld “Het verslaan van niet -determinisme bij LLM -inferentie“onderzoekt waarom AI -modellen vaak verschillende antwoorden op identieke vragen genereren. Hoewel deze variabiliteit is geaccepteerd als een inherent kenmerk van grote taalmodellen, beschouwt het laboratorium van de denkmachines dit niet -determinisme als een oplosbaar probleem in plaats van een onvermijdelijke beperking.

GPU -kernelorkestratie veroorzaakt willekeur

Onderzoeker Horace schreef hij de functie en beweerde dat willekeur in AI -modellen voortkomt uit hoe GPU -kernels worden georkestreerd tijdens het verwerking van inferenties. Inferentieverwerking verwijst naar de rekenstappen die plaatsvinden nadat gebruikers vragen hebben ingediend, zoals op enter drukken in chatgpt. GPU -kernels zijn gespecialiseerde programma’s die worden uitgevoerd op NVIDIA -computerchips. Hij gelooft dat een zorgvuldige beheer van deze orkestratielaag AI -modellen in staat kan stellen om meer voorspelbare en consistente output te genereren.

Consistente reacties verbeteren de training voor het leren van versterkingen

Naast het verbeteren van de betrouwbaarheid voor ondernemingen en wetenschappelijke toepassingen, suggereert hij dat reproduceerbare reacties de training voor versterking (RL) kunnen stroomlijnen. Versterkingsleerbeloningen AI -modellen voor correcte antwoorden, maar inconsistente antwoorden introduceren ruis in trainingsgegevens. Meer consistente antwoorden zouden het RL -proces kunnen verbeteren, dat aansluit bij de eerdere rapportage van de informatie dat het lab van Thinking Machines van plan is RL te gebruiken om AI -modellen aan te passen aan specifieke zakelijke behoeften.

Eerste productlancering gepland voor de komende maanden

Voormalig Openai Chief Technology Officer Mira Murati kondigde in juli aan dat Thinking Machines Lab binnenkort zijn eerste product zal uitbrengen. Ze gaf aan dat het product “nuttig zal zijn voor onderzoekers en startups die aangepaste modellen ontwikkelen”, hoewel specifieke details en of het de reproduceerbaarheidstechnieken bevat, blijven niet bekendgemaakt.

Open onderzoeksbesteding weerspiegelt de vroege openai -aanpak

Denkmachines Lab Aangekondigde plannen om regelmatig blogberichten, code en onderzoeksuitgangen te publiceren om ‘het publiek ten goede te komen, maar ook onze eigen onderzoekscultuur te verbeteren’. Het recente bericht lanceert een nieuwe serie genaamd “Connectionism”, die deze transparantie -engagement weerspiegelt. Deze aanpak weerspiegelt de vroege open onderzoeksbelofte van Openai, hoewel Openai minder transparant werd naarmate deze groeide. De onderzoeksblog biedt zeldzaam inzicht in de activiteiten van Thinking Machines Lab en geeft aan dat het bedrijf aanzienlijke AI -onderzoeksuitdagingen aanpakt, terwijl hij werkt aan producten die de waardering van $ 12 miljard rechtvaardigen.

Tags: Denkmachines Labkunstmatige intelligentieUitgelaten

Related Posts

Anthropic nodigt nog eens 150 organisaties uit voor Project Glasswing

Anthropic nodigt nog eens 150 organisaties uit voor Project Glasswing

3 juni 2026
Microsoft onthult Project Solara voor een agent-first toekomst

Microsoft onthult Project Solara voor een agent-first toekomst

3 juni 2026
Google gaat websites toestaan ​​zich af te melden voor AI-zoekresultaten

Google gaat websites toestaan ​​zich af te melden voor AI-zoekresultaten

3 juni 2026
OpenAI breidt Codex uit met bedrijfsplug-ins en een nieuwe Site-functie

OpenAI breidt Codex uit met bedrijfsplug-ins en een nieuwe Site-functie

3 juni 2026
Meta-patches AI-fout die overname van Instagram-accounts mogelijk maakte

Meta-patches AI-fout die overname van Instagram-accounts mogelijk maakte

2 juni 2026
Populair Codex-pakket betrapt op het exfiltreren van authenticatiegegevens

Populair Codex-pakket betrapt op het exfiltreren van authenticatiegegevens

2 juni 2026

Recent Posts

  • De opt-outregels voor Google AI-zoekopdrachten zorgen voor de lancering van de Enviromates-browser
  • Sony onthult God of War: Laufey voor PS5
  • Onderzoekers ontdekken een twintigvoudige verbetering in ultrasnelle laserexperimenten
  • Microsoft onthult Surface RTX Spark Dev Box voor AI-workloads
  • Intel’s nieuwe Core Ultra-chips zijn naar verluidt schaars

Recent Comments

Geen reacties om weer te geven.
Dataconomy NL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.