Openai heeft ingevoerd Een nieuwe kunstmatige intelligentietool genaamd Deep Research dat uitgebreid online onderzoek voor gebruikers uitvoert, die taken aanpakt, variërend van complexe wetenschappelijke vragen tot gepersonaliseerde productaanbevelingen. De service is beschikbaar voor het betalen van klanten via de chatgpt -chatbot van Openai.
Wat is diep onderzoek?
Diep onderzoek kan uitgebreide rapporten genereren in slechts vijf tot 30 minuten, een taak die gebruikers doorgaans “vele uren” neemt, aldus Openai. De tool analyseert een verscheidenheid aan bronnen, waaronder tekst, afbeeldingen, PDF’s en door de gebruiker gearmeerde bestanden, om informatie te synthetiseren die vergelijkbaar is met een onderzoeksanalist. Kevin Weil, de hoofdproductofficier van Openai, benadrukte zijn vermogen om complexe taken uit te voeren, waarbij ze de prestaties van een mens van een menselijke onderzoeker vergelijken.
Openai lanceert O3-mini, nog steeds duurder dan Deepseek R1
Deze lancering volgt op de introductie van Openai van een andere AI -agent genaamd Operator, die helpt bij taken zoals het boeken van vluchten en het beheren van supermarkten. Beide services zijn exclusief beschikbaar voor gebruikers die zijn geabonneerd op het Chatgpt Pro-plan van $ 200 per maand, wat een strategische focus op betaalde abonnementdiensten aangeeft om deze geavanceerde functies te financieren.
Model | Nauwkeurigheid (%) |
---|---|
GPT-4O | 3.3 |
GROK-2 | 3.8 |
Claude 3.5 Sonnet | 4.3 |
Gemini -denken | 6.2 |
Openai O1 | 9.1 |
Deepseek-R1* | 9.4 |
Openai o3-mini (medium)* | 10.5 |
Openai o3-mini (hoog)* | 13.0 |
Openai diep onderzoek ** | 26.6 |
De tool is een voorbeeld van een bredere trend in de AI-industrie voor het ontwikkelen van agenten die in staat zijn om meerdere stappentaken uit te voeren met minimaal toezicht. Concurrenten, waaronder Microsoft Corp. en Anthropic, onderzoeken ook vergelijkbare technologieën in de hoop de productiviteit te verbeteren in zowel persoonlijke als professionele taken.
Openai CEO Sam Altman heeft aangegeven dat de ontwikkeling van dergelijke agenten een aanzienlijke doorbraak in kunstmatige intelligentie kan zijn. De urgentie van deze vooruitgang wordt onderstreept door de concurrentie van Chinese AI -bedrijven zoals Deepseek te vergroten, die snel vooruitgaan in de sector.
Ondanks zijn mogelijkheden heeft Openai gewaarschuwd voor potentiële beperkingen in verband met diep onderzoek. De tool kan gefabriceerde informatie produceren en verwart vaak geloofwaardige bronnen met geruchten. Gebruikers kunnen beperkingen tegenkomen, zoals het onvermogen om tijdens de eerste uitrol meer dan 100 vragen per maand in te dienen.
De lancering van diep onderzoek werd aangetoond tijdens een evenement in Washington, waar het met succes informatie heeft samengesteld over Albert Einstein, inclusief het genereren van relevante vragen voor hypothetische congreshoorzittingen. De rapporten die door diep onderzoek worden geproduceerd, omvatten ook citaten, hoewel onnauwkeurigheden kunnen voortkomen uit een fenomeen dat bekend staat als “hallucinatie” in AI.
Gaia | Niveau 1 | Niveau 2 | Niveau 3 | AVG. |
---|---|---|---|---|
Vorige sota | 67.92 | 67.44 | 42.31 | 63.64 |
Diep onderzoek (pass@1) | 74.29 | 69.06 | 47.60 | 67.36 |
Diep onderzoek (Cons@64) | 78.66 | 73.21 | 58.03 | 72.57 |
Openai is van plan om in de toekomst de toegang tot diep onderzoek breder uit te breiden en zich te richten op gebruikers die zijn geabonneerd op de Plus-, Team- en Enterprise -plannen. De tool maakt gebruik van een versie van de nieuwste redeneringstechnologie van het bedrijf, OpenAI O3, die specifiek is geoptimaliseerd voor het browsen van web en gegevensanalyse.
De training van Deep Research omvatte real-world taken die zowel browsen- als redeneermogelijkheden vereisen. Het maakt ook gebruik van versterkingsleertechnieken, waardoor het vermogen om informatie effectief te navigeren en te synthetiseren. Recente evaluaties hebben aangetoond dat het model een ongekende nauwkeurigheid bereikt in complexe onderzoekstaken.
OpenAI heeft gemeld dat, in een evaluatie genaamd Humanity’s Last Examen, het model dat diep onderzoek stroomde, 26,6% nauwkeurigheid scoorde, een opmerkelijke prestatie voor AI-systemen die vragen op expertniveau aanpakken bij verschillende onderwerpen. Bovendien overtrof op de GAIA-openbare benchmark de tool eerdere prestatie-records door mogelijkheden aan te tonen die redeneren en multimodale vloeiendheid vereisen.
Hoewel de tool momenteel zeer rekenintensief is, anticipeert OpenAI op verbeteringen om het in de loop van de tijd efficiënter en gebruiksvriendelijker te maken, met plannen voor toekomstige iteraties die de functies en toegankelijkheid ervan kunnen verbeteren.
Diep onderzoek kwam op zondag beschikbaar voor chatgpt -gebruikers, met toekomstige verbeteringen die naar verwachting op mobiele en desktopplatforms zouden worden uitgerold. OpenAI stelt voor dat de mogelijkheden van de tool uitbreiden om toegang tot meer gespecialiseerde gegevensbronnen op te nemen, waardoor de context en personalisatie van de uitgangen worden verrijkt.
Deepseek R1 versus O3-mini in prestaties, kosten en bruikbaarheid confrontatie
Is chatgpt diep onderzoek het waard?
Ja, als:
- Je hebt snel, uitgebreid onderzoek nodig: Diep onderzoek kan gedetailleerde rapporten genereren in 5 tot 30 minuten, waardoor u uren handmatig werk bespaart. Als u vaak snelle, goed gesynthetiseerde informatie nodig heeft, is deze tool een game-wisselaar.
- U behandelt complexe taken: De tool is ontworpen om multi-stappen taken uit te voeren, waardoor het ideaal is voor professionals die gegevens moeten analyseren, rapporten moeten verzamelen of diepgaand onderzoek moeten doen in verschillende domeinen.
- Je bent een chatgpt pro -abonnee: Als u al betaalt voor het Chatgpt Pro-plan van $ 200 per maand, hebt u toegang tot diep onderzoek en andere geavanceerde functies zoals Operator, waardoor het een waardevolle toevoeging aan uw toolkit is.
- U waardeert AI-gedreven productiviteit: Als u AI wilt benutten om de productiviteit in zowel persoonlijke als professionele omgevingen te verbeteren, past diep onderzoek af van de bredere trend van AI -agenten die complexe taken uitvoeren met minimaal toezicht.
- Je bent op een competitief gebied: Met concurrenten zoals Microsoft en Anthropic die soortgelijke tools ontwikkelen, kan het voorblijven van de curve met behulp van geavanceerde AI -onderzoekstools u een voorsprong geven.
Nee, als:
- Je hebt een krap budget: Voor $ 200 per maand is het Chatgpt Pro -plan een belangrijke investering. Als u niet regelmatig geavanceerde AI -tools nodig hebt, kunnen de kosten de voordelen niet rechtvaardigen.
- Je maakt je zorgen over de nauwkeurigheid: Diep onderzoek heeft beperkingen, waaronder het potentieel om gefabriceerde informatie te produceren of geloofwaardige bronnen te verwarren met geruchten. Als uw werk 100% nauwkeurigheid vereist, is deze tool mogelijk niet betrouwbaar genoeg.
- U overschrijdt de querylimieten: Tijdens de eerste uitrol zijn gebruikers beperkt tot 100 vragen per maand. Als uw onderzoek deze limiet moet overschrijden, kunt u de tool beperkend vinden.
- U geeft de voorkeur aan handmatig onderzoek: Als u geniet of hands-on controle over uw onderzoeksproces nodig heeft, kan het vertrouwen op een AI-tool niet in overeenstemming zijn met uw workflow of voorkeuren.
- U hebt geen geavanceerde functies nodig: Als uw onderzoeksbehoeften eenvoudig of zeldzaam zijn, kunnen de geavanceerde mogelijkheden van diep onderzoek overdreven zijn en kunt u uw doelen bereiken met meer basistools.
Uitgelichte afbeeldingskrediet: Openai