OpenAI heeft gelanceerd real-time videomogelijkheden in ChatGPT, waardoor de geavanceerde spraakmodus wordt verbeterd met visueel begrip. Deze functie, die op 12 december werd uitgerold, stelt gebruikers in staat via hun camera met de AI te communiceren en contextuele hulp te krijgen. De integratie betekent een opmerkelijke vooruitgang in de gespreksmogelijkheden van de AI, vooral voor degenen die zich abonneren op ChatGPT Plus, Team of Pro.
OpenAI verbetert ChatGPT met realtime videomogelijkheden
De Advanced Voice Mode omvat nu real-time videoanalyse en functionaliteit voor het delen van schermen. Gebruikers kunnen hun telefoon op objecten richten voor onmiddellijke reacties of hun scherm delen voor gedetailleerde uitleg van instellingen of problemen. Deze toevoeging bouwt voort op eerdere mogelijkheden, waardoor een meer interactieve gebruikerservaring mogelijk wordt. OpenAI demonstreerde de functie tijdens een livestream, waarbij het vermogen werd getoond om informele gesprekken aan te gaan en inzichten te bieden op basis van visuele input.
Wat de beschikbaarheid betreft, begon de uitrol op 12 december en zal zich de komende week uitstrekken. Europese gebruikers en ChatGPT Enterprise- en Edu-abonnees kunnen echter met vertragingen te maken krijgen; deze gebruikers krijgen begin volgend jaar toegang. Deze uitbreiding geeft aan dat OpenAI zich richt op het verbeteren van de gebruikersinteractie met AI, in lijn met het overkoepelende doel om geavanceerde mogelijkheden te bieden binnen het productpakket.
Integraties met iOS 18.2
In een parallelle ontwikkeling heeft Apple onlangs geïntroduceerd iOS 18.2, dat verschillende ChatGPT-functies bevat voor Siri, schrijfhulpmiddelen en visuele intelligentie. Door de integratie met Siri kan de stemassistent zoekopdrachten herkennen die buiten zijn bereik vallen en deze doorsturen naar ChatGPT. Gebruikers worden hiervan op de hoogte gesteld en moeten deze actie goedkeuren voordat deze doorgaat.
Gebruikers met iPhone 16-apparaten kunnen met Visual Intelligence hun camera op objecten of situaties richten om informatie op te halen via ChatGPT of Google. Bovendien bevat de functie Schrijfhulpmiddelen nu een nieuwe “Compose”-tool, waarmee u vanaf het begin inhoud kunt maken met behulp van de mogelijkheden van ChatGPT. Deze functies, waarbij de nadruk ligt op nut en gebruikerscontrole, zijn zo gestructureerd dat ze aansluiten bij de gebruikslimieten van ChatGPT, waardoor een georganiseerde ervaring wordt gegarandeerd.
Updates van de ’12 dagen OpenAI’
OpenAI heeft een campagne georganiseerd met de naam “12 Days of OpenAI”, die begint op 5 december, met dagelijkse livestreamsessies waarin nieuwe functies of producten worden onthuld. CEO Sam Altman omschreef de campagne als een mix van belangrijke updates en kleine verbeteringen. Een van de opmerkelijke aankondigingen was de introductie van een nieuwe kerstmanstem voor de Advanced Voice Mode, die gebruikers kunnen activeren via een sneeuwvlokpictogram.
Daarnaast de campagne onthuld Sora, het nieuwe videomodel van OpenAI, nu beschikbaar voor ChatGPT Pro en Plus-gebruikers. Dit model kan tekst-naar-video- en video-naar-video-inhoud genereren, waardoor de creatieve mogelijkheden voor gebruikers aanzienlijk worden uitgebreid. Andere opmerkelijke updates waren onder meer de aankondiging van Canvas voor alle webgebruikers, voorheen een bètafunctie, die een meer geïntegreerde projectmanagementervaring mogelijk maakt.
Vooruitkijkend heeft OpenAI plannen om zijn aanbod uit te breiden, inclusief een volledige versie van zijn o1-taalmodel, bedoeld om de redeneermogelijkheden verder te verbeteren. Het bedrijf wil Reinforcement Fine-Tuning breder beschikbaar maken, met toepassingen die momenteel worden gezocht bij onderzoeksinstituten en universiteiten voor het verfijnen van AI-modellen voor specifieke taken.
Uitgelichte afbeeldingscredits: Open AI