In het dynamische landschap van kunstmatige intelligentie is het streven naar naadloze integratie tussen mens en technologie een van de belangrijkste doelstellingen. De ambitie is om interacties zo natuurlijk te maken dat het gebruik van geavanceerde technologieën een tweede natuur wordt. Om te ontdekken waar de industrie naartoe gaat, sprak ik met een van de sprekers op onze Epic AI Dev Summit, Of Gorodissky, de vice-president van Onderzoek en Ontwikkeling bij het bedrijf D-ID, mede-organisator van de top. Of is expert in Natural User Interface (NUI) technologieën en ontwikkelt sinds 2018 Generatieve AI bij D-ID.
Alex: Wat is de kernvisie achter de ontwikkeling van Natural User Interface (NUI), en hoe draagt deze bij aan het bredere landschap van AI-agenten?
Of: De visie achter de ontwikkeling van de Natural User Interface (NUI) is om een revolutie teweeg te brengen in de manier waarop mensen omgaan met technologie. NUI vertegenwoordigt een aanzienlijke sprong ten opzichte van de vorige interfaces, met name GUI (Graphical User Interface), waarbij de nadruk wordt gelegd op natuurlijke, face-to-face gesprekken met digitale entiteiten. Ons doel is om de muis en het toetsenbord af te schaffen en te vervangen door een interface waarmee u rechtstreeks en face-to-face met uw apparaten kunt ‘spreken’, zoals u dat met een ander mens zou doen. Deze aanpak humaniseert digitale interacties, waardoor ze toegankelijker, intuïtiever en inclusiever worden. Het overbrugt effectief de kloof tussen de menselijke en de digitale wereld, waardoor de betrokkenheid en tevredenheid van gebruikers in een breed scala van bedrijfssectoren wordt vergroot.
Alex: Over welke toekomstige ontwikkelingen op het gebied van AI en videogeneratie bent u het meest enthousiast, en hoe verwacht u dat de industrie zich op deze komende veranderingen zal voorbereiden?Of: de meest opwindende toekomstige ontwikkelingen op het gebied van AI en videogeneratie hebben betrekking op het creëren van meer meeslepende, menselijke en boeiende interfaces. Met technologieën als de Persona-avatar van Apple in VisionPro, de real-time interactieve Agents van D-ID en de tekst-naar-video-generator van Runway evolueert de industrie naar een meer interactieve en levensechte manier van communiceren. Deze evolutie zal er waarschijnlijk voor zorgen dat alle bedrijven deze generatieve AI-producten gaan inzetten om de klantinteractie te verbeteren. Ik denk dat de voorbereiding op deze veranderingen inhoudt dat we op de hoogte blijven van de technologische ontwikkelingen, investeren in R&D en ervoor zorgen dat deze nieuwe tools toegankelijk en aanpasbaar zijn aan meerdere zakelijke behoeften.
Alex: Wat zijn de obstakels waarmee we te maken krijgen bij het creëren van door AI gegenereerde video-inhoud en welke mogelijke oplossingen kunnen universeel worden toegepast?
Of: het maken van video’s van hoge kwaliteit met behulp van AI wordt nog steeds als een moeilijke taak beschouwd. Niet alle problemen zijn opgelost en het ontwikkelen van oplossingen kan enige tijd duren. Veel bedrijven worstelen met het produceren van video’s die niet alleen temporeel consistent zijn en een hoge resolutie hebben, maar ook zijn gemaakt met een lage latentie of hoge doorvoer, terwijl ze de rekenkosten onder controle houden.
Het is een uitdaging om een bedrijf zo te sturen dat ervoor wordt gezorgd dat technische en productroadmaps zowel innoveren als impactvolle producten opleveren. Om dit te ondervangen, richten we ons op cycli van innovatie en verbetering, waarbij we prioriteit geven aan impactvolle inspanningen en strategisch bouwen aan toekomstige capaciteiten. Door de nadruk te leggen op een gebruikersgericht ontwerp en gebruik te maken van bestaande oplossingen voor niet-kernaspecten, wordt het proces gestroomlijnd.
Alex: Het integreren van AI-technologieën in bestaande systemen en platforms is vaak complex. Hoe integreert de technologie van D-ID met bestaande systemen en platforms, en wat zijn de uitdagingen bij deze integraties?
Of: de technologie van D-ID integreert met bestaande systemen en platforms via de geavanceerde API, ontworpen om flexibel en gebruiksvriendelijk te zijn. Deze API maakt een naadloze integratie van onze AI-mogelijkheden mogelijk, waardoor bedrijven hun AI-ervaringen kunnen personaliseren en afstemmen op specifieke behoeften en doelgroepen. De belangrijkste uitdaging bij deze integraties is volgens ons het garanderen van compatibiliteit en het behouden van de balans tussen technologische verfijning en gebruikerservaring. Onze aanpak is erop gericht deze integraties zo intuïtief en eenvoudig mogelijk te maken, door tools en oplossingen te bieden die onze mogelijkheden afstemmen op de unieke vereisten van elke gebruiker.
Alex: Voorop blijven in het snel evoluerende veld van AI is van cruciaal belang. Welke algemene strategieën moeten bedrijven gebruiken om voorop te blijven lopen op het gebied van AI-technologie?
Of: Nou, het is riskant om uitsluitend op technische superioriteit te vertrouwen, aangezien alles wat je bouwt uiteindelijk een handelsartikel zal worden. Het kan enige tijd duren, als u geluk heeft, jaren, maar u zult niet veel slaap krijgen als u elke keer dat er een nieuw onderzoeksartikel verschijnt, uw bedrijfsstrategie in twijfel trekt.
Probeer in plaats daarvan lasergericht en gebruikersgericht te zijn. Verdubbel de dingen die waarde opleveren en maak gebruik van bestaande oplossingen wanneer de waarde de inspanning niet rechtvaardigt. Technologie op zichzelf is geen wondermiddel. Zorg ervoor dat zowel de product- als de zakelijke aspecten voortdurend aan de orde komen, zodat uw inspanningen zo effectief mogelijk zijn.
U wilt dat uw gebruikers bij u blijven, zelfs als de volgende grote open-sourceoplossing uitkomt. Denk daar eens over na als u kiest waar u uw aandacht op wilt richten.
Alex: Ethische overwegingen zijn cruciaal bij de ontwikkeling van AI. Hoe denkt u dat de industrie ethische praktijken moet garanderen bij het creëren en inzetten van AI-technologieën?
Of: Ja, natuurlijk moeten ethische praktijken een constante toetssteen zijn voor AI-ontwikkelaars. Dit betekent dat we ons moeten inzetten voor transparantie, respect voor de privacy en het naleven van ethische normen. Ik ben van mening dat bedrijven nauw moeten samenwerken met privacy-experts en ethici om strikte richtlijnen vast te stellen en te volgen. Regelmatige audits en moderatie, samen met samenwerking met regelgevende instanties, kunnen een verantwoorde AI-ontwikkeling garanderen. Bovendien kan de implementatie van volgsystemen, watermerken en tools voor inhoudsmoderatie misbruik helpen tegengaan. Het is van cruciaal belang dat leiders in de sector het goede voorbeeld geven en een cultuur van ethisch AI-gebruik creëren waarin innovatie in evenwicht wordt gebracht met verantwoordelijkheid en publiek vertrouwen.
Alex: Kun je een gedenkwaardig succesverhaal delen of een bijzonder innovatief gebruiksvoorbeeld van de technologie van D-ID in actie?
Radio Fórmula, een gerenommeerde media-entiteit in het Mexicaanse Grupo Fórmula-netwerk, maakte gebruik van de technologie van D-ID om door AI gegenereerde nieuwslezers te creëren, wat een revolutie teweegbracht in hun aanpak van nieuwsuitzendingen. Deze samenwerking leidde tot een opmerkelijke toename van de betrokkenheid van een jonger publiek, wat de impactvolle samensmelting van traditionele media met geavanceerde AI-technologie aantoonde. Voor een gedetailleerde verkenning van deze innovatieve onderneming kunt u de volledige casestudy lezen op de website van D-ID: Casestudy Radioformule en D-ID.
Op 30 januari 2024 zal Or meer van zijn inzichten over NUI delen op onze Epic AI Dev Summit, waar hij zijn lezing “Crafting AI agents with a natural user interface” presenteert. Volledige agenda en inschrijving hier!