Je bent weer in een eindeloze Zoom- of Teams-vergadering. Stemmen die voortdreunen, slides die je aandacht nauwelijks vasthouden, en je ogen glazig als iemand kwartaalstatistieken ratelt. Stel je nu eens voor dat de AI in de vergadering, in plaats van je te vervelen met spreadsheets, ter plekke beelden begint te produceren: daadwerkelijke beelden die het gesprek tot leven brengen, in realtime gegenereerd terwijl mensen spreken. Het klinkt futuristisch, maar dat is precies wat Microsoft verzint met een nieuw patent.
Microsofts patenten stem naar beeld
Het nieuwste idee van Microsoft (en ja, het is voorlopig nog maar een idee) is om live audiostreams (lezingen, vergaderingen, elk mondeling gesprek) te nemen en deze direct in afbeeldingen om te zetten. Het Amerikaanse Patent and Trademark Office zojuist liet de details vallen op 10 oktober 2024nadat Microsoft het in april had ingediend. Het systeem zou in wezen naar uw oproepen luisteren, een teksttranscriptie genereren, die via een AI-model invoeren en er verschijnen afbeeldingen uit die overeenkomen met wat er wordt gezegd.
Niet meer “laat me daarvoor een glijbaan omhoog trekken.”

Het einde van saaie vergaderingen? Misschien niet, maar het zal dichtbij zijn
De meeste virtuele vergaderingen zijn behoorlijk saai. En laten we niet doen alsof we niet een groot deel van de tijd besteden aan het uitstippelen van zones.
Maar wat als die bijeenkomsten ineens net zo snel beelden opleveren als het gesprek verloopt? Iemand noemt nieuwe productconcepten en binnen enkele seconden verschijnen er door AI gegenereerde afbeeldingen op het scherm. De droge cijfers die mensen citeren, veranderen plotseling in dynamische grafieken zonder dat iemand op een knop klikt. Wat is dat? Een knelpunt in de toeleveringsketen in Zuidoost-Azië? Bam! Er verschijnt een interactieve kaart waarop de probleemgebieden worden aangegeven.
Voordat je al te opgewonden raakt: laten we duidelijk zijn: dit bevindt zich nog in de patentfase. En als je er lang genoeg bent, weet je dat veel patenten nergens heen gaan. Het indienen van een patent is als het planten van een zaadje: het kan uitgroeien tot iets groots, maar het kan ook gewoon een idee blijven dat nooit wordt ontwikkeld.
Dat gezegd hebbende, als Microsoft ervoor gaat, is de voor de hand liggende thuisbasis voor deze technologie Microsoft Teams. Ze hebben Teams uitgebreid met allerlei AI-gestuurde tools, van Copilot tot verbeterde functies voor videoconferenties, dus dit zou een stap zijn om te zetten.
We hebben al tekst-naar-afbeelding-tools gezien, zoals DALL-E En Halverwege de reis de geest van mensen opblazen. Nu konden we zien dat dit concept werd toegepast op live spraak. Het is alsof je in realtime een stem geeft aan AI-creativiteit.
Maar voorlopig wachten we af.
Uitgelichte afbeeldingscredits: Kerem Gülen/Midjourney