Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
No Result
View All Result

Microsoft patenteert real-time audio-naar-beeldgenerator

byKerem Gülen
15 oktober 2024
in Artificial Intelligence
Home Artificial Intelligence

Je bent weer in een eindeloze Zoom- of Teams-vergadering. Stemmen die voortdreunen, slides die je aandacht nauwelijks vasthouden, en je ogen glazig als iemand kwartaalstatistieken ratelt. Stel je nu eens voor dat de AI in de vergadering, in plaats van je te vervelen met spreadsheets, ter plekke beelden begint te produceren: daadwerkelijke beelden die het gesprek tot leven brengen, in realtime gegenereerd terwijl mensen spreken. Het klinkt futuristisch, maar dat is precies wat Microsoft verzint met een nieuw patent.

Microsofts patenten stem naar beeld

Het nieuwste idee van Microsoft (en ja, het is voorlopig nog maar een idee) is om live audiostreams (lezingen, vergaderingen, elk mondeling gesprek) te nemen en deze direct in afbeeldingen om te zetten. Het Amerikaanse Patent and Trademark Office zojuist liet de details vallen op 10 oktober 2024nadat Microsoft het in april had ingediend. Het systeem zou in wezen naar uw oproepen luisteren, een teksttranscriptie genereren, die via een AI-model invoeren en er verschijnen afbeeldingen uit die overeenkomen met wat er wordt gezegd.

Niet meer “laat me daarvoor een glijbaan omhoog trekken.”

Microsoft patenteert real-time audio-naar-beeldgenerator
Een screenshot voor het patent (Afbeelding tegoed)

Het einde van saaie vergaderingen? Misschien niet, maar het zal dichtbij zijn

De meeste virtuele vergaderingen zijn behoorlijk saai. En laten we niet doen alsof we niet een groot deel van de tijd besteden aan het uitstippelen van zones.

Maar wat als die bijeenkomsten ineens net zo snel beelden opleveren als het gesprek verloopt? Iemand noemt nieuwe productconcepten en binnen enkele seconden verschijnen er door AI gegenereerde afbeeldingen op het scherm. De droge cijfers die mensen citeren, veranderen plotseling in dynamische grafieken zonder dat iemand op een knop klikt. Wat is dat? Een knelpunt in de toeleveringsketen in Zuidoost-Azië? Bam! Er verschijnt een interactieve kaart waarop de probleemgebieden worden aangegeven.

Voordat je al te opgewonden raakt: laten we duidelijk zijn: dit bevindt zich nog in de patentfase. En als je er lang genoeg bent, weet je dat veel patenten nergens heen gaan. Het indienen van een patent is als het planten van een zaadje: het kan uitgroeien tot iets groots, maar het kan ook gewoon een idee blijven dat nooit wordt ontwikkeld.

Dat gezegd hebbende, als Microsoft ervoor gaat, is de voor de hand liggende thuisbasis voor deze technologie Microsoft Teams. Ze hebben Teams uitgebreid met allerlei AI-gestuurde tools, van Copilot tot verbeterde functies voor videoconferenties, dus dit zou een stap zijn om te zetten.

We hebben al tekst-naar-afbeelding-tools gezien, zoals DALL-E En Halverwege de reis de geest van mensen opblazen. Nu konden we zien dat dit concept werd toegepast op live spraak. Het is alsof je in realtime een stem geeft aan AI-creativiteit.

Maar voorlopig wachten we af.


Uitgelichte afbeeldingscredits: Kerem Gülen/Midjourney

Tags: AIkunstmatige intelligentieMicrosoftUitgelicht

Related Posts

Alphaevolve: Hoe Google’s nieuwe AI naar waarheid streeft met zelfcorrectie

Alphaevolve: Hoe Google’s nieuwe AI naar waarheid streeft met zelfcorrectie

15 mei 2025
Tiktok implementeert AI-gegenereerde ALT-teksten voor een betere accessibiliteit

Tiktok implementeert AI-gegenereerde ALT-teksten voor een betere accessibiliteit

15 mei 2025
YouTube’s AI weet nu wanneer je gaat kopen

YouTube’s AI weet nu wanneer je gaat kopen

15 mei 2025
SoundCloud CEO geeft toe dat AI -termen niet duidelijk genoeg waren, geeft een nieuwe belofte uit

SoundCloud CEO geeft toe dat AI -termen niet duidelijk genoeg waren, geeft een nieuwe belofte uit

15 mei 2025
Klaar voor een chatgpt dat je echt kent?

Klaar voor een chatgpt dat je echt kent?

14 mei 2025
Lightricks onthult 13B LTX Video -model voor HQ AI Video Generation

Lightricks onthult 13B LTX Video -model voor HQ AI Video Generation

14 mei 2025

Recent Posts

  • De impact van slimme stoffen op tactische kledingprestaties
  • Databricks wedt groot op serverloze postgres met zijn $ 1 miljard neon acquisitie
  • Alphaevolve: Hoe Google’s nieuwe AI naar waarheid streeft met zelfcorrectie
  • Tiktok implementeert AI-gegenereerde ALT-teksten voor een betere accessibiliteit
  • Trump dwingt Apple om zijn India iPhone -strategie te heroverwegen

Recent Comments

Geen reacties om weer te geven.
Dataconomy NL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.