Speechify voegt spraakgestuurd typen en assistent toe aan Chrome

Speechify, een bedrijf dat bekend staat om tekst-naar-spraak-tools die artikelen, pdf’s en documenten naar audio converteren, heeft spraakgestuurd typen en een stemassistent geïntroduceerd in de Chrome-extensie. Deze uitbreiding is een reactie op de toename van het aantal stemdetectietools in de afgelopen twaalf maanden, aangedreven door de vooruitgang op het gebied van spraakherkenningsmodellen. De functies ondersteunen Engels en omvatten foutcorrectie en verwijdering van opvulwoorden. Speechify richtte zich oorspronkelijk op het mogelijk maken van gebruikers om via zijn platform naar geschreven inhoud te luisteren, waarbij statische tekst werd omgezet in gesproken verhalen voor eenvoudiger consumptie. Met de toevoeging van stemdetectiemogelijkheden verschuift het bedrijf naar interactieve audio-ervaringen. Met de spraaktypefunctie kunt u rechtstreeks in de browser dicteren, waarbij gesproken woorden worden vastgelegd en naar tekst worden omgezet, terwijl veelvoorkomende onnauwkeurigheden, zoals verkeerd gehoorde termen of herhaalde zinnen, automatisch worden aangepakt. Dit sluit aan bij bredere trends in de sector waarbij verbeterde neurale netwerken in spraakherkenning de latentie hebben verminderd en de precisie hebben vergroot, waardoor realtime spraakinvoer haalbaar is geworden voor alledaagse toepassingen. Tijdens een testperiode van meer dan een dag presteerde het spraakgestuurd typen betrouwbaar in applicaties als Gmail en Google Docs, waar de activering soepel verliep en het invoegen van tekst zonder noemenswaardige vertragingen volgde op gesproken invoer. Er deden zich uitdagingen voor op platforms zoals WordPress, waar het starten van het dictaat inconsistent bleek en de uitvoer af en toe onopgeloste fouten bevatte. Vertegenwoordigers van Speechify legden uit dat verbeteringen voor veelgebruikte websites in fasen worden geïmplementeerd om compatibiliteit te garanderen en de prestaties in verschillende omgevingen te verfijnen. Uit vergelijkingen van de nauwkeurigheid bleek dat het stemtypen van Speechify een hoger percentage woordfouten vertoonde in vergelijking met concurrenten als Wispr Flow, Willow en Monologue. Deze alternatieven vertoonden minder gevallen van onjuiste transcripties in vergelijkbare scenario’s. Speechify benadrukte dat het onderliggende model zich sneller aanpast aan individuele gebruikerspatronen door voortdurende interactie, wat leidt tot een geleidelijke afname van het foutenpercentage naarmate de bekendheid met de stem en de spreekstijl van de spreker toeneemt. De stemassistent is geïntegreerd in de zijbalk van de browser en biedt een permanente interface voor zoekopdrachten in natuurlijke taal met betrekking tot de actieve webpagina. Gebruikers kunnen specifieke verzoeken indienen, zoals het identificeren van de drie belangrijkste concepten in de inhoud of het aanvragen van een vereenvoudigde uitleg van complexe secties. Deze opstelling vergemakkelijkt een snel begrip zonder handmatige navigatie, waardoor de toegankelijkheid voor auditieve leerlingen of mensen die multitasken wordt verbeterd. https://www.youtube.com/watch?v=7kL3XTaTFHE Speechify positioneert stem als de centrale interactiemodus, in contrast met platforms als ChatGPT en Gemini. Rohan Pavuluri, de Chief Business Officer van het bedrijf, zei in een e-mail aan TechCrunch“Wij geloven dat chat altijd de standaard gebruikerservaring zal zijn in ChatGPT en Gemini wanneer je de apps opent. Dat is wat hun gebruikers verwachten. Stem zal altijd secundair zijn – en in veel gevallen een bijzaak voor ChatGPT en Gemini. We weten uit een aantal jaren van bouwen aan Speechify dat er een groot deel van de markt is, waaronder onze gebruikers, die stem als de primaire standaardinstelling willen, elke keer dat ze een app openen en met AI praten.” Dit perspectief is gebaseerd op de gevestigde gebruikersbasis van Speechify, die al lang prioriteit geeft aan audio boven tekstgebaseerde betrokkenheid. Er bestaan compatibiliteitsbeperkingen voor browsers die zijn uitgerust met native zijbalkassistenten, zoals OpenAI’s Atlas, Perplexity’s Comet en Dia, waarbij de Speechify-tool niet wordt geactiveerd. De extensie richt zich primair op Chrome en maakt gebruik van de uitgebreide gebruikerspopulatie voor brede acceptatie en het verzamelen van feedback. De implementatie van zowel spraakgestuurd typen als assistent gaat verder dan de Chrome-extensie. Speechify is van plan deze functionaliteiten in de loop van de tijd op te nemen in het volledige pakket desktop- en mobiele applicaties, waardoor een consistente beschikbaarheid op alle apparaten en besturingssystemen wordt gegarandeerd. Naast de huidige releases bevordert Speechify de ontwikkeling van autonome agenten die zijn ontworpen om taken onafhankelijk uit te voeren. Eén van de gedemonstreerde mogelijkheden is het plaatsen van uitgaande oproepen om afspraken veilig te stellen of het beheren van wachttijden bij klantenondersteuningslijnen, waardoor gebruikers geen directe betrokkenheid meer hebben. Soortgelijke initiatieven zijn gaande bij andere bedrijven, waaronder Truecaller en Cloaked, die ook technische agenten zijn voor geautomatiseerde interacties in communicatie- en privacycontexten.

Uitgelicht beeldtegoed

Tags: Spreken