Hoofdstuk 6: De werking van AI-gestuurde spraakassistenten

 

 

Natuurlijke taalgeneratie stelt AI-gestuurde spraakassistenten in staat om verschillende spraakopdrachten te begrijpen en te beantwoorden. Met andere woorden, het kan terugpraten en vragen beantwoorden in een natuurlijke taal. Filters om vloeken te voorkomen worden zowel op de gebruiker als op de spraakherkenner gebruikt. Deze zorgen ervoor dat ze nooit omkeert en aanstootgevende taal herhaalt. Maar voor dit gesprek om een tweerichtingsverkeer te zijn, hebben ze een begrip van de stemmen van gebruikers nodig. Hier komt spraakherkenning om de hoek kijken.

Automatische spraakherkenning gebruikt een akoestisch patroonherkenningsalgoritme om te bepalen welke woorden zijn uitgesproken. Vergelijkbaar met spraaktranscriptie, zet deze technologie gebruikersspraak om in een reeks symbolen die de computer kan begrijpen. Dus, als je “Hey Siri” zegt, wordt je stem opgenomen door de microfoon en omgezet in een reeks getallen die de onderliggende algoritmen kunnen begrijpen.

De vervolgvragen of opdrachten worden vervolgens begrepen en verwerkt door Siri. Hier wordt een diep neuraal netwerk gebruikt om gesproken woorden te analyseren en te vergelijken, waardoor Siri nauwkeurig kan begrijpen wat er is gezegd. En naarmate meer mensen Siri gebruiken, blijft het nieuwe woordenschat en spraakgewoonten leren die helpen de nauwkeurigheid in de loop van de tijd te verbeteren.

Ze kunnen  ook synchroniseren met verschillende andere cloudgebaseerde diensten, waaronder agenda’s, contacten, alarmen en het weer. Hierdoor kan het naadloos interageren met al uw apparaten en taken voltooien. Je kunt  vragen om een Uber-rit te boeken of een herinnering in te stellen voor je komende vergadering.

Tot slot verbetert bijvoorbeled Siri voortdurend zijn machine learning-algoritmen, waardoor het kan leren van onze gewoonten en voorkeuren. Als een beperkte AI kan Siri niet zelfstandig denken of beslissingen nemen onafhankelijk van zijn programmering. Maar door onze interacties met het in de loop van de tijd te analyseren, wordt Siri steeds beter in staat om te begrijpen wat we nodig hebben en ons de best mogelijke resultaten te bieden.

 

Een vergelijking

Een AI spraakassistent maken binnen 10 minuten:


1603, #1603