Introductie

1 minuut

Dankzij ai-spraakmogelijkheden kunnen we systemen beheren met spraakinstructies, antwoorden krijgen van computers voor gesproken vragen, bijschriften genereren van audio en nog veel meer. Spraakinterfaces bieden een natuurlijkere manier om te communiceren met AI-software. De mogelijkheid om te communiceren via gesproken taal kan de toegankelijkheid en inclusiefheid van toepassingen en agents vergroten.

Om dit soort interactie mogelijk te maken, moet het AI-systeem ten minste twee mogelijkheden ondersteunen:

Spraakherkenning: de mogelijkheid om gesproken invoer te detecteren en te interpreteren
Spraaksynthese: de mogelijkheid om gesproken uitvoer te genereren

Voorbeelden van deze mogelijkheden zijn:

Klinische dicteren en noteren in de gezondheidszorg: Artsen kunnen patiëntennotities hardop zeggen tijdens of na afspraken. Een AI-spraak-app converteert de audio naar nauwkeurige medische tekst, waardoor handmatig typen wordt verminderd en tijd bespaart.
Gesprektranscriptie in klantondersteuning: contactcentra transcriberen klantgesprekken in realtime, waardoor het eenvoudiger is om gesprekken te controleren, problemen te detecteren en sentiment te analyseren.
Automatische ondertiteling in media en entertainment: Videoplatforms genereren live- of opgenomen bijschriften voor shows en streams, waardoor de toegankelijkheid en het ondersteunen van meertalige doelgroepen worden verbeterd.
Taalonderwijs en feedback over uitspraak in het onderwijs: Learning-apps gebruiken AI-spraakmogelijkheden om te luisteren naar leerlingen/studenten die spreken en feedback geven over de uitspraak, zodat cursisten oefenen en gesproken taalvaardigheden kunnen verbeteren.
Spraakassistenten in de detailhandel en e-commerce: virtuele winkelassistenten gebruiken spraakherkenning om inzicht te krijgen in gesproken klantaanvragen en tekst-naar-spraak om te reageren met productinformatie of orderstatus.

Azure Speech in Microsoft Foundry Tools biedt mogelijkheden voor spraak-naar-tekst, tekst-naar-spraak en spraakomzetting via spraakherkenning en -synthese. U kunt vooraf samengestelde en aangepaste Speech-servicemodellen gebruiken voor verschillende taken, van het transscriberen van audio naar tekst met hoge nauwkeurigheid, het identificeren van sprekers in gesprekken, het maken van aangepaste stemmen en meer. Vervolgens leert u hoe u spraakherkenning kunt opnemen in een toepassing met Azure Speech.

Opmerking

We herkennen dat verschillende mensen graag op verschillende manieren leren. U kunt ervoor kiezen om deze module in video-indeling te voltooien of u kunt de inhoud lezen als tekst en afbeeldingen. De tekst bevat meer details dan de video's, dus in sommige gevallen kunt u ernaar verwijzen als aanvullend materiaal voor de videopresentatie.

Feedback

Is deze pagina nuttig?