Samenvatting

Voltooid

Opmerking

Zie het tabblad Tekst en afbeeldingen voor meer informatie.

In deze module maakt u kennis met spraakherkenning (spraak-naar-tekst) als basis voor spraaktoepassingen en -agents. Cursisten verkennen hoe gesproken audio wordt vastgelegd vanuit een microfoon of audiobestand en geconverteerd naar geschreven tekst met behulp van Azure Speech. In de module wordt uitgelegd waar spraak-naar-tekst past in een toepassing( in een client-app of een back-endservice) en worden veelvoorkomende scenario's gemarkeerd, zoals livetranscriptie, bijschriften, voicemailverwerking en het leveren van tekstinvoer aan AI-agents.

De module behandelt vervolgens spraaksynthese (tekst-naar-spraak), waarmee toepassingen natuurlijk klinkende gesproken audio van tekst kunnen genereren. Cursisten zien hoe Azure Speech neurale stemmen gebruikt om de uitspraak, toon, snelheid en toonhoogte te beheren en hoe gesynthetiseerde audio direct kan worden afgespeeld of opgeslagen voor later gebruik. In deze sectie wordt benadrukt hoe tekst-naar-spraak toepassingen en agents in staat stelt om hoorbaar te reageren, toegankelijkheid, hands-free interactie en algehele gebruikerservaring te verbeteren.

Ten slotte brengt de module deze mogelijkheden samen met de spraak-naar-spraakfunctie met behulp van Voice Live. Cursisten ontdekken hoe Voice Live spraak-naar-tekst, AI-redenering en tekst-naar-spraak combineert tot één volledig beheerde service voor realtime gesprekken. In plaats van meerdere onderdelen samen te voegen, kunnen ontwikkelaars Voice Live gebruiken om responsieve, natuurlijke spraakagents te bouwen die kunnen luisteren, denken en spreken, waardoor het eenvoudiger is om gesprekservaringen die klaar zijn voor productie te maken met Azure Speech en Microsoft Foundry.

Gebruik de onderstaande koppelingen voor meer informatie.