Résumé
Note
Pour plus d’informations, consultez l’onglet Texte et images !
Ce module introduit la reconnaissance vocale (conversion de la parole en texte) comme fondation pour les applications et agents activés par la voix. Les apprenants explorent la façon dont l’audio parlé est capturé à partir d’un microphone ou d’un fichier audio et convertis en texte écrit à l’aide d’Azure Speech. Le module explique où la reconnaissance vocale s’intègre dans une application ( dans une application cliente ou un service back-end) et met en évidence des scénarios courants tels que la transcription en direct, les légendes, le traitement de la messagerie vocale et la fourniture d’une entrée de texte aux agents IA.
Le module couvre la synthèse vocale, ce qui permet aux applications de générer un audio parlé de manière naturelle à partir du texte. Les apprenants voient comment Azure Speech utilise des voix neuronales pour contrôler la prononciation, le ton, la vitesse et la hauteur, et comment l’audio synthétisé peut être lu immédiatement ou enregistré pour une utilisation ultérieure. Cette section met l’accent sur la façon dont la synthèse vocale permet aux applications et aux agents de répondre de manière audible, améliorant ainsi l’accessibilité, l’interaction sans les mains et l’expérience utilisateur globale.
Enfin, le module regroupe ces fonctionnalités avec la reconnaissance vocale à l’aide de Voice Live. Les apprenants découvrent comment Voice Live combine la reconnaissance vocale, le raisonnement ia et la synthèse vocale en un seul service entièrement géré pour les conversations en temps réel. Au lieu de assembler plusieurs composants, les développeurs peuvent utiliser Voice Live pour créer des agents vocaux réactifs et naturels qui peuvent écouter, penser et parler, ce qui facilite la création d’expériences conversationnelles prêtes pour la production avec Azure Speech et Microsoft Foundry.
Utilisez les liens ci-dessous pour en savoir plus.
- Azure Speech dans la documentation du service
- En savoir plus sur les kits de développement logiciel (SDK) d’Azure Speech
- En savoir plus sur Azure Speech - Voice Live dans la documentation