Présentation
La transcription et la synthèse vocales sont des fonctionnalités utiles dans de nombreux scénarios, notamment :
- Documentation des conversations parlées dans les appels et les réunions.
- Génération de légendes pour des vidéos ou des présentations.
- Création d’interfaces utilisateur audibles pour améliorer l’accessibilité des applications.
- Développement d’assistants IA mains libres qui lisent à haute voix des messages texte ou des e-mails.
Dans ce module, nous allons découvrir comment utiliser des modèles IA génératifs compatibles avec la reconnaissance vocale dans Microsoft Foundry pour convertir la parole en texte et en texte en parole.
Note
Nous reconnaissons que différentes personnes aiment apprendre de différentes façons. Vous pouvez choisir d’effectuer ce module au format vidéo ou lire le contenu sous forme de texte et d’images. Le texte contient plus de détails que les vidéos. Dans certains cas, vous voudrez peut-être y faire référence en tant que matériel supplémentaire à la présentation vidéo.