Introdução
A transcrição de fala e a síntese são recursos úteis em muitos cenários, incluindo:
- Documentando conversas faladas em chamadas e reuniões.
- Gerando legendas para vídeos ou apresentações.
- Criando interfaces de usuário audíveis para melhorar a acessibilidade do aplicativo.
- Desenvolvendo assistentes de IA sem mãos que leem mensagens de texto ou emails em voz alta.
Neste módulo, exploraremos como usar modelos de IA generativos com capacidade de fala no Microsoft Foundry para converter fala em texto e texto em fala.
Note
Reconhecemos que pessoas diferentes gostam de aprender de maneiras diferentes. Você pode optar por concluir este módulo em formato baseado em vídeo ou ler o conteúdo como texto e imagens. O texto contém mais detalhes do que os vídeos, portanto, em alguns casos, talvez você queira se referir a ele como material complementar à apresentação de vídeo.