Introducción

2 minutos

Azure Speech in Foundry Tools proporciona API que puede usar para compilar aplicaciones habilitadas para voz, entre las que se incluyen:

Conversión de voz en texto: UNA API que permite el reconocimiento de voz en el que la aplicación puede aceptar la entrada hablada.
Texto a voz: UNA API que permite la síntesis de voz en la que la aplicación puede proporcionar una salida hablada.
Traducción de habla: una API que puede usar para traducir la entrada de voz en varios idiomas.
Voice Live: UNA API que puede usar para crear agentes de INTELIGENCIA ARTIFICIAL que puedan realizar conversaciones en tiempo real.

Este módulo se centra en el reconocimiento de voz y la síntesis de voz, que son funcionalidades principales de cualquier aplicación habilitada para voz.

Los ejemplos de código de este módulo se proporcionan en Python, pero puede usar cualquiera de los paquetes disponibles del SDK de Voz de Azure para desarrollar aplicaciones habilitadas para voz en su lenguaje preferido. Los paquetes de SDK disponibles incluyen:

Note

Reconocemos que a diferentes personas les gusta aprender de diferentes maneras. Puede optar por completar este módulo en formato basado en vídeo o puede leer el contenido como texto e imágenes. El texto contiene más detalle que los vídeos, por lo que, en algunos casos, es posible que desee hacer referencia a él como material complementario para la presentación de vídeo.

Comentarios

¿Le ha resultado útil esta página?