Zusammenfassung

1 Minute

Hinweis

Weitere Details finden Sie auf der Registerkarte "Text und Bilder ".

In diesem Modul wird die Spracherkennung (Sprach-zu-Text) als Grundlage für sprachfähige Anwendungen und Agents eingeführt. Lernende erfahren, wie gesprochene Audiodaten aus einem Mikrofon oder einer Audiodatei aufgenommen und mithilfe von Azure Speech in geschriebenen Text konvertiert werden. Im Modul wird erläutert, wo Sprache zu Text in eine Anwendung passt – entweder in einer Client-App oder in einem Back-End-Dienst – und hebt häufige Szenarien wie Livetranskription, Untertitel, Voicemailverarbeitung und Bereitstellen von Texteingaben für KI-Agents hervor.

Das Modul befasst sich dann mit der Sprachsynthese (Text-zu-Sprache), mit der Anwendungen gesprochene Audiodaten aus Text generieren können. Lernende erfahren, wie Azure Speech neurale Stimmen verwendet, um die Aussprache, den Ton, die Geschwindigkeit und die Tonhöhe zu steuern und wie synthetisierte Audiodaten sofort wiedergegeben oder zur späteren Verwendung gespeichert werden können. In diesem Abschnitt wird betont, wie Text-zu-Sprache es Anwendungen und Agenten ermöglicht, akustisch zu reagieren, wodurch die Barrierefreiheit, die freihändige Interaktion und die allgemeine Benutzerfreundlichkeit verbessert werden.

Schließlich verbindet das Modul diese Funktionen mit Sprach-zu-Sprach-Übertragung durch Voice Live. Lernende erfahren, wie Voice Live Sprach-zu-Text-, KI-Begründungen und Text-zu-Sprache in einem einzigen, vollständig verwalteten Dienst für Echtzeitunterhaltungen kombiniert. Anstatt mehrere Komponenten zusammenzuheften, können Entwickler Voice Live verwenden, um reaktionsfähige, natürliche Sprach-Agents zu erstellen, die zuhören, denken und sprechen können– was die Erstellung produktionsbereiter Unterhaltungserfahrungen mit Azure Speech und Microsoft Foundry erleichtert.

Verwenden Sie die nachstehenden Links, um mehr zu erfahren.

Azure Speech in der Dienstdokumentation
Weitere Informationen zu den Software Development Kits (SDKs) von Azure Speech
Weitere Informationen zu Azure Speech – Voice Live in der Dokumentation

Feedback

War diese Seite hilfreich?