イントロダクション
Foundry Tools の Azure Speech には、次のような音声対応アプリケーションの構築に使用できる API が用意されています。
- 音声テキスト変換: アプリケーションが音声入力を受け入れることができる 音声認識 を有効にする API。
- テキスト読み上げ: アプリケーションが音声出力を提供できる 音声合成 を可能にする API。
- 音声翻訳: 音声入力を複数の言語に翻訳するために使用できる API。
- Voice Live: リアルタイムの会話を実行できる AI エージェントを構築するために使用できる API。
このモジュールでは、音声認識と音声合成に重点を置いています。これは、音声対応アプリケーションのコア機能です。
このモジュールのコード例は Python で提供されていますが、使用可能な任意の Azure Speech SDK パッケージを使用して、任意の言語で音声対応アプリケーションを開発できます。 使用可能な SDK パッケージは次のとおりです。