イントロダクション

音声テキスト変換: アプリケーションが音声入力を受け入れることができる 音声認識 を有効にする API。
テキスト読み上げ: アプリケーションが音声出力を提供できる 音声合成 を可能にする API。
音声翻訳: 音声入力を複数の言語に翻訳するために使用できる API。
Voice Live: リアルタイムの会話を実行できる AI エージェントを構築するために使用できる API。

Foundry Tools の Azure Speech には、次のような音声対応アプリケーションの構築に使用できる API が用意されています。

このモジュールでは、音声認識と音声合成に重点を置いています。これは、音声対応アプリケーションのコア機能です。

このモジュールのコード例は Python で提供されていますが、使用可能な任意の Azure Speech SDK パッケージを使用して、任意の言語で音声対応アプリケーションを開発できます。使用可能な SDK パッケージは次のとおりです。

フィードバック

このページはお役に立ちましたか?