Foundry Tools における Azure Speech

完了

Foundry Tools の Azure Speech は、Foundry リソースによって提供される音声関連の機能のセットです。 これらの機能を使用して、Microsoft Foundry プロジェクトに組み込まれているアプリとエージェントに音声サポートを追加できます。 例えば次が挙げられます。

  • 記録された通話または会議を文字起こしするアプリケーションを作成する。
  • テキスト メッセージまたはメールを音声で読み上げることができる AI アシスタントを作成する。

音声テキスト変換関数とテキスト読み上げ関数を実行する Azure Speech リソースを示す図。

Microsoft Foundry リソースでの Azure Speech の使用

Foundry Tools で Azure Speech を使用するには、Azure サブスクリプションに Microsoft Foundry リソースをプロビジョニングする必要があります。

Azure サブスクリプションに Foundry リソースをプロビジョニングしたら、その エンドポイント を使用してコードから Azure 言語 API を呼び出し、リソースに関連付けられている キー を指定して要求を認証できます。 AZURE 言語 API を呼び出すには、JSON 形式で REST インターフェイスに要求を送信するか、使用可能なプログラミング言語固有の SDK のいずれかを使用します。

このモジュールのコード例は、 Foundry Tools の Python SDK for Azure Speech を使用して Python に基づいています。 他の一般的な言語 (Microsoft C#、JavaScript など) の SDK も同様のパターンに従います。

SpeechConfig の作成

Foundry Toole エンドポイントの Azure Speech へのアクセスを提供するために作成する必要がある初期オブジェクトは SpeechConfig オブジェクトです。Foundry リソース内のサービスの接続の詳細をカプセル化します。

ヒント

Foundry ポータルの既定のホーム ページには、 プロジェクトのエンドポイントとキーが表示されます。 リソースのキーとエンドポイントを表示するには、ポータルの [操作] ページの [管理] タブで、プロジェクトの親リソースを表示できます。 プロジェクトと foundry リソース キーは同じであり、プロジェクト エンドポイントは /api/projects/{project_name} が追加されたリソース エンドポイントであるため、プロジェクト エンドポイントが https://my-ai-app-foundry.services.ai.azure.com/api/projects/my-ai-appされている場合、リソース エンドポイントは https://my-ai-app-foundry.services.ai.azure.com

たとえば、次の Python コードは、Foundry リソース内の Azure Speech API に要求を送信するために使用できる SpeechConfig オブジェクトを作成します。

# run "pip install azure-cognitiveservices-speech" first to install the package 
import azure.cognitiveservices.speech as speech_sdk

# Create SpeechConfig using endpoint and key
speech_config = speech_sdk.SpeechConfig(subscription="YOUR_FOUNDRY_KEY",
                                        endpoint="YOUR_FOUNDRY_ENDPOINT")

1.48.2 より前の Python SDK のリリースでは、エンドポイントの代わりにリソースをデプロイするリージョンを指定する必要があります。 最新のリリースでは、Foundry リソース エンドポイントまたはリージョンを使用できます。