適用対象:Foundry (クラシック) ポータル。 この記事は、新しい Foundry ポータルでは使用できません。
新しいポータルの詳細を確認します。
注
この記事のリンクは、現在表示している Foundry (クラシック) ドキュメントではなく、新しい Microsoft Foundry ドキュメントのコンテンツを開く場合があります。
この記事では、デプロイの作成に使用されたものとは異なるprojectまたはハブで既存のサーバーレス API を構成する方法について説明します。
Important
プレビュー段階のモデルには、モデル カタログ内のモデル カードで "プレビュー" のマークが付けられます。
モデル カタログ内の特定のモデルは、サーバーレス API としてデプロイできます。 この種類のデプロイは、組織が必要とする企業レベルのセキュリティとコンプライアンスを維持しながら、サブスクリプションでホストせずに API としてモデルを使用する方法を提供します。 このデプロイ オプションでは、サブスクリプションからのクォータを必要としません。
デプロイの作成に使用されたものとは異なるprojectまたはハブでサーバーレス API エンドポイントを使用する必要性は、次のような状況で発生する可能性があります。
- 特定のプロジェクトまたはハブでデプロイを一元化し、組織内のさまざまなプロジェクトまたはハブからそれらを活用することを検討しています。
- 特定のAzure リージョンのハブにモデルをデプロイする必要があります。このリージョンでは、そのモデルのサーバーレス デプロイを使用できます。 しかしそれを、その特定のモデルに対してサーバーレス デプロイを使用できない別のリージョンから使う必要があります。
[前提条件]
有効な支払い方法を持つAzure サブスクリプション。 無料または試用版Azureサブスクリプションは機能しません。 Azureサブスクリプションをお持ちでない場合は、有料のAzureアカウントを作成して始めてください。
Microsoft Foundry ハブ (hub ベースのプロジェクトを使用している場合)。 Foundry project はハブを使用しません。 詳細については、「Project 型を参照してください。
持っていない場合は、ハブベースのプロジェクトを作成します。
サーバーレス API にデプロイされたモデル。 この記事では、前に Meta-Llama-3-8B-Instruct モデルをデプロイしたと想定しています。 このモデルをサーバーレス API としてデプロイする方法については、「モデルをサーバーレス API としてデプロイする」を参照してください。
Foundry を使用するには、次のソフトウェアをインストールする必要があります。
互換性のある任意の Web ブラウザーを使用して、Foundry に移動できます。
サーバーレス API エンドポイント接続を作成する
次の手順に従って、接続を作成します。
エンドポイントがデプロイされているprojectまたはハブに接続します。
接続対象のエンドポイントの URL と資格情報を取得します。 この例では、エンドポイント名 meta-llama3-8b-qwerty の詳細を取得します。
Foundry ポータルのprojectの左側のサイドバーから、My assets>Models + endpoints に移動して、project内のデプロイの一覧を表示します。
接続するデプロイを選びます。
[ターゲット URI] と [キー] の値をコピーします。
次に、接続を作成したいプロジェクトまたはハブに接続します:
接続を作成する必要があるプロジェクトに移動します。
projectで接続を作成します。
Foundry ポータルのprojectから、左側のサイドバーの下部に移動し、管理センターを選択します。
管理センターの左側のサイド バーから、[接続されたリソース] を選択します。
[+ 新しい接続] を選択します。
[サーバーレス モデル] を選択します。
[ターゲット URI] には、前にコピーした値を貼り付けます。
[キー] には、前にコピーした値を貼り付けます。
接続に名前 (この場合は meta-llama3-8b-connection) を付けます。
[接続の追加] を選択します。
これで、接続を利用できるようになります。
接続が機能していることを検証するには、次のようにします。
プロジェクトに戻るには、Foundry ポータルを使用します。
プロジェクトの左側のサイドバーから、作成とカスタマイズ>プロンプトフロー に移動します。
[作成] を選択して新しいフローを作成します。
[チャット フロー] ボックスで [作成] を選びます。
[プロンプト フロー] に名前を付け、[作成] を選びます。
グラフから [チャット] ノードを選択し、[チャット] セクションに移動します。
[接続] に対して、ドロップダウン リストを開いて、作成したばかりの接続 (この場合は meta-llama3-8b-connection) を選びます。
上部のナビゲーション バーから [コンピューティング セッションを開始する] を選択して、プロンプト フローの自動ランタイムを開始します。
[チャット] オプションを選びます。 メッセージを送信して応答を取得できるようになりました。