Important
この機能は ベータ版です。 アカウント管理者は、アカウント コンソール の [プレビュー ] ページからこの機能へのアクセスを制御できます。 Manage Azure Databricks プレビューを参照してください。
このページでは、 Unity AI Gateway エンドポイントを構成する方法について説明します。
Requirements
- Unity AI Gateway プレビューがあなたのアカウントに対して有効になりました。 Manage Azure Databricks プレビューを参照してください。
- Unity AI Gateway でサポートされているリージョン内のAzure Databricks ワークスペース。
- ワークスペースに対して有効になっている Unity カタログ。 「Unity Catalog のワークスペースを有効にする」を参照してください。
Unity AI Gateway エンドポイントを作成する
Unity AI Gateway エンドポイントを作成するには:
- サイドバーで、[ AI ゲートウェイ] をクリックします。
- [ Create Unity AI Gateway Endpoint]\(Unity AI ゲートウェイ エンドポイントの作成\) をクリックします。
- エンドポイント名とプライマリ モデルを構成します。
- Create をクリックしてください。
エンドポイントで機能を構成する
Unity AI Gateway エンドポイントを更新して、機能を有効または無効にすることができます。 Unity AI Gateway の構成の更新が有効になるまでに最大 1 分かかります。
既存のエンドポイントで Unity AI Gateway の機能を更新するには:
- [AI ゲートウェイ] ページからエンドポイントをクリックします。
- [ゲートウェイ エンドポイントの詳細] サイドバーで、更新する機能の横にある編集アイコンをクリックします。
- 変更を加え、[ 保存] をクリックします。
次の表は、使用可能な Unity AI Gateway の機能とその構成方法をまとめたものです。
| 特徴 | 構成する方法 | 詳細情報 |
|---|---|---|
| 使用状況の追跡 | 既定で有効になっています。 |
|
| 推論テーブル | [ 推論テーブルを有効にする] を 選択して、要求と応答をログに記録します。 |
|
| 転送率の制限 | [ レート制限 ] を選択して、1 分あたりのクエリ (QPM) または 1 分あたりのトークン数 (TPM) を構成します。 |
|
| ガードレール | [Guardrails] を選択してコンテンツ ポリシーを構成します。 |
|
| Fallbacks | フォールバック モデルを構成するには 、[フォールバック モデルの追加] を選択します。 | |
| トラフィックの分割 | 複数のモデル バックエンドに要求を分散するには、[ トラフィック分割の追加] を選択します。 | |
| カスタム API | 外部 API に 接続するエンドポイントを作成するときに、[カスタム API] を選択します。 |
|
次の図は、3 つのモデルが Unity AI Gateway エンドポイントの宛先として登録されるフォールバックの例を示しています。
- 要求は、最初はモデル 1 にルーティングされます。
- 要求から 200 応答が返された場合、要求はモデル 1 で成功し、要求とその応答は使用状況の追跡テーブルと推論テーブルに記録されます。
- 要求がモデル 1 で
429または5XXエラーを返した場合、要求はエンドポイントの次のモデルである Model 2 にフォールバックします。 - 要求がモデル 2 で
429または5XXエラーを返した場合、要求はエンドポイントの次のモデルであるモデル 3 にフォールバックします。 - 要求がモデル 3 で
429または5XXエラーを返した場合、すべてのフォールバック モデルが試みられたため、要求は失敗します。 失敗した要求と応答エラーは、使用状況の追跡テーブルと推論テーブルに記録されます。