Important
このページでは、現在 ベータ版の新しい AI ゲートウェイ (UI の左側のナビゲーションに表示されます) について説明します。 アカウント管理者は、アカウント コンソールの [プレビュー ] ページでこの機能へのアクセスを有効にすることができます。 Manage Azure Databricks プレビューを参照してください。
以前のバージョンの Unity AI Gateway の詳細については、 エンドポイントを提供するための Unity AI Gateway に関するページを参照してください。
注
Unity AI Gateway は、AWS GovCloud または Azure Government ではサポートされていません。
Unity AI Gateway とは
Unity AI Gateway は、LLM エンドポイント、エージェント、コーディング ツールを管理するためのエンタープライズ コントロール プレーンです。 これを使用して、使用状況の分析、アクセス許可の構成、プロバイダー間の容量の管理を行います。
Unity AI Gateway を使用すると、次のことができます。
- 組織で LLM、エージェント、コーディング ツールがどのように使用されているかを分析する
- Govern Azure Databricks ホスト型モデルと外部モデルへのアクセス
- ログ すべてのエンドポイントから Unity Catalog への LLM トラフィック
- エンドポイントの正常性とプロバイダーの可用性を監視する
- レート制限とガードレールを適用する
- 特定のエンドポイント、ユーザー、チームにコストを属性付けする
- 信頼性と負荷分散のためにプロバイダー間でトラフィックをインテリジェントにルーティングする
- スケーラビリティのために複数のモデル バックエンド間でトラフィックを分割する
- コードを変更せずにプロバイダーとモデルを切り替える
サポートされている機能
次の表では、使用可能な Unity AI Gateway の機能を定義します。
| 特徴 | Description |
|---|---|
| Permissions | エンドポイントにアクセスできるユーザーを制御します。 |
| 使用状況の追跡 | システム テーブルを使用して使用状況とコストを監視します。 |
| 推論テーブル | Unity カタログ デルタ テーブルの要求と応答を監視および監査します。 |
| 運用メトリック | 使用状況をリアルタイムで監視します。 |
| 転送率の制限 | エンドポイント、ユーザー、またはグループ レベルで使用制限を適用します。 |
| ガードレール | コンテンツ フィルタリング、機密データ保護、カスタム ポリシーを適用します。 |
| コスト配分 | エンドポイントと要求タグを使用して、エンドポイント、ユーザー、チームごとに詳細なレベルでコストを追跡します。 |
| Fallbacks | 障害が発生した場合に複数のプロバイダーにルーティングすることで、信頼性を向上させます。 |
| トラフィックの分割 | スケーラビリティと負荷分散を向上するために、複数のモデル バックエンドにトラフィックを分散します。 |
| カスタム API | LLM エンドポイントと同じアクセス制御、レート制限、ログ記録を使用して、カスタム API と外部 API を管理します。 |
注
Unity AI Gateway の機能では、ベータ期間中に料金は発生しません。
Unity AI Gateway を使用する
Azure Databricksでは、人気のある LLM 用の Unity AI Gateway エンドポイントが提供されます。 エージェント、コーディング ツール、およびその他のアプリケーションを管理するための新しいエンドポイントを作成できます。
開始するには、「 Unity AI Gateway エンドポイントの構成」を参照してください。 エンドポイントのクエリを実行するには、「 Unity AI Gateway エンドポイントのクエリ」を参照してください。 Cursor、Gemini CLI、Codex CLI、Claude Code などのコーディング エージェントを統合するには、「 コーディング エージェントとの統合」を参照してください。 Unity AI Gateway を介して Databricks Apps に作成してデプロイするエージェントから LLM 呼び出しをルーティングするには、 手順 4 を参照してください。Unity AI Gateway を使用して Databricks Apps 上のエージェントから LLM の使用を管理します。
クエリのクイック スタート
次の例は、Pythonと OpenAI クライアントを使用して Unity AI ゲートウェイ エンドポイントにクエリを実行する方法を示しています。
from openai import OpenAI
import os
# To get a Databricks token, see https://docs.databricks.com/dev-tools/auth/pat
DATABRICKS_TOKEN = os.environ.get('DATABRICKS_TOKEN')
client = OpenAI(
api_key=DATABRICKS_TOKEN,
base_url="https://<workspace-url>/ai-gateway/mlflow/v1"
)
chat_completion = client.chat.completions.create(
messages=[
{"role": "user", "content": "Hello!"},
{"role": "assistant", "content": "Hello! How can I assist you today?"},
{"role": "user", "content": "What is Databricks?"},
],
model="databricks-gpt-5-2",
max_tokens=256
)
print(chat_completion.choices[0].message.content)
<workspace-url>をAzure Databricksワークスペースの URL に置き換えます。