エージェントと LLM 用の Unity AI ゲートウェイ

Important

このページでは、現在ベータ版の新しい AI ゲートウェイ (UI の左側のナビゲーションに表示されます) について説明します。アカウント管理者は、アカウントコンソールの [プレビュー ] ページでこの機能へのアクセスを有効にすることができます。 Manage Azure Databricks プレビューを参照してください。

以前のバージョンの Unity AI Gateway の詳細については、エンドポイントを提供するための Unity AI Gateway に関するページを参照してください。

注

Unity AI Gateway は、AWS GovCloud または Azure Government ではサポートされていません。

Unity AI Gateway とは

Unity AI Gateway は、LLM エンドポイント、エージェント、コーディングツールを管理するためのエンタープライズコントロールプレーンです。これを使用して、使用状況の分析、アクセス許可の構成、プロバイダー間の容量の管理を行います。

Unity AI Gateway を使用すると、次のことができます。

組織で LLM、エージェント、コーディングツールがどのように使用されているかを分析する
Govern Azure Databricks ホスト型モデルと外部モデルへのアクセス
ログすべてのエンドポイントから Unity Catalog への LLM トラフィック
エンドポイントの正常性とプロバイダーの可用性を監視する
レート制限とガードレールを適用する
特定のエンドポイント、ユーザー、チームにコストを属性付けする
信頼性と負荷分散のためにプロバイダー間でトラフィックをインテリジェントにルーティングする
スケーラビリティのために複数のモデルバックエンド間でトラフィックを分割する
コードを変更せずにプロバイダーとモデルを切り替える

ai-gateway の概要

サポートされている機能

次の表では、使用可能な Unity AI Gateway の機能を定義します。

特徴	Description
Permissions	エンドポイントにアクセスできるユーザーを制御します。
使用状況の追跡	システムテーブルを使用して使用状況とコストを監視します。
推論テーブル	Unity カタログデルタテーブルの要求と応答を監視および監査します。
運用メトリック	使用状況をリアルタイムで監視します。
転送率の制限	エンドポイント、ユーザー、またはグループレベルで使用制限を適用します。
ガードレール	コンテンツフィルタリング、機密データ保護、カスタムポリシーを適用します。
コスト配分	エンドポイントと要求タグを使用して、エンドポイント、ユーザー、チームごとに詳細なレベルでコストを追跡します。
Fallbacks	障害が発生した場合に複数のプロバイダーにルーティングすることで、信頼性を向上させます。
トラフィックの分割	スケーラビリティと負荷分散を向上するために、複数のモデルバックエンドにトラフィックを分散します。
カスタム API	LLM エンドポイントと同じアクセス制御、レート制限、ログ記録を使用して、カスタム API と外部 API を管理します。

注

Unity AI Gateway の機能では、ベータ期間中に料金は発生しません。

Unity AI Gateway を使用する

Azure Databricksでは、人気のある LLM 用の Unity AI Gateway エンドポイントが提供されます。エージェント、コーディングツール、およびその他のアプリケーションを管理するための新しいエンドポイントを作成できます。

開始するには、「 Unity AI Gateway エンドポイントの構成」を参照してください。エンドポイントのクエリを実行するには、「 Unity AI Gateway エンドポイントのクエリ」を参照してください。 Cursor、Gemini CLI、Codex CLI、Claude Code などのコーディングエージェントを統合するには、「コーディングエージェントとの統合」を参照してください。 Unity AI Gateway を介して Databricks Apps に作成してデプロイするエージェントから LLM 呼び出しをルーティングするには、手順 4 を参照してください。Unity AI Gateway を使用して Databricks Apps 上のエージェントから LLM の使用を管理します。

クエリのクイックスタート

次の例は、Pythonと OpenAI クライアントを使用して Unity AI ゲートウェイエンドポイントにクエリを実行する方法を示しています。

from openai import OpenAI
import os

# To get a Databricks token, see https://docs.databricks.com/dev-tools/auth/pat
DATABRICKS_TOKEN = os.environ.get('DATABRICKS_TOKEN')

client = OpenAI(
    api_key=DATABRICKS_TOKEN,
    base_url="https://<workspace-url>/ai-gateway/mlflow/v1"
)

chat_completion = client.chat.completions.create(
    messages=[
        {"role": "user", "content": "Hello!"},
        {"role": "assistant", "content": "Hello! How can I assist you today?"},
        {"role": "user", "content": "What is Databricks?"},
    ],
    model="databricks-gpt-5-2",
    max_tokens=256
)

print(chat_completion.choices[0].message.content)

<workspace-url>をAzure Databricksワークスペースの URL に置き換えます。

次のステップ

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-03