Unity AI Gateway エンドポイントの使用状況を監視する

Important

この機能は ベータ版です。 アカウント管理者は、アカウント コンソール の [プレビュー ] ページからこの機能へのアクセスを制御できます。 Manage Azure Databricks プレビューを参照してください。

このページでは、使用状況追跡システム テーブルを使用して 、Unity AI Gateway エンドポイントの使用状況を監視する方法について説明します。

使用状況追跡テーブルでは、エンドポイントの要求と応答の詳細が自動的にキャプチャされ、トークンの使用状況や待機時間などの重要なメトリックがログに記録されます。 この表のデータを使用して、使用状況を監視し、コストを追跡し、エンドポイントのパフォーマンスと使用量に関する分析情報を得ることができます。

使用状況の追跡では、Databricks が提供するエンドポイントへの ai_query 要求もキャプチャされます。

Requirements

使用状況テーブルのクエリを実行する

Unity AI Gateway は、使用状況データを system.ai_gateway.usage システム テーブルに記録します。 UI でテーブルを表示したり、Databricks SQL またはノートブックからテーブルにクエリを実行したりすることもできます。

system.ai_gateway.usage テーブルを表示または照会するアクセス許可を持つのは、アカウント管理者だけです。

UI でテーブルを表示するには、エンドポイント ページの [使用状況追跡テーブル] リンクをクリックして、カタログ エクスプローラーでテーブルを開きます。

Databricks SQL またはノートブックからテーブルにクエリを実行するには:

SELECT * FROM system.ai_gateway.usage;

組み込みの使用状況ダッシュボード

組み込みの使用状況ダッシュボードを作成する

アカウント管理者は、AI Gateway ページの [ ダッシュボードの作成 ] をクリックして、使用状況を監視し、コストを追跡し、エンドポイントのパフォーマンスと使用量に関する分析情報を得ることで、組み込みの Unity AI Gateway 使用状況ダッシュボードを作成できます。 アカウント管理者は、ダッシュボード クエリの実行に使用されるウェアハウスを更新することもできます。これは、後続のすべてのクエリに適用されます。

[ダッシュボードの作成] ボタン

ダッシュボードの作成には、SELECT テーブルに対するsystem.ai_gateway.usageアクセス許可が必要なため、アカウント管理者に制限されます。 ダッシュボードのデータは、 usage テーブルのアイテム保持ポリシーの対象となります。 「使用できるシステム テーブルはどれですか?」を参照してください。

組み込みの使用状況ダッシュボードの新しいバージョンを使用できる場合、アカウント管理者は、[AI ゲートウェイ] ページのダッシュボード アクション メニューから [ 更新 ] をクリックできます。

ai-gateway 更新ダッシュボード ダイアログ

次のダッシュボード構成オプションを使用して、ダッシュボードを管理できます。

  • スコープ: ダッシュボードのスコープをアカウントとワークスペースのどちらにするかを選択します。
  • アクセス許可: ダッシュボード所有者のアクセス許可または各ビューアーのアクセス許可を使用してクエリを実行するかどうかを選択します。 「 共有データのアクセス許可とは」を参照してください。
  • 自動更新: このオプションを有効にすると、新しいバージョンが使用可能になり、アカウント管理者が AI ゲートウェイ ページにアクセスするたびに、ダッシュボードが自動的に更新されます。

ai-gateway ダッシュボード オプションの更新

ダッシュボードがバージョン 0.3 以降に更新されると、6 時間ごとにダッシュボードを更新するスケジュールが自動的に作成されます。 必要に応じて、このスケジュールを Lakeview ダッシュボードで無効にすることができます。 「スケジュールを作成する」を参照してください。

使用状況ダッシュボードを表示する

ダッシュボードを表示するには、[AI ゲートウェイ] ページで [ ダッシュボードの表示 ] をクリックします。 組み込みのダッシュボードでは、Unity AI Gateway エンドポイントの使用状況、パフォーマンス、コストを包括的に把握できます。 要求の追跡、トークン使用量、待機時間のメトリック、エラー率、コストの内訳、外部 MCP サーバー トラフィック、およびコーディング エージェント アクティビティを追跡する複数のページが含まれます。

[ダッシュボードの表示] ボタン

ai-gateway の使用状況ダッシュボード

ダッシュボードでは、既定でクロスワークスペース分析が提供されます。 すべてのダッシュボード ページは、日付範囲とワークスペース ID でフィルター処理できます。

  • [概要] タブ: 毎日の要求量、時間の経過に伴うトークン使用量の傾向、トークン消費量別の上位ユーザー数、一意のユーザー数の合計など、高レベルの使用状況メトリックが表示されます。 このタブを使用して、Unity AI Gateway の全体的なアクティビティの簡単なスナップショットを取得し、最もアクティブなユーザーとモデルを特定します。
  • [パフォーマンス] タブ: 待機時間のパーセンタイル (P50、P90、P95、P99)、最初のバイトまでの時間、エラー率、HTTP 状態コードの分布など、主要なパフォーマンス メトリックを追跡します。 このタブを使用して、エンドポイントの正常性を監視し、パフォーマンスのボトルネックや信頼性の問題を特定します。
  • [使用状況] タブ: エンドポイント、ワークスペース、リクエスターごとの詳細な消費量の内訳が表示されます。 このタブには、トークンの使用パターン、要求の分散、キャッシュ ヒット率が表示されます。
  • [Cost Observability] タブ: エンドポイント、ターゲット モデル、ユーザー、エンドポイント タグ、要求タグごとのコストの内訳が表示されます。 このタブには、外部モデルの推定コストも含まれます。 Unity AI Gateway のコストの監視を参照してください。
  • [外部 MCP サーバー] タブ: 外部 MCP サーバー トラフィックの要求量、エラー率、ユーザーと接続、および毎日の使用状況の傾向が表示されます。
  • [コーディング エージェント] タブ: Cursor、Claude Code、Gemini CLI、Codex CLI などの統合コーディング エージェントからのアクティビティを追跡します。 このタブには、アクティブな日、コーディング セッション、コミット、開発者ツールの使用状況を監視するために追加または削除されたコード行などのメトリックが表示されます。 詳細については、 コーディング エージェント ダッシュボード を参照してください。

使用状況テーブルスキーマ

system.ai_gateway.usage テーブルには、次のスキーマがあります。

列名 タイプ Description
account_id STRING アカウント ID。 11d77e21-5e05-4196-af72-423257f74974
workspace_id STRING ワークスペース ID。 1653573648247579
request_id STRING 要求の一意の識別子。 b4a47a30-0e18-4ae3-9a7f-29bcb07e0f00
schema_version INTEGER 使用レコードのスキーマ バージョン。 1
endpoint_id STRING Unity AI Gateway エンドポイントの一意の ID。 43addf89-d802-3ca2-bd54-fe4d2a60d58a
endpoint_name STRING Unity AI Gateway エンドポイントの名前。 databricks-gpt-5-2
endpoint_tags MAP 作成時または更新時にエンドポイントで構成されたタグ。 エンドポイント タグはエンドポイントへのすべての要求に適用され、チーム、コスト センター、またはプロジェクトごとにエンドポイントを分類するのに役立ちます。 使用状況の追跡については、「タグ要求とエンドポイント」を参照してください。 {"team": "engineering"}
endpoint_metadata STRUCT creatorcreation_timelast_updated_timedestinationsinference_tablefallbacksなどのエンドポイント メタデータ。 {"creator": "user.name@email.com", "creation_time": "2026-01-06T12:00:00.000Z", ...}
event_time TIMESTAMP 要求が受信されたときのタイムスタンプ。 2026-01-20T19:48:08.000+00:00
latency_ms LONG 合計待機時間 (ミリ秒)。 300
time_to_first_byte_ms LONG 最初のバイトまでの時間 (ミリ秒)。 300
destination_type STRING 変換先の種類 (外部モデルや基礎モデルなど)。 PAY_PER_TOKEN_FOUNDATION_MODEL
destination_name STRING 変換先モデルまたはプロバイダーの名前。 databricks-gpt-5-2
destination_id STRING 宛先の一意の ID。 507e7456151b3cc89e05ff48161efb87
destination_model STRING 要求に使用される特定のモデル。 GPT-5.2
requester STRING 要求を行ったユーザーまたはサービス プリンシパルの ID。 user.name@email.com
requester_type STRING 要求元の種類 (ユーザー、サービス プリンシパル、またはユーザー グループ)。 USER
ip_address STRING 要求元の IP アドレス。 1.2.3.4
url STRING 要求の URL。 https://<workspace-url>/ai-gateway/mlflow/v1/chat/completions
user_agent STRING 要求元のユーザー エージェント。 OpenAI/Python 2.13.0
api_type STRING API 呼び出しの種類 (チャット、完了、埋め込みなど)。 mlflow/v1/chat/completions
request_tags MAP Databricks-Ai-Gateway-Request-Tags HTTP ヘッダーを使用して個々の要求と共に送信されるユーザー指定のタグ。 要求タグを使用して、特定のプロジェクト、チーム、環境、またはエンド ユーザーに使用状況を属性付けします。 使用状況追跡のためのタグ リクエストとエンドポイントおよび使用状況追跡のためのタグ リクエストを参照してください。 {"project": "chatbot", "team": "ml-platform"}
input_tokens LONG 入力トークンの数。 100
output_tokens LONG 出力トークンの数。 100
total_tokens LONG トークンの合計数 (入力 + 出力)。 200
token_details STRUCT cache_read_input_tokenscache_creation_input_tokensoutput_reasoning_tokensなどの詳細なトークンの内訳。 {"cache_read_input_tokens": 100, ...}
response_content_type STRING 応答のコンテンツ タイプ。 application/json
status_code INT レスポンスのHTTPステータスコード。 200
routing_information STRUCT フォールバック試行のルーティングの詳細。 要求中に試行された各モデルのattemptspriorityactiondestinationdestination_idstatus_codeerror_codelatency_ms、およびstart_timeを含むend_time配列が含まれます。 {"attempts": [{"priority": "1", ...}]}

使用状況追跡用のタグ要求とエンドポイント

AI Gateway では、使用状況を追跡および属性化するために、次の 2 種類のタグがサポートされています。

  • 要求タグ: 呼び出し元が個々の要求にアタッチするカスタム キーと値のペア。 要求タグを使用して、プロジェクト、チーム、環境、エンド ユーザー、または組織に関連するその他のディメンション別の使用状況を属性付けします。
  • エンドポイント タグ: エンドポイント自体で構成されたキーと値のペア。 エンドポイント タグは、エンドポイント経由でルーティングされるすべての要求に適用され、チーム、コスト センター、またはアプリケーションごとにエンドポイントを分類するのに役立ちます。

どちらのタグの種類も system.ai_gateway.usage テーブルに記録され、使用状況データのフィルター処理、集計、分析に使用できます。

リクエスト タグ

個々の要求にタグを付けるために、文字列キーを文字列値にマッピングする JSON オブジェクトを含む Databricks-Ai-Gateway-Request-Tags HTTP ヘッダーを含めます。 要求タグは、使用状況テーブルとrequest_tags 列に記録されます。

REST API、OpenAI SDK、および Anthropic SDK を使用して要求タグを設定する方法の例については、「Tag requests for usage trackingを参照してください。

たとえば、要求タグを使用してプロジェクトごとの使用状況を集計できます。

SELECT
  request_tags['project'] AS project,
  COUNT(*) AS request_count,
  SUM(total_tokens) AS total_tokens
FROM system.ai_gateway.usage
WHERE request_tags['project'] IS NOT NULL
GROUP BY request_tags['project']
ORDER BY total_tokens DESC;

エンドポイント タグ

エンドポイント タグは、AI ゲートウェイ エンドポイントを作成または更新するときに構成されます。 これらは、そのエンドポイントに対するすべての要求の使用状況テーブルの endpoint_tags 列に表示されます。

たとえば、エンドポイント タグを使用してチーム別の使用状況を集計できます。

SELECT
  endpoint_tags['team'] AS team,
  endpoint_name,
  COUNT(*) AS request_count,
  SUM(total_tokens) AS total_tokens
FROM system.ai_gateway.usage
WHERE endpoint_tags['team'] IS NOT NULL
GROUP BY endpoint_tags['team'], endpoint_name
ORDER BY total_tokens DESC;

次のステップ