Important
この機能は ベータ版です。 アカウント管理者は、アカウント コンソール の [プレビュー ] ページからこの機能へのアクセスを制御できます。 Manage Azure Databricks プレビューを参照してください。
このページでは、使用状況追跡システム テーブルを使用して 、Unity AI Gateway エンドポイントの使用状況を監視する方法について説明します。
使用状況追跡テーブルでは、エンドポイントの要求と応答の詳細が自動的にキャプチャされ、トークンの使用状況や待機時間などの重要なメトリックがログに記録されます。 この表のデータを使用して、使用状況を監視し、コストを追跡し、エンドポイントのパフォーマンスと使用量に関する分析情報を得ることができます。
使用状況の追跡では、Databricks が提供するエンドポイントへの ai_query 要求もキャプチャされます。
Requirements
- Unity AI Gateway プレビューがあなたのアカウントに対して有効になりました。 Manage Azure Databricks プレビューを参照してください。
- Unity AI Gateway でサポートされているリージョン内のAzure Databricks ワークスペース。
- ワークスペースに対して有効になっている Unity カタログ。 「Unity Catalog のワークスペースを有効にする」を参照してください。
使用状況テーブルのクエリを実行する
Unity AI Gateway は、使用状況データを system.ai_gateway.usage システム テーブルに記録します。 UI でテーブルを表示したり、Databricks SQL またはノートブックからテーブルにクエリを実行したりすることもできます。
注
system.ai_gateway.usage テーブルを表示または照会するアクセス許可を持つのは、アカウント管理者だけです。
UI でテーブルを表示するには、エンドポイント ページの [使用状況追跡テーブル] リンクをクリックして、カタログ エクスプローラーでテーブルを開きます。
Databricks SQL またはノートブックからテーブルにクエリを実行するには:
SELECT * FROM system.ai_gateway.usage;
組み込みの使用状況ダッシュボード
組み込みの使用状況ダッシュボードを作成する
アカウント管理者は、AI Gateway ページの [ ダッシュボードの作成 ] をクリックして、使用状況を監視し、コストを追跡し、エンドポイントのパフォーマンスと使用量に関する分析情報を得ることで、組み込みの Unity AI Gateway 使用状況ダッシュボードを作成できます。 アカウント管理者は、ダッシュボード クエリの実行に使用されるウェアハウスを更新することもできます。これは、後続のすべてのクエリに適用されます。
注
ダッシュボードの作成には、SELECT テーブルに対するsystem.ai_gateway.usageアクセス許可が必要なため、アカウント管理者に制限されます。 ダッシュボードのデータは、 usage テーブルのアイテム保持ポリシーの対象となります。 「使用できるシステム テーブルはどれですか?」を参照してください。
組み込みの使用状況ダッシュボードの新しいバージョンを使用できる場合、アカウント管理者は、[AI ゲートウェイ] ページのダッシュボード アクション メニューから [ 更新 ] をクリックできます。
次のダッシュボード構成オプションを使用して、ダッシュボードを管理できます。
- スコープ: ダッシュボードのスコープをアカウントとワークスペースのどちらにするかを選択します。
- アクセス許可: ダッシュボード所有者のアクセス許可または各ビューアーのアクセス許可を使用してクエリを実行するかどうかを選択します。 「 共有データのアクセス許可とは」を参照してください。
- 自動更新: このオプションを有効にすると、新しいバージョンが使用可能になり、アカウント管理者が AI ゲートウェイ ページにアクセスするたびに、ダッシュボードが自動的に更新されます。
ダッシュボードがバージョン 0.3 以降に更新されると、6 時間ごとにダッシュボードを更新するスケジュールが自動的に作成されます。 必要に応じて、このスケジュールを Lakeview ダッシュボードで無効にすることができます。 「スケジュールを作成する」を参照してください。
使用状況ダッシュボードを表示する
ダッシュボードを表示するには、[AI ゲートウェイ] ページで [ ダッシュボードの表示 ] をクリックします。 組み込みのダッシュボードでは、Unity AI Gateway エンドポイントの使用状況、パフォーマンス、コストを包括的に把握できます。 要求の追跡、トークン使用量、待機時間のメトリック、エラー率、コストの内訳、外部 MCP サーバー トラフィック、およびコーディング エージェント アクティビティを追跡する複数のページが含まれます。
ダッシュボードでは、既定でクロスワークスペース分析が提供されます。 すべてのダッシュボード ページは、日付範囲とワークスペース ID でフィルター処理できます。
- [概要] タブ: 毎日の要求量、時間の経過に伴うトークン使用量の傾向、トークン消費量別の上位ユーザー数、一意のユーザー数の合計など、高レベルの使用状況メトリックが表示されます。 このタブを使用して、Unity AI Gateway の全体的なアクティビティの簡単なスナップショットを取得し、最もアクティブなユーザーとモデルを特定します。
- [パフォーマンス] タブ: 待機時間のパーセンタイル (P50、P90、P95、P99)、最初のバイトまでの時間、エラー率、HTTP 状態コードの分布など、主要なパフォーマンス メトリックを追跡します。 このタブを使用して、エンドポイントの正常性を監視し、パフォーマンスのボトルネックや信頼性の問題を特定します。
- [使用状況] タブ: エンドポイント、ワークスペース、リクエスターごとの詳細な消費量の内訳が表示されます。 このタブには、トークンの使用パターン、要求の分散、キャッシュ ヒット率が表示されます。
- [Cost Observability] タブ: エンドポイント、ターゲット モデル、ユーザー、エンドポイント タグ、要求タグごとのコストの内訳が表示されます。 このタブには、外部モデルの推定コストも含まれます。 Unity AI Gateway のコストの監視を参照してください。
- [外部 MCP サーバー] タブ: 外部 MCP サーバー トラフィックの要求量、エラー率、ユーザーと接続、および毎日の使用状況の傾向が表示されます。
- [コーディング エージェント] タブ: Cursor、Claude Code、Gemini CLI、Codex CLI などの統合コーディング エージェントからのアクティビティを追跡します。 このタブには、アクティブな日、コーディング セッション、コミット、開発者ツールの使用状況を監視するために追加または削除されたコード行などのメトリックが表示されます。 詳細については、 コーディング エージェント ダッシュボード を参照してください。
使用状況テーブルスキーマ
system.ai_gateway.usage テーブルには、次のスキーマがあります。
| 列名 | タイプ | Description | 例 |
|---|---|---|---|
account_id |
STRING | アカウント ID。 | 11d77e21-5e05-4196-af72-423257f74974 |
workspace_id |
STRING | ワークスペース ID。 | 1653573648247579 |
request_id |
STRING | 要求の一意の識別子。 | b4a47a30-0e18-4ae3-9a7f-29bcb07e0f00 |
schema_version |
INTEGER | 使用レコードのスキーマ バージョン。 | 1 |
endpoint_id |
STRING | Unity AI Gateway エンドポイントの一意の ID。 | 43addf89-d802-3ca2-bd54-fe4d2a60d58a |
endpoint_name |
STRING | Unity AI Gateway エンドポイントの名前。 | databricks-gpt-5-2 |
endpoint_tags |
MAP | 作成時または更新時にエンドポイントで構成されたタグ。 エンドポイント タグはエンドポイントへのすべての要求に適用され、チーム、コスト センター、またはプロジェクトごとにエンドポイントを分類するのに役立ちます。 使用状況の追跡については、「タグ要求とエンドポイント」を参照してください。 | {"team": "engineering"} |
endpoint_metadata |
STRUCT |
creator、creation_time、last_updated_time、destinations、inference_table、fallbacksなどのエンドポイント メタデータ。 |
{"creator": "user.name@email.com", "creation_time": "2026-01-06T12:00:00.000Z", ...} |
event_time |
TIMESTAMP | 要求が受信されたときのタイムスタンプ。 | 2026-01-20T19:48:08.000+00:00 |
latency_ms |
LONG | 合計待機時間 (ミリ秒)。 | 300 |
time_to_first_byte_ms |
LONG | 最初のバイトまでの時間 (ミリ秒)。 | 300 |
destination_type |
STRING | 変換先の種類 (外部モデルや基礎モデルなど)。 | PAY_PER_TOKEN_FOUNDATION_MODEL |
destination_name |
STRING | 変換先モデルまたはプロバイダーの名前。 | databricks-gpt-5-2 |
destination_id |
STRING | 宛先の一意の ID。 | 507e7456151b3cc89e05ff48161efb87 |
destination_model |
STRING | 要求に使用される特定のモデル。 | GPT-5.2 |
requester |
STRING | 要求を行ったユーザーまたはサービス プリンシパルの ID。 | user.name@email.com |
requester_type |
STRING | 要求元の種類 (ユーザー、サービス プリンシパル、またはユーザー グループ)。 | USER |
ip_address |
STRING | 要求元の IP アドレス。 | 1.2.3.4 |
url |
STRING | 要求の URL。 | https://<workspace-url>/ai-gateway/mlflow/v1/chat/completions |
user_agent |
STRING | 要求元のユーザー エージェント。 | OpenAI/Python 2.13.0 |
api_type |
STRING | API 呼び出しの種類 (チャット、完了、埋め込みなど)。 | mlflow/v1/chat/completions |
request_tags |
MAP |
Databricks-Ai-Gateway-Request-Tags HTTP ヘッダーを使用して個々の要求と共に送信されるユーザー指定のタグ。 要求タグを使用して、特定のプロジェクト、チーム、環境、またはエンド ユーザーに使用状況を属性付けします。
使用状況追跡のためのタグ リクエストとエンドポイントおよび使用状況追跡のためのタグ リクエストを参照してください。 |
{"project": "chatbot", "team": "ml-platform"} |
input_tokens |
LONG | 入力トークンの数。 | 100 |
output_tokens |
LONG | 出力トークンの数。 | 100 |
total_tokens |
LONG | トークンの合計数 (入力 + 出力)。 | 200 |
token_details |
STRUCT |
cache_read_input_tokens、cache_creation_input_tokens、output_reasoning_tokensなどの詳細なトークンの内訳。 |
{"cache_read_input_tokens": 100, ...} |
response_content_type |
STRING | 応答のコンテンツ タイプ。 | application/json |
status_code |
INT | レスポンスのHTTPステータスコード。 | 200 |
routing_information |
STRUCT |
フォールバック試行のルーティングの詳細。 要求中に試行された各モデルのattempts、priority、action、destination、destination_id、status_code、error_code、latency_ms、およびstart_timeを含むend_time配列が含まれます。 |
{"attempts": [{"priority": "1", ...}]} |
使用状況追跡用のタグ要求とエンドポイント
AI Gateway では、使用状況を追跡および属性化するために、次の 2 種類のタグがサポートされています。
- 要求タグ: 呼び出し元が個々の要求にアタッチするカスタム キーと値のペア。 要求タグを使用して、プロジェクト、チーム、環境、エンド ユーザー、または組織に関連するその他のディメンション別の使用状況を属性付けします。
- エンドポイント タグ: エンドポイント自体で構成されたキーと値のペア。 エンドポイント タグは、エンドポイント経由でルーティングされるすべての要求に適用され、チーム、コスト センター、またはアプリケーションごとにエンドポイントを分類するのに役立ちます。
どちらのタグの種類も system.ai_gateway.usage テーブルに記録され、使用状況データのフィルター処理、集計、分析に使用できます。
リクエスト タグ
個々の要求にタグを付けるために、文字列キーを文字列値にマッピングする JSON オブジェクトを含む Databricks-Ai-Gateway-Request-Tags HTTP ヘッダーを含めます。 要求タグは、使用状況テーブルとrequest_tagsの 列に記録されます。
REST API、OpenAI SDK、および Anthropic SDK を使用して要求タグを設定する方法の例については、「Tag requests for usage trackingを参照してください。
たとえば、要求タグを使用してプロジェクトごとの使用状況を集計できます。
SELECT
request_tags['project'] AS project,
COUNT(*) AS request_count,
SUM(total_tokens) AS total_tokens
FROM system.ai_gateway.usage
WHERE request_tags['project'] IS NOT NULL
GROUP BY request_tags['project']
ORDER BY total_tokens DESC;
エンドポイント タグ
エンドポイント タグは、AI ゲートウェイ エンドポイントを作成または更新するときに構成されます。 これらは、そのエンドポイントに対するすべての要求の使用状況テーブルの endpoint_tags 列に表示されます。
たとえば、エンドポイント タグを使用してチーム別の使用状況を集計できます。
SELECT
endpoint_tags['team'] AS team,
endpoint_name,
COUNT(*) AS request_count,
SUM(total_tokens) AS total_tokens
FROM system.ai_gateway.usage
WHERE endpoint_tags['team'] IS NOT NULL
GROUP BY endpoint_tags['team'], endpoint_name
ORDER BY total_tokens DESC;