Überwachen von Modellen mithilfe von Rückschlusstabellen

Von Bedeutung

Dieses Feature befindet sich in der Betaversion. Kontoadministratoren können den Zugriff auf dieses Feature über die Seite " Vorschau" der Kontokonsole steuern. Siehe Manage Azure Databricks Previews.

Auf dieser Seite wird beschrieben, wie Sie Schlussfolgerungstabellen verwenden, um Unity AI Gateway-Endpunkte zu überwachen.

Was sind Unity AI Gateway-Ableitungstabellen?

Unity AI Gateway Inference-Tabellen protokollieren Anforderungen und Antworten von Ihren Unity AI Gateway-Endpunkten in Unity Catalog Delta-Tabellen. Sie können diese Daten zum Überwachen, Debuggen und Optimieren Ihrer Modelle verwenden.

Zu den gängigen Anwendungsfällen gehören:

Debuggen: Analysieren Sie Anforderungs- und Antwortnutzlasten, um Probleme zu beheben.
Überwachung: Nachverfolgen der Modellleistung und Identifizieren von Anomalien.
Optimierung: Überprüfen Sie Interaktionen, um Modellaufforderungen und -konfigurationen zu verbessern.
Compliance: Führen von Prüfprotokollen aller Modellinteraktionen.

Anforderungen

Unity AI Gateway Preview für Ihr Konto aktiviert. Siehe Manage Azure Databricks Previews.
Ein Azure Databricks-Arbeitsbereich in einer von Unity AI Gateway unterstützten Region.
Unity-Katalog für Ihren Arbeitsbereich aktiviert. Weitere Informationen finden Sie unter Aktivieren eines Arbeitsbereichs für Unity Catalog.
Sowohl der Ersteller des Endpunkts als auch der Modifizierer müssen über die Berechtigung Kann Verwalten für den Endpunkt verfügen.
- CREATE TABLE Berechtigung im angegebenen Unity-Katalog und -Schema.
- USE CATALOG Berechtigung für den angegebenen Katalog.
- USE SCHEMA Berechtigung für das angegebene Schema.
Der Katalog kann kein Delta-Freigabekatalog für den aktuellen Metastore sein.
Databricks empfiehlt, eine predictive Optimierung für eine verbesserte Leistung zu ermöglichen.

Aktivieren von Rückschlusstabellen

Inference-Tabellen können nur konfiguriert werden, nachdem Sie einen Unity AI Gateway-Endpunkt erstellt haben.

So aktivieren Sie Inferencetabellen:

Klicken Sie in der Randleiste auf AI-Gateway.
Klicken Sie auf den Endpunktnamen, um die Endpunktseite zu öffnen.
Klicken Sie auf Einrichten neben Inference-Tabellen.
Geben Sie den Katalog und das Schema an, in dem Die Ableitungstabelle gespeichert werden soll.
Klicken Sie auf "Speichern".

Der Besitzer der Rückschlusstabelle ist der Benutzer, der den Endpunkt erstellt hat. Alle ACLs folgen den Standardberechtigungen des Unity-Katalogs und können vom Tabellenbesitzer geändert werden.

Hinweis

Das Angeben einer vorhandenen Tabelle wird nicht unterstützt. Azure Databricks erstellt beim Aktivieren von Rückschlusstabellen automatisch eine neue Ableitungstabelle.

Warnung

Die Ableitungstabelle könnte die Protokollierung von Daten beenden oder beschädigt werden, wenn Sie eine der folgenden Aktionen ausführen:

Ändern Sie das Tabellenschema.
Ändern Sie den Tabellennamen.
Löschen Sie die Tabelle.

Deaktivieren von Rückschlusstabellen

So deaktivieren Sie Inferencetabellen:

Klicken Sie in der Randleiste auf AI-Gateway.
Klicken Sie auf den Endpunktnamen, um die Endpunktseite zu öffnen.
Klicken Sie auf das Bearbeitungssymbol neben Inferenz-Tabellen.
Klicken Sie auf "Rückschlusstabellen deaktivieren".

Abfrage der Inferenztabelle

Sie können die Tabelle auf der Benutzeroberfläche anzeigen oder die Tabelle aus Databricks SQL oder einem Notizbuch abfragen.

Wenn Sie die Tabelle auf der Benutzeroberfläche anzeigen möchten, klicken Sie auf der Endpunktseite auf die Verknüpfung der Ableitungstabelle, um die Tabelle im Katalog-Explorer zu öffnen.

So fragen Sie die Tabelle aus Databricks SQL oder einem Notizbuch ab:

SELECT * FROM <catalog>.<schema>.<payload_table>

Ersetzen Sie <catalog>, <schema> und <payload_table> mit Ihrem Tabellenstandort.

Inference-Tabellenschema

Unity AI Gateway-Ableitungstabellen weisen das folgende Schema auf:

Spaltenname	Typ	Description	Example
`request_id`	STRING	Ein eindeutiger Bezeichner für die Anforderung.	`7a99b43cb46c432bb0a7814217701909`
`request_tags`	MAP	Tags, die der Anforderung zugeordnet sind.	`{"team": "engineering"}`
`event_time`	TIMESTAMP	Der Zeitstempel, zu dem die Anforderung empfangen wurde.	`2024-05-17T13:47:13.282-07:00`
`status_code`	INT	Der HTTP-Statuscode der Antwort.	`200`
`sampling_fraction`	DOUBLE	Die Sampling-Anteil, wenn Downsampling verwendet wurde. Ein Wert von 1 bedeutet kein Downsampling.	`1`
`latency_ms`	LONG	Die Gesamtlatenz in Millisekunden.	`300`
`time_to_first_byte_ms`	LONG	Die Zeit für das erste Byte in Millisekunden.	`200`
`request`	STRING	Die unformatierte JSON-Anforderungsnutzlast.	`{"messages": [...], ...}`
`response`	STRING	Die unformatierte JSON-Antwortnutzlast.	`{"choices": [...], ...}`
`destination_id`	STRING	Die ID des Zielmodells oder Anbieters.	`7a99b43c-b46c-432b-b0a7-814217701909`
`logging_error_codes`	ARRAY	Fehlercodes, wenn die Protokollierung fehlgeschlagen ist (z. B. `MAX_REQUEST_SIZE_EXCEEDED`).	`["MAX_RESPONSE_SIZE_EXCEEDED"]`
`requester`	STRING	Die ID des Benutzers oder Dienstprinzipals, der die Anforderung gestellt hat.	`databricks.engineer@databricks.com`
`schema_version`	STRING	Die Schemaversion des Inferenztabellendatensatzes.	`0`

Einschränkungen

Nur externe Speicherkataloge: Inference-Tabellen können nur in externen Speicherkatalogen erstellt werden. Standardspeicherkataloge werden derzeit nicht unterstützt.
Private Endpunkte werden nicht unterstützt: Inference-Tabellen können nicht im Speicher erstellt werden, der über einen privaten Endpunkt gesichert ist. Siehe Einschränkungen des Zerobus-Ingest-Connectors.
Bestmögliche Zustellung: Protokolle sind in der Regel innerhalb von Minuten nach einer Anforderung verfügbar, aber die Übermittlung ist nicht garantiert.
Maximale Nutzlastgröße: Anforderungen und Antworten, die größer als 10 MiB sind, werden nicht protokolliert. Die logging_error_codes-Spalte gibt an, wann dies mit MAX_REQUEST_SIZE_EXCEEDED oder MAX_RESPONSE_SIZE_EXCEEDED erfolgt.
Fehlerantworten: Protokolle werden möglicherweise nicht für Anforderungen aufgefüllt, die Fehler 401, 403, 429 oder 500 zurückgeben.

Nächste Schritte

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-03