Leitfaden für die Automatische Skalierung der Lakebase-API

Von Bedeutung

Lakebase Autoscaling ist die neueste Version von Lakebase mit automatischer Berechnung, Skalierung bis Null, Verzweigung und sofortiger Wiederherstellung. Unterstützte Regionen finden Sie unter "Verfügbarkeit der Region". Wenn Sie ein Lakebase Provisioned-Benutzer sind, lesen Sie Lakebase Provisioned.

Diese Seite bietet eine Übersicht über die Lakebase-Autoscaling-API, einschließlich Authentifizierung, verfügbarer Endpunkte und gängiger Muster für die Arbeit mit der REST-API, Databricks CLI, und Databricks SDKs (Python, Java, Go).

Die vollständige API-Referenz finden Sie in der Dokumentation zur Postgres-API.

Von Bedeutung

Die Lakebase Postgres-API befindet sich in Beta. API-Endpunkte, Parameter und Verhaltensweisen können geändert werden.

Authentifizierung

Die Lakebase Autoscaling-API verwendet die OAuth-Authentifizierung auf Arbeitsbereichsebene zum Verwalten der Projektinfrastruktur (Erstellen von Projekten, Konfigurieren von Einstellungen, usw.).

Hinweis

Zwei Arten von Konnektivität: Diese API dient zum Plattformmanagement (Erstellen von Projekten, Verzweigungen, Berechnungen). Für datenbankzugriff (Herstellen einer Verbindung mit Abfragedaten):

SQL-Clients (psql, pgAdmin, DBeaver): Verwenden Sie Lakebase-OAuth-Token oder Postgres-Kennwörter. Siehe Authentifizierung.
Daten-API (RESTful HTTP): Verwenden Sie Lakebase OAuth-Token. Siehe Daten-API.
Programmiersprachentreiber (psycopg, SQLAlchemy, JDBC): Verwenden Sie Lakebase OAuth-Token oder Postgres-Kennwörter. Siehe Schnellstart.

Eine vollständige Erläuterung dieser beiden Authentifizierungsebenen finden Sie unter Authentifizierungsarchitektur.

Einrichten der Authentifizierung

Authentifizieren mithilfe der Databricks CLI:

databricks auth login --host https://your-workspace.cloud.databricks.com

Folgen Sie den Browseraufforderungen, um sich anzumelden. Die CLI speichert Ihr OAuth-Token unter ~/.databricks/token-cache.json.

Wählen Sie dann Ihre Zugriffsmethode aus:

Python SDK

Das SDK verwendet einheitliche Authentifizierung und verarbeitet automatisch OAuth-Token:

from databricks.sdk import WorkspaceClient

w = WorkspaceClient()

Java SDK

Das SDK verwendet einheitliche Authentifizierung und verarbeitet automatisch OAuth-Token:

import com.databricks.sdk.WorkspaceClient;

WorkspaceClient w = new WorkspaceClient();

Befehlszeilenschnittstelle (CLI)

Befehle verwenden automatisch das zwischengespeicherte Token:

databricks postgres list-projects

cURL

Generieren Sie ein Token für direkte API-Aufrufe:

export DATABRICKS_TOKEN=$(databricks auth token | jq -r .access_token)

curl -X GET "https://your-workspace.cloud.databricks.com/api/2.0/postgres/projects" \
  -H "Authorization: Bearer ${DATABRICKS_TOKEN}"

OAuth-Token laufen nach einer Stunde ab. Regenerieren Sie nach Bedarf.

Weitere Details finden Sie unter Autorisieren des Benutzerzugriffs auf Databricks mit OAuth.

Verfügbare Endpunkte (Beta)

Alle Endpunkte verwenden den Basispfad /api/2.0/postgres/.

Projekte

Operation	Methode	Endpunkt	Dokumentation
Projekt erstellen	`POST`	`/projects`	Erstellen eines Projekts
Projekt aktualisieren	`PATCH`	`/projects/{project_id}`	Allgemeine Einstellungen
Löschen eines Projekts	`DELETE`	`/projects/{project_id}`	Löschen eines Projekts
Projekt abrufen	`GET`	`/projects/{project_id}`	Projektdetails abrufen
Projekte auflisten	`GET`	`/projects`	Projekte auflisten

Zweige

Operation	Methode	Endpunkt	Dokumentation
Branch erstellen	`POST`	`/projects/{project_id}/branches`	Einen Zweig erstellen
Branch aktualisieren	`PATCH`	`/projects/{project_id}/branches/{branch_id}`	Aktualisiere Verzweigungseinstellungen
Verzweigung löschen	`DELETE`	`/projects/{project_id}/branches/{branch_id}`	Löschen einer Verzweigung
Verzweigung abrufen	`GET`	`/projects/{project_id}/branches/{branch_id}`	Filialen anzeigen
Zweige auflisten	`GET`	`/projects/{project_id}/branches`	Branches auflisten

Endpunkte (Berechnet und Lesen von Replikaten)

In der API wird eine Berechnung als Endpunkt bezeichnet. Eine konzeptionelle Übersicht finden Sie unter Computes und Endpunkte.

Die folgende Tabelle ordnet UI-Konzepte ihren API-Entsprechungen zu:

Ui-Konzept	API-Ressource oder -Feld	Dokumentation
Primäre Berechnung	Endpunkt mit `endpoint_type: ENDPOINT_TYPE_READ_WRITE`	Verwalten von Berechnungen
Lesereplikat	Endpunkt mit `endpoint_type: ENDPOINT_TYPE_READ_ONLY`	Lesereplikate verwalten
Hohe Verfügbarkeit	`group` Feld (`EndpointGroupSpec`) bei der Endpunktspezifikation	Verwalten der hohen Verfügbarkeit
Berechnungskennungen (UID, Ressourcenname)	`uid` und `name` (vollständiger Ressourcenpfad) für das Endpoint-Objekt	Berechnen von Bezeichnern

Verfügbare Vorgänge

Operation	Methode	Endpunkt	Dokumentation
Endpunkt erstellen	`POST`	`/projects/{project_id}/branches/{branch_id}/endpoints`	Erstellen eines Lesereplikats
Endpunkt aktualisieren	`PATCH`	`/projects/{project_id}/branches/{branch_id}/endpoints/{endpoint_id}`	Bearbeiten einer Berechnung / Bearbeiten eines Lesereplikats / Verwalten der hohen Verfügbarkeit
Löschen eines Endpunkts	`DELETE`	`/projects/{project_id}/branches/{branch_id}/endpoints/{endpoint_id}`	Lesereplikat löschen
Endpunkt abrufen	`GET`	`/projects/{project_id}/branches/{branch_id}/endpoints/{endpoint_id}`	Rechner anzeigen
Endpunkte auflisten	`GET`	`/projects/{project_id}/branches/{branch_id}/endpoints`	Rechner anzeigen

Rollen

Operation	Methode	Endpunkt	Dokumentation
Rollen auflisten	`GET`	`/projects/{project_id}/branches/{branch_id}/roles`	Anzeigen von Postgres-Rollen
Rolle erstellen	`POST`	`/projects/{project_id}/branches/{branch_id}/roles`	Erstellen einer OAuth-Rolle \| Erstellen einer Kennwortrolle
Rolle abrufen	`GET`	`/projects/{project_id}/branches/{branch_id}/roles/{role_id}`	Anzeigen von Postgres-Rollen
Rolle aktualisieren	`PATCH`	`/projects/{project_id}/branches/{branch_id}/roles/{role_id}`	Aktualisieren einer Rolle
Rolle löschen	`DELETE`	`/projects/{project_id}/branches/{branch_id}/roles/{role_id}`	Löschen einer Rolle

Kataloge

Operation	Methode	Endpunkt	Dokumentation
Registriere die Datenbank mit dem Unity-Katalog	`POST`	`/catalogs`	Registrieren einer Datenbank
Katalogregistrierung erhalten	`GET`	`/catalogs/{catalog_id}`	Überprüfen des Registrierungsstatus
Katalogregistrierung löschen	`DELETE`	`/catalogs/{catalog_id}`	Aufheben der Registrierung einer Datenbank

Hinweis

Register- und Löschvorgänge sind lang andauernde Vorgänge. Den zurückgegebenen Vorgang abfragen, bis done: true. Siehe Lang andauernde Vorgänge.

Durch das Löschen einer Katalogregistrierung wird die zugrunde liegende Postgres-Datenbank nicht gelöscht.

Synchronisierte Tabellen

Operation	Methode	Endpunkt	Dokumentation
Synchronisierungstabelle erstellen	`POST`	`/synced_tables`	Erstellen einer synchronisierten Tabelle
Synchronisierte Tabelle abrufen	`GET`	`/synced_tables/{table_name}`	Überprüfen des Synchronisierungsstatus
Synchronisierte Tabelle löschen	`DELETE`	`/synced_tables/{table_name}`	Löschen einer synchronisierten Tabelle

Hinweis

Im table_name Pfad wird das Format catalog.schema.tableverwendet.

Das Erstellen und Löschen sind zeitaufwendige Vorgänge. Den zurückgegebenen Vorgang abfragen, bis done: true. Siehe Lang andauernde Vorgänge.

Durch das Löschen einer synchronisierten Tabelle wird nur die Unity-Katalogregistrierung entfernt. Legen Sie den Postgres-Tisch separat ab, um Platz freizugeben.

Datenbank-Zugangsdaten

Operation	Methode	Endpunkt	Dokumentation
Datenbankanmeldeinformationen generieren	`POST`	`/credentials`	OAuth-Tokenauthentifizierung

Operationen

Operation	Methode	Endpunkt	Dokumentation
Vorgang abrufen	`GET`	`/projects/{project_id}/operations/{operation_id}`	Siehe Beispiel unten

Berechtigungen

Project ACL-Berechtigungen verwenden die standard Azure Databricks Permissions API und nicht den /api/2.0/postgres/ Basispfad. Legen Sie die request_object_type auf database-projects und request_object_id auf Ihre Projekt-ID fest (z. B. my-app).

Operation	Methode	Endpunkt	Dokumentation
Abrufen von Projektberechtigungen	`GET`	`/api/2.0/permissions/database-projects/{project_id}`	Berechtigungs-API-Referenz
Aktualisieren von Projektberechtigungen	`PATCH`	`/api/2.0/permissions/database-projects/{project_id}`	Berechtigungs-API-Referenz
Ersetzen von Projektberechtigungen	`PUT`	`/api/2.0/permissions/database-projects/{project_id}`	Berechtigungs-API-Referenz

Die zulässigen Berechtigungsstufen für Lakebase-Projekte sind CAN_USE und CAN_MANAGE. CAN_CREATE ist eine geerbte Ebene und kann nicht über die API festgelegt werden. Siehe Berechtigungsstufen.

Für Verwendungsbeispiele und entsprechende CLI/SDK/Terraform-Kommandos siehe Erteilen von Berechtigungen programmgesteuert.

Vorgang abrufen

Überprüfen Sie den Status eines lang andauernden Vorgangs anhand des Ressourcennamens.

Python SDK

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.postgres import Project, ProjectSpec

w = WorkspaceClient()

# Start an operation (example: create project)
operation = w.postgres.create_project(
    project=Project(spec=ProjectSpec(pg_version=17)),
    project_id="my-project",
)
print(f"Operation started: {operation.name()}")

# Wait for completion
result = operation.wait()
print(f"Operation completed: {result.name}")

Java SDK

import com.databricks.sdk.WorkspaceClient;
import com.databricks.sdk.service.postgres.*;

WorkspaceClient w = new WorkspaceClient();

// Start an operation (example: create project)
CreateProjectOperation operation = w.postgres().createProject(
    new CreateProjectRequest()
        .setProjectId("my-project")
        .setProject(new Project()
            .setSpec(new ProjectSpec()
                .setPgVersion(17L)))
);
System.out.println("Operation started: " + operation.getName());

// Wait for completion
Project result = operation.waitForCompletion();
System.out.println("Operation completed: " + result.getName());

Befehlszeilenschnittstelle (CLI)

Die CLI wartet automatisch, bis Vorgänge standardmäßig abgeschlossen sind. Verwenden Sie --no-wait zum Überspringen des Abfragens.

# Create project without waiting
databricks postgres create-project my-project --no-wait \
  --json '{"spec": {"pg_version": 17}}'

# Later, check the operation status using the operation name from the response
databricks postgres get-operation projects/my-project/operations/<operation-id>

cURL

# Get operation status
curl -X GET "$WORKSPACE/api/2.0/postgres/projects/my-project/operations/<operation-id>" \
  -H "Authorization: Bearer ${DATABRICKS_TOKEN}" | jq

Antwortformat:

{
  "name": "projects/my-project/operations/<operation-id>",
  "done": true,
  "response": {
    "@type": "type.googleapis.com/databricks.postgres.v1.Project",
    "name": "projects/my-project",
    ...
  }
}

Felder:

done: false während der Bearbeitung, true nach Abschluss
response: Enthält das Ergebnis, wenn donetrue ist.
error: Enthält Fehlerdetails, wenn der Vorgang fehlgeschlagen ist.

Allgemeine Muster

Ressourcen-Namensgebung

Ressourcen folgen einem hierarchischen Benennungsmuster, bei dem untergeordnete Ressourcen ihren übergeordneten Elementen zugeordnet sind.

Projekte verwenden dieses Format:

projects/{project_id}

Untergeordnete Ressourcen wie Vorgänge werden unter ihrem übergeordneten Projekt geschachtelt:

projects/{project_id}/operations/{operation_id}

Dies bedeutet, dass Sie die übergeordnete Projekt-ID für den Zugriff auf Vorgänge oder andere untergeordnete Ressourcen benötigen.

Ressourcen-IDs:

Beim Erstellen von Ressourcen müssen Sie eine Ressourcen-ID angeben (z. B. my-app) für die Parameter project_id, branch_id oder endpoint_id. Diese ID wird Teil des Ressourcenpfads in API-Aufrufen (z. B. projects/my-app/branches/development).

Sie können optional Ihrer Ressource eine display_name aussagekräftige Beschriftung vergeben. Wenn Sie keinen Anzeigenamen angeben, verwendet das System Ihre Ressourcen-ID als Anzeigenamen.

:::tipp: Suchen von Ressourcen auf der Benutzeroberfläche

Um ein Projekt in der Lakebase-Benutzeroberfläche zu finden, suchen Sie in der Projektliste nach dem Anzeigenamen. Wenn Sie beim Erstellen des Projekts keinen benutzerdefinierten Anzeigenamen angegeben haben, suchen Sie nach Ihrem project_id (z. B. "my-app").

:::

Hinweis

Ressourcen-IDs können nach der Erstellung nicht mehr geändert werden.

Requirements:

Muss 1 bis 63 Zeichen lang sein
Nur Kleinbuchstaben, Ziffern und Bindestriche
Kann nicht mit einem Bindestrich beginnen oder enden
Beispiele: my-app, , analytics-dbcustomer-123

Lang andauernde Vorgänge (LROs)

Erstellen, Aktualisieren und Löschen geben ein databricks.longrunning.Operation Objekt zurück, das einen Abschlussstatus bereitstellt.

Beispiel-Vorgangsantwort:

{
  "name": "projects/my-project/operations/<operation-id>",
  "done": false
}

Abfrage zum Abschluss mithilfe von GetOperation:

Python SDK

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.postgres import Project, ProjectSpec

w = WorkspaceClient()

# Start an operation
operation = w.postgres.create_project(
    project=Project(spec=ProjectSpec(pg_version=17)),
    project_id="my-project",
)

# Wait for completion
result = operation.wait()
print(f"Operation completed: {result.name}")

Java SDK

import com.databricks.sdk.WorkspaceClient;
import com.databricks.sdk.service.postgres.*;

WorkspaceClient w = new WorkspaceClient();

// Start an operation
CreateProjectOperation operation = w.postgres().createProject(
    new CreateProjectRequest()
        .setProjectId("my-project")
        .setProject(new Project()
            .setSpec(new ProjectSpec()
                .setPgVersion(17L)))
);

// Wait for completion
Project result = operation.waitForCompletion();
System.out.println("Operation completed: " + result.getName());

Befehlszeilenschnittstelle (CLI)

Die CLI wartet automatisch, bis Vorgänge standardmäßig abgeschlossen sind. Verwenden Sie --no-wait, um sofort zurückzukehren:

databricks postgres create-project my-project --no-wait \
  --json '{"spec": {"pg_version": 17}}'

cURL

# Poll the operation
curl "$WORKSPACE/api/2.0/postgres/projects/my-project/operations/<operation-id>" \
  -H "Authorization: Bearer ${DATABRICKS_TOKEN}" | jq '.done'

Alle paar Sekunden abfragen, bis donetrue ist.

Aktualisieren von Masken

Aktualisierungsvorgänge erfordern einen update_mask Parameter, der angibt, welche Felder geändert werden sollen. Dadurch wird verhindert, dass nicht verknüpfte Felder versehentlich überschrieben werden.

Formatunterschiede:

Methode	Format	Example
REST API	Query parameter (Abfrageparameter)	`?update_mask=spec.display_name`
Python SDK	FieldMask-Objekt	`update_mask=FieldMask(field_mask=["spec.display_name"])`
Befehlszeilenschnittstelle (CLI)	Positionsargument	`update-project NAME spec.display_name`

Fehlerbehandlung

Die Lakebase-API gibt standardmäßige HTTP-Statuscodes zurück.

409: Widersprüchliche Vorgänge

Lakebase kann aus mehreren Gründen einen 409 Conflict Fehler zurückgeben:

Ein interner Wartungsvorgang wird im Projekt ausgeführt.
Das Projekt hat seine Kapazitätsgrenze für gleichzeitige Vorgänge erreicht.
Ihre eigenen API-Anforderungen überlappen sich. Zum Beispiel das Erstellen einer Verzweigung, bevor eine vorherige Verzweigungserstellung abgeschlossen ist.

Was dies bedeutet:

Lakebase plant manchmal Wartungsvorgänge für Projekte. Wenn eine Clientanforderung eingeht, während eine dieser Vorgänge ausgeführt wird, lehnt Lakebase die neue Anforderung mit einem 409 Conflict Fehler ab. Sie erhalten möglicherweise auch diese Antwort, wenn das Projekt ausgelastet ist oder sich Ihre API-Aufrufe überlappen.

Dieses Verhalten wird erwartet. Clients sollten darauf vorbereitet sein, Anforderungen erneut auszuführen, wenn dieser Fehler auftritt.

Was ist zu tun:

Wiederholen Sie die Anforderung. Wenn der interne Vorgang abgeschlossen oder Kapazität freigegeben wird, akzeptiert Lakebase neue Anforderungen für das Projekt.

Verwenden Sie eine exponentielle Backoff-Strategie für Wiederholungen: Warten Sie ein kurzes Intervall, bevor Sie den ersten Wiederholungsversuch ausführen, und verdoppeln Sie dann die Wartezeit bei jedem nachfolgenden Versuch. Ein Startintervall von 100 Millisekunden mit maximal 30 Sekunden ist ein vernünftiger Standardwert.

Python SDK

import time
from databricks.sdk import WorkspaceClient
from databricks.sdk.errors import ResourceConflict
from databricks.sdk.service.postgres import Branch, BranchSpec

w = WorkspaceClient()

def retry_on_conflict(fn, max_attempts=5, base_delay=0.1):
    """Retry a Lakebase API call when a conflicting operation is in progress."""
    for attempt in range(max_attempts):
        try:
            return fn()
        except ResourceConflict:
            if attempt == max_attempts - 1:
                raise
            wait = base_delay * (2 ** attempt)
            print(f"Conflicting operation in progress. Retrying in {wait}s...")
            time.sleep(wait)

# Example: create a branch with retry
branch = retry_on_conflict(
    lambda: w.postgres.create_branch(
        parent="projects/my-project",
        branch=Branch(spec=BranchSpec(no_expiry=True)),
        branch_id="my-branch",
    ).wait()
)

cURL

# Retry with exponential backoff on 409 responses
retry_on_conflict() {
  local cmd=("$@")
  local max_attempts=5
  local delay=0.1
  local attempt=0

  while [ $attempt -lt $max_attempts ]; do
    response=$(curl -s -w "\n%{http_code}" "${cmd[@]}")
    http_code=$(echo "$response" | tail -n1)
    body=$(echo "$response" | sed '$d')

    if [ "$http_code" -ne 409 ]; then
      echo "$body"
      return 0
    fi

    attempt=$((attempt + 1))
    if [ $attempt -eq $max_attempts ]; then
      echo "Max retries reached. Last response: $body" >&2
      return 1
    fi

    echo "Conflicting operation in progress. Retrying in ${delay}s..." >&2
    sleep "$delay"
    delay=$((delay * 2))
  done
}

# Example: create a branch with retry
retry_on_conflict \
  -X POST "$WORKSPACE/api/2.0/postgres/projects/my-project/branches?branch_id=my-branch" \
  -H "Authorization: Bearer ${DATABRICKS_TOKEN}" \
  -H "Content-Type: application/json" \
  -d '{"spec": {"no_expiry": true}}'

Hinweis

Ein 409 Conflict in einer Lakebase API-Anfrage bedeutet, dass die Anfrage nicht akzeptiert wurde, nicht, dass sie angewendet wurde. Überprüfen Sie immer den Ressourcenstatus nach einem erfolgreichen Wiederholungsversuche, indem Sie den entsprechenden GET Endpunkt aufrufen.

SDKs und Infrastruktur als Code

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-14

Leitfaden für die Automatische Skalierung der Lakebase-API

Authentifizierung

Einrichten der Authentifizierung

Python SDK

Java SDK

Befehlszeilenschnittstelle (CLI)

cURL

Verfügbare Endpunkte (Beta)

Projekte

Zweige

Endpunkte (Berechnet und Lesen von Replikaten)

Verfügbare Vorgänge

Rollen

Kataloge

Synchronisierte Tabellen

Datenbank-Zugangsdaten

Operationen

Berechtigungen

Vorgang abrufen

Python SDK

Java SDK

Befehlszeilenschnittstelle (CLI)

cURL

Allgemeine Muster

Ressourcen-Namensgebung

Lang andauernde Vorgänge (LROs)

Python SDK

Java SDK

Befehlszeilenschnittstelle (CLI)

cURL

Aktualisieren von Masken

Fehlerbehandlung

409: Widersprüchliche Vorgänge

Python SDK

cURL

SDKs und Infrastruktur als Code

Feedback

Zusätzliche Ressourcen