Freigeben über


Statistik zur Abfrageleistung

Von Bedeutung

Dieses Feature befindet sich in Privater Vorschau. Wenden Sie sich an Ihren Azure Databricks-Kontakt, um es zu testen.

Wenn Abfragen ausgeführt werden, gibt Databricks möglicherweise Einblicke zurück, die Möglichkeiten zur Verbesserung der Leistung identifizieren. Auf dieser Seite werden die unterstützten Erkenntnisse und ihre Bedeutung aufgeführt.

Eine umfassendere Übersicht über bewährte Methoden zur Leistung finden Sie im umfassenden Leitfaden zum Optimieren von Databricks- und Spark- und Delta Lake-Workloads.

GLEICHZEITIGES_SCHREIBEN

  • Gleichzeitige Schreibvorgänge in der Tabelle führen zu Konflikten , die automatisch aufgelöst oder fehlschlagen.
  • Empfehlung: Überprüfen Sie den Deltaverlauf , um gleichzeitige Schreibvorgänge zu identifizieren und unterschiedliche Planungen zu berücksichtigen, um Konflikte zu vermeiden.

COVERAGE_FILTER_KEYS_CLUSTERING

  • Die Tabelle wird nach einem oder mehreren Schlüsseln gruppiert , die beim Filtern während des Tabellenscans nicht verwendet werden.
  • Empfehlung: Bestimmen Sie, welche Datenuntermenge Sie für das gewünschte Ergebnis benötigen, und fügen Sie dann Filter nach übereinstimmenden Clusteringschlüsseln hinzu, um das Lesen von Bytes zu reduzieren.

ABDECKUNGS_FILTIER_SCHLÜSSEL_PARTITIONIERUNG

  • Die Tabelle wird durch einen oder mehrere Schlüssel partitioniert , die beim Filtern während der Tabellenüberprüfung nicht verwendet werden.
  • Empfehlung: Bestimmen Sie, welche Datenuntermenge Sie für das gewünschte Ergebnis benötigen, und fügen Sie dann Filter nach übereinstimmenden Partitionierungsschlüsseln hinzu, um den Lesevorgang von Bytes zu reduzieren.

COVERAGE_PHOTON

  • Photon kann den Betrieb nicht beschleunigen, daher wurde die Standard-Runtime-Engine verwendet.
  • Empfehlung: Überprüfen Sie Photon-Einschränkungen, und berücksichtigen Sie die Anpassung der Abfrage, um eine unterstützte Ausführungsstrategie für eine schnellere Laufzeit zu verwenden.

COVERAGE_STATS_DELTA

  • Delta-Datenübersprung-Statistiken fehlen oder sind für die Tabellen-Scan-Dateifilter unvollständig, sodass die Abfrage dateiinterne Filter verwendet. Die folgenden Statistikstatus sind möglich:
    • Vollständig: Statistiken sind für alle Filter verfügbar.
    • Teilweise: Statistiken sind für eine Auswahl von Filtern verfügbar.
    • Nicht verfügbar: Statistiken sind für keinen Filter verfügbar.
    • Nicht verwendet: Statistiken konnten nicht für einen Filter verwendet werden, der den Datentyp konvertiert.
  • Empfehlung: Sammeln Sie Delta-Statistiken , um die Anzahl der Gelesenen von Bytes zu reduzieren.

ABDECKUNGS_STATISTIKEN_OPTIMIERER

DATA_SKEW

EXPLODING_JOIN

  • Verknüpfunggeneriert deutlich mehr Zeilen als gelesen.
  • Empfehlung: Bestimmen Sie, welche Ergebnisuntermenge erforderlich ist, aktualisieren Sie dann die Verknüpfung, oder verringern Sie die Anzahl der Eingabezeilen aus beiden Beziehungen.

IO_THROTTLING

  • Die Cloudspeicheranforderung wurde von Ihrem Cloudanbieter gedrosselt.
  • Empfehlung: Wenden Sie sich an Ihren Administrator, um Ihre Grenzwerte für Cloudspeicheranforderungen mit Ihrem Cloudanbieter zu erhöhen.