Freigeben über


Importieren und Abfragen von Daten mithilfe des Excel-Add-Ins Azure Databricks

Von Bedeutung

Dieses Feature befindet sich in der Public Preview.

Das Excel-Add-In Azure Databricks verbindet Ihren Azure Databricks-Arbeitsbereich mit Microsoft Excel, wodurch verwaltete Lakehouse-Daten direkt in Ihre Kalkulationstabellen integriert werden, damit Sie schneller von Daten zu Entscheidungen wechseln können.

Auf dieser Seite wird beschrieben, wie Sie das Excel-Add-In Azure Databricks verwenden, um Daten aus Azure Databricks in Excel zu importieren und zu analysieren. Sie können Azure Databricks-Tabellen über eine intuitive Benutzeroberfläche durchsuchen und importieren, in der keine SQL-Kenntnisse erforderlich sind. Während das Add-In die Flexibilität zum Ausführen benutzerdefinierter SQL-Abfragen bietet, ist es optional.

Voraussetzungen

Bevor Sie das Excel-Add-In verwenden, vergewissern Sie sich, dass es eingerichtet ist.

Auswählen eines SQL-Lagerlagers

Wählen Sie aus, welches SQL-Lager verwendet werden soll:

  1. Klicken Sie oben rechts im Add-In-Bereich von Azure Databricks in Excel auf das Dropdownmenü.
  2. Wählen Sie aus, welches SQL-Lagerhaus Sie verwenden möchten.

Importieren von Daten aus Azure Databricks

Importieren Sie Daten aus Azure Databricks in Excel, indem Sie eine Tabelle auswählen, eine SQL-Abfrage schreiben oder eine PivotTable importieren.

Hinweis

Sie können Metrikansichten des Unity-Katalogs mithilfe von PivotTables, SQL-Abfragen und benutzerdefinierten Funktionen importieren.

PivotTables erstellen

So erstellen Sie eine PivotTable aus Unity-Katalogtabellen und -ansichten in Excel:

  1. Wählen Sie im Excel-Add-In-Bereich "Azure Databricks" unter der Registerkarte " Neuer Import " die Option "Daten als Importmethode auswählen" aus.

  2. Wählen Sie unter "Katalog" die Tabelle aus, aus der Sie eine PivotTable erstellen möchten, und klicken Sie auf "Auswählen".

  3. Aktivieren Sie das Kontrollkästchen "Pivotdaten ".

  4. Konfigurieren Sie Ihre Zeile, Spalte, Wert und Filter nach Bedarf.

  5. (Optional) Wenn Sie ein Beispiel für den Import anzeigen möchten, klicken Sie auf "Vorschau".

  6. (Optional) Legen Sie einen Zeilengrenzwert für den Import fest.

  7. Importieren Sie Ihre Ergebnisse. Wählen Sie eine der folgenden Optionen aus:

    • Klicken Sie auf "Speichern und importieren ", um die Abfrage zur Wiederverwendung in der Excel-Arbeitsmappe zu speichern und die Ergebnisse zu importieren.
    • Klicken Sie auf den Abwärtspfeil, und klicken Sie dann auf " Ergebnisse importieren", um die Ergebnisse zu importieren, ohne die Abfrage zu speichern. Verwenden Sie diese Option, wenn Sie mit der Bearbeitung eines Imports fortfahren möchten.

    Hinweis

    PivotTables können nur in ein neues Blatt importiert werden.

Wenn Sie mit Unity-Katalogmetriken in PivotTables arbeiten, könnte Sum(measure) in den Ergebnissen angezeigt werden. Dies wird erwartet, und es tritt keine zusätzliche Aggregation auf. Excel erfordert, dass Werte über eine Aggregationsfunktion verfügen, aber da die Daten eindeutige Werte enthalten, tritt keine Aggregation auf.

Tabellen auswählen

Daten werden als Excel-Tabellenobjekt importiert. Sie können die Tabelle verschieben oder das Blatt umbenennen, und das Excel-Add-In aktualisiert Daten am neuen Speicherort.

Gehen Sie wie folgt vor, um Daten aus einer Azure Databricks-Tabelle zu importieren:

  1. Wählen Sie im Excel-Add-In-Bereich "Azure Databricks" unter der Registerkarte " Neuer Import " die Option "Daten als Importmethode auswählen" aus.
  2. Wählen Sie eine Tabelle aus, die aus dem Katalog-Explorer importiert werden soll. Sie können den Katalog mithilfe des Schiebereglersymbols nach Besitzer, Zertifizierungsstatus und anderen Eigenschaften filtern.
  3. Klicke auf Auswählen.
  4. Klicken Sie unter "Spalten" auf den Abwärtspfeil, und deaktivieren Sie die Auswahl der Spalten, die Sie nicht importieren möchten, oder lassen Sie alle Spalten ausgewählt, um die gesamte Tabelle zu importieren.
  5. (Optional) Wenn Sie Filter festlegen möchten, klicken Sie neben +", wählen Sie die Spalte aus, auf die Sie einen Filter anwenden möchten, und geben Sie dann die Filterbedingung ein.
  6. (Optional) Wenn Sie ein Beispiel für den Import anzeigen möchten, klicken Sie auf "Vorschau".
  7. (Optional) Sie können einen Zeilengrenzwert festlegen, um die Anzahl der importierten Zeilen einzuschränken.
  8. (Optional) Um ihre importierten Daten auf einfache Weise zu identifizieren, können Sie einen Importnamen eingeben.
  9. Wählen Sie unter "Ausgabeziel" aus, ob die Daten in ein neues Blatt oder das aktuelle Blatt importiert werden sollen. Wenn Sie in das aktuelle Blatt importieren, beginnen die Daten beim eingegebenen Zellbezug (standardmäßig A1).
  10. Importieren Sie Ihre Ergebnisse. Wählen Sie eine der folgenden Optionen aus:
    • Klicken Sie auf "Speichern und importieren ", um die Abfrage zur Wiederverwendung in der Excel-Arbeitsmappe zu speichern und die Ergebnisse zu importieren.
    • Klicken Sie auf den Abwärtspfeil, und klicken Sie dann auf " Ergebnisse importieren", um die Ergebnisse zu importieren, ohne die Abfrage zu speichern. Verwenden Sie diese Option, wenn Sie mit der Bearbeitung eines Imports fortfahren möchten.

Schreiben von SQL-Abfragen

Die Write SQL-Importmethode unterstützt SQL-Funktionen und gespeicherte Prozeduren.

Gehen Sie wie folgt vor, um benutzerdefinierte SQL-Abfragen für Ihren Azure Databricks-Arbeitsbereich auszuführen:

  1. Wählen Sie im Excel-Add-In-Bereich "Azure Databricks" unter der Registerkarte " Neuer Import " die Option "SQL schreiben " als Importmethode aus.

  2. Geben Sie einen Namen für Ihre Abfrage ein, um sie später zu identifizieren.

  3. Schreiben Sie eine neue Abfrage, oder verwenden Sie eine vorhandene Abfrage aus Ihrem Azure Databricks-Arbeitsbereich.

    • Schreiben Sie Ihre SQL-Abfrage im Editor. Sie können eine beliebige Tabelle im Unity-Katalog abfragen, auf die Sie über Zugriffsberechtigungen verfügen.

      • Klicken Sie auf das Symbol Katalog-Explorer zum Anzeigen Ihrer Schemas und Tabellen.
    • Wenn Sie eine Abfrage aus Ihrem Azure Databricks-Arbeitsbereich oder einer vorhandenen Abfrage in Excel verwenden möchten, klicken Sie auf das Ordnersymbol. Wenn Sie eine vorhandene Abfrage aus Ihrem Azure Databricks-Arbeitsbereich verwenden, werden in Excel vorgenommene Änderungen nicht in Azure Databricks wiedergegeben.

      Hinweis

      Abfragen müssen explizit in Azure Databricks mithilfe der Schaltfläche " Speichern " im Abfrage-Editor gespeichert werden, bevor sie in Excel angezeigt werden.

  4. (Optional) Wenn Sie Abfrageparameter hinzufügen möchten, klicken Sie neben "Parameter" auf "+Hinzufügen". Klicken Sie auf den Parameter, um den Parameternamen und den Parameterwert anzugeben.

  5. Wählen Sie unter "Ausgabeziel" aus, ob die Daten in ein neues Blatt oder das aktuelle Blatt importiert werden sollen. Wenn Sie in das aktuelle Blatt importieren, beginnen die Daten beim eingegebenen Zellbezug (standardmäßig A1).

  6. Klicken Sie auf "Ausführen", um eine Vorschau der Abfrageergebnisse anzuzeigen.

  7. Importieren Sie Ihre Ergebnisse. Wählen Sie eine der folgenden Optionen aus:

    • Klicken Sie auf "Speichern und importieren ", um die Abfrage zur Wiederverwendung in der Excel-Arbeitsmappe zu speichern und die Ergebnisse zu importieren.
    • Klicken Sie auf den Abwärtspfeil, und klicken Sie dann auf " Ergebnisse importieren", um die Ergebnisse zu importieren, ohne die Abfrage zu speichern. Verwenden Sie diese Option, wenn Sie mit der Bearbeitung eines Imports fortfahren möchten.

Sie können auch benutzerdefinierte Funktionen verwenden, um Abfrageparameter hinzuzufügen. Siehe Schreiben von SQL.

Verwenden von benutzerdefinierten Funktionen in Excel

Das Excel-Add-In stellt benutzerdefinierte Funktionen bereit, die Sie in Excel-Formeln verwenden können, um Daten aus Azure Databricks zu importieren.

Auswählen einer Tabelle

Die DATABRICKS.Table Funktion importiert Daten aus einer Unity-Katalogtabelle.

Syntax:

=DATABRICKS.Table(catalog_name.schema_name.table_name, [column1, ...], [limit])

Parameter:

  • catalog_name.schema_name.table_name (erforderlich): Der vollqualifizierte Tabellenname.
  • columns (optional): Ein Array von Spaltennamen, die importiert werden sollen. Lassen Sie diesen Parameter aus, um alle Spalten zu importieren.
  • limit (optional): Die maximale Anzahl der zu importierenden Zeilen. Lassen Sie diesen Parameter aus, um alle Zeilen bis zum Grenzwert von 10 MB zu importieren.

Example:

=DATABRICKS.Table("main.default.customers", {"customer_id", "customer_name"}, 100)

Mit dieser Formel werden die customer_id Und customer_name Spalten aus der main.default.customers Tabelle importiert, die auf 100 Zeilen beschränkt sind.

SQL schreiben

Die DATABRICKS.SQL Funktion führt eine SQL-Abfrage aus, die Abfrageparameter verwendet und die Ergebnisse zurückgibt.

Syntax:

Geben Sie Parameter mithilfe von Werten an.

=DATABRICKS.SQL("query_text", {parameter1_name, parameter1_value; ...})

Geben Sie Parameter mithilfe eines Zellbereichs an. Die Parameter "Name" und "Wert" müssen in Zellen definiert werden, die sich in derselben Zeile befinden.

=DATABRICKS.SQL("query_text", {param_name_cell: param_value_cell; ...})

Parameter:

  • query_text (erforderlich): Die auszuführende SQL-Abfrage.
  • parameters (erforderlich): Eine Zuordnung von Parameterwerten, die in die Abfrage ersetzt werden sollen.

Example:

=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE longitude > :long_param AND latitude > :lat_param LIMIT 10", {"long_param",20; "lat_param",10})

=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE city = :city", M4:N4)

Mit dieser Formel wird eine Abfrage ausgeführt, die Verkaufsdaten durch longitude und latitude mithilfe der bereitgestellten Parameterwerte filtert.

Verwalten von Abfragen

Verwalten Sie Ihre vorhandenen Importe von der Importseite.

Bearbeiten eines vorhandenen Imports

So bearbeiten Sie einen vorhandenen Import:

  1. Klicken Sie im Azure Databricks-Add-In-Bereich in Excel auf die Registerkarte "Importe ".
  2. Suchen Sie den Import, den Sie bearbeiten möchten.
  3. Klicken Sie neben dem Import auf das Dreipunktmenü.
  4. Klicken Sie auf "Bearbeiten ", um den Import zu bearbeiten.

Aktualisieren von Daten

Das Excel-Add-In aktualisiert nicht automatisch importierte Daten. So aktualisieren Sie Ihre Daten mit den neuesten Werten aus Azure Databricks:

  • Gehen Sie wie folgt vor, um einen einzelnen Import zu aktualisieren:
    1. Klicken Sie im Azure Databricks-Add-In-Bereich in Excel auf die Registerkarte "Importe ".
    2. Klicken Sie auf das Aktualisieren-Symbol , um die Aktualisierung neben dem Import, den Sie aktualisieren möchten, durchzuführen.
  • Gehen Sie wie folgt vor, um alle Importe zu aktualisieren:
    1. Klicken Sie im Add-In-Bereich von Azure Databricks auf "Alle aktualisieren".

Das Add-In führt die ursprüngliche Abfrage- oder Tabellenauswahl erneut aus und aktualisiert das Arbeitsblatt mit neuen Daten.

Von Bedeutung

Beim Aktualisieren von Daten löscht das Excel-Add-In alle vorhandenen Daten in der angegebenen Tabelle und lädt die neuesten Daten aus Azure Databricks neu. Alle benutzerdefinierten Spalten, die Sie der Tabelle hinzugefügt haben, werden während des Aktualisierungsprozesses gelöscht.

Teilen von Auswirkungen

Wenn Sie eine Excel-Arbeitsmappe freigeben, die Azure Databricks-Daten enthält, sollten Sie die folgenden Auswirkungen auf den Datenzugriff und die Sicherheit berücksichtigen:

Sichtbarkeit für importierte Daten

Wenn ein Empfänger einen Import aktualisiert, verwendet das Add-In die Unity-Katalogberechtigungen des Empfängers. Wenn sie keinen Zugriff auf die zugrunde liegenden Daten haben, schlägt die Aktualisierung fehl.

Für Arbeitsmappen, bei denen der Datenschutz ein Problem darstellt, können Sie die folgende Problemumgehung verwenden:

  1. Erstellen Sie eine Arbeitsmappe mit allen erforderlichen Formeln und Importen.
  2. Löschen Sie die importierten Daten aus dem Blatt.
  3. Freigeben der Arbeitsmappe für den Empfänger.
  4. Lassen Sie den Empfänger die Daten aktualisieren.

Der Empfänger sieht nur Daten, auf die er Zugriff hat, basierend auf seinen Unity-Katalogberechtigungen.

Zugriff auf Arbeitsbereiche und Datenressourcen

  • Benutzer ohne Zugriff auf die Unity Catalog-Objekte, auf die in der Arbeitsmappe verwiesen wird, können die Daten nicht aktualisieren. Zum Aktualisieren von Daten benötigen Benutzer Leseberechtigungen für die zugrunde liegenden Tabellen und Ansichten im Unity-Katalog.
  • Benutzer müssen Zugriff auf die zugrunde liegende Tabelle in Azure Databricks haben, um vorhandene Importe zu bearbeiten.

Sichtbarkeit von Abfragen

Benutzer mit Bearbeitungszugriff auf die Arbeitsmappe können die Abfragen anzeigen, die zum Generieren der Daten über das Azure Databricks-Add-In verwendet werden, auch wenn sie keinen Zugriff auf die zugrunde liegenden Daten im Unity-Katalog haben.

Einschränkungen

  • Benutzerdefinierte Funktionen: Für benutzerdefinierte Funktionen sind Abfrageergebnisse aufgrund von Einschränkungen der SQL-Ausführungs-API auf 25 MiB beschränkt.
  • Datenladevorgang: Fehler beim Laden von Daten, wenn sich eine Zelle in der Arbeitsmappe im Bearbeitungsmodus befindet.
  • Grenzwert für Excel Desktop-Zeilen: Excel Desktop unterstützt maximal 1.048.576 Zeilen pro Blatt.
  • Excel für den Grenzwert für die Webdateigröße: Excel für das Web unterstützt eine maximale Dateigröße von ca. 25 MB für die Anzeige und Bearbeitung.