Azure Synapse Analytics-Aufgabe

Gilt für:SQL Server SSIS Integration Runtime in Azure Data Factory

Tipp

Microsoft Fabric Data Warehouse ist ein relationales Enterprise-Warehouse auf einem Data Lake-Fundament mit zukunftsfähiger Architektur, integrierter KI und neuen Features. Wenn Sie mit Data Warehouse noch nicht vertraut sind, beginnen Sie mit Fabric Data Warehouse. Vorhandene dedizierte SQL-Pool-Workloads können auf Fabric aktualisieren, um neue Funktionen in den Bereichen Data Science, Echtzeitanalyse und Berichterstellung zu nutzen.

Der Azure Synapse Analytics-Task ermöglicht es einem SSIS-Paket, Tabellendaten aus dem Dateisystem oder Azure Blob Storage in einen dedizierten Azure Synapse Analytics-SQL-Pool zu kopieren. Der Task nutzt PolyBase zur Leistungssteigerung gemäß der Beschreibung im Artikel Azure Synapse Analytics Loading Patterns and Strategies(Azure Synapse Analytics: Muster und Strategien zum Laden). Das gegenwärtig unterstützte Quelldatenformat ist Text mit Trennzeichen in UTF8-Codierung. Beim Kopieren aus einem Dateisystem werden Daten zunächst in Azure Blob Storage für das Staging und dann in einen dedizierten SQL-Pool hochgeladen. Darum ist ein Azure Blob Storage-Konto erforderlich.

Hinweis

Der Azure Storage-Verbindungs-Manager mit dem Diensttyp „Data Lake Gen2“ wird nicht unterstützt.

Wenn Sie Azure Data Lake Gen2 für das Staging oder eine Quelle verwenden möchten, können Sie über den Azure Storage-Verbindungs-Manager eine Verbindung mit dem Diensttyp „Azure Blob Storage“ herstellen.

Der Azure Synapse Analytics-Task ist eine Komponente des SQL Server Integration Services-Feature Packs (SSIS) für Azure.

Zum Hinzufügen eines Azure Synapse Analytics-Tasks ziehen Sie diesen aus der SSIS-Toolbox auf den Designercanvas, und doppelklicken Sie, oder klicken Sie mit der rechten Maustaste darauf, und wählen Sie dann Bearbeiten aus, um das Task-Editor-Dialogfeld zu öffnen.

Konfigurieren Sie auf der Seite Allgemein die folgenden Eigenschaften.

SourceType gibt den Typ des Quelldatenspeichers an. Wählen Sie einen der folgenden Typen aus:

  • FileSystem: Die Quelldaten befinden sich im lokalen Dateisystem.
  • BlobStorage: Die Quelldaten befinden sich in Azure Blob Storage.

Im Folgenden sind die Eigenschaften für jeden Quelltyp aufgeführt.

Dateisystem

Feld BESCHREIBUNG
Lokales Verzeichnis Gibt das lokale Verzeichnis mit den Datendateien an, die hochgeladen werden sollen.
Rekursiv Gibt an, ob Unterverzeichnisse rekursiv durchsucht werden sollen.
Dateiname Geben Sie einen Namensfilter zum Auswählen von Dateien mit einem bestimmten Namensmuster an. Beispiel: „MeinArbeitsblatt*.xsl*“ schließt Dateien wie „MeinArbeitsblatt001.xsl“ und „MeinArbeitsblattABC.xslx“ ein.
Zeilenbegrenzer Gibt ein oder mehrere Zeichen an, die das Ende jeder Zeile markieren.
Spaltentrennzeichen Gibt ein oder mehrere Zeichen an, die das Ende jeder Spalte markieren. Beispiel: | (senkrechter Strich), \t (Tabulator), ' (einfaches Anführungszeichen), " (doppeltes Anführungszeichen) und 0x5c (Backslash).
IsFirstRowHeader Gibt an, ob die erste Zeile in jeder Datendatei Spaltennamen statt tatsächlicher Daten enthält.
AzureStorageConnection Gibt einen Azure Storage-Verbindungs-Manager an.
BlobContainer Hiermit wird der Name des Blobcontainers festgelegt, auf den lokale Daten hochgeladen und über PolyBase an einen dedizierten Azure Synapse Analytics-SQL-Pool weitergeleitet werden. Falls noch nicht vorhanden ist, wird ein neuer Container erstellt.
BlobDirectory Hiermit wird das Blobverzeichnis (virtuelle Hierarchiestruktur) festgelegt, in das lokale Daten hochgeladen und über PolyBase an einen dedizierten Azure Synapse Analytics-SQL-Pool weitergeleitet werden.
RetainFiles Gibt an, ob die zu Azure Storage hochgeladenen Dateien beibehalten werden sollen.
Kompressionstyp Gibt an, welches Komprimierungsformat beim Hochladen von Dateien in Azure Storage verwendet werden soll. Die lokale Quelle ist nicht betroffen.
Kompressionsstufe Gibt an, welcher Komprimierungsgrad für das Komprimierungsformat verwendet werden soll.
SqlPoolConnection Hiermit wird ein ADO.NET-Verbindungs-Manager für den dedizierten Azure Synapse Analytics-SQL-Pool festgelegt.
Tabellenname Gibt den Namen der Zieltabelle an. Verwenden Sie entweder einen vorhandenen Tabellennamen, oder wählen Sie <Neue Tabelle...> aus, um eine neue Tabelle zu erstellen.
TableDistribution Gibt die Verteilungsmethode für die neue Tabelle an. Gilt, wenn für TableNameein neuer Tabellenname angegeben wird.
HashColumnName Gibt an, welche Spalte für die Verteilung der Hashtabelle verwendet werden soll. Gilt, wenn HASH für TableDistributionangegeben wird.

BlobStorage

Feld BESCHREIBUNG
AzureStorageConnection Gibt einen Azure Storage-Verbindungs-Manager an.
BlobContainer Gibt den Namen des Blobcontainers an, in dem sich die Quelldaten befinden.
BlobDirectory Gibt das Blobverzeichnis (virtuelle Hierarchiestruktur) an, in dem sich die Quelldaten befinden.
RowDelimiter Gibt ein oder mehrere Zeichen an, die das Ende jeder Zeile markieren.
Spaltentrennzeichen Gibt ein oder mehrere Zeichen an, die das Ende jeder Spalte markieren. Beispiel: | (senkrechter Strich), \t (Tabulator), ' (einfaches Anführungszeichen), " (doppeltes Anführungszeichen) und 0x5c (umgekehrter Schrägstrich).
Komprimierungstyp Gibt das für die Quelldaten verwendete Komprimierungsformat an.
SqlPoolConnection Hiermit wird ein ADO.NET-Verbindungs-Manager für den dedizierten Azure Synapse Analytics-SQL-Pool festgelegt.
Tabellenname Gibt den Namen der Zieltabelle an. Verwenden Sie entweder einen vorhandenen Tabellennamen, oder wählen Sie <Neue Tabelle...> aus, um eine neue Tabelle zu erstellen.
TableDistribution Gibt die Verteilungsmethode für die neue Tabelle an. Gilt, wenn für TableNameein neuer Tabellenname angegeben wird.
HashColumnName Gibt an, welche Spalte für die Verteilung der Hashtabelle verwendet werden soll. Gilt, wenn HASH für TableDistributionangegeben wird.

Je nachdem, ob Sie in eine neue oder eine vorhandene Tabelle kopieren, wird Ihnen eine andere Seite für Zuordnungen angezeigt. Konfigurieren Sie im ersten Fall, welche Quellspalten zugeordnet werden sollen und wie ihre entsprechenden Namen in der neu zu erstellenden Zieltabelle lauten sollen. Konfigurieren Sie im letztgenannten Fall die Zuordnungsbeziehungen zwischen Quell- und Zielspalten.

Konfigurieren Sie auf der Seite Spalten die Datentypeigenschaften für jede Quellspalte.

Die Seite T-SQL zeigt die T-SQL-Anweisung, die zum Laden von Daten aus Azure Blob Storage in den dedizierten SQL-Pool verwendet wird. Das T-SQL wird automatisch von Konfigurationen auf den anderen Seiten generiert und als Teil der Taskausführung ausgeführt. Um das generierte T-SQL wahlweise nach Ihren speziellen Bedürfnissen manuell zu bearbeiten, klicken Sie auf die Schaltfläche Bearbeiten . Sie können später durch Klicken auf die Schaltfläche Zurücksetzen das automatisch generierte wiederherstellen.