Översikt över migrering Azure Synapse Spark till Fabric

Använd den här artikeln som utgångspunkt för att migrera Azure Synapse Spark-arbetsbelastningar till Microsoft Fabric. Det hjälper dig att avgöra vilken vägledning som ska användas, vad som kan migreras direkt och var manuell refaktorisering eller validering fortfarande krävs.

Fabric Data Engineering stöder lakehouse, notebook, environment, Spark job definition och pipeline objekt. De flesta Synapse Spark-migreringar omfattar en kombination av objektmigrering, ändringar av dataåtkomst, metadatamigrering, kodrefaktorisering och validering efter migrering.

Innan du migrerar

Innan du börjar kontrollerar du att Fabric Data Engineering är rätt mål för din arbetsbelastning. Granska Spark-körning, säkerhetsmodell, poolmodell, miljömodell och dataåtkomstmönster som din aktuella Synapse-implementering är beroende av.

Börja med följande artiklar:

Om du migrerar en befintlig Synapse-arbetsyta planerar du att skapa eller använda en befintlig Fabric arbetsyta som migreringsmål. Den här artikeln beskriver inte fullständig etablering av arbetsytor eller migrering av icke-Spark-arbetsbelastningar.

Vad kan du migrera?

Synapse-to-Fabric migrering sträcker sig vanligtvis över flera arbetsströmmar.

Migreringsområde Typiskt omfång Primär vägledning
Planering och utvärdering Inventera Spark-pooler, notebooks, Spark-jobbdefinitioner, lake-databaser, länkade tjänster och blockers Fas 1: Migreringsstrategi och planering
Objekt, kodrefaktorisering, pooler, konfigurationer och bibliotek Notebook-filer, Spark-jobbdefinitioner, Spark-pooler, lakedatabasmappningar, mssparkutils, länkade tjänster, filsökvägar, katalog-API:er, anslutningsautentisering, miljöer, anpassade pooler, Spark-egenskaper, bibliotekskompatibilitet Fas 2: Migrering av Spark-arbetsbelastning
Hive-metaarkiv och lakemetadata Databaser, tabeller, partitioner, hanterade eller externa tabeller Fas 3: Hive-metaarkiv och datamigrering
Dataaccess och datapipelines OneLake-genvägar, ADLS Gen2-åtkomst, kopieringsaktiviteter, pipelinemigrering Migrera data och pipelines
Säkerhet, validering och övergång Roller, anslutningar, styrning och ledning, verifiering, övergångsplanering Fas 4: Migrering av säkerhet och styrning

Välj din migreringssökväg

Använd sökvägen som matchar ditt mål.

  • Du behöver en heltäckande migreringsplan. Börja med 4-fasens metodtipsserie. Det här är den bästa startpunkten för de flesta produktionsmigreringar.
  • Du vill snabbt flytta Spark-objekt som stöds. Börja med Spark Migration Assistant och använd sedan artiklarna för refaktorisering och validering för att stänga luckorna.
  • Du behöver bara hjälp med ett område. Använd de uppgiftsspecifika artiklarna för anteckningsböcker, Sparkjobbdefinitioner, pooler, bibliotek, Hive Metastore-metadata eller data- eller pipeline-migrering.

För de flesta team är det snabbaste sättet att närma sig en Synapse Spark-migrering:

  1. Granska Compare Fabric och Azure Synapse Spark: Key Differences.
  2. Läs Fas 1: Migreringsstrategi och planering.
  3. Kör Spark Synapse till Fabric Spark Migration Assistant där det är tillämpligt.
  4. Omstrukturera notebook-filer, Spark-jobb, pooler och bibliotek med hjälp av Fas 2: migrering av Spark-arbetsbelastning.
  5. Verifiera dataåtkomst, metadata, säkerhet och snabb beredskap med hjälp av de återstående artiklarna om bästa praxis.

Skärmbild som visar migreringsscenarierna.

Migrering från Synapse Spark till Fabric är vanligtvis en kopierings- och anpassningsprocess snarare än en direkt flytt på plats. Du kan migrera många tillgångar snabbt, men du bör fortfarande förvänta dig att verifiera körningsbeteende, ersätta Synapse-specifika integreringar och justera säkerhets-, metadata- och driftmönster med Fabric.

Metodtipsserie

Använd metodtipsserien för en strukturerad migreringsväg från slutpunkt till slutpunkt:

Uppgiftsspecifika migreringsartiklar

Om du behöver riktad vägledning för en specifik migreringsuppgift använder du följande artiklar: