Panoramica della migrazione di Azure Synapse Spark a Fabric

Usare questo articolo come punto di partenza per la migrazione di carichi di lavoro spark Azure Synapse a Microsoft Fabric. Consente di decidere quali indicazioni usare, quali elementi possono essere migrati direttamente e dove è ancora necessario effettuare il refactoring o la convalida manuale.

Fabric Data Engineering supporta elementi come lakehouse, notebook, ambiente, definizione di job Spark e pipeline. La maggior parte delle migrazioni di Synapse Spark implica una combinazione di migrazione degli elementi, modifiche all'accesso ai dati, migrazione dei metadati, refactoring del codice e convalida post-migrazione.

Prima di eseguire la migrazione

Prima di iniziare, verificare che Fabric Data Engineering sia la destinazione giusta per il carico di lavoro. Esaminare i modelli di runtime spark, modello di sicurezza, modello di pool, modello di ambiente e accesso ai dati da cui dipende l'implementazione corrente di Synapse.

Iniziare con questi articoli:

Se si esegue la migrazione di un'area di lavoro Synapse esistente, pianificare la creazione o l'uso di un'area di lavoro Fabric esistente come destinazione della migrazione. Questo articolo non tratta il provisioning completo dell'area di lavoro né la migrazione di carichi di lavoro non Spark.

Che cosa puoi migrare?

La migrazione da Synapse a Fabric si estende in genere su diversi flussi di lavoro.

Area di migrazione Ambito tipico Linee guida principali
Pianificazione e valutazione Pool di Spark di inventario, notebook, definizioni di processi Spark, database lake, servizi collegati e blocchi Fase 1: strategia e pianificazione della migrazione
Elementi, refactoring del codice, pool, configurazioni e librerie Notebook, definizioni di job Spark, pool Spark, mappature di database del lake, mssparkutils, servizi collegati, percorsi dei file, API del catalogo, autenticazione connettore, ambienti, pool personalizzati, proprietà Spark, compatibilità della libreria Fase 2: Migrazione del carico di lavoro Spark
Metastore Hive e metadati del lago Database, tabelle, partizioni, tabelle gestite e tabelle esterne Fase 3: Hive Metastore e migrazione dei dati
Accesso ai dati e pipeline Collegamenti rapidi a OneLake, accesso ad ADLS Gen2, attività di copia, migrazione della pipeline Eseguire la migrazione di dati e pipeline
Sicurezza, convalida e migrazione Ruoli, connessioni, governance, verifica, pianificazione del passaggio Fase 4: Migrazione della sicurezza e della governance

Scegliere il percorso di migrazione

Utilizza il percorso che corrisponde al tuo obiettivo.

  • È necessario un piano di migrazione end-to-end. Iniziare con la serie di procedure consigliate in 4 fasi. Questo è il punto di ingresso migliore per la maggior parte delle migrazioni di produzione.
  • Si vogliono spostare rapidamente gli elementi Spark supportati. Iniziare con gli articoli di Spark Migration Assistant e quindi usare gli articoli di refactoring e convalida per chiudere le lacune.
  • Hai bisogno di aiuto solo con un settore. Usare gli articoli specifici dell'attività per notebook, definizioni di processi Spark, pool, librerie, metadati metastore Hive o migrazione di dati/pipeline.

Per la maggior parte dei team, il modo più rapido per affrontare una migrazione di Synapse Spark è:

  1. Esaminare Compare Fabric e Azure Synapse Spark: differenze principali.
  2. Lettura Fase 1: Strategia e pianificazione della migrazione.
  3. Eseguire Spark Synapse per Fabric Spark Migration Assistant ove applicabile.
  4. Ristrutturare notebook, processi Spark, pool e librerie nella Fase 2: Trasferimento del carico di lavoro Spark.
  5. Convalida l'accesso ai dati, i metadati, la sicurezza e la prontezza al passaggio utilizzando i restanti articoli delle migliori pratiche.

Screenshot che mostra gli scenari di migrazione.

La migrazione da Synapse Spark a Fabric è in genere un processo di copia e adattamento anziché uno spostamento diretto sul posto. È possibile eseguire rapidamente la migrazione di molti asset, ma è comunque necessario prevedere di convalidare il comportamento di runtime, sostituire le integrazioni specifiche di Synapse e allineare sicurezza, metadati e modelli operativi con Fabric.

Serie di procedure consigliate

Utilizzare la serie di best practice per un percorso di migrazione completo e strutturato.

Articoli specifici per attività sulla migrazione

Se sono necessarie indicazioni mirate per un'attività di migrazione specifica, usare questi articoli: