Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Usare questo articolo come punto di partenza per la migrazione di carichi di lavoro spark Azure Synapse a Microsoft Fabric. Consente di decidere quali indicazioni usare, quali elementi possono essere migrati direttamente e dove è ancora necessario effettuare il refactoring o la convalida manuale.
Fabric Data Engineering supporta elementi come lakehouse, notebook, ambiente, definizione di job Spark e pipeline. La maggior parte delle migrazioni di Synapse Spark implica una combinazione di migrazione degli elementi, modifiche all'accesso ai dati, migrazione dei metadati, refactoring del codice e convalida post-migrazione.
Prima di eseguire la migrazione
Prima di iniziare, verificare che Fabric Data Engineering sia la destinazione giusta per il carico di lavoro. Esaminare i modelli di runtime spark, modello di sicurezza, modello di pool, modello di ambiente e accesso ai dati da cui dipende l'implementazione corrente di Synapse.
Iniziare con questi articoli:
- Compare Fabric e Azure Synapse Spark: differenze principali
- Fase 1: strategia e pianificazione della migrazione
Se si esegue la migrazione di un'area di lavoro Synapse esistente, pianificare la creazione o l'uso di un'area di lavoro Fabric esistente come destinazione della migrazione. Questo articolo non tratta il provisioning completo dell'area di lavoro né la migrazione di carichi di lavoro non Spark.
Che cosa puoi migrare?
La migrazione da Synapse a Fabric si estende in genere su diversi flussi di lavoro.
| Area di migrazione | Ambito tipico | Linee guida principali |
|---|---|---|
| Pianificazione e valutazione | Pool di Spark di inventario, notebook, definizioni di processi Spark, database lake, servizi collegati e blocchi | Fase 1: strategia e pianificazione della migrazione |
| Elementi, refactoring del codice, pool, configurazioni e librerie | Notebook, definizioni di job Spark, pool Spark, mappature di database del lake, mssparkutils, servizi collegati, percorsi dei file, API del catalogo, autenticazione connettore, ambienti, pool personalizzati, proprietà Spark, compatibilità della libreria |
Fase 2: Migrazione del carico di lavoro Spark |
| Metastore Hive e metadati del lago | Database, tabelle, partizioni, tabelle gestite e tabelle esterne | Fase 3: Hive Metastore e migrazione dei dati |
| Accesso ai dati e pipeline | Collegamenti rapidi a OneLake, accesso ad ADLS Gen2, attività di copia, migrazione della pipeline | Eseguire la migrazione di dati e pipeline |
| Sicurezza, convalida e migrazione | Ruoli, connessioni, governance, verifica, pianificazione del passaggio | Fase 4: Migrazione della sicurezza e della governance |
Scegliere il percorso di migrazione
Utilizza il percorso che corrisponde al tuo obiettivo.
- È necessario un piano di migrazione end-to-end. Iniziare con la serie di procedure consigliate in 4 fasi. Questo è il punto di ingresso migliore per la maggior parte delle migrazioni di produzione.
- Si vogliono spostare rapidamente gli elementi Spark supportati. Iniziare con gli articoli di Spark Migration Assistant e quindi usare gli articoli di refactoring e convalida per chiudere le lacune.
- Hai bisogno di aiuto solo con un settore. Usare gli articoli specifici dell'attività per notebook, definizioni di processi Spark, pool, librerie, metadati metastore Hive o migrazione di dati/pipeline.
Ordine di lettura consigliato
Per la maggior parte dei team, il modo più rapido per affrontare una migrazione di Synapse Spark è:
- Esaminare Compare Fabric e Azure Synapse Spark: differenze principali.
- Lettura Fase 1: Strategia e pianificazione della migrazione.
- Eseguire Spark Synapse per Fabric Spark Migration Assistant ove applicabile.
- Ristrutturare notebook, processi Spark, pool e librerie nella Fase 2: Trasferimento del carico di lavoro Spark.
- Convalida l'accesso ai dati, i metadati, la sicurezza e la prontezza al passaggio utilizzando i restanti articoli delle migliori pratiche.
La migrazione da Synapse Spark a Fabric è in genere un processo di copia e adattamento anziché uno spostamento diretto sul posto. È possibile eseguire rapidamente la migrazione di molti asset, ma è comunque necessario prevedere di convalidare il comportamento di runtime, sostituire le integrazioni specifiche di Synapse e allineare sicurezza, metadati e modelli operativi con Fabric.
Serie di procedure consigliate
Utilizzare la serie di best practice per un percorso di migrazione completo e strutturato.
- Fase 1: strategia e pianificazione della migrazione
- Fase 2: Migrazione del carico di lavoro Spark
- Fase 3: Hive Metastore e migrazione dei dati
- Fase 4: Migrazione della sicurezza e della governance
Articoli specifici per attività sulla migrazione
Se sono necessarie indicazioni mirate per un'attività di migrazione specifica, usare questi articoli:
- Assistente alla Migrazione da Spark Synapse a Fabric Spark
- Eseguire la migrazione di notebook di Azure Synapse a Fabric
- Integrazione delle definizioni di processi Spark da Azure Synapse a Fabric
- Migrare pool Spark da Azure Synapse a Fabric
- Migrare le configurazioni di Spark da Azure Synapse a Fabric
- Migrare le librerie Spark da Azure Synapse a Fabric
- Eseguire la migrazione dei metadati metastore Hive
- Eseguire la migrazione di dati e pipeline
Contenuto correlato
- Compare Fabric e Azure Synapse Spark: differenze principali
- Fase 1: strategia e pianificazione della migrazione
- Assistente di Migrazione da Spark Synapse a Fabric Spark
- Altre informazioni sulle opzioni di migrazione per pool di Spark, configurazioni, librerie, notebook e definizione del processo Spark
- Eseguire la migrazione di dati e pipeline
- Eseguire la migrazione dei metadati del metastore di Hive