Condividi tramite


Usare le pipeline di integrazione e distribuzione Git per gli ambienti

Quando si configura un ambiente nel portale di Fabric, aggiungendo librerie, selezionando un runtime spark, ottimizzando le impostazioni di calcolo, queste opzioni sono attive solo nel servizio Fabric. Se qualcuno modifica accidentalmente un'impostazione o se è necessario riprodurre l'ambiente in un'altra area di lavoro, non c'è una cronologia integrata su cui fare affidamento.

Le pipeline di integrazione e distribuzione Git risolve questo problema. Connettendo l'area di lavoro a un repository Git, si ottiene la cronologia delle versioni, la diramazione e la revisione del codice per la configurazione dell'ambiente, proprio come per il codice dell'applicazione. Le pipeline di distribuzione consentono quindi di alzare di livello un ambiente testato tra più fasi, ad esempio dallo sviluppo al test alla produzione, senza ricrearlo manualmente.

Integrare Git per gli ambienti Fabric

L'integrazione git consente di eseguire il backup, la versione e collaborare alla configurazione dell'ambiente tramite rami Git. Quando si connette un'area di lavoro a un repository Git, Fabric serializza le librerie dell'ambiente e le impostazioni di calcolo Spark (incluso il runtime di Spark) in file che Git può tenere traccia. Altri componenti dell'ambiente non sono attualmente inclusi in Git.

Le modifiche apportate in Git vengono sincronizzate con lo stato di gestione temporanea dell'ambiente, che non diventano effettive fino alla pubblicazione. Pubblicare dopo ogni sincronizzazione Git per garantire che l'ambiente live rifletta le modifiche. Se si preferisce un flusso di lavoro code-first, è possibile pubblicare tramite l'API di pubblicazione per l'ambiente.

Tenere presente quanto segue:

  • Riferimenti al pool personalizzato : quando si sincronizza un ambiente da un repository a un'area di lavoro diversa, l'ID pool personalizzato associato viene mantenuto as-is. Poiché le definizioni dei pool sono limitate all'ambito dell'area di lavoro, i riferimenti tra aree di lavoro diverse non vengono risolti. Aggiornare instance_pool_id nel file sincronizzato con un pool esistente nell'area di lavoro di destinazione oppure rimuovere la proprietà per ripristinare un pool di avvio. È possibile elencare i pool disponibili con l'API Elenco pool personalizzati dell'area di lavoro o crearne una con l'API Crea pool personalizzato dell'area di lavoro.
  • Limite di dimensioni del commit: ogni commit è limitato a 150 MB. Non è possibile eseguire il commit di librerie personalizzate superiori a 150 MB tramite Git.

Connettere l'area di lavoro di Fabric a un repository di Azure DevOps

Se si è l'amministratore di un'area di lavoro, passare a Impostazioni area di lavoro e configurare la connessione nella sezione Controllo del codice sorgente . Per altre informazioni, vedere Gestire un'area di lavoro con Git.

Dopo la connessione, è possibile trovare elementi, inclusi gli ambienti sincronizzati con il repository.

Screenshot che mostra la connessione dell'area di lavoro a un repository Di Azure DevOps.

Rappresentazione locale di un ambiente su Git

Nella cartella radice dell'elemento gli ambienti sono organizzati con una cartella Libraries che contiene sottocartelle PublicLibraries e CustomLibraries insieme alla cartella Setting .

Screenshot che mostra la rappresentazione locale dell'ambiente in Git.

Librerie

Quando si esegue il commit di un ambiente in Git, la sezione della libreria pubblica viene trasformata nella relativa rappresentazione YAML. Viene eseguito anche il commit della libreria personalizzata insieme al relativo file di origine.

Screenshot che mostra la rappresentazione locale dell'ambiente della libreria pubblica in Git.

È possibile aggiornare il catalogo pubblico modificando la rappresentazione YAML. Proprio come l'esperienza del portale, è possibile specificare una libreria da PyPI e Conda. È possibile specificare la libreria con la versione prevista, un intervallo di versioni o senza una versione. Il sistema consente di determinare una versione compatibile con altre dipendenze nell'ambiente. Per cancellare tutti i cataloghi pubblici esistenti, eliminare il file YAML.

È possibile aggiornare il catalogo personalizzato aggiungendo nuovi file o eliminando direttamente i file esistenti.

Nota

È possibile usare il proprio file YAML personalizzato per gestire il catalogo pubblico. Il nome del file deve essere environment.yml in modo che il sistema possa riconoscerlo correttamente.

Calcolo di Spark

Anche la sezione di calcolo di Spark viene trasformata nella rappresentazione YAML. All'interno di questo file YAML è possibile cambiare il pool collegato, ottimizzare le configurazioni di calcolo, gestire le proprietà spark e selezionare il runtime spark desiderato.

Screenshot che mostra la rappresentazione locale di calcolo Spark dell'ambiente in Git.

Configurare una pipeline di distribuzione per un ambiente

Importante

Questa funzionalità è in anteprima.

Le pipeline di distribuzione del contenuto delle fabriche semplificano il processo di consegna del contenuto modificato attraverso diverse fasi, come ad esempio il passaggio dallo sviluppo al test. La pipeline automatica può includere gli elementi dell'ambiente per semplificare il processo di ricreazione.

È possibile configurare una pipeline di distribuzione assegnando le aree di lavoro a fasi diverse. Per altre informazioni, vedere Introduzione alle pipeline di distribuzione.

Screenshot che mostra la distribuzione di un ambiente in una pipeline di distribuzione.

Dopo aver configurato correttamente la pipeline, è possibile trovare lo stato della distribuzione. Dopo aver selezionato Distribuisci con l'ambiente selezionato, tutti i contenuti dell'ambiente vengono distribuiti nelle aree di lavoro di destinazione. Lo stato dell'ambiente originale viene mantenuto in questo processo in modo che le configurazioni pubblicate rimangano nello stato pubblicato e non richiedano alcuna pubblicazione aggiuntiva.

Importante

Attualmente, il pool personalizzato non è supportato nelle pipeline di distribuzione. Se l'ambiente seleziona il pool personalizzato, le configurazioni della sezione Calcolo nell'ambiente di destinazione vengono impostate con valori predefiniti. In questo caso, gli ambienti continuano a visualizzare le differenze nella pipeline di distribuzione anche se la distribuzione viene eseguita correttamente.