Ottimizzare i modelli usando il calcolo gestito (anteprima) (versione classica)

Si applica solo a:Portale di Foundry (versione classica). Questo articolo non è disponibile per il nuovo portale foundry. Altre informazioni sul nuovo portale.

Nota

I collegamenti in questo articolo potrebbero aprire contenuto nella nuova documentazione di Microsoft Foundry anziché nella documentazione di Foundry (versione classica) visualizzata.

Importante

Gli elementi contrassegnati (anteprima) in questo articolo sono attualmente in anteprima pubblica. Questa anteprima viene fornita senza un contratto di servizio e non è consigliabile per i carichi di lavoro di produzione. Alcune funzionalità potrebbero non essere supportate o potrebbero avere funzionalità limitate. Per altre informazioni, vedere Condizioni supplementari per l'utilizzo delle anteprime di Microsoft Azure.

Informazioni su come ottimizzare e distribuire modelli usando il calcolo gestito in Microsoft Foundry. Modificare i parametri di training (frequenza di apprendimento, dimensioni batch, periodi) per ottimizzare le prestazioni.

L'ottimizzazione di un modello con training preliminare per un'attività correlata è più efficiente del training di un nuovo modello da zero.

Usare le impostazioni di ottimizzazione nel portale per configurare dati, calcolo e iperparametri. Al termine del training, è possibile valutare e distribuire il modello risultante.

Questo articolo illustra come:

  • Selezionare un modello di base.
  • Configurare le divisioni di calcolo e dati.
  • Ottimizzare gli iperparametri in modo sicuro.
  • Inviare e monitorare un processo di ottimizzazione.
  • Valutare e distribuire il modello ottimizzato.

Prerequisiti

Importante

Questo articolo fornisce il supporto legacy per i progetti basati su hub. Non funzionerà per i progetti Foundry. Vedere Come si conosce il tipo di progetto di cui si dispone?

nota di compatibilità SDK: gli esempi di codice richiedono una versione specifica Microsoft Foundry SDK. Se si verificano problemi di compatibilità, valutare la possibilità di eseguire la migrazione da un progetto basato su hub a un progetto Foundry.

  • I controlli di accesso basati sui ruoli di Azure (Azure RBAC) vengono usati per assegnare autorizzazioni alle operazioni nel portale Foundry. Per eseguire la procedura descritta in questo articolo, all'account utente deve essere assegnato il ruolo owner o contributor per la sottoscrizione Azure. Per altre informazioni sulle autorizzazioni, vedere Controllo degli accessi in base al ruolo nel portale di Foundry.

Ottimizzare un modello di base usando il calcolo gestito

Suggerimento

Poiché è possibile customizzare il riquadro sinistro nel portale di Microsoft Foundry, è possibile che vengano visualizzati elementi diversi rispetto a quelli illustrati in questi passaggi. Se non viene visualizzato ciò che si sta cercando, selezionare ... Altro nella parte inferiore del riquadro sinistro.

  1. Accedere a Microsoft Foundry. Assicurarsi che l'interruttore New Foundry sia disattivato. Questi passaggi fanno riferimento a Foundry (versione classica).

  2. Se non sei già nel progetto, selezionalo.

  3. Selezionare Ottimizzazione fine dal riquadro a sinistra.

    1. Selezionare Ottimizzare un modello e aggiungere il modello da ottimizzare. Questo articolo usa Phi-3-mini-4k-instruct per l'illustrazione.
    2. Selezionare Avanti per visualizzare le opzioni di ottimizzazione disponibili. Alcuni modelli di base supportano solo l'opzione Di calcolo gestito .
  4. In alternativa, è possibile selezionare Catalogo modelli dalla barra laterale sinistra del progetto e trovare la scheda modello del modello di base che si vuole ottimizzare.

    1. Selezionare Ottimizza nella scheda del modello per visualizzare le opzioni di ottimizzazione disponibili. Alcuni modelli di base supportano solo l'opzione Di calcolo gestito .

    Screenshot che mostra le opzioni di ottimizzazione per un modello di base in Foundry.

  5. Selezionare Calcolo gestito. Verrà visualizzata l'opzione Impostazioni di base.

Configurare le impostazioni di ottimizzazione

In questa sezione vengono illustrati i passaggi per configurare l'ottimizzazione per il modello usando un ambiente di calcolo gestito.

  1. Specificare un nome di modello, ad esempio phi3mini-faq-v1. Selezionare Avanti per Calcolo.

  2. Selezionare le dimensioni di una macchina virtuale GPU. Verificare la quota per lo SKU scelto.

    Screenshot che mostra le impostazioni per il calcolo da usare per l'ottimizzazione.

  3. Selezionare Avanti per Dati di addestramento. Il tipo di attività può essere preimpostato (ad esempio, completamento chat).

  4. Specificare i dati di training (caricare JSONL/CSV/TSV o selezionare un set di dati registrato). Esempi di bilanciamento per ridurre la distorsione.

  5. Selezionare Avanti per Dati di convalida. Mantenere la divisione automatica o fornire un set di dati separato.

  6. Selezionare Avanti per Parametri attività. Regolare epoche, tasso di apprendimento, dimensione batch. Inizia con un approccio conservativo; procedi iterando in base alle metriche di convalida.

  7. Selezionare Avanti per Revisione. Confermare i conteggi e i parametri.

  8. Selezionare Invia per avviare il processo.

Monitorare e valutare

  • Tenere traccia dello stato del processo nell'elenco dei processi di ottimizzazione.
  • Esaminare i log per problemi di pre-elaborazione o allocazione.
  • Al termine, visualizzare le metriche di valutazione generate (se abilitate) o eseguire una valutazione separata confrontando il modello base e ottimizzato.

Distribuire il modello ottimizzato

Eseguire la distribuzione dal riepilogo del processo. Usare un nome di distribuzione come faq-v1. Registrare la versione del modello e l'hash del set di dati per la riproducibilità. Aggiungere il tracciamento per monitorare le richieste reali.

Risoluzione dei problemi

Problema Causa Azione
Bloccato in coda Capacità GPU insufficiente Provare SKU o regioni alternative
Overfitting rapido Troppi periodi/set di dati di piccole dimensioni Ridurre le epoche o espandere i dati
Nessun miglioramento delle metriche Rumore del set di dati/obiettivo non allineato Ridefinire l'etichettatura o la selezione delle metriche
Latenza più elevata dopo la distribuzione Maggior sovraccarico del modello base/adattatore Prendere in considerazione un modello di base più piccolo o ottimizzare le dimensioni del batch