Ottimizzazione automatica di Personalizer (anteprima)

Important

A partire dal 20 settembre 2023 non sarà possibile creare nuove risorse di Personalizer. Il servizio Personalizer sarà ritirato il 1° ottobre 2026. Consigliamo di migrare al microsoft/learning-loop open-source.

Introduction

L'ottimizzazione automatica di Personalizer consente di risparmiare il lavoro manuale necessario per mantenere un ciclo di Personalizer alle migliori prestazioni di machine learning, tramite la ricerca e l'applicazione automatica delle impostazioni di machine learning migliori utilizzate per addestrare i modelli. Il Personalizer adotta criteri rigorosi per applicare nuove impostazioni di apprendimento, per garantire che i miglioramenti non comportino perdite nelle ricompense.

"Personalizer Auto-Optimize è disponibile in anteprima pubblica e le funzionalità, gli approcci e i processi cambieranno in base al feedback degli utenti."

Quando usare Ottimizzazione automatica

Nella maggior parte dei casi, l'opzione migliore consiste nell'attivare l’ottimizzazione automatica. Auto-Optimize è abilitata per impostazione predefinita per i nuovi cicli di Personalizer.

L'ottimizzazione automatica può essere utile nelle situazioni seguenti:

  • Crei applicazioni utilizzate da molti clienti, e ognuno ottiene i propri cicli di Personalizzazione; ad esempio, se ospiti più siti di e-commerce. Auto-Ottimizzazione consente di evitare il lavoro manuale richiesto per regolare le impostazioni di apprendimento per un numero elevato di loop di Personalizer.
  • Hai distribuito Personalizer e hai verificato che funzioni correttamente, ottenendo risultati positivi, assicurandoti che non vi siano bug o problemi nelle funzionalità.

Note

L'ottimizzazione automatica sovrascriverà periodicamente le impostazioni di apprendimento di Personalizer. Se il caso d'uso o il settore richiede il controllo e l'archivio di modelli e impostazioni oppure se sono necessari backup delle impostazioni precedenti, è possibile usare l'API Personalizza esperienze per recuperare le impostazioni di apprendimento o scaricarle tramite il portale di Azure.

Come abilitare e disabilitare l'ottimizzazione automatica

Per abilitare l'ottimizzazione automatica, usare l'interruttore a levetta nella sezione "Impostazioni modello e apprendimento" nel portale di Azure.

In alternativa, è possibile attivare Auto-Optimize usando l'API /configurations/service di Personalizer.

Per disabilitare Ottimizzazione automatica, disattivare l'interruttore.

Ottimizzare automaticamente i report

Nel pannello Impostazioni modello e apprendimento è possibile visualizzare la cronologia delle esecuzioni di ottimizzazione automatica e l'azione eseguita per ognuna di esse.

La tabella mostra:

  • Quando si è verificata un'esecuzione di ottimizzazione automatica.
  • Quale finestra di dati è stata inclusa.
  • Quali sono state le prestazioni di ricompensa delle impostazioni di apprendimento online, di base e migliori trovate.
  • Azioni eseguite: se le impostazioni di apprendimento sono state aggiornate o meno.

Le prestazioni di ricompensa delle diverse impostazioni di apprendimento in ogni riga della cronologia di ottimizzazione automatica vengono visualizzate in numeri assoluti e in percentuale rispetto alle prestazioni di base.

Esempio: se la ricompensa media di base è stimata a 0,20 e il comportamento dell'Online Personalizer raggiunge 0,30, questi valori saranno mostrati rispettivamente come 100% e 150%. Se l'ottimizzazione automatica ha rilevato impostazioni di apprendimento in grado di ottenere una ricompensa media di 0,40, verrà visualizzata come 200% (0,40 è il 200% di 0,20). Supponendo che i margini di confidenza lo consentano, si applicheranno le nuove impostazioni, che saranno poi usate da Personalizer come impostazioni online fino all'esecuzione successiva.

Per l'analisi viene conservata una cronologia di un massimo di 24 esecuzioni precedenti di ottimizzazione automatica. È possibile cercare altri dettagli su tali valutazioni e report offline per ognuno di essi. I report inoltre contengono tutte le impostazioni di apprendimento presenti in questa cronologia, che è possibile trovare e scaricare o applicare.

Funzionamento

Personalizer esegue costantemente il training dei modelli di intelligenza artificiale che utilizza sulla base delle ricompense. Il training viene eseguito seguendo alcune impostazioni di apprendimento, che contengono iperparametri e altri valori usati nel processo di addestramento. Queste impostazioni di apprendimento possono essere ottimizzate in base alla tua specifica istanza di Personalizer.

Personalizzatore può anche eseguire Valutazioni offline. Le valutazioni offline esaminano i dati pregressi e possono produrre una stima statistica della ricompensa media che diversi algoritmi e modelli di Personalizer avrebbero potuto ottenere. Durante questo processo, Personalizer cercherà anche impostazioni di apprendimento migliori, stimandone le prestazioni, cioè il numero di ricompense che avrebbero potuto ottenere durante quel periodo di tempo.

Frequenza di ottimizzazione automatica

L'ottimizzazione automatica verrà eseguita periodicamente e si baserà sui dati pregressi.

  • Ad esempio, se l'applicazione invia a Personalizza esperienze più di circa 20 Mb di dati nelle ultime due settimane, userà le ultime due settimane di dati.
  • Se l'applicazione invia una quantità inferiore a questa, Personalizer aggiungerà i dati dei giorni precedenti fino a quando non saranno disponibili dati sufficienti per l'ottimizzazione, oppure fino a quando non si raggiungeranno i dati archiviati più vecchi (fino al limite di giorni di conservazione dei dati).

Gli orari e i giorni esatti in cui viene eseguita l'ottimizzazione automatica vengono determinati dal servizio Personalizza esperienze e variano nel tempo.

Criteri per l'aggiornamento delle impostazioni di apprendimento

Personalizer usa queste stime della ricompensa per decidere se modificare le impostazioni di apprendimento correnti per altri. Ogni stima è una curva di distribuzione, con limiti di confidenza superiori e inferiori del 95%. Personalizza esperienze applicherà le nuove impostazioni di apprendimento solo se:

  • Hanno mostrato ricompense medie più elevate nel periodo di valutazione.
  • hanno un limite inferiore dell'intervallo di confidenza del 95%, ovvero superiore al limite inferiore dell'intervallo di confidenza del 95% delle impostazioni di apprendimento online. Questo criterio di massimizzazione del miglioramento della ricompensa, cercando al contempo di eliminare la probabilità di perdita di ricompense future, è gestito da Personalizza esperienze e attinge dalla ricerca sugli algoritmi seldoniani e sulla sicurezza dell'IA.

Limitazioni dell'ottimizzazione automatica

L'ottimizzazione automatica di Personalizer si basa su una valutazione di un periodo passato per stimare le prestazioni nel futuro. È possibile che, a causa di fattori esterni legati al mondo, all'applicazione e agli utenti, queste stime e previsioni sui modelli di Personalizer, realizzate nel periodo precedente, non siano rappresentative del futuro.

L'anteprima dell'ottimizzazione automatica non è disponibile per i cicli di Personalizer che hanno abilitato la funzionalità di anteprima dell'API di personalizzazione Multi-Slot.

Passaggi successivi