Condividi tramite


Inferenza e valutazione dei modelli di previsione

Questo articolo presenta i concetti relativi all'inferenza e alla valutazione dei modelli nelle attività di previsione. Per istruzioni ed esempi per il training dei modelli di previsione in AutoML, vedere Configurare AutoML per eseguire il training di un modello di previsione di serie temporali con SDK e interfaccia della riga di comando.

Dopo aver usato AutoML per eseguire il training e selezionare un modello migliore, il passaggio successivo consiste nel generare previsioni. Quindi, se possibile, valutarne l'accuratezza in un set di test derivato dai dati di training. Per informazioni su come configurare ed eseguire la valutazione del modello di previsione in Machine Learning automatizzato, vedere Orchestrazione di training, inferenza e valutazione.

Scenari di inferenza

Nell'apprendimento automatico l'inferenza è il processo di generazione di stime di modelli per i nuovi dati non usati nel training. Esistono diversi modi per generare stime nella previsione a causa della dipendenza temporale dei dati. Lo scenario più semplice è quando il periodo di inferenza segue immediatamente il periodo di training e vengono generate stime all'orizzonte di previsione. Il diagramma seguente illustra questo scenario:

Diagramma che illustra una previsione immediatamente successiva al periodo di training.

Il diagramma mostra due parametri di inferenza importanti:

  • La lunghezza del contesto è la quantità di cronologia richiesta dal modello per effettuare una previsione.
  • L'orizzonte di previsione indica quanto avanti nel tempo viene eseguito il training del responsabile della previsione per la stima.

I modelli di previsione usano in genere alcune informazioni cronologiche, il contesto, per creare stime in anticipo fino all'orizzonte di previsione. Quando il contesto fa parte dei dati di training, AutoML salva gli elementi necessari per effettuare previsioni. Non è necessario specificarlo in modo esplicito.

Altri due scenari di inferenza sono più complessi:

  • Generazione di stime più lontano nel futuro rispetto all'orizzonte di previsione
  • Ottenere stime quando si verifica un divario tra i periodi di training e di inferenza

Le sottosezioni seguenti esaminano questi casi.

Stima oltre l'orizzonte di previsione: previsione ricorsiva

Quando sono necessarie previsioni oltre l'orizzonte, AutoML applica il modello in modo ricorsivo nel periodo di inferenza. Le stime del modello vengono restituite come input per generare stime per le successive finestre di previsione. Il diagramma seguente mostra un semplice esempio:

Diagramma che illustra una previsione ricorsiva in un set di test.

In questo caso l'apprendimento automatico genera previsioni su un periodo pari a tre volte la lunghezza dell'orizzonte. Usa stime da una finestra come contesto per la finestra successiva.

Avviso

La previsione ricorsiva può accumulare errori di modellazione. Le stime diventano meno accurate tanto più lontane sono dall'orizzonte di previsione originale. È possibile trovare un modello più accurato ripetendo il training con un orizzonte più lungo.

Stima con un divario tra periodi di training e di inferenza

Si supponga che, dopo aver eseguito il training di un modello, lo si voglia usare per eseguire stime da nuove osservazioni non ancora disponibili durante il training. In questo caso, esiste un divario di tempo tra i periodi di training e di inferenza:

Diagramma che illustra una previsione con un divario tra i periodi di training e di inferenza.

AutoML supporta questo scenario di inferenza, ma è necessario fornire i dati di contesto nel periodo di divario, come illustrato nel diagramma. I dati di stima passati al [componente di inferenza](how-to-auto-train-forecast.md#orchestrate-training-inference-and-evaluation-by using-components-and-pipelines) devono avere valori per le caratteristiche e i valori della destinazione osservati nel divario e valori mancanti o valori NaN per la destinazione nel periodo di inferenza. La tabella seguente mostra un esempio di questo criterio:

Tabella che mostra un esempio di dati di stima quando è presente un divario tra i periodi di training e di inferenza.

I valori noti della destinazione e delle funzionalità vengono forniti dal 2023-05-01 fino al 2023-05-03. I valori di destinazione mancanti a partire dal 2023-05-04 indicano che il periodo di inferenza inizia da tale data.

AutoML usa i nuovi dati di contesto per aggiornare il ritardo e altre funzionalità di lookback e anche per aggiornare modelli come ARIMA che mantengono uno stato interno. Questa operazione non aggiorna o adatta i parametri del modello.

Valutazione del modello

La valutazione è il processo di generazione di predizioni su un set di test separato dai dati di training e di calcolo delle metriche da queste predizioni che guidano le decisioni di distribuzione del modello. Di conseguenza, è disponibile una modalità di inferenza adatta alla valutazione del modello, ovvero una previsione di rolling.

Una procedura consigliata per la valutazione di un modello di previsione consiste nell’eseguire il rollforward del responsabile della previsione sottoposto a training nel tempo nel set di test, calcolando la media delle metriche degli errori in diverse finestre di stima. Questa procedura viene talvolta definita backtest. Idealmente, il set di test per la valutazione è lungo rispetto all'orizzonte di previsione del modello. In caso contrario, le stime dell'errore di previsione potrebbero essere statisticamente rumorose e meno affidabili.

Il diagramma seguente mostra un semplice esempio con tre finestre di previsione:

Diagramma che illustra una previsione di rolling in un set di test.

Il diagramma illustra tre parametri di valutazione di rolling:

  • La lunghezza del contesto è la quantità di cronologia richiesta dal modello per effettuare una previsione.
  • L'orizzonte di previsione indica quanto avanti nel tempo viene eseguito il training del responsabile della previsione per la stima.
  • La dimensione del passaggio rappresenta l'anticipo con cui la finestra mobile avanza a ogni iterazione sul set di test.

Il contesto avanza insieme alla finestra di previsione. I valori effettivi del set di test vengono usati per effettuare previsioni quando rientrano nella finestra di contesto attuale. La data più recente dei valori effettivi utilizzati per una determinata finestra di previsione viene chiamata ora di origine della finestra. La tabella seguente mostra un output di esempio della previsione di rolling a tre finestre con un orizzonte di tre giorni e una dimensione del passaggio di un giorno:

Diagramma che mostra la tabella di output di esempio ricavata da una previsione di rolling.

Con una tabella simile a questa, è possibile visualizzare le previsioni rispetto ai valori effettivi e calcolare le metriche di valutazione desiderate. Le pipeline di AutoML possono generare previsioni di rolling in un set di test con un componente di inferenza.

Note

Quando il periodo di prova è la stessa lunghezza dell'orizzonte di previsione, una previsione di rolling offre una singola finestra delle previsioni fino all'orizzonte.

Metriche di valutazione

Lo scenario aziendale specifico determina in genere la scelta del riepilogo o della metrica di valutazione. Alcune opzioni comuni includono i seguenti esempi:

  • Tracciati dei valori target osservati rispetto ai valori previsti per verificare che il modello catturi determinate dinamiche dei dati.
  • Errore medio assoluto percentuale (MAPE) tra valori effettivi e previsti
  • Radice errore quadratico medio (RMSE), possibilmente con una normalizzazione, tra valori effettivi e previsti
  • Errore assoluto medio (MAE), possibilmente con una normalizzazione, tra valori effettivi e previsti

A seconda dello scenario aziendale, potrebbe essere necessario creare utilità di post-elaborazione personalizzate per calcolare le metriche di valutazione da risultati di inferenza o previsioni in sequenza. Per altre informazioni sulle metriche, vedere Metriche di regressione/previsione.