Condividi tramite


Calcolatore stime (Strumenti di analisi tabelle per Excel)

Strumento di calcolo delle previsioni

Lo strumento Calcolatore stime consente di creare una scorecard che può essere usata per analizzare nuovi dati e valutare le opzioni o i rischi. Ad esempio, se si dispone di dati cronologici e demografici sui clienti, lo strumento Calcolatore stime può essere utile con due attività chiave:

  • Generazione di un'analisi sottostante dei dati demografici, del comportamento di acquisto e di vari altri fattori.

  • Creazione di una scorecard di lavoro che consente di valutare i membri e di fornire raccomandazioni per i nuovi prodotti o offerte di servizi.

La procedura guidata crea anche un foglio di lavoro che archivia tutti i calcoli sottostanti, in modo che sia possibile interagire con il modello e vedere in che modo i diversi valori di input influiscono sul punteggio finale.

Se si sceglie, la procedura guidata può anche creare una versione stampata del foglio di lavoro che è possibile usare per l'assegnazione dei punteggi offline. Non è possibile interagire con il modello come è possibile con la cartella di lavoro di Excel online, ma la versione stampata fornisce tutti i calcoli necessari per immettere i valori e calcolare un punteggio finale.

Uso del Calcolatore delle Previsioni

  1. Aprire una tabella di Excel contenente i dati da analizzare.

  2. Fare clic su Calcolatore previsioni nella scheda Analizza.

  3. Nella finestra di dialogo Calcolatore di Previsioni, per Obiettivo, scegli la colonna che vuoi prevedere, ad esempio il comportamento di acquisto.

  4. Specificare il valore di destinazione. Se il valore è numerico, usare l'opzione In intervallo e quindi digitare i valori minimo e massimo per l'intervallo desiderato. Se il valore è discreto, selezionare l'opzione Esattamente e quindi selezionare il valore nell'elenco a discesa.

  5. Fare clic su Scegli colonne da usare per l'analisi.

  6. Nella finestra di dialogo Selezione colonna avanzata selezionare le colonne con informazioni utili. Rimuovere tutte le colonne non rilevanti per l'analisi. Fare clic su OK.

    Per evitare di inclinare i risultati, è anche necessario rimuovere colonne con informazioni duplicate. Ad esempio, se si dispone di una colonna Income che contiene dati numerici e una colonna Income Group che contiene le etichette High, Medium e Low, non è consigliabile includere entrambe le colonne nello stesso modello. È invece possibile creare un modello separato per ogni colonna.

  7. Nella sezione Opzioni di output selezionare Calcolatore operativo per creare l'analisi e la scorecard all'interno di una cartella di lavoro di Excel. Selezionare Printer-ready Calculator (Calcolatore pronto per stampante) per creare l'analisi e generare anche un report che può essere stampato e usato per l'assegnazione dei punteggi a mano.

  8. Fare clic su Esegui.

    Lo strumento crea nuovi fogli di lavoro che contengono i report e le scorecard.

Requisiti

Lo strumento Prediction Calculator usa l'algoritmo Microsoft Logistic Regression, che può funzionare con valori discreti, nonché dati numerici discretizzati e continui.

Informazioni sui report di assegnazione dei punteggi

Se si selezionano entrambe le opzioni di output, il Calcolatore stime crea i tre nuovi fogli di lavoro seguenti all'interno della cartella di lavoro corrente:

  • Report di stimache contiene i risultati dell'analisi, completi di tabelle interattive e grafici che consentono di sperimentare interazioni e profitti.

  • Calcolatore di stima interattivo che consente di creare punteggi.

  • Calcolatore stampabile con istruzioni e coefficienti da usare per l'assegnazione dei punteggi.

  • Questa sezione descrive le informazioni in ogni report e come usare le varie opzioni del report.

Report di previsione con grafici

Il primo report di previsione è intitolato Prediction Calculator Report per lo stato di destinazione < dell'attributo > di <destinazione>. Contiene una tabella di fattori derivati dall'analisi, insieme agli strumenti che consentono di valutare l'impatto finanziario di una particolare analisi.

Tabella per specificare i costi e i profitti

Il primo strumento di questo report, situato in alto a sinistra, è una tabella in cui è possibile specificare i costi e i profitti associati alla previsione corretta o errata di un valore. Questi costi e profitti sono necessari per calcolare la soglia di punteggio ottimale per il calcolatore.

Elemento Descrizione ed esempio
Costo del falso positivo Costo del presupposto che il modello abbia stimato correttamente un risultato positivo quando effettivamente la stima è errata.

Ad esempio, il modello prevede che un cliente acquisterà qualcosa e, basandoti su questo, elabori una campagna per indirizzare quel cliente. È possibile immettere il costo di sensibilizzazione per il cliente qui.
Costo falso negativo Costo del presupposto che il modello abbia stimato correttamente un valore negativo quando effettivamente la stima è errata.

Ad esempio, il modello potrebbe prevedere che è improbabile che i clienti più anziani acquistino una bicicletta, ma scopri che il modello era distorto e di conseguenza hai perso l'opportunità di indirizzare i clienti più anziani. È possibile assegnare un costo di un'opportunità persa qui.
Vero profitto positivo Trarre profitto dalla stima corretta di un risultato positivo. Ad esempio, se si rivolgono ai clienti giusti e questo porta a una vendita, si inserisce qui il profitto per cliente.
Vero profitto negativo Trarre profitto dalla stima corretta di un risultato negativo.

Ad esempio, se è possibile identificare correttamente i clienti che non devono essere destinati, è possibile immettere qui il numero X di dollari pubblicitari per cliente.

Grafico per la visualizzazione del profitto massimo

Quando si immettono i valori nella tabella, i grafici correlati vengono aggiornati automaticamente per mostrare il punto migliore per massimizzare il profitto dato il modello corrente. Il grafico a linee a destra di questa tabella visualizza il profitto per varie soglie di punteggio. Il profitto viene stimato usando le cifre relative ai profitti e ai costi digitate nella tabella, in base alle stime e alle probabilità del modello.

Se, ad esempio, nella tabella superiore sinistra, la cella di Soglia suggerita per massimizzare il profitto mostra il valore 500, il grafico sul lato destro mostrerà 500 come punto più alto del grafico a linee. Questo valore pari a 500 significa che per massimizzare i profitti, è consigliabile usare le prime 500 raccomandazioni del modello di data mining, ordinate in base alla probabilità.

Tabella che elenca i punteggi per ogni attributo e valore

La tabella in basso a sinistra del report mostra una suddivisione dettagliata dei valori rilevati e il modo in cui ogni valore influisce sul risultato. Non è possibile modificare i valori in questa tabella; vengono visualizzati per comprendere la stima.

Ad esempio, la tabella seguente mostra un esempio dei risultati quando il risultato di destinazione è che un cliente acquista una bicicletta. La tabella elenca ogni colonna di input usata nel modello, indipendentemente dal fatto che l'input abbia interessato il modello. La tabella elenca anche i valori discreti e i valori discretizzati se la colonna di input contiene dati numerici continui.

I valori nella colonna Impatto relativo sono probabilità, rappresentati come percentuali. La cella è ombreggiata per rappresentare visivamente l'impatto di questo valore sui risultati.

Attributo Valore Impatto relativo
Stato civile Sposato 0
Stato civile Singolo 71
Genere Femmina 13
Genere Maschio 0

È possibile interpretare questi fattori nel modo seguente:

  • Essere sposati non influisce sulla probabilità del cliente di acquistare una bicicletta.

  • Tuttavia, essere single è un forte indicatore (70%) che il cliente probabilmente acquista una bicicletta.

  • Il sesso del cliente ha solo un effetto marginale (13%) sul comportamento previsto per l'acquisto di biciclette se il cliente è una donna e non ha alcun effetto sul comportamento previsto per l'acquisto di biciclette se il cliente è un uomo.

Grafico dei costi cumulativi di classificazione errata

Il grafico ad area in basso a destra del report mostra il costo cumulativo di misclassificazione per varie soglie di punteggio. Questo grafico usa anche le cifre sui costi e sui profitti immesse per falsi positivi, veri positivi, falsi negativi e falsi positivi.

A differenza del grafico in alto a destra del report, che si concentra sull'ottimizzazione dei profitti, questo grafico incorpora il costo di effettuare la stima errata. Questo grafico è particolarmente utile in scenari come la prevenzione, in cui il costo di prendere la decisione sbagliata supera significativamente il costo di indovinare correttamente.

Ad esempio, anche se il primo grafico suggerisce che la destinazione dei primi 500 clienti stimati dal modello è il modo per raggiungere i profitti massimi, è possibile decidere dopo aver esaminato questo secondo grafico che i costi di destinazione errata dei clienti sono troppo elevati e decidere invece di tagliare la campagna di marketing ai primi 400 clienti.

Calcolatore di stime interattivo

Il secondo foglio di lavoro creato dallo strumento Prediction Calculator è denominato Prediction Calculator per <lo stato di >destinazione dell'<attributo di >destinazione. Si tratta di un foglio di lavoro interattivo che è possibile usare per calcolare i singoli punteggi. Poiché questo foglio di lavoro usa modelli e statistiche archiviati nel modello, è possibile sperimentare valori diversi e vedere come influiscono sul punteggio stimato. Questo report include anche due sezioni: una è interattiva e una viene fornita come riferimento.

Prima tabella

È possibile selezionare o digitare un nuovo valore nella colonna Valore della tabella per vedere come la modifica del valore influisce sul punteggio.

Ad esempio, se il report contiene i valori seguenti, è possibile ridurre il valore di Cars a 1 e quindi su 0 per vedere come influisce sul comportamento di acquisto dei clienti. Quando si modifica il valore di Cars in 0, la stima nella parte inferiore diventa TRUE.

Attributo Valore Impatto relativo
Stato civile Sposato 0
Genere Maschio 0
Reddito 39050 - 71062 117
Bambini 0 157
Educazione Scapoli 22
Occupazione Lavoro manuale qualificato 33
Proprietario della casa 8
Auto 2 50
Distanza del pendolarismo 0-1 miglia 99
Area geografica Nord America 0
Età 37 - 46 5
Totale 491
Previsione per 'Sì' Falso

Quando viene digitato il nuovo valore, il punteggio visualizzato nella cella Predizione per Sì cambia in TRUE, e i punteggi di impatto relativo per i vari attributi vengono aggiornati.

Annotazioni

Anche se si modifica un solo valore, ad esempio il numero di automobili, i valori e gli effetti di altri attributi possono cambiare quando si esegue questa operazione. Questo perché i modelli di data mining spesso trovano relazioni complesse tra i dati e la modifica di una variabile può avere effetti imprevisti. Per questo motivo, è consigliabile usare il calcolatore di stima interattivo per sperimentare valori diversi o esplorare il modello di data mining per comprendere meglio le interazioni. Per altre informazioni, vedere Esplorare i modelli.

Scomposizione punteggio

Questa tabella mostra i singoli punteggi per ogni possibile stato delle colonne di input e l'impatto relativo che il punteggio ha sui risultati. Questa tabella è statica e solo per riferimento.

Calcolatore previsione stampabile

Il terzo foglio di lavoro creato dallo strumento Prediction Calculator è denominato PrintablePrediction Calculator per lo stato> di destinazione dell'attributo <>di <destinazione. Questa scorecard deve essere stampata in modo da poter calcolare manualmente i punteggi quando si è lontani dal computer.

Per stampare e usare il report di assegnazione dei punteggi generato dal calcolatore delle stime
  1. Fare clic sulla scheda intitolata Printable Prediction Calculator per l'attributo <>.

  2. Scegliere Anteprima di stampa dal menu File di Excel.

  3. Modificare l'orientamento della pagina, i margini e altre opzioni di stampa fino a quando la scorecard non si adatta alla pagina nel modo desiderato.

    Questa scorecard non è dinamica e non è connessa al modello in alcun modo, pertanto è possibile spostare colonne o righe per migliorare la formattazione senza influire sui dati sottostanti.

  4. Stampare la scheda dei punteggi.

  5. Per ogni attributo, scegliere un solo valore. Per il valore scelto, inserire un segno di spunta nella casella e scrivere il numero corrispondente nella colonna Punteggio .

  6. Compilare il maggior numero possibile di attributi per garantire l'accuratezza.

  7. Calcolare la somma dei punteggi per ogni attributo e immettere tale numero nella riga Totale .

  8. Convertire il punteggio in un risultato stimato utilizzando i criteri stampati nel foglio immediatamente dopo la riga Totale .

Analysis Services fornisce l'algoritmo Microsoft Logistic Regression per l'uso in questo tipo di analisi. Se si ha già familiarità con la regressione logistica, è possibile creare facilmente modelli di regressione logistica usando l'opzione Avanzate del client di data mining per Excel. Per altre informazioni, vedere Modellazione avanzata (componenti aggiuntivi di data mining per Excel). Per altre informazioni sulle opzioni e i parametri per i modelli di regressione logistica, vedere l'argomento "Algoritmo di regressione logistica Microsoft" nella documentazione online di SQL Server.

Vedere anche

Strumenti di analisi tabelle per Excel