Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
L'algoritmo di campionamento in Power BI migliora gli oggetti visivi che campionino dati ad alta densità. Ad esempio, è possibile creare un grafico a linee dai risultati delle vendite dei punti vendita, ogni negozio ha più di 10.000 ricevute di vendita ogni anno. Un grafico a linee di tali informazioni sulle vendite campiona i dati per ogni negozio e crea un grafico a linee multiserie che rappresenta i dati sottostanti. Selezionare una rappresentazione significativa dei dati per illustrare la variazione delle vendite nel tempo. Questa pratica è comune nella visualizzazione dei dati ad alta densità. I dettagli del campionamento dei dati ad alta densità sono descritti in questo articolo.
Annotazioni
L'algoritmo di campionamento ad alta densità descritto in questo articolo è disponibile sia in Power BI Desktop che nel servizio Power BI.
Funzionamento del campionamento di linee ad alta densità
In precedenza, Power BI ha selezionato una raccolta di punti dati di esempio nell'intera gamma di dati sottostanti in modo deterministico. Ad esempio, con dati ad alta densità in un oggetto visivo che si estende su un anno di calendario, l'oggetto visivo visualizza 350 punti dati di esempio. L'algoritmo seleziona ogni punto dati per garantire che l'intera gamma di dati sia rappresentata nell'oggetto visivo. Per comprendere come ciò accade, si immagini di tracciare un prezzo azionario in un periodo di un anno e di selezionare 365 punti dati per creare un oggetto visivo grafico a linee. Questo è un punto di dati per ogni giorno.
In tale situazione, esistono molti valori per un prezzo azionario entro ogni giorno. Naturalmente, c'è un valore giornaliero alto e basso, ma questi valori possono verificarsi in qualsiasi momento durante il giorno in cui il mercato azionario è aperto. Per il campionamento di linee ad alta densità, se il campione di dati sottostante viene acquisito alle 10:30 e alle 12:00 ogni giorno, si ottiene uno snapshot rappresentativo dei dati sottostanti, ad esempio il prezzo alle 10:30 e alle 12:00. Tuttavia, lo snapshot potrebbe non registrare l'effettivo massimo e minimo del prezzo azionario per quel valore rappresentativo della giornata. In questa situazione e in altri casi, il campionamento è rappresentativo dei dati sottostanti, ma non sempre acquisisce punti importanti, che in questo caso sarebbero i prezzi azionari giornalieri alti e bassi.
Per definizione, i dati ad alta densità vengono campionati per creare visualizzazioni ragionevolmente rapide e reattive all'interattività. Troppi punti dati su un grafico possono rallentarlo e possono ridurre la visibilità delle tendenze. Il modo in cui i dati vengono campionati determina la creazione dell'algoritmo di campionamento per offrire la migliore esperienza di visualizzazione. In Power BI Desktop, l'algoritmo offre la migliore combinazione di velocità di risposta, rappresentazione e conservazione chiara di punti importanti in ogni sezione temporale.
Funzionamento dell'algoritmo di campionamento linea
L'algoritmo per il campionamento di linee ad alta densità è disponibile per gli oggetti visivi grafico a linee e grafico ad area con un asse x continuo.
Per un oggetto visivo ad alta densità, Power BI suddivide in modo intelligente i dati in blocchi ad alta risoluzione e quindi seleziona i punti importanti per rappresentare ogni blocco. Questo processo di sezionamento dei dati ad alta risoluzione viene ottimizzato per garantire che il grafico risultante sia visivamente indistinguibile dal rendering di tutti i punti dati sottostanti, ma è più veloce e più interattivo.
Valori minimi e massimi per le visualizzazioni a linee ad alta densità
Per qualsiasi visualizzazione, si applicano le limitazioni seguenti:
- 3.500 è il numero massimo di punti dati visualizzati nella maggior parte degli oggetti visivi, indipendentemente dal numero di punti dati o serie sottostanti. Per le eccezioni, vedere l'elenco seguente. Ad esempio, se si dispone di 10 serie con 350 punti dati ciascuna, l'elemento visivo raggiunge il limite massimo totale di punti dati. Se si ha a disposizione una serie, questa potrebbe contenere fino a 3.500 punti dati, se l'algoritmo ritiene che sia il miglior campionamento per i dati sottostanti.
- È previsto un massimo di 60 serie per qualsiasi oggetto visivo. Se sono presenti più di 60 serie, suddividere i dati e creare più visualizzazioni con non più di 60 serie ciascuna. È consigliabile usare un filtro dei dati per visualizzare solo i segmenti dei dati, ma solo per determinate serie. Ad esempio, se vengono visualizzate tutte le sottocategorie in una leggenda, è possibile usare un filtro per filtrare in base alla categoria complessiva sulla stessa pagina del rapporto.
Il numero massimo di limiti di dati è superiore per i tipi di oggetto visivo seguenti, che sono eccezioni al limite di 3.500 punti dati:
- 150.000 punti dati massimo per le visualizzazioni R.
- 30.000 punti dati per le visualizzazioni di Azure Maps.
- 10.000 punti dati per alcune configurazioni dei grafici di dispersione (i grafici di dispersione predefiniti hanno 3.500 punti dati).
- 3.500 per tutti gli altri elementi visivi usando il campionamento ad alta densità. Altri oggetti visivi potrebbero visualizzare più dati, ma non usano il campionamento.
Questi parametri assicurano che gli oggetti visivi in Power BI Desktop eseguano rapidamente il rendering, rimangano reattivi all'interazione dell'utente e non causi un sovraccarico di calcolo eccessivo nel computer che esegue il rendering dell'oggetto visivo.
Valutare i punti dati rappresentativi per visualizzazioni a linee ad alta densità
Quando il numero di punti dati sottostanti supera il numero massimo di punti dati che l'oggetto visivo può rappresentare, inizia un processo denominato binning . Binning suddivide i dati sottostanti in gruppi denominati bin e quindi affina in modo iterativo tali contenitori.
L'algoritmo crea il maggior numero possibile di bin per creare la massima granularità per l'oggetto visivo. All'interno di ogni contenitore, l'algoritmo trova il valore minimo e massimo dei dati per garantire che i valori importanti e significativi, ad esempio gli outlier, vengano acquisiti e visualizzati nell'oggetto visivo. In base ai risultati del binning e alla successiva valutazione dei dati da parte di Power BI, la risoluzione minima per l'asse x per il visivo viene determinata per garantire la massima granularità per il visivo.
Come accennato in precedenza, la granularità minima per ogni serie è di 350 punti e il massimo è 3.500 per la maggior parte degli oggetti visivi. Le eccezioni sono elencate nella sezione precedente.
Ogni contenitore è rappresentato da due punti dati, che diventano i punti dati rappresentativi del bin nella visualizzazione. I punti dati sono il valore alto e basso di quel intervallo. Selezionando i valori alti e bassi, il processo di binning garantisce che qualsiasi valore elevato importante o significativo valore basso venga acquisito e accuratamente rappresentato nel visuale.
Se il processo sembra un sacco di analisi per garantire che l'outlier occasionale venga acquisito e visualizzato correttamente nella visualizzazione, hai ragione. Questo è il motivo esatto per l'algoritmo e il processo di binning.
Suggerimenti e campionamento di linee ad alta densità
Il processo di binning acquisisce e visualizza il valore minimo e massimo in un determinato contenitore. Questo processo potrebbe influire sul modo in cui i tooltip visualizzano i dati quando si passa il puntatore del mouse sui punti dati. Per spiegare come e perché questo processo influisce sulle descrizioni comando, esaminiamo l'esempio sui prezzi azionari.
Stai creando una visualizzazione basata sul prezzo delle azioni e stai confrontando due azioni diverse, entrambe con campionamento ad alta densità. I dati sottostanti per ogni serie hanno molti punti dati. Ad esempio, si acquisisce il prezzo azionario ogni secondo del giorno. L'algoritmo di campionamento delle linee ad alta densità esegue il binning per ogni serie indipendentemente dalle altre.
Ora, il primo titolo aumenta il prezzo alle 12:02, quindi torna rapidamente indietro di 10 secondi più tardi. Questo è un punto di dati importante. Quando si esegue il binning per tale stock, il valore elevato a 12:02 è un punto dati rappresentativo per tale contenitore.
Tuttavia, per la seconda azione, 12:02 non è un valore massimo o minimo nell'intervallo che include quel momento. Forse l'alto e il basso dell'intervallo che include le 12:02 si verificano dopo tre minuti. In questo caso, quando viene creato il grafico a linee e si passa il puntatore del mouse su 12:02, viene visualizzato un valore nel tooltip per il primo titolo. Questo valore esiste perché il primo titolo salta alle 12:02 e l'algoritmo seleziona tale valore come punto dati elevato del bin. Tuttavia, non viene visualizzato alcun valore nel tooltip alle 12:02 per il secondo titolo. Il secondo titolo non aveva un valore massimo o minimo per l'intervallo che includeva le 12:02. Di conseguenza, non sono presenti dati da visualizzare per il secondo titolo alle 12:02 e pertanto non vengono visualizzati dati di descrizione comando.
Questa situazione si verifica spesso con i suggerimenti. I valori alti e bassi per un intervallo specifico probabilmente non corrispondono perfettamente ai punti di valore dell'asse x scalati uniformemente, quindi il tooltip non visualizza il valore.
Attivare il campionamento di linee ad alta densità
Per impostazione predefinita, l'algoritmo è Attivato. Per modificare questa impostazione, passare al riquadro Formattazione, nella scheda Generale, e nella parte inferiore si vedrà il cursore Campionamento ad alta densità. Selezionare il dispositivo di scorrimento per passare da On a Off.
Considerazioni e limitazioni
L'algoritmo per il campionamento di linee ad alta densità è un miglioramento importante di Power BI, ma è necessario tenere presenti alcune considerazioni quando si lavora con valori e dati ad alta densità.
- A causa di una maggiore granularità e del processo di binning, Tooltips potrebbero mostrare un valore solo se i dati rappresentativi si allineano al cursore. Per ulteriori informazioni, consultare la sezione Suggerimenti e campionamento di linee ad alta densità in questo articolo.
- Quando le dimensioni di un'origine dati complessiva sono troppo grandi, l'algoritmo elimina serie (elementi legenda) per contenere il vincolo massimo di importazione dei dati.
- In questo caso, l'algoritmo ordina alfabeticamente la serie di legende. Inizia l'elenco degli elementi della legenda in ordine alfabetico fino a quando non viene raggiunto il valore massimo di importazione dei dati e non importa più serie.
- Quando un set di dati sottostante ha più di 60 serie, il numero massimo di serie, l'algoritmo ordina la serie in ordine alfabetico ed elimina le serie oltre la 60a serie ordinata alfabeticamente.
- Se i valori nei dati non sono di tipo numerico o data/ora, Power BI non utilizza l'algoritmo e ritorna al precedente algoritmo di campionamento a bassa densità.
- L'impostazione Mostra elementi senza dati non è supportata dall'algoritmo.
- L'algoritmo non è supportato quando si usa una connessione dinamica a un modello ospitato in SQL Server Analysis Services versione 2016 o precedenti. È supportato nei modelli ospitati in Power BI o In Azure Analysis Services.
Contenuti correlati
- Nei grafici a dispersione di Power BI, campionamento ad alta densità