Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questa esercitazione illustra come creare un processo di Analisi di flusso che scrive in una tabella Delta in Azure Data Lake Storage Gen2. In questa esercitazione si apprenderà come:
- Distribuire un generatore di eventi che invia dati di esempio all'hub eventi
- Creare un processo di Analisi di flusso.
- Configurare Azure Data Lake Storage Gen2 con una tabella Delta
- Eseguire il lavoro di analisi del flusso
Prerequisiti
Prima di iniziare, completare i passaggi seguenti:
- Se non hai una sottoscrizione di Azure, crea un account gratuito.
- Distribuire il generatore di eventi TollApp in Azure. Usare questo collegamento per distribuire il modello di Azure TollApp. Impostare il
intervalparametro su 1. Creare e usare un nuovo gruppo di risorse per questo passaggio. - Creare un account Data Lake Storage Gen2.
Creare un processo di Analisi di flusso.
Accedi al portale di Azure.
Selezionare Tutti i servizi nel menu a sinistra.
Spostare il mouse sui processi di Analisi dei flussi nella sezione Analisi e selezionare + (più).
Selezionare Crea una risorsa nell'angolo superiore sinistro del portale di Azure.
Selezionare Analytics>attività di Stream Analytics dall'elenco dei risultati.
In Nuovo processo di Analisi di flusso seguire questa procedura:
- Per Sottoscrizione selezionare la sottoscrizione di Azure.
- Per Gruppo di risorse selezionare la stessa risorsa usata in precedenza nella distribuzione TollApp.
- In Nome, immettere un nome per il processo. Il nome del processo di Analisi di flusso può contenere solo caratteri alfanumerici, trattini e caratteri di sottolineatura. Deve avere una lunghezza compresa tra 3 e 63 caratteri.
- Per Ambiente di hosting verificare che Cloud sia selezionato.
- Per Unità di flusso, selezionare 1. Le unità di streaming rappresentano le risorse di calcolo necessarie per eseguire un processo. Per informazioni sul ridimensionamento delle unità di streaming, vedere Informazioni e regolazione delle unità di streaming.
Selezionare Rivedi e crea nella parte inferiore della pagina.
In Rivedi e crea rivedere le impostazioni e selezionare Crea per creare un processo di Analisi di flusso.
Nella pagina di distribuzione selezionare Vai alla risorsa per passare alla pagina del Processo di Analisi dei flussi.
Configurare l'input del processo
Il passaggio successivo consiste nel definire un'origine di input per il processo di lavoro per leggere i dati utilizzando l'Hub eventi creato nella distribuzione di TollApp.
Trova il processo Stream Analytics creato nella sezione precedente.
Nella sezione Topologia del processo del processo di Stream Analytics, selezionare Input.
Seleziona + Aggiungi input e Hub eventi.
Compilare il modulo di input con i valori seguenti creati tramite il modello di Azure TollApp:
Per Alias di input immettere entrystream.
Scegliere Seleziona Hub eventi dalla tua sottoscrizione.
Per Sottoscrizione selezionare la sottoscrizione di Azure.
Per Spazio dei nomi dell'hub eventi, selezionare lo spazio dei nomi dell'hub eventi creato nella sezione precedente.
Usare le opzioni predefinite nelle impostazioni rimanenti e selezionare Salva.
Configurare l'output del lavoro
Il passaggio successivo consiste nel definire un sink di output in cui il processo può scrivere dati. In questa esercitazione si scrive l'output in una tabella Delta in Azure Data Lake Storage Gen2.
Nella sezione Topologia processo del processo di Analisi di flusso selezionare l'opzione Output.
Selezionare + Aggiungi archiviazione>Blob storage/ADLS Gen2.
Compilare il modulo di output con i dettagli seguenti e selezionare Salva:
Per Alias di output immettere DeltaOutput.
Scegliere Seleziona archiviazione BLOB/ADLS Gen2 dalle sottoscrizioni.
Per Sottoscrizione selezionare la sottoscrizione di Azure.
Per Account di archiviazione scegliere l'account ADLS Gen2 (quello che inizia con tollapp) creato.
Per contenitore selezionare Crea nuovo e specificare un nome di contenitore univoco.
Per Formato di serializzazione eventi selezionare Delta Lake. Anche se Delta Lake è elencato come una delle opzioni qui, non è un formato di dati. Delta Lake usa file Parquet versionati per archiviare i tuoi dati. Per altre informazioni su Delta Lake.
Per il percorso della tabella Delta, immettere la cartella/tabella delta dell'esercitazione.
Usare le opzioni predefinite nelle impostazioni rimanenti e selezionare Salva.
Creare query
A questo punto, si configura un processo di Analisi di flusso per leggere un flusso di dati in ingresso. Il passaggio successivo consiste nel creare una query che analizza i dati in tempo reale. Le query usano un linguaggio simile a SQL con alcune estensioni specifiche di Analisi di flusso.
Selezionare Query sotto Topologia del lavoro nel menu a sinistra.
Immettere la query seguente nella finestra di query. In questo esempio la query legge i dati da Hub eventi e copia i valori selezionati in una tabella Delta in ADLS Gen2.
SELECT State, CarModel.Make, TollAmount INTO DeltaOutput FROM EntryStream TIMESTAMP BY EntryTimeSelezionare Salva query sulla barra degli strumenti.
Avviare il processo di Analisi di flusso e controllare l'output
Tornare alla pagina di panoramica del processo nel portale di Azure e selezionare Avvia.
Nella pagina Avvia processo verificare che l'opzione Ora sia selezionata per Ora di inizio dell'output del processo e quindi selezionare Avvia nella parte inferiore della pagina.
Dopo alcuni minuti, nel portale trovare l'account di archiviazione e il contenitore configurato come output per il processo. È ora possibile visualizzare la tabella delta nella cartella specificata nel contenitore. L'operazione richiede alcuni minuti per avviarsi la prima volta. Dopo l'avvio, l'esecuzione continua man mano che arrivano i dati.
Pulire le risorse
Quando le risorse non sono più necessarie, eliminare il gruppo di risorse, il processo di Analisi di flusso e tutte le risorse correlate. L'eliminazione dell'attività interrompe la fatturazione per le unità di streaming consumate dall'attività. Se si prevede di utilizzare l'attività in futuro, è possibile interromperla e riavviarla quando necessario. Se non si intende continuare a usare questo processo, eliminare tutte le risorse create in questa esercitazione attenendosi alla procedura seguente:
- Scegliere Gruppi di risorse dal menu a sinistra del portale di Azure e quindi selezionare il nome della risorsa creata.
- Nella pagina del gruppo di risorse selezionare Elimina, digitare il nome della risorsa da eliminare nella casella di testo e quindi selezionare Elimina.
Passaggi successivi
In questa esercitazione è stato creato un semplice processo di Analisi di flusso, sono stati filtrati i dati in ingresso e sono stati scritti risultati in una tabella Delta nell'account ADLS Gen2. Per altre informazioni sui processi di Analisi di flusso, vedere: