Creazione di report personalizzati dello scanner (anteprima)

Questo articolo descrive la funzionalità di creazione di report personalizzati dello scanner Microsoft Purview Information Protection (anteprima). La creazione di report personalizzati offre agli amministratori dello scanner i dati necessari nel database del cluster di scanner per creare report personalizzati in base ai risultati dell'analisi, tra cui l'etichettatura, lo stato di protezione e i tipi di informazioni sensibili corrispondenti.

La creazione di report personalizzati è disponibile con Microsoft Purview Information Protection client e scanner versione 3.2.89.0 o successiva. La creazione di report personalizzati è abilitata da un amministratore tramite il controllo delle funzionalità dello scanner.

Cosa abilita la creazione di report personalizzati

Attualmente, lo scanner produce report CSV e TXT per analisi e archivia un set limitato di dati operativi nel database del cluster. Per creare un quadro completo dello stato del file, ovvero le modifiche, gli elementi etichettati, gli elementi protetti e i tipi di dati sensibili esistenti, gli amministratori devono combinare più esportazioni CSV tra cicli di analisi e caricarli in uno strumento di creazione di report separato.

Creazione di report personalizzati consente di spostare tali dati nel database del cluster dello scanner in modo che gli amministratori possano:

  • Eseguire una query sull'etichetta presente e precedente, sullo stato di protezione e sui conteggi SIT per ogni file analizzato in un repository.
  • Differenziali di calcolo tra le analisi ,ad esempio la modifica del numero di SIT corrispondenti per file.
  • Vedere quali tipi di informazioni sensibili sono stati confrontati con quali file e quante corrispondenze per tipo.See which sensitive information types were matched on which files, and how many matches per type.
  • Connettere il database del cluster di scanner a uno strumento di creazione di report di propria scelta, ad esempio Power BI, un data warehouse aziendale o uno strumento di dashboard basato su SQL, senza dover prima unire le esportazioni CSV.

Lo scanner rimane la fonte della verità. Creazione di report personalizzati scrive i dati di report aggiuntivi nello stesso database del cluster dello scanner condiviso nel ciclo di analisi successivo dopo l'abilitazione della funzionalità.

Aggiornamento dello schema del database

Le tabelle e le colonne di report necessarie per la creazione di report personalizzati sono state aggiunte per la prima volta allo schema del database del cluster dello scanner nella versione client 3.2.57.0. Finché la creazione di report personalizzati non è abilitata, le nuove colonne e le nuove tabelle esistono ma non vengono popolate. La funzionalità dello scanner esistente rimane invariata.

Nota

Non è necessario installare prima la versione client 3.2.57.0. Sia che si stia installando lo scanner fresco o che si stia eseguendo l'aggiornamento da qualsiasi versione precedente, lo scanner distribuisce lo schema completo del database (incluse le tabelle e le colonne di creazione di report personalizzati) durante l'installazione o l'aggiornamento.

Quando la creazione di report personalizzati è abilitata tramite il controllo della funzionalità Scanner, lo scanner avvia il popolamento dei dati seguenti nel ciclo di analisi successivo.

Aggiunte a dbo.ScannerFiles

dbo.ScannerFiles continua a contenere una riga per ogni file analizzato. Creazione di report personalizzati popola le colonne aggiuntive seguenti per acquisire lo stato del file e il delta tra l'analisi corrente e quella precedente:

Colonna Tipo Descrizione
LabelName NVARCHAR(MAX)Nullable Nome dell'etichetta corrente applicato al file. NULL se non etichettato.
PrevLabelId NVARCHAR(MAX)Nullable ID etichetta applicato all'analisi precedente, archiviato come stringa. NULL se in precedenza non è stato etichettato.
PrevLabelName NVARCHAR(MAX)Nullable Nome etichetta applicato all'analisi precedente. NULL se in precedenza non è stato etichettato.
ProtectionState NVARCHAR(MAX)Nullable Stato di protezione corrente per il file alla fine dell'analisi.
PrevProtectionState NVARCHAR(MAX)Nullable Stato di protezione registrato durante l'analisi precedente.
ClassificationCount INTPredefinito 0 Il numero di corrispondenze del tipo di informazioni riservate nel file durante l'analisi corrente.
LatestScanSessionId UNIQUEIDENTIFIERNullable Identifica la sessione di analisi più recente che ha toccato il file. Usato per calcolare i delta tra i cicli di analisi.
FileStatus NVARCHAR(MAX)Nullable Eliminazione finale del file nel ciclo di analisi, ad esempio lo stato requires-justification impostato da ProcessJobo Failed per i file che non possono essere elaborati.

Nuova tabella: dbo.MatchedClassificationAction

dbo.MatchedClassificationAction è una nuova tabella che archivia i tipi di informazioni sensibili corrispondenti per ogni file per analisi. Ogni riga rappresenta un sit corrispondente per un singolo file in una singola sessione di analisi.

Colonna Tipo Descrizione
Id BIGINT IDENTITY (chiave primaria) Chiave surrogata per la riga.
FilePath NVARCHAR(MAX)Nullable Percorso completo del file su cui è stata trovata la corrispondenza con SIT.
FileHashPath BINARY(64)Nullable Hash del percorso del file. I join a dbo.ScannerFiles.HashPath e sono indicizzati per le prestazioni di join.
ScanSessionId UNIQUEIDENTIFIERNullable Identifica la sessione di analisi in cui è stata trovata una corrispondenza con sit. I join a dbo.ScannerFiles.ScanSessionId e sono indicizzati.
MatchedInformationTypeName NVARCHAR(MAX)Nullable Nome visualizzato del tipo di informazioni riservate corrispondente, U.S. social security number (SSN)ad esempio .
MatchedInformationTypeId UNIQUEIDENTIFIERNullable GUID del sit corrispondente. Lo stesso GUID viene usato nei log di Microsoft Purview Information Protection locali per Workload=OnPremisesFileShareScanner.
MatchedInformationTypeCount INTPredefinito 0 Numero di corrispondenze per questo SIT nel file.
ConfidenceScore INTPredefinito 0 Punteggio di attendibilità della corrispondenza.

dbo.ScanSummary (totali per analisi) è invariato.

Domande di esempio a cui può rispondere la creazione di report personalizzati

Dopo aver popolato il database, gli amministratori possono eseguire query come:

  • Quali repository hanno la massima concentrazione di SIT corrispondenti e come è cambiata tale concentrazione dopo l'ultima analisi?
  • Quali file sono stati etichettati o rietichettati durante il ciclo di analisi più recente e qual era l'etichetta precedente?
  • Quali file non sono ancora etichettati ma contengono corrispondenze per uno o più tipi di informazioni sensibili?
  • Quali tipi di informazioni sensibili sono più diffusi in un determinato repository e con quale attendibilità?
  • Quali file sono passati da non protetti a protetti (o viceversa) dall'ultima analisi?

Abilitare la creazione di report personalizzati

La creazione di report personalizzati viene attivata tramite la configurazione delle funzionalità controllata dall'amministratore. Da qualsiasi nodo nel cluster dello scanner eseguire:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting="On"}

Per abilitare la creazione di report personalizzati in fase di installazione in un nuovo nodo dello scanner, usare il -FeatureSettings parametro con Install-Scanner:

Install-Scanner -SqlServerInstance SQLSERVER1 -Cluster Europe -FeatureSettings @{CustomReporting="On"}

Per confermare lo stato corrente, eseguire:

Get-ScannerConfiguration

La modifica ha effetto su ogni nodo del cluster nel ciclo di analisi successivo. Non è necessario riavviare il servizio.

Per interrompere il popolamento delle colonne e della tabella di creazione di report personalizzati, eseguire:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting="Off"}

Se si disabilita la creazione di report personalizzati, le nuove scritture vengono arrestate. I dati già scritti nelle colonne e nelle tabelle di report non vengono eliminati, pertanto è possibile riabilitare la funzionalità in un secondo momento senza perdita di dati.

Pianificare il database del cluster di scanner per la creazione di report

Quando si attiva la creazione di report personalizzati, il database del cluster dello scanner archivia un numero di dati notevolmente superiore per ciclo di analisi, ovvero colonne aggiuntive per file in dbo.ScannerFiles, più una riga per sit corrispondente per ogni file per analisi in dbo.MatchedClassificationAction. La compilazione di report sul database del cluster dello scanner aggiunge anche un carico di lavoro di lettura che viene eseguito insieme alle operazioni di lettura e scrittura dello scanner.

Prima di abilitare la creazione di report personalizzati nell'ambiente di produzione, considerare quanto segue:

  • Dimensioni del cluster e volume di analisi. Stimare il numero di file analizzati per ciclo, il numero tipico di corrispondenze SIT per file e la frequenza di analisi. Usare questi numeri per ridimensionare il database.
  • Impatto operativo. La creazione di report sulle query sullo stesso database in cui sta scrivendo lo scanner può competere con lo scanner per le risorse durante un ciclo di analisi.
  • Carico di lavoro per la creazione di report effettivamente desiderato. Dashboard interattivi, estrazioni pianificate e query ad hoc hanno un impatto molto diverso.

Per la maggior parte delle distribuzioni di produzione, è consigliabile ospitare il database del cluster scanner in SQL Server Enterprise in modo da poter dedicare una replica di sola lettura alla creazione di report. Con un SQL Server Always On gruppo di disponibilità, è possibile instradare il traffico di report a una replica secondaria leggibile in modo che le query di report non concorrono con il carico di lavoro operativo dello scanner nella replica primaria.

Questa separazione consente agli strumenti di creazione report (ad esempio, Power BI) di connettersi alla replica di sola lettura e di aggiornarsi in base alla propria cadenza senza influire sulla velocità effettiva dell'analisi nel database primario.

Nota

Lo scanner stesso legge sempre da e scrive nel database primario. Solo il carico di lavoro di report personalizzato deve essere puntato a una replica di sola lettura.

Limitazioni durante l'anteprima

  • In questa anteprima non è disponibile alcun dashboard predefinito con la creazione di report personalizzati. I clienti creano report personalizzati sul database del cluster dello scanner.
  • Le impostazioni configurate dalla configurazione delle funzionalità controllate dall'amministratore non sono sincronizzate con il portale di Microsoft Purview. Non tutte le funzionalità dello scanner finiranno per essere configurabili dal portale. Per le funzionalità disponibili nel portale e configurate in tale sito, l'impostazione configurata dal portale ha la precedenza e impedisce gli aggiornamenti da PowerShell.

Vedere anche