Relatórios Personalizados do Scanner (pré-visualização)

Este artigo descreve a funcionalidade de Relatórios Personalizados do Proteção de Informações do Microsoft Purview scanner (pré-visualização). Os Relatórios Personalizados fornecem aos administradores do scanner os dados de que precisam na base de dados do cluster de scanners para criarem os seus próprios relatórios com base nos resultados da análise, incluindo etiquetagem, estado de proteção e tipos de informações confidenciais correspondentes (SITs).

Os Relatórios Personalizados estão disponíveis com Proteção de Informações do Microsoft Purview cliente e a versão 3.2.89.0 ou posterior. Os Relatórios Personalizados são ativados por um administrador através do controlo de funcionalidades do Scanner.

O que os Relatórios Personalizados permitem

Atualmente, o scanner produz relatórios CSV e TXT por análise e armazena um conjunto limitado de dados operacionais na base de dados do cluster. Para criar uma imagem completa do estado do ficheiro — o que mudou, o que está etiquetado, o que está protegido e que tipos de dados confidenciais existem em que — os administradores têm de combinar múltiplas exportações de CSV em ciclos de análise e carregá-las numa ferramenta de relatórios separada.

Os Relatórios Personalizados movem esses dados para a base de dados do cluster de scanner para que os administradores possam:

  • Consulte a etiqueta presente e anterior, o estado de proteção e as contagens SIT para cada ficheiro analisado num repositório.
  • Diferenças de computação entre análises (por exemplo, a alteração no número de SITs correspondentes por ficheiro).
  • Veja que tipos de informações confidenciais foram correspondidos em que ficheiros e quantas correspondências por tipo.
  • Ligue a base de dados do cluster de scanners a uma ferramenta de relatórios à sua escolha (por exemplo, o Power BI, um armazém de relatórios empresarial ou uma ferramenta de dashboarding baseada em SQL) sem primeiro ter de coser as exportações de CSV em conjunto.

O scanner continua a ser a fonte da verdade. Os Relatórios Personalizados escrevem os dados de relatórios adicionais na base de dados do cluster de scanners no próximo ciclo de análise após a funcionalidade estar ativada.

Esquema de banco de dados

As tabelas e colunas de relatórios exigidas pelos Relatórios Personalizados foram adicionadas primeiro ao esquema da base de dados do cluster de scanner na versão 3.2.57.0 do cliente. Até que os Relatórios Personalizados estejam ativados, as novas colunas e tabelas existem, mas não são preenchidas. A funcionalidade do scanner existente não é inalterada.

Observação

Não precisa de instalar primeiro a versão 3.2.57.0 do cliente. Quer esteja a instalar o scanner atualizado ou a atualizar a partir de qualquer versão anterior, o analisador implementa o esquema completo da base de dados (incluindo as colunas e tabelas de Relatórios Personalizados) na instalação ou atualização.

Quando os Relatórios Personalizados são ativados através do controlo de funcionalidades do Scanner, o scanner começa a preencher os seguintes dados no próximo ciclo de análise.

Adições a dbo.ScannerFiles

dbo.ScannerFiles continua a conter uma linha por ficheiro analisado. Os Relatórios Personalizados preenchem as seguintes colunas adicionais para capturar o estado do ficheiro e o delta entre a análise atual e a anterior:

Coluna Tipo Descrição
LabelName NVARCHAR(MAX), nulo Nome da etiqueta atual aplicado ao ficheiro. NULL se não for etiquetado.
PrevLabelId NVARCHAR(MAX), nulo ID da etiqueta aplicado na análise anterior, armazenado como uma cadeia. NULL se anteriormente não tiver a etiqueta.
PrevLabelName NVARCHAR(MAX), nulo Nome da etiqueta aplicado na análise anterior. NULL se anteriormente não tiver a etiqueta.
ProtectionState NVARCHAR(MAX), nulo Estado de proteção atual do ficheiro no final da análise.
PrevProtectionState NVARCHAR(MAX), nulo Estado de proteção registado na análise anterior.
ClassificationCount INT, predefinição 0 Contagem de correspondências de tipos de informações confidenciais no ficheiro na análise atual.
LatestScanSessionId UNIQUEIDENTIFIER, nulo Identifica a sessão de análise mais recente que tocou no ficheiro. Utilizado para calcular deltas em ciclos de análise.
FileStatus NVARCHAR(MAX), nulo Eliminação final do ficheiro no ciclo de análise (por exemplo, a justificação necessária status definida por ProcessJobou Failed para ficheiros que não puderam ser processados).

Nova tabela: dbo.MatchedClassificationAction

dbo.MatchedClassificationAction é uma nova tabela que armazena os tipos de informações confidenciais correspondentes por ficheiro por análise. Cada linha representa um SIT correspondente para um único ficheiro numa única sessão de análise.

Coluna Tipo Descrição
Id BIGINT IDENTITY (chave primária) Chave de substituição da linha.
FilePath NVARCHAR(MAX), nulo Caminho completo do ficheiro no qual o SIT foi correspondido.
FileHashPath BINARY(64), nulo Hash do caminho do ficheiro. Associa-se a dbo.ScannerFiles.HashPath e é indexado para o desempenho da associação.
ScanSessionId UNIQUEIDENTIFIER, nulo Identifica a sessão de análise na qual o SIT foi correspondido. Associa-se a dbo.ScannerFiles.ScanSessionId e é indexado.
MatchedInformationTypeName NVARCHAR(MAX), nulo Nome a apresentar do tipo de informações confidenciais correspondentes (por exemplo, U.S. social security number (SSN)).
MatchedInformationTypeId UNIQUEIDENTIFIER, nulo GUID do SIT correspondente. O mesmo GUID é utilizado nos registos de Proteção de Informações do Microsoft Purview local para Workload=OnPremisesFileShareScanner.
MatchedInformationTypeCount INT, predefinição 0 Número de correspondências para este SIT no ficheiro.
ConfidenceScore INT, predefinição 0 Pontuação de confiança da partida.

Nova tabela: dbo.ScannedFilesArchive

dbo.ScannedFilesArchive é uma nova tabela que armazena um arquivo histórico de ficheiros processados pelo scanner, com linhas associadas à sessão de análise que os criou. Ao contrário da tabela dinâmica dbo.ScannerFiles , que apenas mantém o estado mais recente de cada ficheiro, esta tabela preserva os estados arquivados anteriores para controlo de alterações, relatórios e auditoria.

Files que o scanner ignora porque nada foi alterado, uma vez que a sessão de análise anterior não foi novamente inserida, pelo que as sessões de análise posteriores não contêm uma snapshot completa de todos os ficheiros. Em vez disso, apenas a entrada de arquivo existente da sessão que processou o ficheiro pela última vez permanece, o que mantém o arquivo inclinado, preservando um histórico de alterações significativas.

Coluna Tipo Descrição
Id BIGINT IDENTITY (chave primária) Chave de substituição da linha.
HashPath BINARY(64) Hash do caminho do ficheiro. Associa-se a dbo.ScannerFiles.HashPath.
FullPath NVARCHAR(MAX) Caminho completo do ficheiro no momento da sessão de análise.
ScanSessionId UNIQUEIDENTIFIER A sessão de análise que produziu esta linha de arquivo.
LastModifiedTime DATETIME2, nulo Carimbo de data/hora da última modificação do ficheiro, conforme observado durante a sessão de análise.
LabelId UNIQUEIDENTIFIER, nulo ID da etiqueta aplicado ao ficheiro no momento da sessão de análise.
IssueCount INT, predefinição 0 Número de problemas registados no ficheiro nesta sessão de análise.
EndScan DATETIME2, nulo Hora em que o ficheiro concluiu o processamento nesta sessão de análise.
JobStartTime DATETIME2, nulo Hora em que a tarefa de processamento deste ficheiro foi iniciada.
LabelName NVARCHAR(MAX), nulo Nome da etiqueta aplicado no momento desta sessão de análise.
PrevLabelId NVARCHAR(MAX), nulo ID da etiqueta na sessão de análise anterior, armazenada como uma cadeia.
PrevLabelName NVARCHAR(MAX), nulo Nome da etiqueta na sessão de análise anterior.
ProtectionState NVARCHAR(MAX), nulo Estado de proteção no momento desta sessão de análise.
PrevProtectionState NVARCHAR(MAX), nulo Estado de proteção na sessão de análise anterior.
ClassificationCount INT, predefinição 0, nulo Contagem de correspondências de tipos de informações confidenciais nesta sessão de análise.
LatestScanSessionId UNIQUEIDENTIFIER, nulo Sabe-se que a última sessão de análise tocou no ficheiro no momento em que esta linha de arquivo foi gravada.
FileStatus NVARCHAR(MAX), nulo Eliminação do ficheiro na sessão de análise (por exemplo, Modified ou Deleted).

dbo.ScanSummary (totais por análise) não mudou.

Perguntas de exemplo que os Relatórios Personalizados podem responder

Assim que os Relatórios Personalizados estiverem a preencher a base de dados, os administradores podem executar consultas como:

  • Que repositórios têm a maior concentração de SITs correspondentes e como é que essa concentração mudou desde a última análise?
  • Que ficheiros foram etiquetados ou recautados durante o ciclo de análise mais recente e qual era a etiqueta anterior?
  • Que ficheiros ainda não têm etiqueta, mas contêm correspondências para um ou mais tipos de informações confidenciais?
  • Que tipos de informações confidenciais são mais predominantes num determinado repositório e em que confiança?
  • Que ficheiros transitaram de desprotegidos para protegidos (ou inversos) desde a última análise?

Ativar Relatórios Personalizados

Os Relatórios Personalizados são ativados através da configuração de funcionalidades controlada pelo administrador. A partir de qualquer nó no cluster de scanners, execute:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting=$true}

Para ativar os Relatórios Personalizados no momento da instalação num novo nó de scanner, utilize o -FeatureSettings parâmetro com Install-Scanner:

Install-Scanner -SqlServerInstance SQLSERVER1 -Cluster Europe -FeatureSettings @{CustomReporting=$true}

Para confirmar o estado atual, execute:

Get-ScannerConfiguration

A alteração entra em vigor em todos os nós do cluster no próximo ciclo de análise. Não é necessário reiniciar o serviço.

Para parar de preencher as colunas e tabelas de Relatórios Personalizados, execute:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting=$false}

A desativação de Relatórios Personalizados interrompe as novas escritas. Os dados já escritos nas colunas e tabelas de relatórios não são eliminados, pelo que a funcionalidade pode ser reativada mais tarde sem perda de dados.

Planear a base de dados do cluster de scanners para relatórios

Quando ativa relatórios personalizados, a base de dados do cluster do scanner armazena significativamente mais dados : colunas adicionais por ficheiro no dbo.ScannerFiles, uma linha por SIT correspondente por ficheiro por análise no dbo.MatchedClassificationActione arquiva as linhas em dbo.ScannedFilesArchive para ficheiros que o scanner realmente processa e arquiva durante uma sessão de análise em vez de para cada ficheiro inalterado em cada ciclo. A criação de relatórios na base de dados do cluster de scanner também adiciona uma carga de trabalho de leitura que é executada juntamente com as leituras e escritas operacionais do scanner.

Antes de ativar os Relatórios Personalizados na produção, considere:

  • Tamanho do cluster e volume de análise. Calcule o número de ficheiros analisados por ciclo, o número típico de correspondências SIT por ficheiro e a frequência de análise. Utilize esses números para dimensionar a base de dados.
  • Impacto operacional. Comunicar consultas na mesma base de dados para a qual o scanner está a escrever pode competir com o scanner para obter recursos durante um ciclo de análise.
  • A carga de trabalho de relatórios que realmente pretende. Os dashboards interativos, os extratos agendados e as consultas ad hoc têm impactos muito diferentes.

Para a maioria das implementações de produção, recomendamos que aloje a base de dados do cluster do scanner no SQL Server Enterprise para que possa dedicar uma réplica só de leitura aos relatórios. Com uma SQL Server Always On grupo de disponibilidade, pode encaminhar o tráfego de relatórios para um réplica secundário legível para que as consultas de relatórios não compitam com a carga de trabalho operacional do scanner no réplica primário.

Esta separação permite que as ferramentas de relatórios (por exemplo, o Power BI) se liguem ao réplica só de leitura e atualizem com base na sua própria cadência sem afetar o débito de análise no principal.

Observação

O próprio scanner lê e escreve sempre na base de dados primária. Apenas a carga de trabalho de relatórios personalizados deve ser apontada para um réplica só de leitura.

Limitações durante a pré-visualização

  • Não existem dashboard incorporados fornecidos com Relatórios Personalizados nesta pré-visualização. Os clientes criam os seus próprios relatórios na base de dados do cluster de scanners.
  • As definições configuradas pela configuração de funcionalidades controladas pelo administrador não são sincronizadas com o portal do Microsoft Purview. Nem todas as funcionalidades do scanner acabarão por ser configuráveis a partir do portal. Para funcionalidades que também são configuráveis a partir do portal do Microsoft Purview, uma definição configurada no portal tem precedência e impede atualizações do PowerShell.

Confira também