Análisis de informes personalizados (versión preliminar)

En este artículo se describe la característica de informes personalizados del escáner de Microsoft Purview Information Protection (versión preliminar). Custom Reporting proporciona a los administradores del analizador los datos que necesitan en la base de datos del clúster del analizador para crear sus propios informes con los resultados del examen, incluidos el etiquetado, el estado de protección y los tipos de información confidencial (SIT) coincidentes.

Informes personalizados está disponible con Microsoft Purview Information Protection cliente y escáner versión 3.2.89.0 o posterior. Un administrador habilita la creación de informes personalizados mediante el control de características del escáner.

Qué habilita la creación de informes personalizados

En la actualidad, el analizador genera informes CSV y TXT por examen y almacena un conjunto limitado de datos operativos en la base de datos del clúster. Para crear una imagen completa del estado del archivo (qué ha cambiado, qué se etiqueta, qué está protegido y qué tipos de datos confidenciales existen), los administradores tienen que combinar varias exportaciones CSV entre ciclos de examen y cargarlas en una herramienta de informes independiente.

Informes personalizados mueven esos datos a la base de datos del clúster del analizador para que los administradores puedan:

Consulte los recuentos de etiqueta, estado de protección y SIT presentes y anteriores para cada archivo examinado en un repositorio.
Diferencias de proceso entre exámenes (por ejemplo, el cambio en el número de SIT coincidentes por archivo).
Vea qué tipos de información confidencial coinciden en qué archivos y cuántas coincidencias por tipo.
Conecte la base de datos del clúster del analizador a una herramienta de informes de su elección (por ejemplo, Power BI, un almacén de informes empresarial o una herramienta de paneles basada en SQL) sin tener que unir primero las exportaciones CSV.

El escáner sigue siendo la fuente de la verdad. Custom Reporting escribe los datos de informes adicionales en la misma base de datos de clúster de escáner compartido en el siguiente ciclo de examen después de habilitar la característica.

Esquema de base de datos

Las tablas y columnas de informes que requiere Custom Reporting se agregaron primero al esquema de base de datos del clúster del analizador en la versión de cliente 3.2.57.0. Hasta que informes personalizados estén habilitados, las nuevas columnas y tablas existen, pero no se rellenan. La funcionalidad del escáner existente no cambia.

Nota:

No es necesario instalar primero la versión 3.2.57.0 del cliente. Tanto si va a instalar el escáner como si está actualizando desde cualquier versión anterior, el analizador implementa el esquema completo de la base de datos (incluidas las tablas y columnas de informes personalizados) al instalar o actualizar.

Cuando informes personalizados se habilitan mediante el control de características Escáner, el escáner comienza a rellenar los siguientes datos en el siguiente ciclo de examen.

Adiciones a `dbo.ScannerFiles`

dbo.ScannerFiles sigue conteniendo una fila por archivo examinado. Informes personalizados rellena las siguientes columnas adicionales para capturar el estado del archivo y la diferencia entre el examen actual y el anterior:

Column	Tipo	Descripción
`LabelName`	`NVARCHAR(MAX)`, que admite valores NULL	Nombre de etiqueta actual aplicado al archivo. `NULL` si no está etiquetado.
`PrevLabelId`	`NVARCHAR(MAX)`, que admite valores NULL	Identificador de etiqueta aplicado en el examen anterior, almacenado como una cadena. `NULL` si anteriormente no se etiquetaba.
`PrevLabelName`	`NVARCHAR(MAX)`, que admite valores NULL	Nombre de etiqueta aplicado en el examen anterior. `NULL` si anteriormente no se etiquetaba.
`ProtectionState`	`NVARCHAR(MAX)`, que admite valores NULL	Estado de protección actual del archivo al final del examen.
`PrevProtectionState`	`NVARCHAR(MAX)`, que admite valores NULL	Estado de protección registrado en el examen anterior.
`ClassificationCount`	`INT`, valor predeterminado `0`	El recuento de tipos de información confidencial coincide en el archivo en el examen actual.
`LatestScanSessionId`	`UNIQUEIDENTIFIER`, que admite valores NULL	Identifica la sesión de examen más reciente que tocó el archivo. Se usa para calcular diferencias entre ciclos de examen.
`FileStatus`	`NVARCHAR(MAX)`, que admite valores NULL	Eliminación final del archivo en el ciclo de examen (por ejemplo, el estado requires-justification establecido por `ProcessJob`o `Failed` para los archivos que no se pudieron procesar).

Nueva tabla: `dbo.MatchedClassificationAction`

dbo.MatchedClassificationAction es una nueva tabla que almacena los tipos de información confidencial coincidentes por archivo por examen. Cada fila representa una SIT coincidente para un único archivo en una sola sesión de examen.

Column	Tipo	Descripción
`Id`	`BIGINT IDENTITY` (clave principal)	Clave suplente de la fila.
`FilePath`	`NVARCHAR(MAX)`, que admite valores NULL	Ruta de acceso completa del archivo en el que coincidió sit.
`FileHashPath`	`BINARY(64)`, que admite valores NULL	Hash de la ruta de acceso del archivo. Se une a `dbo.ScannerFiles.HashPath` y se indexa para el rendimiento de la combinación.
`ScanSessionId`	`UNIQUEIDENTIFIER`, que admite valores NULL	Identifica la sesión de examen en la que coincidió la SIT. Se une a `dbo.ScannerFiles.ScanSessionId` y se indexa.
`MatchedInformationTypeName`	`NVARCHAR(MAX)`, que admite valores NULL	Nombre para mostrar del tipo de información confidencial coincidente (por ejemplo, `U.S. social security number (SSN)`).
`MatchedInformationTypeId`	`UNIQUEIDENTIFIER`, que admite valores NULL	GUID de la SIT coincidente. El mismo GUID se usa en los registros de Microsoft Purview Information Protection locales para `Workload=OnPremisesFileShareScanner`.
`MatchedInformationTypeCount`	`INT`, valor predeterminado `0`	Número de coincidencias para esta SIT en el archivo.
`ConfidenceScore`	`INT`, valor predeterminado `0`	Puntuación de confianza de la coincidencia.

dbo.ScanSummary (totales por examen) no cambia.

Preguntas de ejemplo que los informes personalizados pueden responder

Una vez que informes personalizados rellenan la base de datos, los administradores pueden ejecutar consultas como:

¿Qué repositorios tienen la mayor concentración de SIT coincidentes y cómo ha cambiado esa concentración desde el último examen?
¿Qué archivos se etiquetaron o se etiquetaron de nuevo durante el ciclo de examen más reciente y cuál era la etiqueta anterior?
¿Qué archivos siguen sin etiquetar pero contienen coincidencias para uno o más tipos de información confidencial?
¿Qué tipos de información confidencial son más frecuentes en un repositorio determinado y en qué confianza?
¿Qué archivos pasaron de desprotegidos a protegidos (o lo contrario) desde el último examen?

Habilitación de informes personalizados

Informes personalizados está activado mediante la configuración de características controlada por el administrador. Desde cualquier nodo del clúster del analizador, ejecute:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting="On"}

Para habilitar informes personalizados en el momento de la instalación en un nuevo nodo de escáner, use el -FeatureSettings parámetro con Install-Scanner:

Install-Scanner -SqlServerInstance SQLSERVER1 -Cluster Europe -FeatureSettings @{CustomReporting="On"}

Para confirmar el estado actual, ejecute:

Get-ScannerConfiguration

El cambio surte efecto en todos los nodos del clúster en el siguiente ciclo de examen. No es necesario reiniciar el servicio.

Para dejar de rellenar las columnas y la tabla de informes personalizados, ejecute:

Set-ScannerConfiguration -FeatureSettings @{CustomReporting="Off"}

Al deshabilitar informes personalizados, se detienen las nuevas escrituras. Los datos ya escritos en las columnas y tablas de informes no se eliminan, por lo que la característica se puede volver a habilitar más adelante sin pérdida de datos.

Planeamiento de la base de datos del clúster del analizador para la generación de informes

Al activar informes personalizados, la base de datos del clúster del analizador almacena significativamente más datos por ciclo de examen: columnas adicionales por archivo en dbo.ScannerFiles, más una fila por SIT coincidente por archivo por examen en dbo.MatchedClassificationAction. La creación de informes en la base de datos del clúster del analizador también agrega una carga de trabajo de lectura que se ejecuta junto con las lecturas y escrituras operativas del analizador.

Antes de habilitar informes personalizados en producción, tenga en cuenta lo siguiente:

Tamaño del clúster y volumen de examen. Calcule el número de archivos examinados por ciclo, el número típico de coincidencias SIT por archivo y la frecuencia con la que se examina. Use esos números para ajustar el tamaño de la base de datos.
Impacto operativo. La generación de informes de consultas en la misma base de datos en la que está escribiendo el analizador puede competir con el analizador en busca de recursos durante un ciclo de examen.
La carga de trabajo de informes que realmente desea. Los paneles interactivos, los extractos programados y las consultas ad hoc tienen impactos muy diferentes.

Para la mayoría de las implementaciones de producción, se recomienda hospedar la base de datos del clúster del analizador en SQL Server Enterprise para que pueda dedicar una réplica de solo lectura a los informes. Con un SQL Server Always On grupo de disponibilidad, puede enrutar el tráfico de informes a una réplica secundaria legible para que las consultas de informes no compitan con la carga de trabajo operativa del analizador en la réplica principal.

Esta separación permite que las herramientas de informes (por ejemplo, Power BI) se conecten a la réplica de solo lectura y se actualicen en su propia cadencia sin afectar al rendimiento del examen en la principal.

Nota:

El propio analizador siempre lee y escribe en la base de datos principal. Solo la carga de trabajo de informes personalizada debe apuntarse a una réplica de solo lectura.

Limitaciones durante la versión preliminar

No hay ningún panel integrado entregado con informes personalizados en esta versión preliminar. Los clientes crean sus propios informes en la base de datos del clúster del analizador.
La configuración configurada por la configuración de características controlada por el administrador no se sincroniza con el portal de Microsoft Purview. No todas las características del escáner terminarán siendo configurables desde el portal. Para las características que están disponibles en el portal y que se han configurado allí, la configuración configurada por el portal tiene prioridad e impide las actualizaciones de PowerShell.

Vea también

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-04-28