Describir tipos de esquema dimensionales
El modelado dimensional es una técnica de diseño que organiza los datos de las cargas de trabajo analíticas. A diferencia de los modelos normalizados usados en sistemas transaccionales, los modelos dimensionales priorizan el rendimiento de las consultas y la comprensión del usuario. El resultado es una estructura de datos que refleja cómo los usuarios empresariales piensan en sus datos y permiten informes eficaces.
En Microsoft Fabric, puede implementar modelos dimensionales tanto en un almacén de Fabric como en un lakehouse. Comprender los tipos de esquema le ayuda a elegir la estructura adecuada para los requisitos de análisis.
Comprender el modelado dimensional
En un modelo dimensional, los datos se organizan en dos tipos de tablas:
- Las tablas de hechos almacenan medidas asociadas a eventos empresariales o observaciones, como cantidades de ventas, cantidades de pedidos o lecturas de temperatura. Las tablas de hechos contienen valores numéricos que se pueden agregar.
- Las tablas de dimensiones describen las entidades relevantes para los requisitos de análisis. Representan las cosas que modela, como productos, clientes, fechas o ubicaciones. Las tablas de dimensiones proporcionan el contexto para analizar los datos de hechos.
Esta separación de medidas del contexto descriptivo crea una estructura intuitiva para los analistas y optimizada para los motores de consulta.
Comparación de tipos de esquema
Hay varios tipos de esquema que puede usar para organizar tablas de hechos y dimensiones. Cada tipo ofrece diferentes inconvenientes entre la simplicidad de las consultas, la eficiencia del almacenamiento y la flexibilidad.
Esquema de estrella
Un esquema de estrella coloca una tabla de hechos en el centro con tablas de dimensiones que radian hacia fuera. Cada tabla de dimensiones se conecta directamente a la tabla de hechos a través de relaciones clave. El nombre procede de la apariencia visual: una tabla de hechos central con tablas de dimensiones que forman puntos de una estrella.
El esquema star es el enfoque recomendado para la mayoría de las cargas de trabajo de análisis en Microsoft Fabric. Ofrece varias ventajas:
- Menos combinaciones dan lugar a un rendimiento de consulta más rápido. Normalmente, las consultas solo necesitan una unión por dimensión.
- La estructura intuitiva se asigna a la forma en que los usuarios empresariales piensan en los datos. Los usuarios filtran y agrupan por dimensiones (quién, qué, cuándo, dónde) y agregan medidas.
- Base para los modelos semánticos en Power BI. Los esquemas star son un requisito previo para los modelos semánticos empresariales y admiten escenarios de Copilot e IA.
- Bajo mantenimiento a medida que evoluciona el almacenamiento de datos. Agregar un nuevo atributo a una dimensión o una nueva tabla de hechos es sencillo sin reestructurar las tablas existentes.
Un esquema de estrella suele contener varias tablas de hechos, cada una que representa un proceso de negocio diferente. Por ejemplo, un modelo minorista podría tener estrellas independientes para las ventas, el inventario y la compra, compartiendo dimensiones comunes.
Sugerencia
Comience con un esquema de estrella para la mayoría de los proyectos. Sus ventajas de simplicidad y rendimiento superan los menores costos de almacenamiento de las tablas de dimensiones desnormalizadas.
Un esquema de copo de nieve.
Un esquema de copo de nieve extiende el esquema de estrella normalizando las tablas de dimensiones. En lugar de almacenar todos los atributos en una sola tabla de dimensiones, los atributos relacionados se dividen en tablas relacionadas independientes. Por ejemplo, una dimensión de producto podría tener tablas independientes para subcategoría y categoría, cada una vinculada por claves externas.
El término copo de nieve procede del patrón de bifurcación que aparece al diagrama de las relaciones. Cada rama del copo de nieve representa un nivel de normalización.
Considere un esquema en copo de nieve cuando:
- Una dimensión es extremadamente grande y los costos de almacenamiento superan las necesidades de rendimiento de las consultas.
- Necesita claves para relacionar los datos de dimensión con hechos en distintos niveles de granularidad. Por ejemplo, los objetivos de ventas de nivel de producto y ventas de nivel de subcategoría.
- Debe realizar un seguimiento de los cambios históricos en niveles más altos de granularidad.
Sin embargo, los esquemas de copo de nieve requieren más combinaciones, lo que puede reducir el rendimiento de las consultas y agregar complejidad a las consultas. Si planea crear un modelo semántico, debe crear una vista que una las tablas en forma de copo de nieve, debido a que las jerarquías de Power BI requieren columnas de una sola tabla.
Elegir un tipo de esquema
Use las instrucciones siguientes para elegir el tipo de esquema adecuado para su escenario:
| Tipo de esquema | Más adecuado para | Compromisos |
|---|---|---|
| Estrella | Mayoría de las cargas de trabajo de análisis, modelos semánticos de Power BI, escenarios de IA | Redundancia de almacenamiento secundaria de dimensiones desnormalizadas |
| Snowflake | Dimensiones muy grandes con jerarquías compartidas en distintos niveles de grano | Consultas complejas, más combinaciones |
A medida que crece tu almacén de datos, naturalmente terminas con varios esquemas de estrella que comparten sus dimensiones. Por ejemplo, un modelo comercial podría tener tablas de hechos independientes para las ventas, el inventario y la compra que hacen referencia a las mismas dimensiones de producto y fecha. Este patrón surge a través del diseño de dimensiones conformes, que aprenderá en una unidad posterior.
Modelos dimensionales como base para la inteligencia artificial
La estructura que elija para el modelo dimensional es importante más allá de los informes tradicionales. Copilot en Power BI genera mejores respuestas en lenguaje natural cuando los datos subyacentes usan relaciones de esquema de estrella claras, porque la separación de hechos y dimensiones corresponde directamente a cómo se formulan las preguntas: "Mostrar las ventas totales por región por trimestre".
Esta misma estructura también alimenta la carga de trabajo Fabric IQ. El elemento de ontología de Fabric IQ define conceptos empresariales como tipos de entidad (como Customer y Product), propiedades y relaciones. Estos se asignan de forma natural a los conceptos del modelo dimensional: los tipos de entidad corresponden a dimensiones, propiedades corresponden a atributos y relaciones reflejan las conexiones basadas en claves entre tablas. Puede generar una ontología directamente a partir de un modelo semántico de Power BI basado en su modelo dimensional, lo que significa que las decisiones de diseño que tome aquí fluyen a través de agentes de inteligencia artificial que razonan sobre los datos en términos de negocio.
Ahora que comprende los tipos de esquema, puede centrarse en diseñar las tablas de hechos que se encuentran en el centro del modelo dimensional.