Cuándo usar Azure Data Explorer

Completado

Aquí se explica cómo puede decidir si Azure Data Explorer es la elección correcta para las necesidades de análisis de macrodatos. Al evaluar los siguientes criterios, puede determinar si Azure Data Explorer cumple sus objetivos funcionales y de rendimiento.

  • Análisis interactivo
  • Variedad de datos
  • Velocidad de datos
  • Volumen de datos
  • Organización de datos
  • Simultaneidad de consultas
  • Diferencias entre compilación y compra

Criterios de decisión

Azure Data Explorer es una plataforma de análisis interactivo de macrodatos que permite a los usuarios tomar decisiones controladas por datos en un entorno muy ágil. Los factores que se enumeran aquí pueden ayudarle a evaluar si Azure Data Explorer es una buena opción para la carga de trabajo actual. Se deben formular las siguientes preguntas clave.

Análisis interactivo

¿Es necesario analizar los datos de forma interactiva?

El análisis de datos incluye técnicas como la agregación, el ámbito, la evaluación, la correlación, la detección de anomalías, la previsión y la evaluación general del modelo. Esto ayuda a reducir grandes cantidades de datos en conclusiones accionables. La realización de estas actividades de forma interactiva es la base de Azure Data Explorer. Estas actividades pueden producirse en paneles interactivos, aplicaciones analíticas personalizadas, o mediante interacción directa con los datos a través de consultas fácilmente comprensibles para humanos y visualización. Es posible que Azure Data Explorer no sea la tecnología adecuada para ejecutar trabajos por lotes de larga duración en los datos. Considere la posibilidad de usar tecnologías como Microsoft Spark que funcionan bien con Azure Data Explorer para ejecutar tareas de larga duración.

Variedad de datos

¿Cómo se estructuran los datos?

Azure Data Explorer proporciona un índice de texto completo de alto rendimiento escalable y compatibilidad con esquemas dinámicos. Si necesita analizar y procesar datos estructurados, semiestructurados (json/xml) y texturales, es una buena indicación de que Azure Data Explorer es relevante para la carga de trabajo.

Velocidad de datos

¿El análisis de datos en tiempo real es un factor crítico?

Azure Data Explorer puede ingerir grandes cantidades de datos rápidamente y en baja latencia. Los conjuntos de datos típicos incluyen seguimientos, registros de transacciones, series temporales, métricas y flujos de registros de actividad en general. El análisis casi en tiempo real sobre datos nuevos es un caso de uso común. Azure Data Explorer se conecta bien a tecnologías de streaming como Azure Event Hubs, IoT Hubs y Kafka para impulsar dichas cargas de trabajo. Pero si es necesario realizar análisis en tiempo real, es posible que Azure Data Explorer no sea la mejor opción.

Volumen de datos

¿Cuántos datos hay que ingerir?

Azure Data Explorer se ha creado para proporcionar análisis de rutas de acceso semiactivo, interactivo y por medio de API, en cargas de trabajo de datos masivas. En escenarios en los que el tamaño total de los datos acumulados es de unos gigabytes, es posible que haya otras soluciones más rentables.

Organización de datos

¿Con qué coherencia se organizan los datos?

Azure Data Explorer se ha creado para aplicar el esquema al leer datos sin procesar. Este enfoque crea flexibilidad para examinar los datos de maneras diferentes y desde distintos puntos de vista en función de las necesidades actuales. Esta funcionalidad es valiosa para afrontar desafíos inesperados en la seguridad, las operaciones y en entornos competitivos, entre otras áreas. Azure Data Explorer proporciona velocidad, escalabilidad y rentabilidad extremas para analizar datos sin procesar. A menudo, en implementaciones de almacenamiento de datos, un proceso de extracción, transformación y carga (ETL) genera periódicamente un conjunto bien mantenido, altamente coherente y bien documentado de entidades y atributos. Los análisis de estos esquemas de estrella complejos suelen implicar grandes combinaciones de hechos para las que Azure Data Explorer no está optimizado.

Simultaneidad de consultas

¿Cuántos usuarios tienen que consultar, ingerir o procesar datos al mismo tiempo?

Azure Data Explorer se usa ampliamente para implementar ofertas de SaaS de análisis. Si es necesario admitir diferentes necesidades de análisis únicas de un gran número de solicitudes en paralelo, Azure Data Explorer proporciona una buena solución.

Diferencias entre compilación y compra

¿Cuánto se quiere personalizar la plataforma de datos?

Azure Data Explorer es una plataforma como servicio totalmente administrada. Pero no proporciona una solución lista para su uso. Es necesario personalizar, configurar, conectar y crear experiencias sobre ella para ofrecer una solución (compilación). Hay varias soluciones de Microsoft y de terceros que usan Azure Data Explorer para ofrecer estas soluciones llave en mano en distintos dominios y verticales. Por ejemplo, Azure Monitor para operaciones de TI, Microsoft Advanced Threat Protection y Microsoft Sentinel en el dominio de seguridad, y Azure Time Series Insights y Azure IoT Central en los dominios de IoT.

Aplicación de los criterios

Azure Data Explorer funciona mejor para habilitar funcionalidades de análisis interactivos para los trabajadores del conocimiento sobre una alta velocidad y diversos datos sin procesar. Vamos a pensar en cómo aplicar los criterios enumerados anteriormente a nuestros procesos de ejemplo en el caso de las empresas textiles.

¿Se debería usar Azure Data Explorer para los datos de producción?

El departamento de producción de la empresa textil de ejemplo debe tomar decisiones sobre cómo administrar volúmenes de inventario y producción. Tienen registros entrantes de datos para el inventario. También quieren usar datos geoespaciales de marketing para anticiparse a las necesidades de productos por región. Estos datos tienen un alto grado de variedad, velocidad y volumen. No se organizan de forma coherente y muchas partes interesadas tienen que consultar simultáneamente estos datos. Desde la ingesta hasta la consulta, necesitan una latencia baja. Necesitan tiempos de respuesta de consulta inferiores a un segundo y menos. En función de los criterios de decisión, Azure Data Explorer es una buena opción para la división de producción de la empresa textil.

¿Se debería usar Azure Data Explorer para los datos de marketing?

El departamento de marketing de la empresa textil quiere evaluar la eficacia de su campaña. Tienen información de la secuencia de clic de su sitio web y campañas publicitarias. También tienen datos de texto libre (no estructurados) de las redes sociales. Estos datos son muy variados y no están organizados. El departamento va a querer realizar análisis interactivos exploratorios. En función de los criterios de decisión, Azure Data Explorer es una buena opción para la división de marketing de la empresa textil.

Resumen de instrucciones

En la tabla siguiente se muestra cómo evaluar nuevos casos de uso. Aunque aquí no se tratan todos los casos de uso, creemos que puede ayudarle a decidir si Azure Data Explorer es la solución adecuada para usted.

Caso de uso Análisis interactivo Macrodatos (variedad, velocidad y volumen) Organización de datos Concurrencia Compilación frente a compra ¿Debo usar Azure Data Explorer?
Implementación de un SaaS de análisis de seguridad Uso intensivo de análisis interactivos, casi en tiempo real. Los datos de seguridad son diversos, de gran volumen y de alta velocidad. Varía A menudo, varios analistas de varios inquilinos usan el sistema. La implementación de una oferta de SaaS es un escenario de Creación.
Análisis de registros de CDN Interactivo para la solución de problemas, supervisión de QoS. Los registros de CDN son diversos, de gran volumen y de alta velocidad. Separe las entradas de registro. Un pequeño grupo de científicos de datos puede usar estos análisis, pero también puede alimentar muchos paneles. El valor extraído del análisis de CDN es específico del escenario y necesita análisis personalizados.
Base de datos de serie temporal para telemetría de IoT Interactivo para la solución de problemas, el análisis de tendencias, el uso y la detección de anomalías. La telemetría de IoT es de alta velocidad, pero puede estar estructurada o tener un tamaño medio. Conjuntos de registros relacionados. Un pequeño grupo de científicos de datos puede usar estos análisis, pero también puede alimentar muchos paneles. El contexto suele ser la compilación al buscar una base de datos.

En la tabla de diagrama de flujo siguiente se resumen las preguntas clave que se pueden plantear cuando se considera la posibilidad de usar Azure Data Explorer.

Diagrama de flujo en el que se muestra cuándo usar Azure Data Explorer. Entre las preguntas se incluyen si necesita leer y escribir un registro específico, si necesita realizar tareas de larga duración, almacenamiento de datos clásico, se debe ejecutar en otras nubes y datos pequeños.