Szenarios für die Verwendung von Azure Data Explorer
Hier besprechen wir, wie Sie entscheiden können, ob Azure Data Explorer die richtige Wahl für Ihre Big Data-Analyseanforderungen ist. Anhand der folgenden Kriterien können Sie feststellen, ob Azure Data Explorer Ihre Leistungs- und Funktionsziele erfüllt.
- Interaktive Analysen
- Datenvielzahl
- Datengeschwindigkeit
- Datenmenge
- Datenorganisation
- Abfrageparallelität
- Erstellen im Vergleich zu Kaufen
Entscheidungskriterien
Azure Data Explorer ist eine interaktive Big-Data-Analyseplattform, die Benutzer*innen in die Lage versetzt, datengestützte Entscheidungen in einer hochgradig agilen Umgebung zu treffen. Die hier aufgelisteten Faktoren können Ihnen helfen zu beurteilen, ob Azure Data Explorer für die jeweilige Workload geeignet ist. Die folgenden wichtigen Fragen sollten gestellt werden.
Interaktive Analysen
Muss ich Daten interaktiv analysieren?
Die Datenanalyse umfasst Techniken wie Aggregation, Bereichsdefinition, Bewertung, Korrelation, Anomalieerkennung, Prognose und allgemeine Modellauswertung. Diese tragen dazu bei, große Datenmengen in umsetzbare Schlussfolgerungen zu reduzieren. In Azure Data Explorer geht es genau um das interaktive Durchführen solcher Aktivitäten. Diese Aktivitäten können in interaktiven Dashboards, analytischen benutzerdefinierten Anwendungen oder über direkte Interaktion mit Daten über benutzerfreundliche Abfragen und Visualisierungen erfolgen. Azure Data Explorer ist möglicherweise nicht die richtige Technologie für die Ausführung von lang laufenden Batch-Aufträgen über Daten. Erwägen Sie den Einsatz von Technologien wie Microsoft Spark, die gut mit dem Azure Data Explorer zusammenarbeiten, für lang laufende Aufgaben.
Datenvielzahl
Wie vielfältig ist meine Datenstruktur?
Azure Data Explorer bietet skalierbare und hochleistungsfähige Volltextindexunterstützung sowie dynamische Schemaunterstützung. Wenn Sie strukturierte, halbstrukturierte (json/xml) und Texturdaten analysieren und verarbeiten müssen, ist dies ein guter Hinweis darauf, dass Azure Data Explorer für Ihre Workload relevant ist.
Datengeschwindigkeit
Ist die Echtzeit-Datenanalyse ein kritischer Faktor?
Der Azure-Daten-Explorer kann große Datenmengen schnell und in geringer Latenz erfassen. Typische Datensätze umfassen Ablaufverfolgungen, Transaktionsprotokolle, Zeitreihen, Metriken und Aktivitätsdatenströme im Allgemeinen. Analysen in Quasi-Echtzeit für neue Daten sind ein gängiger Anwendungsfall. Azure Data Explorer verbindet sich gut mit Streamingtechnologien wie Azure Event Hubs, IoT Hubs und Kafka, um solche Workloads zu nutzen. Wenn Sie jedoch Echtzeit-Analysen benötigen, ist Azure Data Explorer möglicherweise nicht die beste Option.
Datenmenge
Wie viele Daten muss ich aufnehmen?
Azure Data Explorer ist so aufgebaut, dass über umfangreiche Datenworkloads Analysen für einen warmen Pfad interaktiv und über die API bereitstellt werden. In Szenarios, in denen die gesamt kumulierte Datengröße einige Gigabyte beträgt, gibt es möglicherweise andere kostengünstigere Lösungen.
Datenorganisation
Wie konsistent sind meine Daten organisiert?
Azure Data Explorer ist so konzipiert, um „Schema-on-Read“ auf Rohdaten anzuwenden. Dieser Ansatz bietet Flexibilität, Daten basierend auf den aktuellen Anforderungen auf unterschiedliche Weise und aus unterschiedlichen Blickwinkeln zu untersuchen. Diese Fähigkeit ist unter anderem für die Bewältigung unerwarteter Herausforderungen in den Bereichen Sicherheit, Vorgänge und Wettbewerb sinnvoll. Azure Data Explorer bietet Hochgeschwindigkeit, Skalierbarkeit und Kosteneffizienz für die Analyse von Rohdaten. Häufig generiert ein ETL-Prozess (Extract, Transform and Load) in regelmäßigen Abständen eine gut kuratierte, hochkonsistente und gut dokumentierte Gruppe von Entitäten und Attributen. Analysen für diese komplexen Sternschemas umfassen in der Regel große Fakt-zu-Fakt-zu-Fakt-Joins, für die Azure Data Explorer nicht optimiert ist.
Abfrageparallelität
Wie viele Benutzer müssen Daten gleichzeitig abfragen/verarbeiten?
Azure Data Explorer wird allgemein für die Implementierung von SaaS-Analyseangeboten verwendet. Wenn es darum geht, unterschiedliche und einzigartige Analyseanforderungen einer großen Anzahl von Anforderungen parallel zu unterstützen, kann Azure Data Explorer eine gute Lösung sein.
Erstellen im Vergleich zu Kaufen
Wie viel möchte ich meine Datenplattform anpassen?
Azure Data Explorer ist ein vollständig verwaltetes Platform-as-a-Service-Modell. Er bietet jedoch keine sofort einsatzbereite, vorgefertigte Lösung. Für die Bereitstellung einer Lösung (Build), ist es zusätzlich zur Anzupassen, Konfiguration und Verknüpfung erforderlich, Funktionen zu erstellen. Es gibt verschiedene Lösungen von Microsoft und Drittanbietern, die Azure Data Explorer verwenden, um solche turnkey-Lösungen in verschiedenen Domänen und Vertikalen bereitzustellen. Beispielsweise Azure Monitor für IT-Vorgänge, Microsoft Advanced Threat Protection und Microsoft Sentinel in der Sicherheitsdomäne sowie Azure Time Series Insights und Azure IoT Central in den IoT-Domänen.
Anwenden der Kriterien
Azure Data Explorer eignet sich am besten für die Aktivierung interaktiver Analysefunktionen für Wissensmitarbeiter über hohe Geschwindigkeit und vielfältige Rohdaten. Lassen Sie uns darüber nachdenken, wie wir die Kriterien, die wir zuvor aufgelistet haben, auf unsere Beispielprozesse im Szenario des Bekleidungsunternehmens anwenden können.
Sollte Azure Data Explorer für Produktionsdaten verwendet werden?
Die Produktionsabteilung unseres Bekleidungsunternehmens muss Entscheidungen über die Verwaltung von Lagerbeständen und Produktionsvolumen treffen. Sie verfügen über Protokolle für eingehende Daten für die Inventur. Außerdem möchten sie räumliche Daten aus dem Marketing verwenden, um Produktanforderungen nach Region vorherzusagen. Diese Daten haben einen hohen Grad an Vielfalt, Geschwindigkeit und Volumen. Es ist nicht konsistent organisiert , und viele Projektbeteiligte müssen diese Daten gleichzeitig abfragen. Von der Aufnahme in die Abfrage erfordern sie eine geringe Latenz. Die Abfrageantwortzeiten müssen weniger als eine Sekunde oder noch weniger betragen. Basierend auf den Entscheidungskriterien eignet sich Azure Data Explorer gut für die Produktionsabteilung des Bekleidungsunternehmens.
Sollte Azure Data Explorer für Marketingdaten verwendet werden?
Die Marketingabteilung des Bekleidungsunternehmens möchte die Effektivität ihrer Kampagne bewerten. Das Team verfügt über Clickstreamdaten von der Website und aus den Werbekampagnen. Es verfügt auch über Freitextdaten (unstrukturierte Daten) aus sozialen Medien. Diese Daten sind sehr unterschiedlich und unorganisiert. Die Abteilung möchte explorative interaktive Analysen durchführen. Basierend auf den Entscheidungskriterien eignet sich Azure Data Explorer gut für die Marketingabteilung des Bekleidungsunternehmens.
Zusammenfassung
Die folgende Tabelle zeigt, wie neue Anwendungsfälle ausgewertet werden. Auch wenn hier nicht alle Anwendungsfälle behandelt werden, sollte dieses Beispiel Ihnen helfen zu entscheiden, ob Azure Data Explorer die richtige Lösung für Sie ist.
| Anwendungsfall | Interaktive Analysen | Big Data (Varianz, Geschwindigkeit, Volume) | Dateiorganisation | Parallelität | Erstellen im Vergleich zu Kaufen | Sollte ich Azure Data Explorer verwenden? |
|---|---|---|---|---|---|---|
| Implementieren einer Security Analytics SaaS | Starke Nutzung interaktiver Analysen in Quasi-Echtzeit. | Sicherheitsdaten sind vielfältig, hochvolumig und schnell. | Variiert | Häufig verwenden mehrere Analyst*innen von mehreren Mandanten aus das System. | Die Implementierung eines SaaS-Angebots ist ein Build-Szenario. | Ja |
| CDN-Protokollanalyse | Interaktiv für die Problembehandlung, QoS-Überwachung | CDN-Protokolle sind unterschiedlich, mit hohem Volumen und hoher Geschwindigkeit. | Trennen von Protokolldatensätzen | Eine kleine Gruppe von Datenwissenschaftlern kann diese Analytik nutzen, sie kann jedoch auch viele Dashboards unterstützen. | Der aus den CDN-Analysen gewonnene Wert ist szenariospezifisch und erfordert benutzerdefinierte Analysen. | Ja |
| Zeitreihendatenbank für IoT-Telemetrie | Interaktiv zur Problembehandlung, Analyse von Trends, Nutzung und Erkennung von Anomalien. | IoT-Telemetrie ist sehr schnell, kann aber nur strukturiert oder mittelgroß sein. | Verwandte Datensätze | Eine kleine Gruppe von Datenwissenschaftlern kann diese Analytik nutzen, sie kann jedoch auch viele Dashboards unterstützen. | Der Kontext wird in der Regel beim Suchen nach einer Datenbank erstellt . | Ja |
Das folgende Flussdiagramm fasst die wichtigsten Fragen zusammen, die Sie sich stellen sollten, wenn Sie den Einsatz von Azure Data Explorer in Erwägung ziehen.