Entwickeln von Vorgängen mit Einblicken
- 15 Minuten
|
|
|---|
Erstellen Sie eine Kultur, in der das Team immer darauf hinstrebt, die Qualität zu verbessern, indem Sie Workloads überwachen und alle Säulen des Azure Well-Architected Framework berücksichtigen. Geben Sie dem Team und den Projektbeteiligten die benötigten Daten, z. B. Statistiken, Trends und Erkenntnisse, damit sie intelligente Entscheidungen treffen können, unabhängig davon, ob es sich um schnelle Korrekturen oder langfristige Planung handelt. Verwenden Sie das, was Sie aus den Daten lernen, um immer besser zu werden.
Vorgänge, die auf Observierbarkeit ausgelegt sind, helfen Ihnen, vor Problemen zu bleiben, Qualität und Sicherheit aufrechtzuerhalten, Wachstum zu planen und das Produkt effektiver zu verwalten.
Ein wichtiger Bestandteil der Überwachung ist die Integritätsmodellierung, die Ihnen hilft, Probleme zu finden, bevor sie zu großen Vorfällen führen, die sich auf Kunden auswirken. Effiziente Überwachung bedeutet weniger Zeit, auf Probleme zu reagieren und mehr Zeit, um die Erfahrung zu verbessern.
Beispielszenario
Contoso hat eine interne Web-App namens Contoso Real Estate erstellt, um Neueinstellungen und Mitarbeiter zu unterstützen, die sich umstellen. Sie ermöglicht es Den Menschen, während ihres Umzugs nach kurzlebigen Wohnungen zu suchen und zu buchen. Das HR-Team verwendet auch die App, um den Umzugsprozess zu unterstützen.
Die App wird live und vollständig in Azure gehostet. Es basiert auf Microservices mithilfe von Azure-Container-Apps und verwendet auch Azure-Funktionen, Azure-Datenbank für PostgreSQL, Azure Blob Storage und Azure Monitor.
Anzeigen Ihrer Workload über Telemetrie
Erfassen Sie Telemetrie aus Dem Anwendungscode, der die wichtigsten Schritte in der Ausführung verbindet, damit Sie das vollständige Bild von allgemeinen Trends bis hin zu detaillierten Aktionen sehen können.
Priorisieren Sie Aktionen basierend darauf, wie schwerwiegend das Problem ist, und verstehen Sie die Details, um den Kontext zu ermitteln. Diese Informationen sind für Problembehandlungszwecke von entscheidender Bedeutung.
Herausforderung für Contoso
Nach einer kürzlichen Aktualisierung der Contoso Real Estate-App melden Benutzer, dass ein Problem vorliegt, bei dem die Suchseite manchmal einen leeren Bildschirm oder eine generische Fehlermeldung anzeigt. Es geschieht nicht jedes Mal, und normalerweise aktualisieren Sie die Seite, oder versuchen Sie erneut, die Suche zu beheben.
Wenn das Team die Protokolle für den Such-Microservice überprüft hat, bemerkten sie mehr Fehler, insbesondere Timeouts beim Versuch, eine Verbindung mit der Azure-Datenbank für PostgreSQL herzustellen. Sie können jedoch nicht feststellen, ob diese Fehler dieselben sind, die die Probleme verursachen, die Benutzer auf dem Front-End sehen.
Anwenden des Ansatzes und der Ergebnisse
Das Entwicklungsteam hat beschlossen, die Protokollierung sowohl in der Web-App als auch in den kernigen Microservices zu erweitern, um herauszufinden, was schief läuft. Für die Suchfunktion werden nun die Suchbegriffe, die Uhrzeit der Anforderung, die Client-IP-Adresse und der benutzername protokolliert, der an die Suche gebunden ist. Diese zusätzlichen Informationen sollten ihnen dabei helfen, die Punkte über verschiedene Teile des Systems zu verbinden.
Diese Änderung half dem Team zu bestätigen, dass die Ursache der Benutzerprobleme Datenbankabfragetimeouts war, die nicht ordnungsgemäß im neuesten App-Update behandelt wurden. Nachdem sie herauszufinden haben, war es ziemlich einfach zu beheben.
Das Team entwickelt nun einen neuen Ansatz mit OpenTelemetry, um eine umfassendere verteilte Ablaufverfolgungslösung zu erstellen, die alle Lösungsebenen abdeckt.
Visualisieren von Überwachungsdaten in Dashboards
Sammeln und visualisieren Sie Daten in Dashboards, um Überwachungsdaten anzuzeigen, die für Ihr Publikum spezifisch sind, und das größere Bild im Auge behalten. Verwenden Sie Situationsdashboards, um wichtige Informationen hervorzuheben und Interessengruppen Einblicke zu geben. Verwenden Sie Betriebsdashboards und Arbeitsmappen, die Drilldownfunktionen für Operatoraktivitäten wie die Reaktion auf Vorfälle aufweisen. Aktualisieren Sie die Dashboards häufig, und geben Sie feine Details an.
Sie können Visualisierungen verwenden, um Trends zu analysieren, Geschäftsziele nachzuverfolgen und Vorfälle zu verwalten.
Dashboards, die auf das Interesse des Kunden zugeschnitten sind, sind einfacher zu verstehen und helfen Teams, Probleme zu erfassen und schneller zu handeln.
Herausforderung für Contoso
- Das Workloadteam sammelt Telemetriedaten aus allen Lösungsebenen in einem einzigen Log Analytics-Arbeitsbereich, auf den jeder zugreifen kann, einschließlich Entwicklungs- und Betriebsteams und anderer Projektbeteiligter. Das Arbeiten mit diesen Daten ist jedoch nicht einfach. Es ist kompliziert und unübersichtlich, was es für Teammitglieder frustrierend macht, die versuchen, Hintergrundgeräusche von umsetzbaren Daten zu trennen.
Anwenden des Ansatzes und der Ergebnisse
Das Team bemüht sich, Daten mithilfe von Dashboards zu sammeln und zu visualisieren. Jedes Dashboard ist auf eine bestimmte Zielgruppe zugeschnitten:
Bei Projektbeteiligten konzentrieren sich die Dashboards stärker auf das Gesamtbild, z. B. den Gesamtzustand der Lösung, die Anzahl der Benutzer, Suchvorgänge und Reservierungen. Sie bietet eine klare Ansicht der Leistung der Lösung aus geschäftlicher Sicht.
Für das Betriebsteam gehen die Dashboards und Arbeitsmappen tiefer, mit detaillierteren Daten und der Möglichkeit, einen Drilldown in bestimmte Bereiche durchzuführen. Diese Dashboards helfen bei der Problembehandlung, der Reaktion auf Vorfälle und der täglichen Überwachung.
Mit den Dashboards können Benutzer Trends analysieren, Geschäftsziele nachverfolgen und Vorfälle effektiver verwalten. Jedes Dashboard verfügt über Daten, die für die beabsichtigte Zielgruppe relevanter sind und von ihren Interessen und Bedürfnissen gesteuert werden.
Entwerfen einer robusten Warnungsstrategie
Machen Sie Warnungen umsetzbar, indem Sie sie an die richtigen Personen senden, mit klaren Beschreibungen und Schweregraden. Fügen Sie Informationen aus verschiedenen Quellen hinzu, sodass sie alle an einem Ort sind, und alles nachverfolgen, was nicht mit den Geschäftszielen übereinstimmt.
Lösen Sie Warnungen nur für Vorfälle aus, die Eine Aktion benötigen, und zielen Sie auf proaktive Warnungen ab, die Ihnen helfen, Probleme zu beheben, bevor sie zu einem totalen Fehler werden. Ein gutes Benachrichtigungssystem sollte Ihnen mitteilen, was falsch ist, wie ernst es ist, und nur genügend Informationen geben, um Dinge klar und umsetzbar zu machen. Dann kann das Team direkt in die Behebung von Problemen springen, ohne Zeit zu verschwenden.
Herausforderung für Contoso
Contoso verwendet Azure Monitor, um Warnungen an das Betriebsteam zu senden, wenn ein Fehler auftritt. Das Team empfängt derzeit jedoch zu viele Warnungen, die irrelevant, unklar oder redundant sind. Dies führt zu Warnungsermüdung. Das Team fehlt wichtige Warnungen, und die Produktivität verlangsamt sich.
Es gab auch einige Situationen von Ausfällen, die verhindert oder minimiert werden könnten, wenn jeder eine Warnung einen Kopf gab. So gab es z. B. Fälle, in denen allmähliche Verlangsamungen in der Verarbeitungszeit der Datenbankabfrage zu Ausfällen geführt haben. Wenn das Team intelligentere Benachrichtigungen hatte, die diese Verlangsamungen früher gekennzeichnet haben, konnten sie möglicherweise fortfahren, bevor das System fehlgeschlagen war.
Anwenden des Ansatzes und der Ergebnisse
Das Betriebsteam startet einen Bereinigungsaufwand, um alle Warnungen mit niedriger Priorität zu entfernen, die nur Rauschen hinzufügen. Nur kritische und umsetzbare Warnungen dürfen aktiv bleiben. Außerdem überprüfen sie die verbleibenden Warnungen, um sicherzustellen, dass sie genügend Kontext geben, damit das Team das Problem beheben kann, ohne weitere Informationen zu benötigen.
Sie nutzen die Möglichkeit, neue proaktive, umsetzbare Warnungen einzurichten, mit denen sie Maßnahmen ergreifen können, bevor ein Fehler auftritt. Sie haben beispielsweise eine neue Warnung hinzugefügt, um die Datenbankadministratoren zu benachrichtigen, sobald eine stetige Verlangsamung der Datenbankabfrageleistung angezeigt wird.
Als Nächstes untersuchen sie Möglichkeiten zum Automatisieren von Antworten auf allgemeine Warnungen, z. B. die Verlangsamung der Datenbank.
Überprüfen Sie Ihr Wissen
Feedback
War diese Seite hilfreich?
No
Benötigen Sie Hilfe zu diesem Thema?
Möchten Sie versuchen, Ask Learn zu verwenden, um Sie durch dieses Thema zu klären oder zu leiten?