Condividi tramite


Esercitazione: Creare un piano di risposta agli eventi imprevisti per l'agente SRE di Azure

In questa esercitazione viene creato un piano di risposta che filtra gli eventi imprevisti in base alla gravità e al servizio, indirizza gli eventi imprevisti a un agente personalizzato specifico per l'indagine automatizzata e viene illustrato come usare l'interruttore abilita o disabilita.

Tempo stimato: 5-10 minuti

In questa esercitazione, farai:

  • Creare il piano di risposta dall'Agent Canvas
  • Configurare i criteri di filtro (gravità, servizio, tipo, titolo) per instradare gli eventi imprevisti
  • Anteprima degli incidenti storici corrispondenti prima di effettuare il commit
  • Usare l'interruttore enable/disable per sospendere e riprendere il routing
  • Verificare i piani nella griglia dei piani di risposta

Prerequisiti

  • Un agente con una piattaforma di eventi imprevisti connessa (PagerDuty, ServiceNow o Monitoraggio di Azure)
  • Almeno un agente personalizzato è configurato
  • Ruolo collaboratore o proprietario nella risorsa agente

Annotazioni

Per altre informazioni sui piani di risposta agli eventi imprevisti e sui problemi risolti, vedere Piani di risposta agli eventi imprevisti.

Aprire il canvas dell'agente

Nel portale dell'agente SRE, seleziona il tuo agente. Nella barra laterale sinistra, accedi a Builder>Agent Canvas.

Avviso

Quando si connette per la prima volta una piattaforma di eventi imprevisti, il portale potrebbe creare automaticamente un piano di risposta di avvio rapido predefinito. Prima di creare piani personalizzati, passare alla visualizzazione Tabella e selezionare la scheda Piani di risposta agli eventi imprevisti da controllare. Eliminare il piano di avvio rapido , se esistente. I piani sovrapposti possono causare l'instradamento errato degli incidenti o la loro elaborazione doppia.

Creare un nuovo piano di risposta

Nel Canvas Agente, selezionare la freccia a discesa Crea sulla barra degli strumenti. Selezionare Trigger>Piano di risposta agli incidenti.

Verrà visualizzata la finestra di dialogo di creazione.

Compilare i criteri di filtro. I campi visualizzati dipendono dalla piattaforma degli incidenti.

  • Nome del piano di risposta agli eventi imprevisti: immettere un nome descrittivo, ad esempio high-sev-api-trigger.

Per Monitoraggio di Azure:

  • Gravità: selezionare uno o più livelli di gravità (selezione multipla).
  • Title contains (facoltativo): aggiungere una parola chiave per restringere ulteriormente le corrispondenze.

Per PagerDuty/ServiceNow:

  • Servizio interessato: selezionare il servizio a cui si riferisce il piano oppure selezionare "Tutti".
  • Tipo di evento imprevisto: scegliere la classificazione degli eventi imprevisti oppure selezionare "Tutti i tipi di eventi imprevisti".
  • Priorità: selezionare uno o più livelli di priorità (selezione multipla, ad esempio P1 e P2).
  • Title contains (facoltativo): aggiungere una parola chiave per restringere ulteriormente le corrispondenze.

Scegliere la configurazione della risposta:

  • Agente personalizzato di risposta: selezionare l'agente personalizzato che gestisce gli eventi imprevisti corrispondenti.
  • Livello di autonomia dell'agente: scegliere la modalità di risposta dell'agente:
    • Autonomo (impostazione predefinita): l'agente analizza in modo indipendente ed esegue la mitigazione.
    • Revisione: l'agente propone azioni per l'approvazione prima dell'esecuzione.

Suggerimento

Iniziare con la modalità di revisione per i nuovi piani se si vuole convalidare il comportamento di indagine dell'agente prima di concedere l'autonomia completa. Per impostazione predefinita, i nuovi piani sono impostati su Autonomo.

Compilare tutti i campi obbligatori: nome del piano, servizio interessato, tipo di evento imprevisto e almeno un livello di priorità. Il pulsante Avanti diventa abilitato.

Anteprima degli incidenti corrispondenti

Seleziona Avanti. L'anteprima degli eventi imprevisti mostra una tabella degli eventi imprevisti precedenti che soddisfano i criteri di filtro.

Nella tabella vengono visualizzate le colonne seguenti per ogni evento imprevisto corrispondente:

  • Priorità, data di creazione, titolo, ID evento imprevisto e stato

Un filtro di intervallo di tempo (impostazione predefinita: ultimi 90 giorni) regola la finestra di anteprima.

Esaminare i risultati:

  • Troppe coincidenze? Torna indietro e aggiungi una restrizione di gravità o una parola chiave nel titolo.
  • Nessuna corrispondenza? Questa condizione è normale per i nuovi servizi. Il piano funziona ancora per eventi imprevisti futuri.
  • Numero giusto? Il filtro è ben regolato.

Selezionare Crea piano di risposta agli eventi imprevisti per salvare il piano.

Il piano viene visualizzato nella griglia con lo stato impostato su (badge verde).

Attivare e disattivare un piano

Selezionare il piano selezionandone la casella di controllo nella griglia.

  1. Selezionare Disattiva sulla barra degli strumenti. Viene visualizzata una finestra di dialogo di conferma.
  2. Selezionare per disabilitare il piano.

Il badge di stato diventa Disattivato. Lo scanner smette di abbinare gli incidenti con questo piano. La configurazione del filtro viene mantenuta.

Per riabilitare la funzione:

  1. Selezionare di nuovo il piano.
  2. Seleziona Attiva. La modifica diventa effettiva immediatamente senza conferma.

Il badge di stato torna su .

A questo punto, è possibile passare un piano tra On e Off senza eliminarlo.

Verificare nella griglia dei piani di risposta

È possibile visualizzare il piano nella griglia dei piani di risposta agli eventi imprevisti con il badge di stato, l'agente personalizzato, il filtro di gravità e le colonne a livello di autonomia.

Verificare le informazioni seguenti:

  • Il piano compare nella griglia con lo stato, l'agente personalizzato e la gravità corretti.

Suggerimento

** Utilizzare il filtro Title contiene per eseguire il test in modo sicuro. Impostarlo in modo che corrisponda a un titolo specifico dell'evento imprevisto di test (ad esempio, [TEST] CPU spike) e creare un evento imprevisto di test con tale titolo. Questo approccio convalida il comportamento dell'agente senza influire sul routing di produzione. Dopo la verifica, regolare o rimuovere il filtro del titolo.

Modificare o eliminare un piano di risposta

Modificare un piano di risposta

Per modificare un piano di risposta:

  1. Nella griglia dei piani di risposta selezionare il collegamento ID del piano per aprire il piano.
  2. La vista di modifica si apre con tutte le impostazioni attuali precompilate.
  3. Modificare i criteri di filtro, l'agente personalizzato o il livello di autonomia.
  4. Seleziona Salva per applicare le modifiche.

Eliminare un piano di risposta

Per eliminare un piano di risposta:

  1. Selezionare il piano usando la casella di controllo nella griglia.
  2. Selezionare Elimina sulla barra degli strumenti.
  3. Quando viene visualizzata la finestra di dialogo di conferma, selezionare .

I piani eliminati arrestano immediatamente gli incidenti di routing. Indagini attive avviate dal piano continuano a essere completate.

Passo successivo

risorsa Descrizione
Piani di risposta agli eventi imprevisti Comprendere la funzionalità completa dei piani di risposta.
Connettersi a Esplora dati di Azure Concedere all'agente personalizzato l'accesso ai dati di log.
Analisi approfondita Analisi complessa della causa radice.
Agenti personalizzati Agenti personalizzati specializzati per tipi di incidente diversi.