Skapa en incidenthanteringsplan i Azure SRE-agenten

Med incidenthanteringsplaner kan du automatiskt dirigera inkommande incidenter till rätt anpassad agent baserat på filterkriterier som allvarlighetsgrad, tjänst och incidenttyp. I stället för att manuellt triiera varje avisering definierar du villkoren en gång och din agent hanterar matchande incidenter när de anländer.

I den här självstudien skapar du en svarsplan från agentarbetsytan, förhandsgranskar matchande incidenter och använder växlingsknappen aktivera/inaktivera för att styra när planen är aktiv.

Förutsättningar

  • En agent med en incidentplattform ansluten (PagerDuty, ServiceNow eller Azure Monitor)
  • Minst en anpassad agent har konfigurerats
  • Rollen "Medverkande" eller "Ägare" för agentresurs

Steg 1: Öppna agentarbetsytan

I SRE-agentportalen väljer du din agent. I det vänstra sidofältet går du till BuilderAgent Canvas.

Varning

När du först ansluter en incidentplattform kan en standardlösning för snabbstart skapas automatiskt. Innan du skapar anpassade planer växlar du till Tabellvy och väljer fliken Incidenthanteringsplaner för att kontrollera. Ta bort snabbstartsplanen om den finns. Överlappande planer kan orsaka att incidenter dirigeras felaktigt eller bearbetas två gånger.

Steg 2: Skapa en ny svarsplan

I arbetsytan Agent väljer du Skapa i verktygsfältet. Välj Utlösare>incidenthanteringsplan.

Dialogrutan Skapa öppnas.

Fyll i filtervillkoren. Vilka fält du ser beror på din incidentplattform:

  • Namn på incidenthanteringsplan: Ange ett beskrivande namn, till exempel high-sev-api-trigger.

För Azure Monitor:

  • Allvarlighetsgrad: Välj en eller flera allvarlighetsnivåer.
  • Rubrik innehåller (valfritt): Lägg till ett nyckelord för att begränsa matchningar.

För PagerDuty/ServiceNow:

  • Påverkad tjänst: Välj den tjänst som planen omfattar eller välj Alla.
  • Incidenttyp: Välj incidentklassificering eller välj Alla incidenttyper.
  • Prioritet: Välj en eller flera prioritetsnivåer, till exempel P1 och P2.
  • Rubrik innehåller (valfritt): Lägg till ett nyckelord för att begränsa matchningar.

Välj svarskonfigurationen:

  • Anpassad agent för svar: Välj den anpassade agent som hanterar matchade incidenter.

  • Agentens autonominivå: Välj hur din agent svarar:

    • Autonomt (Standard): Din agent undersöker och utför åtgärder självständigt.
    • Granska: Din agent föreslår åtgärder för ditt godkännande innan de genomförs.

Anmärkning

När du väljer Autonom (standard), visas en ℹ️-ikon bredvid alternativet.

Välj den för att granska bekräftelsen av autonomt läge – en sammanfattning av vad autonom körning innebär, inklusive agentgränser, begränsningar för AI-modell och ditt ansvar. Mer information finns i Svarsplaner –> Konfiguration av anpassad agent .

Tips/Råd

Börja med granskningsläget för nya planer om du vill verifiera agentens undersökningsbeteende innan du beviljar fullständig autonomi. Nya planer har autonoma som standardinställning.

Konfigurera väntetid för återundersökning av larm (endast Azure Monitor)

Om din incidentplattform är Azure Monitor visas avsnittet Reinvestigation cooldown under autonominivån:

  • Aktivera (kryssruta, standard: på): När det är aktiverat, sammanslås återkommande larm av samma larmregel inom nedkylningsfönstret med den befintliga undersökningstråden i stället för att starta en ny. Lösta trådar i fönstret öppnas igen.

  • Nedkylningstid (spinnare, standard: 3 timmar, intervall: 1–24): Hur lång tid efter att en tråd har lösts eller stängts innan en ny brand skapar en ny undersökning i stället för att öppna den befintliga tråden igen.

Låt standardinställningarna vara kvar för de flesta aviseringsregler. Inaktivera endast nedkylning för kritiska aviseringar där varje brand behöver en oberoende undersökning.

Varning

Om du inaktiverar nedkylningen kan tokenförbrukningen öka avsevärt för aviseringsregler med brus. En regel som utlöses var femte minut skulle skapa en ny granskning varje gång.

Fyll i alla obligatoriska fält: plannamn, påverkad tjänst, incidenttyp och minst en prioritetsnivå. Knappen Nästa aktiveras.

Steg 3: Förhandsgranska matchande incidenter

Klicka på Nästa. Förhandsgranskningen av incidenter visar en tabell med tidigare incidenter som matchar dina filtervillkor.

Tabellen visar:

  • Prioritet, Skapat datum, Rubrik, Incident-ID och Status för varje matchande incident
  • Ett tidsintervallfilter (standard: Senaste 90 dagarna) för att justera förhandsgranskningsfönstret

Granska resultaten:

  • För många matcher? Gå tillbaka och lägg till en allvarlighetsbegränsning eller rubriknyckelord.
  • Inga matchningar? Det här resultatet är normalt för nya tjänster. Din plan fungerar fortfarande för framtida incidenter.
  • Rätt nummer? Filtret är väljusterat.

Välj Skapa incidenthanteringsplan för att spara planen.

Checkpoint: Planen visas i rutan med Status (grönt symbol).

Steg 4: Inaktivera och aktivera en plan

Markera din plan genom att markera kryssrutan i rutnätet.

  1. Välj Inaktivera i verktygsfältet. En dialogruta för bekräftelse visas.
  2. Välj Ja för att inaktivera planen.

Statusikonen ändras till Av. Skannern slutar att matcha händelser mot denna plan. Filterkonfigurationen sparas.

Följ dessa steg för att återaktivera planen:

  1. Välj planen igen.
  2. Välj Aktivera. Den börjar gälla omedelbart utan bekräftelse.

Statusikonen återgår till .

Checkpoint: Växlingsknappen fungerar – du kan växla en plan mellan På och Av utan att ta bort den.

Steg 5: Verifiera i rutnätet för svarsplaner

Du kan se din plan direkt i rutnätet på sidan incidenthanteringsplaner med statusindikator, anpassad agent, filtrering för allvarlighetsgrad och autonominivåkolumner.

Checkpoint: Din plan visas i rutnätet med rätt status, anpassad agent och allvarlighetsgrad.

Tips/Råd

Använd filtret Rubrik innehåller för att testa på ett säkert sätt. Ställ in den så att den matchar en specifik titel för testincidenter (till exempel "[TEST] CPU spike") och skapa en testincident med den rubriken. Den här metoden verifierar agentens beteende utan att påverka produktionsroutningen. När du har verifierat, justerar eller tar du bort rubrikfiltret.

Redigera eller ta bort en svarsplan

Edit

  1. I rutnätet för svarsplaner väljer du länken plan-ID för att öppna planen.
  2. Redigeringsvyn öppnas med alla aktuella inställningar ifyllda.
  3. Ändra filtervillkoren, den anpassade agenten eller autonominivån.
  4. Välj Spara för att tillämpa ändringarna.

Delete

  1. Markera planen med hjälp av kryssrutan i rutnätet.
  2. Välj Ta bort i verktygsfältet.
  3. En dialogruta för bekräftelse visas. Välj Ja för att bekräfta.

Planer som tas bort stoppar routingincidenter omedelbart. Aktiva undersökningar som inleddes av planen fortsätter tills de är slutförda.

Det här har du lärt dig

  • Så här skapar du svarsplaner från sidan Incidenthanteringsplaner .
  • Hur filterkriterier (allvarlighetsgrad, tjänst, typ, rubrik) dirigerar incidenter till rätt anpassad agent.
  • Så här förhandsgranskar du matchande historiska incidenter innan du genomför.
  • Så här använder du växlingsknappen aktivera/inaktivera för att pausa och återuppta routningen.
  • För att verifiera planer i den enhetliga rutnätsvyn i Agent Canvas.
  • Skillnaden mellan autonoma och granskade autonominivåer.
Resource Det här lär du dig
Incidenthanteringsplaner Förstå kapaciteten för fullständiga åtgärdsplaner
Ansluta en datakälla Ge din anpassade agent åtkomst till loggdata
Djup undersökning Komplex analys av rotorsaker
Anpassade agenter Specialiserade skräddarsydda agenter för olika incidenttyper