Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Los planes de respuesta a incidentes permiten enrutar automáticamente los incidentes entrantes al agente personalizado adecuado en función de criterios de filtro, como la gravedad, el servicio y el tipo de incidente. En lugar de clasificar manualmente cada alerta, se definen las condiciones una vez y el agente controla los incidentes coincidentes a medida que llegan.
En este tutorial, creas un plan de respuesta a partir del lienzo del agente, obtienes una vista previa de los incidentes coincidentes y usas el interruptor activar/desactivar para controlar cuándo está activo el plan.
Prerrequisitos
- Un agente con una plataforma de incidentes conectada (PagerDuty, ServiceNow o Azure Monitor)
- Al menos un agente personalizado configurado
- Rol de colaborador o propietario en el recurso del agente
Paso 1: Abrir el lienzo del agente
En el portal del agente de SRE, seleccione su agente. En la barra lateral izquierda, vaya a Constructor → Canvas del agente.
Advertencia
Cuando se conecta por primera vez una plataforma de incidentes, es posible que se cree automáticamente un plan de respuesta de inicio rápido predeterminado. Antes de crear planes personalizados, cambie a la vista Tabla y seleccione la pestaña Planes de respuesta a incidentes para comprobar. Elimine el plan de inicio rápido si existe. Los planes superpuestos pueden hacer que los incidentes se enruten incorrectamente o se procesen dos veces.
Paso 2: Crear un nuevo plan de respuesta
En el lienzo del agente, seleccione Crear en la barra de herramientas. Seleccione Desencadenar>Plan de respuesta a incidentes.
Se abre el cuadro de diálogo "Crear".
Rellene los criterios de filtro. Los campos que ve dependen de la plataforma de incidentes:
-
Nombre del plan de respuesta a incidentes: escriba un nombre descriptivo, como
high-sev-api-trigger.
Para Azure Monitor:
- Gravedad: seleccione uno o más niveles de gravedad.
- El título contiene (opcional): agregue una palabra clave para restringir los resultados.
Para PagerDuty/ServiceNow:
- Servicio afectado: seleccione el servicio que cubre este plan o seleccione Todo.
- Tipo de incidente: elija la clasificación de incidentes o seleccione Todos los tipos de incidentes.
- Prioridad: seleccione uno o varios niveles de prioridad, como P1 y P2.
- El título contiene (opcional): agregue una palabra clave para acotar coincidencias.
Elija la configuración de respuesta:
Agente personalizado de respuesta: seleccione el agente personalizado que controla incidentes coincidentes.
Nivel de autonomía del agente: elija cómo responde el agente:
- Autónomo (valor predeterminado): el agente investiga y realiza la mitigación de forma independiente.
- Revisión: el agente propone acciones para su aprobación antes de ejecutarse.
Nota:
Al seleccionar Autónomo (valor predeterminado), aparece un ℹicono ️ junto a la opción .
Selecciónelo para revisar la confirmación del modo autónomo : un resumen de lo que significa la ejecución autónoma, incluidos los límites del agente, las limitaciones del modelo de IA y sus responsabilidades. Consulte Planes de respuesta:> configuración del agente personalizado para obtener más información.
Sugerencia
Comience con el modo de revisión para los nuevos planes si desea validar el comportamiento de investigación del agente antes de conceder una autonomía completa. De forma predeterminada, los nuevos planes son Autónomos.
Configurar el período de espera de reinvestigación de alertas (solo Azure Monitor)
Si la plataforma de incidentes es Azure Monitor, aparece una sección Reinvestigation debajo del nivel de autonomía:
Habilitar (casilla, valor predeterminado: activado): cuando está habilitado, las activaciones recurrentes de la misma regla de alerta dentro del período de espera se combinan en el hilo de investigación existente en lugar de iniciar uno nuevo. Los subprocesos resueltos dentro de la ventana se vuelven a abrir.
Tiempo de enfriamiento (número predeterminado: 3 horas, intervalo: 1-24): cuánto tiempo después de resolver o cerrar un subproceso antes de que un nuevo incendio cree una investigación nueva en lugar de volver a abrir el subproceso existente.
Deje los valores predeterminados para la mayoría de las reglas de alerta. Deshabilite el enfriamiento solo para las alertas críticas en las que cada incendio necesite una investigación independiente.
Advertencia
Deshabilitar el enfriamiento puede aumentar significativamente el consumo de tokens para las reglas de alerta ruidosa. Una regla que se activa cada 5 minutos crearía una nueva investigación cada vez.
Rellene todos los campos obligatorios: nombre del plan, servicio afectado, tipo de incidente y al menos un nivel de prioridad. El botón Siguiente se habilita.
Paso 3: Vista previa de incidentes coincidentes
Seleccione Siguiente. La versión preliminar de incidentes muestra una tabla de incidentes anteriores que coinciden con los criterios de filtro.
La tabla muestra:
- Prioridad, Fecha de creación, Título, Identificador de incidente y Estado para cada incidente coincidente
- Filtro de intervalo de tiempo (valor predeterminado: últimos 90 días) para ajustar la ventana de vista previa
Revise los resultados:
- ¿Demasiadas coincidencias? Vuelva y agregue una restricción de gravedad o una palabra clave de título.
- ¿No hay coincidencias? Este resultado es normal para los nuevos servicios. Tu plan sigue funcionando para futuros incidentes.
- ¿Número correcto? El filtro está bien ajustado.
Seleccione Crear plan de respuesta a incidentes para guardar el plan.
Punto de control: El plan aparece en la cuadrícula con estado Activado (distintivo verde).
Paso 4: Desactivar y activar un plan
Seleccione su plan marcando su casilla en la cuadrícula.
- Seleccione Desactivar en la barra de herramientas. Aparece un cuadro de diálogo de confirmación.
- Seleccione Sí para deshabilitar el plan.
El distintivo de estado cambia a Desactivado. El escáner deja de comparar incidentes con este plan. Se conserva la configuración del filtro.
Para volver a habilitar el plan, siga estos pasos:
- Vuelva a seleccionar el plan.
- Seleccione Activar. Surte efecto inmediatamente sin confirmación.
El distintivo de estado vuelve a Activado.
Punto de control: El botón de alternancia funciona: puede cambiar un plan entre Activado y Desactivado sin eliminarlo.
Paso 5: Comprobar en la cuadrícula de planes de respuesta
Puede ver el plan directamente en la cuadrícula de página Planes de respuesta a incidentes con la notificación de estado, el agente personalizado, el filtro de gravedad y las columnas de nivel de autonomía.
Punto de control: El plan aparece en la rejilla con el estado correcto, el agente personalizado y la gravedad correspondiente.
Sugerencia
Usa el filtro Título contiene para probar de forma segura. Establézcalo para que coincida con un título de incidente de prueba específico (por ejemplo, "[TEST] CPU spike") y cree un incidente de prueba con ese título. Este método valida el comportamiento del agente sin afectar al enrutamiento de producción. Una vez comprobado, ajuste o quite el filtro de título.
Editar o eliminar un plan de respuesta
Edit
- En la tabla de planes de respuesta, seleccione el vínculo ID de plan para abrir el plan.
- La vista de edición se abre con toda la configuración actual rellenada previamente.
- Modifique los criterios de filtro, el agente personalizado o el nivel de autonomía.
- Seleccione Guardar para aplicar los cambios.
Delete
- Seleccione el plan mediante la casilla de la cuadrícula.
- Seleccione Eliminar en la barra de herramientas.
- Aparece un cuadro de diálogo de confirmación. Seleccione Sí para confirmar la acción.
Los planes eliminados detienen inmediatamente los incidentes de enrutamiento. Las investigaciones activas que el plan inició continúan hasta su finalización.
Lo que ha aprendido
- Cómo crear planes de respuesta desde la página Planes de respuesta a incidentes .
- Cómo los criterios de filtro (gravedad, servicio, tipo, título) dirigen los incidentes al agente personalizado correcto.
- Cómo obtener una vista previa de los incidentes históricos que coinciden antes de comprometerse.
- Cómo usar el interruptor de habilitar/deshabilitar para pausar y reanudar el enrutamiento.
- Cómo verificar los planes en la vista de cuadrícula unificada en el Agent Canvas.
- La diferencia entre los niveles de autonomía autónoma y de revisión.
Contenido relacionado
| Recurso | Lo que aprendes |
|---|---|
| Planes de respuesta a incidentes | Descripción de la funcionalidad de planes de respuesta completos |
| Conexión de un origen de datos | Permite que tu agente personalizado acceda a los datos del registro |
| Investigación profunda | Análisis de causas principales complejas |
| Agentes personalizados | Agentes personalizados especializados para diferentes tipos de incidentes |