Solución Agent Health en Azure Monitor

La solución Agent Health en Azure le ayuda a comprender qué agentes de supervisión no responden y envían datos operativos. Esto incluye todos los agentes que informan directamente al área de trabajo de Log Analytics en Azure Monitor o a un grupo de administración de System Center Operations Manager conectado a Azure Monitor.

También puede usar la solución Agent Health para:

  • Realice un seguimiento de cuántos agentes se implementan y dónde se distribuyen geográficamente.
  • Realice otras consultas para mantener el conocimiento de la distribución de agentes implementados en Azure, en otros entornos en la nube o en el entorno local.

Importante

La solución Agent Health solo supervisa el estado del agente de Log Analytics que está en desuso a partir del 31 de agosto de 2024. Esta solución no supervisa el estado del agente de Azure Monitor.

Prerrequisitos

Antes de implementar esta solución, confirme que tiene agentes de Windows comunicando con el área de trabajo de Log Analytics o informando a un grupo de administración de Operations Manager que está integrado en su área de trabajo.

Módulos de administración

Si el grupo de administración de Operations Manager está conectado a un área de trabajo de Log Analytics, los siguientes módulos de administración se instalan en Operations Manager. Estos módulos de administración también se instalan en equipos Windows conectados directamente después de agregar esta solución:

  • Microsoft System Center Advisor HealthAssessment Direct Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Microsoft System Center Advisor HealthAssessment Server Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

No hay nada que configurar o administrar con estos módulos de administración. Para más información sobre cómo se actualizan los módulos de administración de soluciones, consulte Conexión de Operations Manager a Log Analytics.

Configuración

Agregue la solución Agent Health al área de trabajo de Log Analytics mediante el proceso descrito en Incorporación de soluciones. No es necesario realizar ninguna otra configuración.

Agentes compatibles

En la tabla siguiente se describen los orígenes conectados que admite esta solución.

Origen conectado Compatible Description
Agentes de Windows Los eventos de latidos se recopilan de agentes de Windows directos.
Grupo de administración del System Center Operations Manager Los eventos de latido se recopilan de los agentes que informan al grupo de administración cada 60 segundos y luego se envían a Azure Monitor. No se requiere una conexión directa de agentes de Operations Manager a Azure Monitor. Los datos de eventos de heartbeat se reenvían desde el grupo de administración al espacio de trabajo de Log Analytics.

Utiliza la solución

Al agregar la solución al área de trabajo de Log Analytics, el icono estado del agente se agrega al panel. Este icono muestra el número total de agentes y el número de agentes que no responden en las últimas 24 horas.

Captura de pantalla que muestra el icono Estado del agente en el panel.

Seleccione el icono Estado del agente para abrir el panel Estado del agente . El panel incluye las columnas de la tabla siguiente. Cada columna enumera los 10 eventos principales por recuento que coinciden con los criterios de esa columna para el intervalo de tiempo especificado. Puede ejecutar una búsqueda de registros que proporcione toda la lista. Seleccione Ver todo debajo de cada columna o seleccione el encabezado de columna.

Columna Description
Recuento de agentes a lo largo del tiempo Tendencia del recuento de agentes durante un período de siete días para los agentes de Linux y Windows
Recuento de agentes que no responden Lista de agentes que no han enviado un latido en las últimas 24 horas
Distribución por tipo de sistema operativo Partición del número de agentes de Windows y Linux que tiene en su entorno
Distribución por versión del agente Partición de las versiones del agente instaladas en el entorno y un recuento de cada una
Distribución por categoría del agente Clasificación de las categorías de agentes que envían eventos de latido: agentes directos, agentes de Operations Manager o el servidor de administración de Operations Manager
Distribución por grupo de administración Una partición de los grupos de administración de Operations Manager en su entorno
Ubicación geográfica de agentes Partición de los países o regiones donde tiene agentes y un recuento total del número de agentes que se han instalado en cada país o región.
Recuento de puertas de enlace instaladas Número de servidores que tienen instalada la puerta de enlace de Log Analytics y una lista de estos servidores

Captura de pantalla que muestra un ejemplo del panel de la solución Agent Health.

Registros de logs de Azure Monitor

La solución crea un tipo de registro en el área de trabajo de Log Analytics: latido. Los registros de latido tienen las propiedades enumeradas en la tabla siguiente.

Propiedad Description
Type Heartbeat
Category Direct Agent, SCOM Agent o SCOM Management Server
Computer Nombre del equipo
OSType Sistema operativo Windows o Linux
OSMajorVersion Versión principal del sistema operativo
OSMinorVersion Versión menor del sistema operativo
Version Versión del agente de Log Analytics o del agente de Operations Manager
SCAgentChannel Direct y/o SCManagementServer
IsGatewayInstalled true si está instalada la puerta de enlace de Log Analytics; de otra manera false
ComputerIP Dirección IP pública para una máquina virtual de Azure, si hay una disponible; Dirección SNAT de Azure (no la dirección IP privada) de una máquina virtual que usa una dirección IP privada
ComputerPrivateIPs Lista de direcciones IP privadas del equipo
RemoteIPCountry Ubicación geográfica donde se implementa el equipo
ManagementGroupName Nombre del grupo de gestión de Operations Manager
SourceComputerId Identificador único del equipo
RemoteIPLongitude Longitud de la ubicación geográfica del equipo
RemoteIPLatitude Latitud de la ubicación geográfica del equipo

Cada agente que informe a un servidor de administración de Operations Manager enviará dos señales de latido. El valor de la propiedad SCAgentChannel incluirá tanto Direct como SCManagementServer, en función de los orígenes de datos y las soluciones de supervisión que haya habilitado en la suscripción.

Si lo recuerda, los datos de las soluciones se envían:

  • Directamente desde un servidor de administración de Operations Manager a Azure Monitor.
  • Directamente desde el agente a Azure Monitor, debido al volumen de datos recopilados en el agente.

Para los eventos de latido que tienen el valor SCManagementServer, el ComputerIP valor es la dirección IP del servidor de administración porque carga realmente los datos. En el caso de los latidos donde SCAgentChannel se establece en Direct, es la dirección IP pública del agente.

Ejemplos de búsquedas en registros

En la tabla siguiente se proporcionan búsquedas de registros de ejemplo para los registros que recopila la solución.

Query Description
Latido | Computadora distinta Número total de agentes
Señal de estado | resumir ÚltimaLlamada = max(TiempoGenerado) por Computadora | donde ÚltimaLlamada < hace(24h) Recuento de agentes que no responden en las últimas 24 horas
Latido | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < hace 15m Recuento de agentes que no responden en los últimos 15 minutos
Heartbeat | donde TimeGenerated > hace 24h y Computer en ((Heartbeat | donde TimeGenerated > hace 24h | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Equipos en línea en las últimas 24 horas
Latido | donde TimeGenerated > ago(24h) y Computer !in ((Heartbeat | where TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Total de agentes sin conexión en los últimos 30 minutos (durante las últimas 24 horas)
Pulso | summarize ValorAgregado = dcount(Computer) by OSType Tendencia del número de agentes a lo largo del tiempo por tipo de sistema operativo
Ritmo cardíaco | resumir ValorAgregado = dcount(Computer) por OSType Distribución por tipo de sistema operativo
Pulso | summarize AggregatedValue = dcount(Computer) by Version Distribución por versión del agente
Heartbeat | summarize ValorAgregado = count() by Categoría Distribución por categoría del agente
Pulso | summarize AggregatedValue = dcount(Computer) by ManagementGroupName Distribución por grupo de administración
Latido | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry Ubicación geográfica de agentes
Heartbeat | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | distinct Computer Número de puertas de enlace de Log Analytics instaladas

Pasos siguientes

Obtenga información sobre cómo generar alertas a partir de consultas de registro en Azure Monitor.