Riferimento dati di monitoraggio Foundry Agent Service (classico)

Note

Questo documento fa riferimento al portale di Microsoft Foundry (versione classica).

Gli agenti (versione classica) sono ora deprecati e verranno ritirati il 31 marzo 2027. Usare i nuovi agenti nel Microsoft servizio agenti Foundry. Seguire la guida alla migrazione per aggiornare i carichi di lavoro.

Questo articolo contiene tutte le informazioni di riferimento sul monitoraggio per questo servizio.

Consulta Monitor Foundry Agent Service per dettagli sui dati che puoi raccogliere sui tuoi agenti.

Metrics

Ecco le metriche più importanti che pensiamo dovresti monitorare per il Servizio Agente. Più avanti in questo articolo c'è un elenco più lungo di tutte le metriche disponibili, che contiene maggiori dettagli sulle metriche in questa lista più breve. Consulta l'elenco qui sotto per le informazioni più aggiornate. È in corso l'aggiornamento delle tabelle nelle sezioni seguenti.

Supported metrics

Questa sezione elenca tutte le metriche della piattaforma raccolte automaticamente per questo servizio. Queste metriche fanno anche parte dell'elenco globale di tutte le metriche della piattaforma supportate in Monitoraggio di Azure.

  • Tutte le colonne potrebbero non essere presenti in ogni tabella.
  • Alcune colonne potrebbero superare l'area di visualizzazione della pagina. Selezionare Espandi tabella per visualizzare tutte le colonne disponibili.

Table headings

  • Categoria : gruppo o classificazione delle metriche.
  • Metric: nome visualizzato della metrica visualizzato nel portale di Azure.
  • Nome nell'API REST : nome della metrica indicato nell'API REST.
  • Unità - Unità di misura.
  • Aggregazione : tipo di aggregazione predefinito. Valori validi: Average (Avg), Minimum (Min), Maximum (Max), Total (Sum), Count.
  • Dimensioni - Dimensioni disponibili per la metrica.
  • Grani - di tempoIntervalli in cui viene campionata la metrica. Ad esempio, PT1M indica che la metrica viene campionata ogni minuto, PT30M ogni 30 minuti, PT1H ogni ora e così via.
  • DS Export- Indica se la metrica è esportabile nei log Monitoraggio di Azure tramite le impostazioni di diagnostica. Per informazioni sull'esportazione delle metriche, vedere Creare le impostazioni di diagnostica in Monitoraggio di Azure.

Category: Agents

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Agents

Numero di eventi per gli Agenti AI in questo spazio di lavoro
Agents Count Average, Maximum, Minimum, Total (Sum) EventType PT1M No
IndexedFiles

Numero di file indicizzati per la ricerca file in questo spazio di lavoro
IndexedFiles Count Average, Maximum, Minimum, Total (Sum) ErrorCode, Status, VectorStoreId PT1M No
Messages

Numero di eventi per i messaggi AI Agent in questo spazio di lavoro
Messages Count Average, Maximum, Minimum, Total (Sum) EventType, ThreadId PT1M No
Runs

Numero di esecuzioni degli agenti AI in questo spazio di lavoro
Runs Count Average, Maximum, Minimum, Total (Sum) AgentId, RunStatus, StatusCodeStreamType PT1M No
Threads

Numero di eventi per i thread AI Agent in questo spazio di lavoro
Threads Count Average, Maximum, Minimum, Total (Sum) EventType PT1M No
Tokens

Conteggio dei token da parte degli Agenti AI in questo spazio di lavoro
Tokens Count Average, Maximum, Minimum, Total (Sum) AgentId, TokenType PT1M No
ToolCalls

Chiamate agli strumenti effettuate dagli agenti AI in questo spazio di lavoro
ToolCalls Count Average, Maximum, Minimum, Total (Sum) AgentId, ToolName PT1M No

Category: Model

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Implementazione del modello fallita

Numero di implementazioni di modelli che hanno fallito in questo spazio di lavoro
Model Deploy Failed Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, StatusCode PT1M Yes
Inizio del dispiegamento del modello

Numero di implementazioni di modelli avviate in questo spazio di lavoro
Model Deploy Started Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario PT1M Yes
Distribuzione del modello con successo

Numero di implementazioni di modelli che hanno avuto successo in questo spazio di lavoro
Model Deploy Succeeded Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario PT1M Yes
Registro modello guasto

Numero di registrazioni di modelli fallite in questo spazio di lavoro
Model Register Failed Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, StatusCode PT1M Yes
Registro modello riuscito

Numero di registrazioni di modelli che hanno avuto successo in questo spazio di lavoro
Model Register Succeeded Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario PT1M Yes

Category: Quota

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Active Cores

Numero di nuclei attivi
Active Cores Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Active Nodes

Numero di nodi Acitve. Questi sono i nodi che stanno attivamente eseguendo un lavoro.
Active Nodes Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Idle Cores

Numero di core inattivi
Idle Cores Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Idle Nodes

Numero di nodi inattivi. I nodi inattivi sono quelli che non esegueno alcun lavoro ma possono accettare nuovi lavori se disponibili.
Idle Nodes Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Leaving Cores

Numero di nuclei residui
Leaving Cores Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Leaving Nodes

Numero di nodi in uscita. I nodi che lasciano sono quelli che hanno appena finito di elaborare un lavoro e passano in stato di inattività.
Leaving Nodes Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Preempted Cores

Numero di nuclei preempted
Preempted Cores Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Preempted Nodes

Numero di nodi preemptiti. Questi nodi sono quelli a bassa priorità che vengono tolti dal pool di nodi disponibile.
Preempted Nodes Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Percentuale di utilizzo della quota

Percentuale della quota utilizzata
Quota Utilization Percentage Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName, VmFamilyNameVmPriority PT1M Yes
Total Cores

Numero totale di nuclei
Total Cores Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Total Nodes

Numero totale di nodi. Questo totale include alcuni nodi attivi, nodi inattivi, nodi inutilizzabili, nodi premeptati, nodi uscenti
Total Nodes Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Unusable Cores

Numero di nuclei inutilizzabili
Unusable Cores Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes
Unusable Nodes

Numero di nodi inutilizzabili. I nodi inutilizzabili non funzionano a causa di qualche problema irrisolvibile. Azure riciclerà questi nodi.
Unusable Nodes Count Average, Maximum, Minimum, Total (Sum) Scenario, ClusterName PT1M Yes

Category: Resource

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
CpuCapacityMillicores

Capacità massima di un nodo CPU in millicore. La capacità viene aggregata a intervalli di un minuto.
CpuCapacityMillicores Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
CpuMemoryCapacityMegabytes

Utilizzo massimo della memoria di un nodo CPU in megabyte. L'utilizzo viene aggregato in intervalli di un minuto.
CpuMemoryCapacityMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
CpuMemoryUtilizationMegabytes

Utilizzo della memoria di un nodo CPU in megabyte. L'utilizzo viene aggregato in intervalli di un minuto.
CpuMemoryUtilizationMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
CpuMemoryUtilizationPercentage

Percentuale di utilizzo della memoria di un nodo CPU. L'utilizzo viene aggregato in intervalli di un minuto.
CpuMemoryUtilizationPercentage Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
CpuUtilization

Percentuale di utilizzo su un nodo CPU. L'utilizzo viene riportato ogni minuto.
CpuUtilization Count Average, Maximum, Minimum, Total (Sum) Scenario, runId, NodeIdClusterName PT1M Yes
CpuUtilizationMillicores

Utilizzo di un nodo CPU nei millicore. L'utilizzo viene aggregato in intervalli di un minuto.
CpuUtilizationMillicores Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
CpuUtilizationPercentage

Percentuale di utilizzo di un nodo CPU. L'utilizzo viene aggregato in intervalli di un minuto.
CpuUtilizationPercentage Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
DiskAvailMegabytes

Spazio su disco disponibile in megabyte. Le metriche vengono aggregate a intervalli di un minuto.
DiskAvailMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
DiskReadMegabytes

Dati letti dal disco in megabyte. Le metriche vengono aggregate a intervalli di un minuto.
DiskReadMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
DiskUsedMegabytes

Ho usato spazio su disco in megabyte. Le metriche vengono aggregate a intervalli di un minuto.
DiskUsedMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
DiskWriteMegabytes

Dati scritti su disco in megabyte. Le metriche vengono aggregate a intervalli di un minuto.
DiskWriteMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
GpuCapacityMilliGPUs

Capacità massima di un dispositivo GPU nelle milli-GPU. La capacità viene aggregata a intervalli di un minuto.
GpuCapacityMilliGPUs Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, DeviceIdComputeName PT1M Yes
GpuEnergyJoules

Energia intervallare in Joule su un nodo GPU. L'energia viene riportata a intervalli di un minuto.
GpuEnergyJoules Count Average, Maximum, Minimum, Total (Sum) Scenario, runId, rootRunId, InstanceId, DeviceIdComputeName PT1M Yes
GpuMemoryCapacityMegabytes

Capacità massima di memoria di un dispositivo GPU in megabyte. Capacità aggregata a intervalli di un minuto.
GpuMemoryCapacityMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, DeviceIdComputeName PT1M Yes
GpuMemoryUtilization

Percentuale di utilizzo della memoria su un nodo GPU. L'utilizzo viene riportato ogni minuto.
GpuMemoryUtilization Count Average, Maximum, Minimum, Total (Sum) Scenario, runId, NodeId, DeviceIdClusterName PT1M Yes
GpuMemoryUtilizationMegabytes

Utilizzo della memoria di un dispositivo GPU in megabyte. L'utilizzo si aggregava a intervalli di un minuto.
GpuMemoryUtilizationMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, DeviceIdComputeName PT1M Yes
GpuMemoryUtilizationPercentage

Percentuale di utilizzo della memoria di un dispositivo GPU. L'utilizzo si aggregava a intervalli di un minuto.
GpuMemoryUtilizationPercentage Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, DeviceIdComputeName PT1M Yes
GpuUtilization

Percentuale di utilizzo su un nodo GPU. L'utilizzo viene riportato ogni minuto.
GpuUtilization Count Average, Maximum, Minimum, Total (Sum) Scenario, runId, NodeId, DeviceIdClusterName PT1M Yes
GpuUtilizationMilliGPUs

Utilizzo di un dispositivo GPU nelle milli-GPU. L'utilizzo viene aggregato in intervalli di un minuto.
GpuUtilizationMilliGPUs Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, DeviceIdComputeName PT1M Yes
GpuUtilizationPercentage

Percentuale di utilizzo di un dispositivo GPU. L'utilizzo viene aggregato in intervalli di un minuto.
GpuUtilizationPercentage Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, DeviceIdComputeName PT1M Yes
IBReceiveMegabytes

Dati di rete ricevuti tramite InfiniBand in megabyte. Le metriche vengono aggregate a intervalli di un minuto.
IBReceiveMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeNameDeviceId PT1M Yes
IBTransmitMegabytes

Dati di rete inviati tramite InfiniBand in megabyte. Le metriche vengono aggregate a intervalli di un minuto.
IBTransmitMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeNameDeviceId PT1M Yes
NetworkInputMegabytes

Dati di rete ricevuti in megabyte. Le metriche vengono aggregate a intervalli di un minuto.
NetworkInputMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeNameDeviceId PT1M Yes
NetworkOutputMegabytes

Dati di rete inviati in megabyte. Le metriche vengono aggregate a intervalli di un minuto.
NetworkOutputMegabytes Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeNameDeviceId PT1M Yes
StorageAPIFailureCount

Archiviazione BLOB di Azure API call failure count.
StorageAPIFailureCount Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes
StorageAPISuccessCount

Archiviazione BLOB di Azure API calls success count.
StorageAPISuccessCount Count Average, Maximum, Minimum, Total (Sum) RunId, InstanceId, ComputeName PT1M Yes

Category: Run

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Annulla le corse richieste

Numero di esecuzioni in cui è stato richiesto il cancel per questo workspace. Il conteggio viene aggiornato quando viene ricevuta una richiesta di cancellazione per una serie.
Cancel Requested Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Cancelled Runs

Numero di esecuzioni annullate per questo spazio di lavoro. Il conteggio viene aggiornato quando una run viene annullata con successo.
Cancelled Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Completed Runs

Numero di esecuzioni completate con successo per questo spazio di lavoro. Il conteggio viene aggiornato quando una run è completata e l'output è stato raccolto.
Completed Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Errors

Numero di errori di esecuzione in questo spazio di lavoro. Il conteggio viene aggiornato ogni volta che una run incontra un errore.
Errors Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario PT1M Yes
Failed Runs

Numero di esecuzioni fallite per questo spazio di lavoro. Il conteggio viene aggiornato quando una run fallisce.
Failed Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Finalizing Runs

Il numero di esecuzioni è entrato nello stato finale per questo spazio di lavoro. Il conteggio viene aggiornato quando una run è completata ma la raccolta dei risultati è ancora in corso.
Finalizing Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Run Non Rispondono

Numero di run che non rispondono per questo workspace. Il conteggio viene aggiornato quando una run entra in stato Non Rispondente.
Not Responding Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Run Non Iniziate

Numero di esecuzioni nello stato Non Avviato per questo spazio di lavoro. Il conteggio viene aggiornato quando viene ricevuta una richiesta per creare una run, ma le informazioni sulla run non sono ancora state popolate.
Not Started Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Preparing Runs

Numero di corse che si stanno preparando per questo spazio di lavoro. Il conteggio viene aggiornato quando una run entra nello stato di Preparazione mentre l'ambiente di run è in fase di preparazione.
Preparing Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Provisioning Runs

Numero di esecuzioni che stanno facendo provisioning per questo spazio di lavoro. Il conteggio viene aggiornato quando una run è in attesa della creazione o del provisioning del target di calcolo.
Provisioning Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Queued Runs

Numero di esecuzioni in coda per questo workspace. Il conteggio viene aggiornato quando una run viene messa in coda nel calce target. Può verificarsi in attesa che i nodi di calcolo necessari siano pronti.
Queued Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Started Runs

Numero di run in corso per questo spazio di lavoro. Il conteggio viene aggiornato quando la run inizia a funzionare con le risorse richieste.
Started Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Starting Runs

Numero di esecuzioni avviate per questo spazio di lavoro. Il conteggio viene aggiornato dopo che la richiesta di creare le informazioni di run e run, come l'ID di run, è stata popolata
Starting Runs Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M Yes
Warnings

Numero di avvisi di run in questo spazio di lavoro. Il conteggio viene aggiornato ogni volta che una partita incontra un avviso.
Warnings Count Totale (Somma), Media, Minimo, Massimo, Conteggio Scenario PT1M Yes