Azure OpenAI monitoring data reference (classic)

Visualizzazione attualmente:Versione del portale - Foundry (versione classica)Passare alla versione per il nuovo portale foundry

Questo articolo contiene tutte le informazioni di riferimento sul monitoraggio per questo servizio.

Vedere Monitor Azure OpenAI per informazioni dettagliate sui dati che è possibile raccogliere per Azure OpenAI in Microsoft Foundry Models e su come usarli.

Metrics

Questa sezione elenca tutte le metriche della piattaforma raccolte automaticamente per questo servizio. Queste metriche fanno anche parte dell'elenco globale di tutte le metriche della piattaforma supportate in Monitoraggio di Azure.

Per informazioni sulla conservazione delle metriche, vedere panoramica Monitoraggio di Azure Metrics.

Metriche supportate per Microsoft. CognitiveServices/accounts

Di seguito sono riportate le metriche più importanti che è consigliabile monitorare per Azure OpenAI. Più avanti in questo articolo è riportato un elenco più lungo di tutte le metriche disponibili per questo spazio dei nomi che contiene altri dettagli sulle metriche in questo elenco più breve. Per informazioni più aggiornate, vedere di seguito. È in corso l'aggiornamento delle tabelle nelle sezioni seguenti.

  • Azure richieste OpenAI
  • Active Tokens
  • Token di completamento generati
  • Processed FineTuned Training Hours
  • Token di inferenza elaborati
  • Token di richiesta elaborati
  • Utilizzo gestito con provisioning V2
  • Frequenza di corrispondenza della cache dei token di richiesta
  • Tempo di risposta
  • Tempo tra i token
  • Time to Last Byte
  • Tempo normalizzato al primo byte
  • Token al secondo

È anche possibile monitorare le metriche di Sicurezza del contenuto usate da altri servizi correlati.

  • Blocked Volume
  • Rilevato volume dannoso
  • Potenziale conteggio utenti offensivi
  • Evento del sistema di sicurezza
  • Totale volume inviato per il controllo di sicurezza

Note

La metrica Utilizzo gestito con provisioning è ora deprecata e non è più consigliata. Questa metrica è stata sostituita dalla metrica Utilizzo gestito con provisioning V2 . I token al secondo, il tempo di risposta, il tempo tra i token non sono attualmente disponibili per le distribuzioni Standard.

Le metriche di Servizi cognitivi hanno la categoria Servizi cognitivi - Richieste HTTP nella tabella seguente. Queste metriche sono metriche legacy comuni a tutte le risorse di questo tipo. Microsoft non consiglia più di usare queste metriche con Azure OpenAI.

Nella tabella seguente sono elencate le metriche disponibili per il Microsoft. Tipo di risorsa CognitiveServices/accounts.

  • Tutte le colonne potrebbero non essere presenti in ogni tabella.
  • Alcune colonne potrebbero superare l'area di visualizzazione della pagina. Selezionare Espandi tabella per visualizzare tutte le colonne disponibili.

Table headings

  • Categoria : gruppo o classificazione delle metriche.
  • Metric: nome visualizzato della metrica visualizzato nel portale di Azure.
  • Nome nell'API REST : nome della metrica indicato nell'API REST.
  • Unità - Unità di misura.
  • Aggregazione : tipo di aggregazione predefinito. Valori validi: Average (Avg), Minimum (Min), Maximum (Max), Total (Sum), Count.
  • Dimensioni - Dimensioni disponibili per la metrica.
  • Grani - di tempoIntervalli in cui viene campionata la metrica. Ad esempio, PT1M indica che la metrica viene campionata ogni minuto, PT30M ogni 30 minuti, PT1H ogni ora e così via.
  • DS Export- Indica se la metrica è esportabile nei log Monitoraggio di Azure tramite le impostazioni di diagnostica. Per informazioni sull'esportazione delle metriche, vedere Creare le impostazioni di diagnostica in Monitoraggio di Azure.

Category: Actions

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Action Occurences

Numero di volte in cui viene visualizzata ogni azione.
ActionIdOccurrences Count Total (Sum) ActionId, Mode, RunId PT1M Yes
Azioni per evento

Numero di azioni per evento.
ActionsPerEvent Count Average Mode, RunId PT1M Yes

Categoria: Azure OpenAI - Richieste HTTP

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Azure OpenAI AvailabilityRate

Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte >HTTP =500.
AzureOpenAIAvailabilityRate Percent Minimum, Maximum, Average ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M No
Azure Richieste OpenAI

Numero di chiamate effettuate all'API OpenAI Azure per un periodo di tempo. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion, StatusCode (esito positivo, clienterrors, errori del server), IsSpillover per informazioni di spillover, ServiceTier, StreamType (Streaming e richieste non di streaming) e operazione.
AzureOpenAIRequests Count Total (Sum) ApiName, OperationName, , StreamType, ModelDeploymentNameModelName, StatusCodeModelVersionIsSpillover, ServiceTierRequestRegionServiceTierResponse PT1M Yes

Categoria: Azure OpenAI - Latenza

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Tempo compreso tra il token

Per le richieste di streaming; frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
AzureOpenAINormalizedTBTInMS MilliSeconds Maximum, Minimum, Average Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes
Tempo normalizzato al primo byte

Per le richieste di streaming e non di streaming; tempo necessario per il primo byte dei dati di risposta dopo che la richiesta viene effettuata dal modello, normalizzata per token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
AzureOpenAINormalizedTTFTInMS MilliSeconds Maximum, Minimum, Average Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes
Tempo di risposta

Misura di latenza consigliata (velocità di risposta) per le richieste di streaming. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Calcolato come tempo impiegato per la prima risposta dopo che un utente invia una richiesta, come misurato dal gateway API. Questo numero aumenta man mano che le dimensioni delle richieste aumentano e/o le dimensioni dei riscontri nella cache si riducono. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion.

Nota: questa metrica è un'approssimazione come latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata.
AzureOpenAITimeToResponse MilliSeconds Minimum, Maximum, Average ApiName, OperationName, Region, StreamTypeModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M Yes
Token al secondo

Enumera la velocità di generazione per una determinata risposta Azure modello OpenAI. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
AzureOpenAITokenPerSecond Count Maximum, Minimum, Average Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes
Time to Last Byte

Per le richieste di streaming e non di streaming; tempo necessario per ricevere l'ultimo byte dei dati di risposta dopo che la richiesta viene effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo.
AzureOpenAITTLTInMS MilliSeconds Maximum, Minimum, Average Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes

Categoria: Azure OpenAI - Utilizzo

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Active Tokens

Token totali meno token memorizzati nella cache in un periodo di tempo. Si applica alle distribuzioni PTU e gestite da PTU. Usare questa metrica per comprendere l'utilizzo basato su TPS o TPM per i PTU e confrontare i benchmark per i TPM o tps di destinazione per gli scenari. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion.
ActiveTokens Count Minimum, Maximum, Average, Total (Sum) Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes
Token di completamento audio

Numero di token di richiesta audio generati (output) in un modello OpenAI. Si applica alle distribuzioni di modelli con pagamento in base al consumo e gestite da PTU.
AudioCompletionTokens Count Total (Sum) ModelDeploymentName, ModelName, ModelVersionRegion PT1M Yes
Token di richiesta audio

Numero di token di richiesta audio elaborati (input) in un modello OpenAI. Si applica alle distribuzioni di modelli con pagamento in base al consumo e gestite da PTU.
AudioPromptTokens Count Total (Sum) ModelDeploymentName, ModelName, ModelVersionRegion PT1M Yes
Frequenza di corrispondenza della cache dei token di richiesta

Percentuale di token di richiesta che raggiungono la cache. Si applica alle distribuzioni PTU e gestite da PTU.
AzureOpenAIContextTokensCacheMatchRate Percent Minimum, Maximum, Average Region, ModelDeploymentName, ModelNameModelVersion PT1M No
Utilizzo gestito con provisioning (deprecato)

L'utilizzo % per un deployment gestito provvisoriamente, calcolato come (PTU consumate / PTU dispiegate) x 100. Quando l'utilizzo è maggiore o uguale a 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming)
AzureOpenAIProvisionedManagedUtilization Percent Minimum, Maximum, Average Region, StreamType, ModelDeploymentName, ModelNameModelVersion PT1M No
Utilizzo gestito con provisioning V2

L'utilizzo % per un deployment gestito provvisoriamente, calcolato come (PTU consumate / PTU dispiegate) x 100. Quando l'utilizzo è maggiore o uguale a 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming)
AzureOpenAIProvisionedManagedUtilizationV2 Percent Minimum, Maximum, Average Region, StreamType, ModelDeploymentName, ModelNameModelVersion PT1M No
Processed FineTuned Training Hours

Numero di ore di training elaborate in un modello OpenAI FineTuned
FineTunedTrainingHours Count Total (Sum) ApiName, ModelDeploymentName, FeatureName, UsageChannelRegion PT1M Yes
Token di completamento generati

Numero di token generati (output) da un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName.
GeneratedTokens Count Total (Sum) ApiName, ModelDeploymentName, FeatureName, UsageChannel, RegionModelVersion PT1M Yes
Token di richiesta elaborati

Numero di token di richiesta elaborati (input) in un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName.
ProcessedPromptTokens Count Total (Sum) ApiName, ModelDeploymentName, FeatureName, UsageChannel, RegionModelVersion PT1M Yes
Secondi api in tempo reale usati

Numero realtimeAPI di secondi usati
RealtimeUsageTime Count Total (Sum) Region, ModelDeploymentName PT1M Yes
Token di inferenza elaborati

Numero di token di inferenza elaborati in un modello OpenAI. Calcolato come token di richiesta (input) più token generati (output). Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName.
TokenTransaction Count Total (Sum) ApiName, ModelDeploymentName, FeatureName, UsageChannel, RegionModelVersion PT1M Yes

Categoria: Servizi cognitivi - Richieste HTTP

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Blocked Calls

Numero di chiamate che hanno superato la frequenza o il limite di quota. Non usare per Azure servizio OpenAI.
BlockedCalls Count Total (Sum) ApiName, OperationName, RegionRatelimitKey PT1M Yes
Client Errors

Numero di chiamate con errore lato client (codice di risposta HTTP 4xx). Non usare per Azure servizio OpenAI.
ClientErrors Count Total (Sum) ApiName, OperationName, RegionRatelimitKey PT1M Yes
Data In

Dimensioni dei dati in ingresso in byte. Non usare per Azure servizio OpenAI.
DataIn Bytes Total (Sum) ApiName, OperationName, Region PT1M Yes
Data Out

Dimensioni dei dati in uscita in byte. Non usare per Azure servizio OpenAI.
DataOut Bytes Total (Sum) ApiName, OperationName, Region PT1M Yes
Latency

Latenza in millisecondi. Non usare per Azure servizio OpenAI.
Latency MilliSeconds Average ApiName, OperationName, RegionRatelimitKey PT1M Yes
Ratelimit

Valore ratelimit corrente della chiave ratelimit. Non usare per Azure servizio OpenAI.
Ratelimit Count Total (Sum) Region, RatelimitKey PT1M Yes
Server Errors

Numero di chiamate con errore interno del servizio (codice di risposta HTTP 5xx). Non usare per Azure servizio OpenAI.
ServerErrors Count Total (Sum) ApiName, OperationName, RegionRatelimitKey PT1M Yes
Successful Calls

Numero di chiamate riuscite. Non usare per Azure servizio OpenAI.
SuccessfulCalls Count Total (Sum) ApiName, OperationName, RegionRatelimitKey PT1M Yes
Total Calls

Numero totale di chiamate. Non usare per Azure servizio OpenAI.
TotalCalls Count Total (Sum) ApiName, OperationName, RegionRatelimitKey PT1M Yes
Total Errors

Numero totale di chiamate con risposta di errore (codice di risposta HTTP 4xx o 5xx). Non usare per Azure servizio OpenAI.
TotalErrors Count Total (Sum) ApiName, OperationName, RegionRatelimitKey PT1M Yes
Total Token Calls

Numero totale di chiamate di token.
TotalTokenCalls Count Total (Sum) ApiName, OperationName, Region PT1M Yes

Categoria: Servizi cognitivi - SLI

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
AvailabilityRate

Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte >HTTP =500. Non usare per Azure servizio OpenAI.
SuccessRate Percent Minimum, Maximum, Average ApiName, OperationName, RegionRatelimitKey PT1M No

Categoria: Informazioni sul contenuto - Utilizzo

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Face Transactions

Numero di chiamate API effettuate al servizio Viso
FaceApiTransactions Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Minuti audio elaborati

Minuti di audio elaborato
ProcessedAudioMinutes Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Processed Pages

Numero di pagine di documenti elaborate
ProcessedDocumentPages Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Processed Images

Numero di immagini elaborate
ProcessedImageCount Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Minuti video elaborati

Minuti di video elaborati
ProcessedVideoMinutes Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Tokens

Numero di token utilizzati
Tokens Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes

Categoria: ContentSafety - Rischi&Sicurezza

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Conteggio utenti potenzialmente offensivi

Numero di utenti potenzialmente offensivi che hanno rilevato nel corso di un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: ModelDeploymentName.
RAIAbusiveUsersCount Count Total (Sum) Region, ModelDeploymentName PT1M Yes
Rilevato volume dannoso

Numero di chiamate effettuate a Azure'API OpenAI e rilevate come dannose (sia il modello di blocco che la modalità di annotazione) da parte del filtro contenuto applicato in un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType.
RAIHarmfulRequests Count Total (Sum) Region, ModelDeploymentName, ModelName, ModelVersionApiName, TextType, , CategorySeverity PT1M Yes
Blocked Volume

Numero di chiamate effettuate a Azure'API OpenAI e rifiutate dal filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType.
RAIRejectedRequests Count Total (Sum) Region, ModelDeploymentName, ModelName, ModelVersionApiName, , TextTypeCategory PT1M Yes
Evento del sistema di sicurezza

Evento di sistema per i rischi e il monitoraggio della sicurezza. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: EventType.
RAISystemEvent Count Average Region, EventType PT1M Yes
Totale volume inviato per il controllo di sicurezza

Numero di chiamate effettuate a Azure'API OpenAI e rilevate dal filtro del contenuto applicato in un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName.
RAITotalRequests Count Total (Sum) Region, ModelDeploymentName, ModelName, ModelVersionApiName PT1M Yes

Categoria: ContentSafety - Utilizzo

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Conteggio chiamate per la moderazione delle immagini

Numero di chiamate per la moderazione delle immagini.
ContentSafetyImageAnalyzeRequestCount Count Total (Sum) ApiVersion PT1M Yes
Conteggio chiamate per la moderazione del testo

Numero di chiamate per la moderazione del testo.
ContentSafetyTextAnalyzeRequestCount Count Total (Sum) ApiVersion PT1M Yes

Category: Estimations

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Conteggio eventi casuali di base

Stima per il numero di eventi casuali di base.
BaselineRandomEventCount Count Total (Sum) Mode, RunId PT1M Yes
Ricompensa casuale prevista

Stima della ricompensa casuale prevista.
BaselineRandomReward Count Total (Sum) Mode, RunId PT1M Yes
Conteggio eventi online

Stima per il conteggio degli eventi online.
OnlineEventCount Count Total (Sum) Mode, RunId PT1M Yes
Online Reward

Stima della ricompensa online.
OnlineReward Count Total (Sum) Mode, RunId PT1M Yes
Conteggio eventi baseline utente

Stima per il conteggio degli eventi di base definiti dall'utente.
UserBaselineEventCount Count Total (Sum) Mode, RunId PT1M Yes
Ricompensa di base utente

Stima per la ricompensa di base definita dall'utente.
UserBaselineReward Count Total (Sum) Mode, RunId PT1M Yes

Categoria: Occorrenze delle funzionalità

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Occorrenze delle funzionalità di azione

Numero di volte in cui viene visualizzata ogni funzionalità di azione.
ActionFeatureIdOccurrences Count Total (Sum) FeatureId, Mode, RunId PT1M Yes
Occorrenze delle funzionalità di contesto

Numero di volte in cui viene visualizzata ogni funzionalità di contesto.
ContextFeatureIdOccurrences Count Total (Sum) FeatureId, Mode, RunId PT1M Yes
Occorrenze delle funzionalità slot

Numero di volte in cui viene visualizzata ogni funzionalità dello slot.
SlotFeatureIdOccurrences Count Total (Sum) FeatureId, Mode, RunId PT1M Yes

Category: FeatureCardinality

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Cardinalità delle funzionalità in base all'azione

Cardinalità delle funzionalità in base all'azione.
FeatureCardinality_Action Count Average FeatureId, Mode, RunId PT1M Yes
Cardinalità delle funzionalità per contesto

Cardinalità delle funzionalità in base al contesto.
FeatureCardinality_Context Count Average FeatureId, Mode, RunId PT1M Yes
Cardinalità delle funzionalità per slot

Cardinalità delle funzionalità basata su slot.
FeatureCardinality_Slot Count Average FeatureId, Mode, RunId PT1M Yes

Categoria: Funzionalità per evento

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Funzionalità di azione per evento

Numero medio di funzionalità di azione per evento.
ActionFeaturesPerEvent Count Average Mode, RunId PT1M Yes
Caratteristiche del contesto per evento

Numero di funzionalità di contesto per evento.
ContextFeaturesPerEvent Count Average Mode, RunId PT1M Yes
Funzionalità slot per evento

Numero medio di funzionalità dello slot per evento.
SlotFeaturesPerEvent Count Average Mode, RunId PT1M Yes

Categoria: Lingua - Processi

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Durata processo (anteprima)

Nota: questo valore dipende principalmente dalle dimensioni di input, dal numero di documenti e dalla complessità dell'attività. Si tratta di un valore aggregato in tutte le attività del processo.
JobDuration MilliSeconds Minimum, Maximum, Average JobStatus, JobType PT1M Yes

Categoria: Modelli - Richieste HTTP

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Frequenza di disponibilità del modello

Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte >HTTP =500.
ModelAvailabilityRate Percent Minimum, Maximum, Average Region, ModelDeploymentName, ModelNameModelVersion PT1M No
Model Requests

Numero di chiamate effettuate all'API del modello in un periodo di tempo. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go.
ModelRequests Count Total (Sum) ApiName, OperationName, , StreamType, ModelDeploymentNameModelName, StatusCodeModelVersionIsSpillover, ServiceTierRequestRegionServiceTierResponse PT1M Yes

Categoria: Modelli - Latenza

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Tempo tra i token

Frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU e gestite da PTU. Per le richieste non di streaming, questo valore è una stima.
NormalizedTimeBetweenTokens MilliSeconds Maximum, Minimum, Average ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M Yes
Tempo normalizzato al primo byte

Il tempo necessario per il primo byte dei dati di risposta deve essere ricevuto dopo che la richiesta viene effettuata dal modello, normalizzata per token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per le richieste non di streaming, questo valore è una stima.
NormalizedTimeToFirstToken MilliSeconds Maximum, Minimum, Average ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M Yes
Time to Last Byte

Il tempo necessario per l'ultimo byte dei dati di risposta deve essere ricevuto dopo che la richiesta viene effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per le richieste non di streaming, questo valore è una stima.
TimeToLastByte MilliSeconds Maximum, Minimum, Average ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M Yes
Tempo di risposta

Misura di latenza consigliata (velocità di risposta). Si applica alle distribuzioni PTU e gestite da PTU. Calcolato come tempo impiegato per la prima risposta dopo che un utente invia una richiesta, come misurato dal gateway API. Questo numero aumenta man mano che le dimensioni delle richieste aumentano e/o le dimensioni dei riscontri nella cache si riducono. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion.

Nota: questa metrica è un'approssimazione come latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per le richieste non di streaming, questo valore è una stima. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata.
TimeToResponse MilliSeconds Minimum, Maximum, Average ApiName, OperationName, Region, StreamTypeModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M Yes
Token al secondo

Enumera la velocità di generazione per una determinata risposta del modello. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU e gestite da PTU. Per le richieste non di streaming, questo valore è una stima.
TokensPerSecond Count Maximum, Minimum, Average ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M Yes

Categoria: Modelli - Utilizzo

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Annotated Pages

Numero totale di pagine elaborate con annotazioni. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go.
AnnotatedPages Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes
Token di input audio

Numero di token di richiesta audio elaborati (input) in un modello OpenAI. Si applica alle distribuzioni di modelli gestiti da PTU.
AudioInputTokens Count Total (Sum) ModelDeploymentName, ModelName, ModelVersionRegion PT1M Yes
Token di output audio

Numero di token di richiesta audio generati (output) in un modello OpenAI. Si applica alle distribuzioni di modelli gestiti da PTU.
AudioOutputTokens Count Total (Sum) ModelDeploymentName, ModelName, ModelVersionRegion PT1M Yes
Richiedi token letti dalla cache

Numero totale di token letti dalla cache. Si applica alle distribuzioni di modelli di Anthropic. Superficie nella sezione utilizzo delle risposte come cache_read_input_tokens
cacheReadInputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersionContextLength PT1M Yes
Token di richiesta scritti nella cache (TTL di 1 ora)

Numero di token di richiesta usati per creare la voce di 1 ora. Si applica alle distribuzioni di modelli di Anthropic. Superficie nella sezione utilizzo delle risposte come cache_creation.ephemeral_1h_input_tokens
ephemeral1hInputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersionContextLength PT1M Yes
Token di richiesta scritti nella cache (TTL di 5 minuti)

Numero di token di richiesta usati per creare la voce della cache di 5 minuti. Si applica alle distribuzioni di modelli di Anthropic. Superficie nella sezione utilizzo delle risposte come cache_creation.ephemeral_5m_input_tokens
ephemeral5mInputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersionContextLength PT1M Yes
Generated Images

Numero totale di immagini generate. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go.
GeneratedImages Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes
Input Tokens

Numero di token di richiesta elaborati (input) in un modello. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go.
InputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes
Output Tokens

Numero di token generati (output) da un modello OpenAI. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go.
OutputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes
Provisioned Utilization

L'utilizzo % per un deployment gestito provvisoriamente, calcolato come (PTU consumate / PTU dispiegate) x 100. Quando l'utilizzo è maggiore o uguale a 100%, le chiamate vengono limitate e viene restituito il codice di errore 429.
ProvisionedUtilization Percent Minimum, Maximum, Average Region, ModelDeploymentName, ModelNameModelVersion PT1M No
Total Pages

Numero totale di pagine elaborate. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go.
TotalPages Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes
Total Tokens

Numero di token di inferenza elaborati in un modello. Calcolato come token di richiesta (input) più token generati (output). Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go.
TotalTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelNameModelVersion PT1M Yes

Categoria: Spazi dei nomi per evento

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Spazi dei nomi azione per evento

Numero medio di spazi dei nomi delle azioni per evento.
ActionNamespacesPerEvent Count Average Mode, RunId PT1M Yes
Spazi dei nomi context per evento

Numero di spazi dei nomi di contesto per evento.
ContextNamespacesPerEvent Count Average Mode, RunId PT1M Yes
Spazi dei nomi slot per evento

Numero medio di spazi dei nomi degli slot per evento.
SlotNamespacesPerEvent Count Average Mode, RunId PT1M Yes

Category: Rewards

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Ricompensa media per evento

Ricompensa media per evento.
Reward Count Average BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, ModeRunId PT1M Yes
Slot Reward

Ricompensa per slot.
SlotReward Count Average BaselineActionId, ChosenActionId, MatchesBaseline, NonDefaultRewardSlotId, SlotIndex, , ModeRunId PT1M Yes

Category: Slots

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Ricompensa complessiva dello strumento di stima previsto

Ricompensa complessiva dello strumento di stima previsto.
BaselineEstimatorOverallReward Count Average Mode, RunId PT1M Yes
Ricompensa dello slot di stima di base

Ricompensa stimata prevista per slot.
BaselineEstimatorSlotReward Count Average SlotId, SlotIndex, ModeRunId PT1M Yes
Stima casuale prevista Ricompensa complessiva

Ricompensa complessiva dello strumento di stima casuale previsto.
BaselineRandomEstimatorOverallReward Count Average Mode, RunId PT1M Yes
Ricompensa dello slot di stima casuale prevista

Ricompensa stima casuale prevista per slot.
BaselineRandomEstimatorSlotReward Count Average SlotId, SlotIndex, ModeRunId PT1M Yes
Slots

Numero di slot per evento.
NumberOfSlots Count Average Mode, RunId PT1M Yes
Premio complessivo dello strumento di stima online

Premio complessivo dello strumento di stima online.
OnlineEstimatorOverallReward Count Average Mode, RunId PT1M Yes
Premio slot di stima online

Online Estimator Reward by slot.
OnlineEstimatorSlotReward Count Average SlotId, SlotIndex, ModeRunId PT1M Yes
Slot Occurrences

Numero di volte in cui viene visualizzato ogni slot.
SlotIdOccurrences Count Total (Sum) SlotId, SlotIndex, ModeRunId PT1M Yes

Categoria: SpeechServices - Utilizzo

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Audio Seconds Batch Trascritto

Numero batch di secondi trascritti
AudioSecondsBatchTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Audio Seconds Batch Whisper Transcritto

Numero di sussurri batch trascritto
AudioSecondsBatchWhisperTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Audio Seconds Fast Transcritto

Numero rapido di secondi trascritti
AudioSecondsFastTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Audio Seconds Fast Whisper Trascritto

Numero veloce di secondi trascritti
AudioSecondsFastWhisperTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Secondi audio trascritti

Numero di secondi trascritti
AudioSecondsTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Secondi audio tradotti

Numero di secondi tradotti
AudioSecondsTranslated Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Secondi di hosting del modello Avatar

Numero di secondi.
AvatarModelHostingSeconds Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Secondi di training del modello Avatar

Numero di secondi.
AvatarModelTrainingSeconds Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Numero di profili voce

Numero di profili voce registrati. Prorated hourly.
NumberofSpeakerProfiles Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Transazioni di riconoscimento del parlante

Numero di transazioni di riconoscimento voce
SpeakerRecognitionTransactions Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Ore di hosting del modello di riconoscimento vocale

Numero di ore di hosting del modello di riconoscimento vocale
SpeechModelHostingHours Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Synthesized Characters

Numero di caratteri.
SynthesizedCharacters Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Video Seconds Sintetizzato

Numero di secondi sintetizzati
VideoSecondsSynthesized Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Token di input audio live vocale

Numero di token di input audio, esclusi i token memorizzati nella cache.
VoiceLiveAudioInputTokens Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Token di output audio live vocale

Numero di token di output audio.
VoiceLiveAudioOutputTokens Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Token di input audio memorizzati nella cache vocale

Numero di token di input audio memorizzati nella cache.
VoiceLiveCachedAudioInputTokens Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Token di input di testo memorizzati nella cache vocale

Numero di token di input di testo memorizzati nella cache.
VoiceLiveCachedTextInputTokens Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Token di input di testo live vocale

Numero di token di input di testo, esclusi i token memorizzati nella cache.
VoiceLiveTextInputTokens Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Token di output del testo live vocale

Numero di token di output di testo.
VoiceLiveTextOutputTokens Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Ore di hosting del modello vocale

Numero di ore.
VoiceModelHostingHours Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Minuti di training del modello vocale

Numero di minuti.
VoiceModelTrainingMinutes Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes

Categoria: Servizi Traduttore - Utilizzo

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Caratteri sottoposti a training (deprecato)

Numero totale di caratteri sottoposti a training.
CharactersTrained Count Total (Sum) ApiName, OperationName, Region PT1M Yes
Caratteri tradotti (deprecato)

Numero totale di caratteri nella richiesta di testo in ingresso.
CharactersTranslated Count Total (Sum) ApiName, OperationName, Region PT1M Yes
Caratteri documento tradotti

Numero di caratteri nella richiesta di traduzione dei documenti.
DocumentCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Caratteri personalizzati del documento tradotti

Numero di caratteri nella richiesta di traduzione documenti personalizzata.
DocumentCustomCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Caratteri di sincronizzazione documenti tradotti

Numero di caratteri nella richiesta di traduzione dei documenti (sincrona).
OneDocumentCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Caratteri personalizzati di sincronizzazione documenti tradotti

Numero di caratteri nella richiesta di traduzione documento personalizzata (sincrona).
OneDocumentCustomCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Caratteri di testo tradotti

Numero di caratteri nella richiesta di traduzione testuale in ingresso.
TextCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Caratteri personalizzati di testo tradotti

Numero di caratteri nella richiesta di traduzione di testo personalizzata in ingresso.
TextCustomCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Caratteri sottoposti a training del testo

Numero di caratteri sottoposti a training usando la traduzione testuale.
TextTrainedCharacters Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Secondi di app Translator Pro

Numero di secondi di utilizzo di Translator Pro App.
TranslatorProAppSeconds Seconds Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes

Category: Usage

Metric Nome nell'API REST Unit Aggregation Dimensions Time Grains DS Export
Inference Count

Conteggio inferenza del servizio Frontdoor Carnegie
CarnegieInferenceCount Count Total (Sum) Region, Modality, Category, Language, SeverityLevelUseCustomList PT1M Yes
Visione artificiale Transazioni

Numero di transazioni Visione artificiale
ComputerVisionTransactions Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Tempo di training di Visione personalizzata

Tempo di training di Visione personalizzata
CustomVisionTrainingTime Seconds Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Transazioni di Visione personalizzata

Numero di transazioni di stima di Visione personalizzata
CustomVisionTransactions Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Immagini del viso con training

Numero di immagini di cui è stato eseguito il training. 1.000 immagini con training per transazione.
FaceImagesTrained Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Faces Stored

Numero di visi archiviati, ripartiti ogni giorno. Il numero di visi archiviati viene segnalato ogni giorno.
FacesStored Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Face Transactions

Numero di chiamate API effettuate al servizio Viso
FaceTransactions Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Images Stored

Numero di immagini di Visione personalizzata archiviate.
ImagesStored Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Learned Events

Numero di eventi appresi.
LearnedEvents Count Total (Sum) IsMatchBaseline, Mode, RunId PT1M Yes
Richieste di riconoscimento vocale LUIS

Numero di richieste di riconoscimento vocale LUIS per la comprensione delle finalità
LUISSpeechRequests Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Richieste di testo LUIS

Numero di richieste di testo LUIS
LUISTextRequests Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Matched Rewards

Numero di ricompense abbinate.
MatchedRewards Count Total (Sum) Mode, RunId PT1M Yes
Eventi non attivati

Numero di eventi ignorati.
NonActivatedEvents Count Total (Sum) Mode, RunId PT1M Yes
Observed Rewards

Numero di ricompense osservate.
ObservedRewards Count Total (Sum) Mode, RunId PT1M Yes
Processed Characters

Numero di caratteri elaborati da Strumento di lettura immersiva.
ProcessedCharacters Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Record di testo sull'integrità elaborati

Numero di record di testo di integrità elaborati
ProcessedHealthTextRecords Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Processed Images

Numero di immagini elaborate
ProcessedImages Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Processed Pages

Numero di pagine elaborate
ProcessedPages Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Record di testo elaborati

Conteggio dei record di testo.
ProcessedTextRecords Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Record di testo qa

Numero di record di testo elaborati
QuestionAnsweringTextRecords Count Total (Sum) ApiName, FeatureName, UsageChannelRegion PT1M Yes
Durata sessione di riconoscimento vocale (deprecata)

Durata totale della sessione di riconoscimento vocale in secondi.
SpeechSessionDuration Seconds Total (Sum) ApiName, OperationName, Region PT1M Yes
Total Events

Numero di eventi.
TotalEvents Count Total (Sum) Mode, RunId PT1M Yes
Totale transazioni (deprecato)

Numero totale di transazioni.
TotalTransactions Count Total (Sum) <Nessuno> PT1M Yes

Metric dimensions

Per informazioni sulle dimensioni delle metriche, vedere Metriche multidimensionali.

Questo servizio ha le dimensioni seguenti associate alle relative metriche.

  • ApiName
  • FeatureName
  • ModelDeploymentName
  • ModelName
  • ModelVersion
  • OperationName
  • Region
  • StatusCode
  • StreamType
  • UsageChannel

Resource logs

Questa sezione elenca i tipi di log delle risorse che è possibile raccogliere per questo servizio. La sezione esegue il pull dall'elenco di tutti i tipi di categoria dei log delle risorse supportati in Monitoraggio di Azure.

Log delle risorse supportati per Microsoft. CognitiveServices/accounts

Category Nome visualizzato categoria Log table Supporta il piano di log di base Supporta la trasformazione in fase di inserimento Example queries Costi da esportare
Audit Audit Logs AzureDiagnostics

Log da più risorse di Azure.

No No No
AzureOpenAIRequestUsage Azure utilizzo delle richieste OpenAI AzureDiagnostics

Log da più risorse di Azure.

No No Yes
RequestResponse Log di richiesta e risposta AzureDiagnostics

Log da più risorse di Azure.

No No No
Trace Trace Logs AzureDiagnostics

Log da più risorse di Azure.

No No No

tabelle dei log Monitoraggio di Azure

Questa sezione elenca le tabelle dei log Monitoraggio di Azure rilevanti per questo servizio, disponibili per la query Log Analytics tramite query Kusto. Le tabelle contengono dati di log delle risorse e probabilmente più a seconda di ciò che viene raccolto e indirizzato a tali dati.

Azure OpenAI microsoft.cognitiveservices/accounts

Activity log

Nella tabella collegata sono elencate le operazioni che è possibile registrare nel log attività per questo servizio. Queste operazioni sono un subset di tutte le possibili operazioni del provider di risorse nel log attività.

Per altre informazioni sullo schema delle voci del log attività, vedere Schema del log attività.