Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Visualizzazione attualmente:Versione del portale - Foundry (versione classica)Passare alla versione per il nuovo portale foundry
Questo articolo contiene tutte le informazioni di riferimento sul monitoraggio per questo servizio.
Vedere Monitor Azure OpenAI per informazioni dettagliate sui dati che è possibile raccogliere per Azure OpenAI in Microsoft Foundry Models e su come usarli.
Metrics
Questa sezione elenca tutte le metriche della piattaforma raccolte automaticamente per questo servizio. Queste metriche fanno anche parte dell'elenco globale di tutte le metriche della piattaforma supportate in Monitoraggio di Azure.
Per informazioni sulla conservazione delle metriche, vedere panoramica Monitoraggio di Azure Metrics.
Metriche supportate per Microsoft. CognitiveServices/accounts
Di seguito sono riportate le metriche più importanti che è consigliabile monitorare per Azure OpenAI. Più avanti in questo articolo è riportato un elenco più lungo di tutte le metriche disponibili per questo spazio dei nomi che contiene altri dettagli sulle metriche in questo elenco più breve. Per informazioni più aggiornate, vedere di seguito. È in corso l'aggiornamento delle tabelle nelle sezioni seguenti.
- Azure richieste OpenAI
- Active Tokens
- Token di completamento generati
- Processed FineTuned Training Hours
- Token di inferenza elaborati
- Token di richiesta elaborati
- Utilizzo gestito con provisioning V2
- Frequenza di corrispondenza della cache dei token di richiesta
- Tempo di risposta
- Tempo tra i token
- Time to Last Byte
- Tempo normalizzato al primo byte
- Token al secondo
È anche possibile monitorare le metriche di Sicurezza del contenuto usate da altri servizi correlati.
- Blocked Volume
- Rilevato volume dannoso
- Potenziale conteggio utenti offensivi
- Evento del sistema di sicurezza
- Totale volume inviato per il controllo di sicurezza
Note
La metrica Utilizzo gestito con provisioning è ora deprecata e non è più consigliata. Questa metrica è stata sostituita dalla metrica Utilizzo gestito con provisioning V2 . I token al secondo, il tempo di risposta, il tempo tra i token non sono attualmente disponibili per le distribuzioni Standard.
Le metriche di Servizi cognitivi hanno la categoria Servizi cognitivi - Richieste HTTP nella tabella seguente. Queste metriche sono metriche legacy comuni a tutte le risorse di questo tipo. Microsoft non consiglia più di usare queste metriche con Azure OpenAI.
Nella tabella seguente sono elencate le metriche disponibili per il Microsoft. Tipo di risorsa CognitiveServices/accounts.
- Tutte le colonne potrebbero non essere presenti in ogni tabella.
- Alcune colonne potrebbero superare l'area di visualizzazione della pagina. Selezionare Espandi tabella per visualizzare tutte le colonne disponibili.
Table headings
- Categoria : gruppo o classificazione delle metriche.
- Metric: nome visualizzato della metrica visualizzato nel portale di Azure.
- Nome nell'API REST : nome della metrica indicato nell'API REST.
- Unità - Unità di misura.
- Aggregazione : tipo di aggregazione predefinito. Valori validi: Average (Avg), Minimum (Min), Maximum (Max), Total (Sum), Count.
- Dimensioni - Dimensioni disponibili per la metrica.
-
Grani - di tempoIntervalli in cui viene campionata la metrica. Ad esempio,
PT1Mindica che la metrica viene campionata ogni minuto,PT30Mogni 30 minuti,PT1Hogni ora e così via. - DS Export- Indica se la metrica è esportabile nei log Monitoraggio di Azure tramite le impostazioni di diagnostica. Per informazioni sull'esportazione delle metriche, vedere Creare le impostazioni di diagnostica in Monitoraggio di Azure.
Category: Actions
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Action Occurences Numero di volte in cui viene visualizzata ogni azione. |
ActionIdOccurrences |
Count | Total (Sum) |
ActionId, Mode, RunId |
PT1M | Yes |
|
Azioni per evento Numero di azioni per evento. |
ActionsPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
Categoria: Azure OpenAI - Richieste HTTP
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Azure OpenAI AvailabilityRate Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte >HTTP =500. |
AzureOpenAIAvailabilityRate |
Percent | Minimum, Maximum, Average |
ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion |
PT1M | No |
|
Azure Richieste OpenAI Numero di chiamate effettuate all'API OpenAI Azure per un periodo di tempo. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion, StatusCode (esito positivo, clienterrors, errori del server), IsSpillover per informazioni di spillover, ServiceTier, StreamType (Streaming e richieste non di streaming) e operazione. |
AzureOpenAIRequests |
Count | Total (Sum) |
ApiName, OperationName, , StreamType, ModelDeploymentNameModelName, StatusCodeModelVersionIsSpillover, ServiceTierRequestRegionServiceTierResponse |
PT1M | Yes |
Categoria: Azure OpenAI - Latenza
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Tempo compreso tra il token Per le richieste di streaming; frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
AzureOpenAINormalizedTBTInMS |
MilliSeconds | Maximum, Minimum, Average |
Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
|
Tempo normalizzato al primo byte Per le richieste di streaming e non di streaming; tempo necessario per il primo byte dei dati di risposta dopo che la richiesta viene effettuata dal modello, normalizzata per token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
AzureOpenAINormalizedTTFTInMS |
MilliSeconds | Maximum, Minimum, Average |
Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
|
Tempo di risposta Misura di latenza consigliata (velocità di risposta) per le richieste di streaming. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Calcolato come tempo impiegato per la prima risposta dopo che un utente invia una richiesta, come misurato dal gateway API. Questo numero aumenta man mano che le dimensioni delle richieste aumentano e/o le dimensioni dei riscontri nella cache si riducono. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. Nota: questa metrica è un'approssimazione come latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata. |
AzureOpenAITimeToResponse |
MilliSeconds | Minimum, Maximum, Average |
ApiName, OperationName, Region, StreamTypeModelDeploymentName, ModelName, , ModelVersionStatusCode |
PT1M | Yes |
|
Token al secondo Enumera la velocità di generazione per una determinata risposta Azure modello OpenAI. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
AzureOpenAITokenPerSecond |
Count | Maximum, Minimum, Average |
Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
|
Time to Last Byte Per le richieste di streaming e non di streaming; tempo necessario per ricevere l'ultimo byte dei dati di risposta dopo che la richiesta viene effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. |
AzureOpenAITTLTInMS |
MilliSeconds | Maximum, Minimum, Average |
Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
Categoria: Azure OpenAI - Utilizzo
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Active Tokens Token totali meno token memorizzati nella cache in un periodo di tempo. Si applica alle distribuzioni PTU e gestite da PTU. Usare questa metrica per comprendere l'utilizzo basato su TPS o TPM per i PTU e confrontare i benchmark per i TPM o tps di destinazione per gli scenari. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. |
ActiveTokens |
Count | Minimum, Maximum, Average, Total (Sum) |
Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
|
Token di completamento audio Numero di token di richiesta audio generati (output) in un modello OpenAI. Si applica alle distribuzioni di modelli con pagamento in base al consumo e gestite da PTU. |
AudioCompletionTokens |
Count | Total (Sum) |
ModelDeploymentName, ModelName, ModelVersionRegion |
PT1M | Yes |
|
Token di richiesta audio Numero di token di richiesta audio elaborati (input) in un modello OpenAI. Si applica alle distribuzioni di modelli con pagamento in base al consumo e gestite da PTU. |
AudioPromptTokens |
Count | Total (Sum) |
ModelDeploymentName, ModelName, ModelVersionRegion |
PT1M | Yes |
|
Frequenza di corrispondenza della cache dei token di richiesta Percentuale di token di richiesta che raggiungono la cache. Si applica alle distribuzioni PTU e gestite da PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Percent | Minimum, Maximum, Average |
Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | No |
|
Utilizzo gestito con provisioning (deprecato) L'utilizzo % per un deployment gestito provvisoriamente, calcolato come (PTU consumate / PTU dispiegate) x 100. Quando l'utilizzo è maggiore o uguale a 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming) |
AzureOpenAIProvisionedManagedUtilization |
Percent | Minimum, Maximum, Average |
Region, StreamType, ModelDeploymentName, ModelNameModelVersion |
PT1M | No |
|
Utilizzo gestito con provisioning V2 L'utilizzo % per un deployment gestito provvisoriamente, calcolato come (PTU consumate / PTU dispiegate) x 100. Quando l'utilizzo è maggiore o uguale a 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Percent | Minimum, Maximum, Average |
Region, StreamType, ModelDeploymentName, ModelNameModelVersion |
PT1M | No |
|
Processed FineTuned Training Hours Numero di ore di training elaborate in un modello OpenAI FineTuned |
FineTunedTrainingHours |
Count | Total (Sum) |
ApiName, ModelDeploymentName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Token di completamento generati Numero di token generati (output) da un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName. |
GeneratedTokens |
Count | Total (Sum) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, RegionModelVersion |
PT1M | Yes |
|
Token di richiesta elaborati Numero di token di richiesta elaborati (input) in un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName. |
ProcessedPromptTokens |
Count | Total (Sum) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, RegionModelVersion |
PT1M | Yes |
|
Secondi api in tempo reale usati Numero realtimeAPI di secondi usati |
RealtimeUsageTime |
Count | Total (Sum) |
Region, ModelDeploymentName |
PT1M | Yes |
|
Token di inferenza elaborati Numero di token di inferenza elaborati in un modello OpenAI. Calcolato come token di richiesta (input) più token generati (output). Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName. |
TokenTransaction |
Count | Total (Sum) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, RegionModelVersion |
PT1M | Yes |
Categoria: Servizi cognitivi - Richieste HTTP
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Blocked Calls Numero di chiamate che hanno superato la frequenza o il limite di quota. Non usare per Azure servizio OpenAI. |
BlockedCalls |
Count | Total (Sum) |
ApiName, OperationName, RegionRatelimitKey |
PT1M | Yes |
|
Client Errors Numero di chiamate con errore lato client (codice di risposta HTTP 4xx). Non usare per Azure servizio OpenAI. |
ClientErrors |
Count | Total (Sum) |
ApiName, OperationName, RegionRatelimitKey |
PT1M | Yes |
|
Data In Dimensioni dei dati in ingresso in byte. Non usare per Azure servizio OpenAI. |
DataIn |
Bytes | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Data Out Dimensioni dei dati in uscita in byte. Non usare per Azure servizio OpenAI. |
DataOut |
Bytes | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Latency Latenza in millisecondi. Non usare per Azure servizio OpenAI. |
Latency |
MilliSeconds | Average |
ApiName, OperationName, RegionRatelimitKey |
PT1M | Yes |
|
Ratelimit Valore ratelimit corrente della chiave ratelimit. Non usare per Azure servizio OpenAI. |
Ratelimit |
Count | Total (Sum) |
Region, RatelimitKey |
PT1M | Yes |
|
Server Errors Numero di chiamate con errore interno del servizio (codice di risposta HTTP 5xx). Non usare per Azure servizio OpenAI. |
ServerErrors |
Count | Total (Sum) |
ApiName, OperationName, RegionRatelimitKey |
PT1M | Yes |
|
Successful Calls Numero di chiamate riuscite. Non usare per Azure servizio OpenAI. |
SuccessfulCalls |
Count | Total (Sum) |
ApiName, OperationName, RegionRatelimitKey |
PT1M | Yes |
|
Total Calls Numero totale di chiamate. Non usare per Azure servizio OpenAI. |
TotalCalls |
Count | Total (Sum) |
ApiName, OperationName, RegionRatelimitKey |
PT1M | Yes |
|
Total Errors Numero totale di chiamate con risposta di errore (codice di risposta HTTP 4xx o 5xx). Non usare per Azure servizio OpenAI. |
TotalErrors |
Count | Total (Sum) |
ApiName, OperationName, RegionRatelimitKey |
PT1M | Yes |
|
Total Token Calls Numero totale di chiamate di token. |
TotalTokenCalls |
Count | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
Categoria: Servizi cognitivi - SLI
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
AvailabilityRate Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte >HTTP =500. Non usare per Azure servizio OpenAI. |
SuccessRate |
Percent | Minimum, Maximum, Average |
ApiName, OperationName, RegionRatelimitKey |
PT1M | No |
Categoria: Informazioni sul contenuto - Utilizzo
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Face Transactions Numero di chiamate API effettuate al servizio Viso |
FaceApiTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Minuti audio elaborati Minuti di audio elaborato |
ProcessedAudioMinutes |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Processed Pages Numero di pagine di documenti elaborate |
ProcessedDocumentPages |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Processed Images Numero di immagini elaborate |
ProcessedImageCount |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Minuti video elaborati Minuti di video elaborati |
ProcessedVideoMinutes |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Tokens Numero di token utilizzati |
Tokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
Categoria: ContentSafety - Rischi&Sicurezza
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Conteggio utenti potenzialmente offensivi Numero di utenti potenzialmente offensivi che hanno rilevato nel corso di un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: ModelDeploymentName. |
RAIAbusiveUsersCount |
Count | Total (Sum) |
Region, ModelDeploymentName |
PT1M | Yes |
|
Rilevato volume dannoso Numero di chiamate effettuate a Azure'API OpenAI e rilevate come dannose (sia il modello di blocco che la modalità di annotazione) da parte del filtro contenuto applicato in un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType. |
RAIHarmfulRequests |
Count | Total (Sum) |
Region, ModelDeploymentName, ModelName, ModelVersionApiName, TextType, , CategorySeverity |
PT1M | Yes |
|
Blocked Volume Numero di chiamate effettuate a Azure'API OpenAI e rifiutate dal filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType. |
RAIRejectedRequests |
Count | Total (Sum) |
Region, ModelDeploymentName, ModelName, ModelVersionApiName, , TextTypeCategory |
PT1M | Yes |
|
Evento del sistema di sicurezza Evento di sistema per i rischi e il monitoraggio della sicurezza. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: EventType. |
RAISystemEvent |
Count | Average |
Region, EventType |
PT1M | Yes |
|
Totale volume inviato per il controllo di sicurezza Numero di chiamate effettuate a Azure'API OpenAI e rilevate dal filtro del contenuto applicato in un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName. |
RAITotalRequests |
Count | Total (Sum) |
Region, ModelDeploymentName, ModelName, ModelVersionApiName |
PT1M | Yes |
Categoria: ContentSafety - Utilizzo
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Conteggio chiamate per la moderazione delle immagini Numero di chiamate per la moderazione delle immagini. |
ContentSafetyImageAnalyzeRequestCount |
Count | Total (Sum) | ApiVersion |
PT1M | Yes |
|
Conteggio chiamate per la moderazione del testo Numero di chiamate per la moderazione del testo. |
ContentSafetyTextAnalyzeRequestCount |
Count | Total (Sum) | ApiVersion |
PT1M | Yes |
Category: Estimations
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Conteggio eventi casuali di base Stima per il numero di eventi casuali di base. |
BaselineRandomEventCount |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Ricompensa casuale prevista Stima della ricompensa casuale prevista. |
BaselineRandomReward |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Conteggio eventi online Stima per il conteggio degli eventi online. |
OnlineEventCount |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Online Reward Stima della ricompensa online. |
OnlineReward |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Conteggio eventi baseline utente Stima per il conteggio degli eventi di base definiti dall'utente. |
UserBaselineEventCount |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Ricompensa di base utente Stima per la ricompensa di base definita dall'utente. |
UserBaselineReward |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
Categoria: Occorrenze delle funzionalità
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Occorrenze delle funzionalità di azione Numero di volte in cui viene visualizzata ogni funzionalità di azione. |
ActionFeatureIdOccurrences |
Count | Total (Sum) |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Occorrenze delle funzionalità di contesto Numero di volte in cui viene visualizzata ogni funzionalità di contesto. |
ContextFeatureIdOccurrences |
Count | Total (Sum) |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Occorrenze delle funzionalità slot Numero di volte in cui viene visualizzata ogni funzionalità dello slot. |
SlotFeatureIdOccurrences |
Count | Total (Sum) |
FeatureId, Mode, RunId |
PT1M | Yes |
Category: FeatureCardinality
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Cardinalità delle funzionalità in base all'azione Cardinalità delle funzionalità in base all'azione. |
FeatureCardinality_Action |
Count | Average |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Cardinalità delle funzionalità per contesto Cardinalità delle funzionalità in base al contesto. |
FeatureCardinality_Context |
Count | Average |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Cardinalità delle funzionalità per slot Cardinalità delle funzionalità basata su slot. |
FeatureCardinality_Slot |
Count | Average |
FeatureId, Mode, RunId |
PT1M | Yes |
Categoria: Funzionalità per evento
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Funzionalità di azione per evento Numero medio di funzionalità di azione per evento. |
ActionFeaturesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Caratteristiche del contesto per evento Numero di funzionalità di contesto per evento. |
ContextFeaturesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Funzionalità slot per evento Numero medio di funzionalità dello slot per evento. |
SlotFeaturesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
Categoria: Lingua - Processi
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Durata processo (anteprima) Nota: questo valore dipende principalmente dalle dimensioni di input, dal numero di documenti e dalla complessità dell'attività. Si tratta di un valore aggregato in tutte le attività del processo. |
JobDuration |
MilliSeconds | Minimum, Maximum, Average |
JobStatus, JobType |
PT1M | Yes |
Categoria: Modelli - Richieste HTTP
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Frequenza di disponibilità del modello Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte >HTTP =500. |
ModelAvailabilityRate |
Percent | Minimum, Maximum, Average |
Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | No |
|
Model Requests Numero di chiamate effettuate all'API del modello in un periodo di tempo. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go. |
ModelRequests |
Count | Total (Sum) |
ApiName, OperationName, , StreamType, ModelDeploymentNameModelName, StatusCodeModelVersionIsSpillover, ServiceTierRequestRegionServiceTierResponse |
PT1M | Yes |
Categoria: Modelli - Latenza
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Tempo tra i token Frequenza di generazione dei token del modello, misurata in millisecondi. Si applica alle distribuzioni PTU e gestite da PTU. Per le richieste non di streaming, questo valore è una stima. |
NormalizedTimeBetweenTokens |
MilliSeconds | Maximum, Minimum, Average |
ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion |
PT1M | Yes |
|
Tempo normalizzato al primo byte Il tempo necessario per il primo byte dei dati di risposta deve essere ricevuto dopo che la richiesta viene effettuata dal modello, normalizzata per token. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per le richieste non di streaming, questo valore è una stima. |
NormalizedTimeToFirstToken |
MilliSeconds | Maximum, Minimum, Average |
ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion |
PT1M | Yes |
|
Time to Last Byte Il tempo necessario per l'ultimo byte dei dati di risposta deve essere ricevuto dopo che la richiesta viene effettuata dal modello. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per le richieste non di streaming, questo valore è una stima. |
TimeToLastByte |
MilliSeconds | Maximum, Minimum, Average |
ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion |
PT1M | Yes |
|
Tempo di risposta Misura di latenza consigliata (velocità di risposta). Si applica alle distribuzioni PTU e gestite da PTU. Calcolato come tempo impiegato per la prima risposta dopo che un utente invia una richiesta, come misurato dal gateway API. Questo numero aumenta man mano che le dimensioni delle richieste aumentano e/o le dimensioni dei riscontri nella cache si riducono. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. Nota: questa metrica è un'approssimazione come latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per le richieste non di streaming, questo valore è una stima. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata. |
TimeToResponse |
MilliSeconds | Minimum, Maximum, Average |
ApiName, OperationName, Region, StreamTypeModelDeploymentName, ModelName, , ModelVersionStatusCode |
PT1M | Yes |
|
Token al secondo Enumera la velocità di generazione per una determinata risposta del modello. I token totali generati vengono divisi per il tempo necessario per generare i token, in secondi. Si applica alle distribuzioni PTU e gestite da PTU. Per le richieste non di streaming, questo valore è una stima. |
TokensPerSecond |
Count | Maximum, Minimum, Average |
ApiName, OperationName, Region, StreamTypeModelDeploymentName, , ModelNameModelVersion |
PT1M | Yes |
Categoria: Modelli - Utilizzo
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Annotated Pages Numero totale di pagine elaborate con annotazioni. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go. |
AnnotatedPages |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
|
Token di input audio Numero di token di richiesta audio elaborati (input) in un modello OpenAI. Si applica alle distribuzioni di modelli gestiti da PTU. |
AudioInputTokens |
Count | Total (Sum) |
ModelDeploymentName, ModelName, ModelVersionRegion |
PT1M | Yes |
|
Token di output audio Numero di token di richiesta audio generati (output) in un modello OpenAI. Si applica alle distribuzioni di modelli gestiti da PTU. |
AudioOutputTokens |
Count | Total (Sum) |
ModelDeploymentName, ModelName, ModelVersionRegion |
PT1M | Yes |
|
Richiedi token letti dalla cache Numero totale di token letti dalla cache. Si applica alle distribuzioni di modelli di Anthropic. Superficie nella sezione utilizzo delle risposte come cache_read_input_tokens |
cacheReadInputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersionContextLength |
PT1M | Yes |
|
Token di richiesta scritti nella cache (TTL di 1 ora) Numero di token di richiesta usati per creare la voce di 1 ora. Si applica alle distribuzioni di modelli di Anthropic. Superficie nella sezione utilizzo delle risposte come cache_creation.ephemeral_1h_input_tokens |
ephemeral1hInputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersionContextLength |
PT1M | Yes |
|
Token di richiesta scritti nella cache (TTL di 5 minuti) Numero di token di richiesta usati per creare la voce della cache di 5 minuti. Si applica alle distribuzioni di modelli di Anthropic. Superficie nella sezione utilizzo delle risposte come cache_creation.ephemeral_5m_input_tokens |
ephemeral5mInputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersionContextLength |
PT1M | Yes |
|
Generated Images Numero totale di immagini generate. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go. |
GeneratedImages |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
|
Input Tokens Numero di token di richiesta elaborati (input) in un modello. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go. |
InputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
|
Output Tokens Numero di token generati (output) da un modello OpenAI. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go. |
OutputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
|
Provisioned Utilization L'utilizzo % per un deployment gestito provvisoriamente, calcolato come (PTU consumate / PTU dispiegate) x 100. Quando l'utilizzo è maggiore o uguale a 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. |
ProvisionedUtilization |
Percent | Minimum, Maximum, Average |
Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | No |
|
Total Pages Numero totale di pagine elaborate. Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go. |
TotalPages |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
|
Total Tokens Numero di token di inferenza elaborati in un modello. Calcolato come token di richiesta (input) più token generati (output). Si applica a PTU, PTU-Managed e implementazioni Pay-as-you-go. |
TotalTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelNameModelVersion |
PT1M | Yes |
Categoria: Spazi dei nomi per evento
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Spazi dei nomi azione per evento Numero medio di spazi dei nomi delle azioni per evento. |
ActionNamespacesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Spazi dei nomi context per evento Numero di spazi dei nomi di contesto per evento. |
ContextNamespacesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Spazi dei nomi slot per evento Numero medio di spazi dei nomi degli slot per evento. |
SlotNamespacesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
Category: Rewards
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Ricompensa media per evento Ricompensa media per evento. |
Reward |
Count | Average |
BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, ModeRunId |
PT1M | Yes |
|
Slot Reward Ricompensa per slot. |
SlotReward |
Count | Average |
BaselineActionId, ChosenActionId, MatchesBaseline, NonDefaultRewardSlotId, SlotIndex, , ModeRunId |
PT1M | Yes |
Category: Slots
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Ricompensa complessiva dello strumento di stima previsto Ricompensa complessiva dello strumento di stima previsto. |
BaselineEstimatorOverallReward |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Ricompensa dello slot di stima di base Ricompensa stimata prevista per slot. |
BaselineEstimatorSlotReward |
Count | Average |
SlotId, SlotIndex, ModeRunId |
PT1M | Yes |
|
Stima casuale prevista Ricompensa complessiva Ricompensa complessiva dello strumento di stima casuale previsto. |
BaselineRandomEstimatorOverallReward |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Ricompensa dello slot di stima casuale prevista Ricompensa stima casuale prevista per slot. |
BaselineRandomEstimatorSlotReward |
Count | Average |
SlotId, SlotIndex, ModeRunId |
PT1M | Yes |
|
Slots Numero di slot per evento. |
NumberOfSlots |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Premio complessivo dello strumento di stima online Premio complessivo dello strumento di stima online. |
OnlineEstimatorOverallReward |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Premio slot di stima online Online Estimator Reward by slot. |
OnlineEstimatorSlotReward |
Count | Average |
SlotId, SlotIndex, ModeRunId |
PT1M | Yes |
|
Slot Occurrences Numero di volte in cui viene visualizzato ogni slot. |
SlotIdOccurrences |
Count | Total (Sum) |
SlotId, SlotIndex, ModeRunId |
PT1M | Yes |
Categoria: SpeechServices - Utilizzo
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Audio Seconds Batch Trascritto Numero batch di secondi trascritti |
AudioSecondsBatchTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Audio Seconds Batch Whisper Transcritto Numero di sussurri batch trascritto |
AudioSecondsBatchWhisperTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Audio Seconds Fast Transcritto Numero rapido di secondi trascritti |
AudioSecondsFastTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Audio Seconds Fast Whisper Trascritto Numero veloce di secondi trascritti |
AudioSecondsFastWhisperTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Secondi audio trascritti Numero di secondi trascritti |
AudioSecondsTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Secondi audio tradotti Numero di secondi tradotti |
AudioSecondsTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Secondi di hosting del modello Avatar Numero di secondi. |
AvatarModelHostingSeconds |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Secondi di training del modello Avatar Numero di secondi. |
AvatarModelTrainingSeconds |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Numero di profili voce Numero di profili voce registrati. Prorated hourly. |
NumberofSpeakerProfiles |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Transazioni di riconoscimento del parlante Numero di transazioni di riconoscimento voce |
SpeakerRecognitionTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Ore di hosting del modello di riconoscimento vocale Numero di ore di hosting del modello di riconoscimento vocale |
SpeechModelHostingHours |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Synthesized Characters Numero di caratteri. |
SynthesizedCharacters |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Video Seconds Sintetizzato Numero di secondi sintetizzati |
VideoSecondsSynthesized |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Token di input audio live vocale Numero di token di input audio, esclusi i token memorizzati nella cache. |
VoiceLiveAudioInputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Token di output audio live vocale Numero di token di output audio. |
VoiceLiveAudioOutputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Token di input audio memorizzati nella cache vocale Numero di token di input audio memorizzati nella cache. |
VoiceLiveCachedAudioInputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Token di input di testo memorizzati nella cache vocale Numero di token di input di testo memorizzati nella cache. |
VoiceLiveCachedTextInputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Token di input di testo live vocale Numero di token di input di testo, esclusi i token memorizzati nella cache. |
VoiceLiveTextInputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Token di output del testo live vocale Numero di token di output di testo. |
VoiceLiveTextOutputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Ore di hosting del modello vocale Numero di ore. |
VoiceModelHostingHours |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Minuti di training del modello vocale Numero di minuti. |
VoiceModelTrainingMinutes |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
Categoria: Servizi Traduttore - Utilizzo
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Caratteri sottoposti a training (deprecato) Numero totale di caratteri sottoposti a training. |
CharactersTrained |
Count | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Caratteri tradotti (deprecato) Numero totale di caratteri nella richiesta di testo in ingresso. |
CharactersTranslated |
Count | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Caratteri documento tradotti Numero di caratteri nella richiesta di traduzione dei documenti. |
DocumentCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Caratteri personalizzati del documento tradotti Numero di caratteri nella richiesta di traduzione documenti personalizzata. |
DocumentCustomCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Caratteri di sincronizzazione documenti tradotti Numero di caratteri nella richiesta di traduzione dei documenti (sincrona). |
OneDocumentCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Caratteri personalizzati di sincronizzazione documenti tradotti Numero di caratteri nella richiesta di traduzione documento personalizzata (sincrona). |
OneDocumentCustomCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Caratteri di testo tradotti Numero di caratteri nella richiesta di traduzione testuale in ingresso. |
TextCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Caratteri personalizzati di testo tradotti Numero di caratteri nella richiesta di traduzione di testo personalizzata in ingresso. |
TextCustomCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Caratteri sottoposti a training del testo Numero di caratteri sottoposti a training usando la traduzione testuale. |
TextTrainedCharacters |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Secondi di app Translator Pro Numero di secondi di utilizzo di Translator Pro App. |
TranslatorProAppSeconds |
Seconds | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
Category: Usage
| Metric | Nome nell'API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Inference Count Conteggio inferenza del servizio Frontdoor Carnegie |
CarnegieInferenceCount |
Count | Total (Sum) |
Region, Modality, Category, Language, SeverityLevelUseCustomList |
PT1M | Yes |
|
Visione artificiale Transazioni Numero di transazioni Visione artificiale |
ComputerVisionTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Tempo di training di Visione personalizzata Tempo di training di Visione personalizzata |
CustomVisionTrainingTime |
Seconds | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Transazioni di Visione personalizzata Numero di transazioni di stima di Visione personalizzata |
CustomVisionTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Immagini del viso con training Numero di immagini di cui è stato eseguito il training. 1.000 immagini con training per transazione. |
FaceImagesTrained |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Faces Stored Numero di visi archiviati, ripartiti ogni giorno. Il numero di visi archiviati viene segnalato ogni giorno. |
FacesStored |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Face Transactions Numero di chiamate API effettuate al servizio Viso |
FaceTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Images Stored Numero di immagini di Visione personalizzata archiviate. |
ImagesStored |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Learned Events Numero di eventi appresi. |
LearnedEvents |
Count | Total (Sum) |
IsMatchBaseline, Mode, RunId |
PT1M | Yes |
|
Richieste di riconoscimento vocale LUIS Numero di richieste di riconoscimento vocale LUIS per la comprensione delle finalità |
LUISSpeechRequests |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Richieste di testo LUIS Numero di richieste di testo LUIS |
LUISTextRequests |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Matched Rewards Numero di ricompense abbinate. |
MatchedRewards |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Eventi non attivati Numero di eventi ignorati. |
NonActivatedEvents |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Observed Rewards Numero di ricompense osservate. |
ObservedRewards |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Processed Characters Numero di caratteri elaborati da Strumento di lettura immersiva. |
ProcessedCharacters |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Record di testo sull'integrità elaborati Numero di record di testo di integrità elaborati |
ProcessedHealthTextRecords |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Processed Images Numero di immagini elaborate |
ProcessedImages |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Processed Pages Numero di pagine elaborate |
ProcessedPages |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Record di testo elaborati Conteggio dei record di testo. |
ProcessedTextRecords |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Record di testo qa Numero di record di testo elaborati |
QuestionAnsweringTextRecords |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannelRegion |
PT1M | Yes |
|
Durata sessione di riconoscimento vocale (deprecata) Durata totale della sessione di riconoscimento vocale in secondi. |
SpeechSessionDuration |
Seconds | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Total Events Numero di eventi. |
TotalEvents |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Totale transazioni (deprecato) Numero totale di transazioni. |
TotalTransactions |
Count | Total (Sum) | <Nessuno> | PT1M | Yes |
Metric dimensions
Per informazioni sulle dimensioni delle metriche, vedere Metriche multidimensionali.
Questo servizio ha le dimensioni seguenti associate alle relative metriche.
- ApiName
- FeatureName
- ModelDeploymentName
- ModelName
- ModelVersion
- OperationName
- Region
- StatusCode
- StreamType
- UsageChannel
Resource logs
Questa sezione elenca i tipi di log delle risorse che è possibile raccogliere per questo servizio. La sezione esegue il pull dall'elenco di tutti i tipi di categoria dei log delle risorse supportati in Monitoraggio di Azure.
Log delle risorse supportati per Microsoft. CognitiveServices/accounts
| Category | Nome visualizzato categoria | Log table | Supporta il piano di log di base | Supporta la trasformazione in fase di inserimento | Example queries | Costi da esportare |
|---|---|---|---|---|---|---|
Audit |
Audit Logs |
AzureDiagnostics Log da più risorse di Azure. |
No | No | No | |
AzureOpenAIRequestUsage |
Azure utilizzo delle richieste OpenAI |
AzureDiagnostics Log da più risorse di Azure. |
No | No | Yes | |
RequestResponse |
Log di richiesta e risposta |
AzureDiagnostics Log da più risorse di Azure. |
No | No | No | |
Trace |
Trace Logs |
AzureDiagnostics Log da più risorse di Azure. |
No | No | No |
tabelle dei log Monitoraggio di Azure
Questa sezione elenca le tabelle dei log Monitoraggio di Azure rilevanti per questo servizio, disponibili per la query Log Analytics tramite query Kusto. Le tabelle contengono dati di log delle risorse e probabilmente più a seconda di ciò che viene raccolto e indirizzato a tali dati.
Azure OpenAI microsoft.cognitiveservices/accounts
Activity log
Nella tabella collegata sono elencate le operazioni che è possibile registrare nel log attività per questo servizio. Queste operazioni sono un subset di tutte le possibili operazioni del provider di risorse nel log attività.
Per altre informazioni sullo schema delle voci del log attività, vedere Schema del log attività.
Related content
- Vedere Monitor Azure OpenAI per una descrizione del monitoraggio Azure OpenAI.
- Per informazioni dettagliate sul monitoraggio delle risorse Azure, vedere Monitor Azure risorse con Monitoraggio di Azure.