Azure Comprensione del contenuto nelle quote e nei limiti del servizio Foundry Tools

Nota

Le versioni 2024-12-01-preview e 2025-05-01-preview delle API Content Understanding sono attualmente in anteprima pubblica. Queste anteprime vengono fornite senza un contratto di servizio e non sono consigliate per i carichi di lavoro di produzione. Per ulteriori informazioni, vedere Condizioni Supplementari per l'utilizzo delle versioni di anteprima di Microsoft Azure e l’Addendum sulla protezione dei dati di Microsoft Products and Services ("DPA").

Questo articolo elenca le quote e i limiti per Azure Content Understanding nel servizio Strumenti Foundry.

Limiti generali

Proprietà Limite
ID analizzatore 1-64 caratteri. Alfanumerico, punto e carattere di sottolineatura. Modello: [a-zA-Z0-9._]{1,64}
Proprietà URL ≤ 8.192 caratteri
Proprietà descrittive ≤ 1.024 caratteri
Nomi dei campi ≤ 64 caratteri. Lettere Unicode, numeri, segni di combinazione, punteggiatura, punto, trattino e sottolineatura. Modello: [\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64}
Tag ≤ 10 tag
Chiave tag ≤ 64 caratteri. Caratteri alfanumerici e + - . : = _ / caratteri. Modello: [a-zA-Z0-9+-.:=_/]{1,64}
Valore tag ≤ 256 caratteri. Caratteri alfanumerici e + - . : = _ / caratteri. Può essere vuoto. Modello: [a-zA-Z0-9+-.:=_/]{0,256}
ID di riferimento dell'immagine ≤ 256 caratteri

Limiti delle risorse

Quota Standard (S0)
Max analizzatori 100,000
Analisi massima/minuto 1.000 pagine/immagini
Quattro ore di audio
Quattro ore di video
Numero massimo di operazioni/min 3,000

Modelli generativi supportati

Content Understanding si connette ai modelli Foundry per le funzionalità generative. Il servizio aggiunge periodicamente il supporto per altri modelli. Per altre informazioni, vedere Connettere l'analizzatore Content Understanding alle distribuzioni del modello Foundry.

I modelli attualmente supportati sono:

Tipo di modello Modello Versione
Completamento chat gpt-4o 2024-08-06
Completamento chat gpt-4o 2024-11-20
Completamento chat gpt-4o-mini 2024-11-20
Completamento chat gpt-4.1 2025-04-14
Completamento chat gpt-4.1-mini 2025-04-14
Completamento chat gpt-4.1-nano 2025-04-14
Incorporamenti text-embedding-3-small
Incorporamenti text-embedding-3-large
Incorporamenti text-embedding-ada-002

Limiti dei file di input

Documento e testo

Tipi di file supportati Dimensioni file Lunghezza Contatore di estrazione
.pdf
.tiff
.jpg, .jpeg, .jpe, .png, .bmp, .heif.heic
≤ 200 MB ≤ 300 pagine Basic (OCR) o Standard (Layout)
.docx, .xlsx, , .pptx ≤ 200 MB ≤ 1M caratteri Minimo
.txt
.html, .md, , .rtf
.eml, .msg
.xml
≤ 1 MB ≤ 1M caratteri Minimo

Ilconteggio delle pagine per i file non impaginati: a scopo di fatturazione, Content Understanding usa regole equivalenti alla pagina: file di testo e file di posta elettronica (TXT, HTML, MD, XML, MSG, EML) contano 3.000 caratteri come una pagina (arrotondata). I fogli di calcolo (XLSX) contano un foglio come una pagina (inclusi i fogli nascosti). Le presentazioni (PPTX) contano una diapositiva come una pagina. Word documenti (DOCX) usano la paginazione nativa.

Nota

La modalità Pro (2025-05-01-preview) supporta attualmente solo i tipi di file .pdf, .tiff e image come input. L'input totale non può superare 100 MB e 150 pagine.

Immagine

Tipi di file supportati Dimensioni file Risoluzione
.jpg, .jpeg, .jpe, .png, .bmp, .heif.heic ≤ 200 MB Min: 50 x 50 pixel
Max: 10.000 x 10.000 pixel

Audio

Tipi di file supportati Dimensioni file Lunghezza
.wav (PCM: pcm_s8, pcm_u8, pcm_s16*, pcm_u16*, pcm_s24*, pcm_u24*, pcm_s32*, pcm_u32*, pcm_f32*, pcm_f64*)
.mp3
.mp4
.opus, .ogg (Opus)
.flac
.wma
.aac
.webm (Opus, Vorbis)
.m4a (AAC, AC-3)
Max: 300 MB Massimo: due ore

Content Understanding supporta file audio fino a 1 GB e 4 ore di durata, ma il tempo di trascrizione è notevolmente ridotto per i file da 300 MB o meno o due ore o meno.

Video

Tipi di file e risoluzione supportati

Tipi di file supportati Risoluzione
.mp4, .m4v
.flv (H.264 e AAC)
.wmv, .asf
.avi
.mkv
.mov
Min: 320 x 240 pixel
Max: 1920 x 1.080 pixel

Limiti delle dimensioni dei file

Metodo di caricamento Dimensione del file Lunghezza Descrizione
API analyzeBinary (caricamento diretto) ≤ 200 MB ≤ 30 minuti Caricare i file video direttamente nel corpo della richiesta API usando l'API analyzeBinary. L'esperienza utente di Microsoft Foundry e l'esperienza utente di Content Understanding Studio usano questo metodo.
analizzare API (riferimento del file) Massimo: 4 GB Max: Due ore Fare riferimento ai file video in base all'URL da Archiviazione BLOB di Azure o da una risorsa di archiviazione simile quando si usa l'API Analizza.

Nota

L'analisi video presenta le limitazioni seguenti:

  • API analyzeBinary: dimensioni massime del file di 200 MB e durata massima di 30 minuti durante il caricamento del video direttamente nel corpo della richiesta
  • Campionamento dei fotogrammi: analizza circa un fotogramma al secondo, il che potrebbe non catturare movimenti rapidi o eventi brevi.
  • Risoluzione: tutti i fotogrammi vengono ridimensionati a 512 x 512 pixel, che potrebbero influire sulla visibilità di piccoli dettagli o oggetti distanti

Limiti dello schema dei campi

Content Understanding supporta sia i tipi di valore di campo di base che le strutture annidate, inclusi elenchi, gruppi, tabelle e tabelle fisse.

  • Tipi di valore di campo di base: string, date, time, number, integer e boolean.
  • Campo elenco: sequenza di valori dello stesso tipo, rappresentati come matrice di campi di base nell'API.
  • Campo gruppo: set di campi correlati semanticamente, rappresentati come oggetto di campi di base nell'API.
  • Campo tabella: numero variabile di elementi con sottocampi fissi, rappresentati come matrice di oggetti di campi di base nell'API.
  • Campo tabella fissa: gruppo di campi con sottocampi condivisi, rappresentati come oggetto di oggetti di campi di base nell'API.

Limiti di base

Proprietà Documento Testo Immagine Audio Video
Numero massimo di campi 1,000 1,000 1,000 1,000 1,000
Numero massimo di categorie di campi di classificazione 300 300 300 300 300
Metodi di generazione supportati Estrarre
Generare
Classificare
Generare
Classificare
Generare
Classificare
Generare
Classificare
Generare
Classificare
  • Il limite di campi Max include tutti i campi denominati. Ad esempio, un elenco di stringhe viene conteggiato come un campo, mentre un gruppo con campi secondari stringa e numero viene conteggiato come tre campi.
  • Il limite Max classify field categories è il numero totale di categorie in tutti i campi che usano il classify metodo di generazione.

Limiti dell'origine delle informazioni

Digitare Limiti
Dati di training Solo documenti
Totale di 1 GB
50.000 pagine/immagini totali

Limiti di segmentazione e classificazione

Nota

Questi limiti si applicano alla segmentazione e alla classificazione di Content Understanding stessa. Non si applicano alla classificazione dei campi all'interno della funzionalità di estrazione.

Proprietà Limite
Nome categoria Non è possibile iniziare con un segno di dollaro ($).
Nome e descrizione della categoria Massimo 120 caratteri per il nome combinato e la descrizione in ogni categoria.
Numero di categorie 200 per analizzatore per documenti, 1 per video.
Classificazione gerarchica Cinque livelli per i documenti, due livelli per i video