Compreensão de Conteúdo do Azure nas quotas e limites de serviço do Foundry Tools

Nota

APIs de entendimento de conteúdo 2024-12-01-preview e 2025-05-01-preview estão atualmente em pré-visualização pública. Estas prévias são fornecidas sem um acordo de nível de serviço e não são recomendadas para cargas de trabalho em produção. Para mais informações, consulte Termos Suplementares de Utilização para Versões de Pré-visualização do Microsoft Azure e o Aditamento de Proteção de Dados para Produtos e Serviços da Microsoft ("DPA").

Este artigo lista as quotas e limites para o serviço Azure Content Understanding no Foundry Tools.

Limites gerais

Propriedade Limite
ID do Analisador 1-64 caracteres. Alfanumérico, ponto e sublinhado. Padrão: [a-zA-Z0-9._]{1,64}
Propriedades da URL ≤ 8.192 caracteres
Propriedades da descrição ≤ 1.024 caracteres
Nomes dos campos ≤ 64 caracteres. Letras Unicode, números, marcas de combinação, pontuação de ligação, ponto final, hífen e sublinhado. Padrão: [\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64}
Etiquetas ≤ 10 etiquetas
Chave da etiqueta ≤ 64 caracteres. Alfanuméricos e + - . : = _ / caracteres. Padrão: [a-zA-Z0-9+-.:=_/]{1,64}
Valor da etiqueta ≤ 256 caracteres. Alfanuméricos e + - . : = _ / caracteres. Pode estar vazia. Padrão: [a-zA-Z0-9+-.:=_/]{0,256}
ID de referência da imagem ≤ 256 caracteres

Limites de recursos

Quota Padrão (S0)
Analisadores Max 100,000
Análise máxima/min 1.000 páginas/imagens
Quatro horas de áudio
Quatro horas de vídeo
Operações máximas/min 3,000

Modelos generativos suportados

A Compreensão de Conteúdo conecta-se aos Foundry Models para funcionalidades generativas. O serviço adiciona periodicamente suporte para mais modelos. Para saber mais, consulte Ligar o seu analisador de Compreensão de Conteúdo às implementações do modelo Foundry.

Os modelos atualmente suportados são:

Tipo de Modelo Modelo Versão
Conclusão do Chat GPT-4O 2024-08-06
Conclusão do Chat GPT-4O 2024-11-20
Conclusão do Chat GPT-4O-mini 2024-11-20
Conclusão do Chat GPT-4.1 2025-04-14
Conclusão do Chat GPT-4.1-mini 2025-04-14
Conclusão do Chat gpt-4.1-nano 2025-04-14
Embeddings Embutir texto-3-pequeno
Embeddings texto-embedding-3-grande
Embeddings text-embedding-ada-002

Limites dos ficheiros de entrada

Documento e texto

Tipos de ficheiros suportados Tamanho do ficheiro Duração Medidor de extração
.pdf
.tiff
.jpg, .jpeg, .jpe, .png, .bmp, .heif, , .heic
≤ 200 MB ≤ 300 páginas Básico (OCR) ou Padrão (Esquema)
.docx, .xlsx, .pptx ≤ 200 MB ≤ 1 milhão de caracteres Mínimo
.txt
.html, .md, .rtf
.eml, .msg
.xml
≤ 1 MB ≤ 1 milhão de caracteres Mínimo

Contagem de páginas para ficheiros não paginados: Para fins de faturação, o Content Understanding utiliza regras equivalentes às páginas: ficheiros de texto e ficheiros de email (TXT, HTML, MD, XML, MSG, EML) contam 3.000 caracteres como uma página (arredondado para cima). As folhas de cálculo (XLSX) contam uma folha como uma página (incluindo folhas ocultas). As apresentações (PPTX) contam um slide como uma página. Documentos Word (DOCX) usam paginação nativa.

Nota

O modo Pro (2025-05-01-preview) atualmente só suporta .pdf, .tiff e tipos de ficheiros de imagem como entrada. O total de entrada não pode exceder 100 MB e 150 páginas.

Imagem

Tipos de ficheiros suportados Tamanho do ficheiro Resolução
.jpg, .jpeg, .jpe, .png, .bmp, .heif, , .heic ≤ 200 MB Mínimo: 50 x 50 píxeis
Máximo: 10k x 10k pixels

Áudio

Tipos de ficheiros suportados Tamanho do ficheiro Duração
.wav (PCM: pcm_s8, pcm_u8, pcm_s16*, pcm_u16*, pcm_s24*, pcm_u24*, pcm_s32*, pcm_u32*, pcm_f32*, pcm_f64*)
.mp3
.mp4
.opus✓ , .ogg (Opus)
.flac
.wma
.aac
.webm (Opus, Vorbis)
.m4a (AAC, AC-3)
Máximo: 300 MB Max: Duas horas

O Content Understanding suporta ficheiros de áudio até 1 GB e 4 horas de duração, mas o tempo de transcrição é substancialmente reduzido para ficheiros de 300 MB ou menos ou duas horas ou menos.

Vídeos

Tipos de ficheiros suportados e resolução

Tipos de ficheiros suportados Resolução
.mp4, .m4v
.flv (H.264 e AAC)
.wmv, .asf
.avi
.mkv
.mov
Mínimo: 320 x 240 pixels
Máx: 1920 x 1.080 píxeis

Limites de tamanho do ficheiro

Método de Upload Tamanho do ficheiro Duração Descrição
API analyzeBinary (carregamento direto) ≤ 200 MB ≤ 30 minutos Carregue ficheiros de vídeo diretamente no corpo do pedido da API usando a API analyzeBinary. O Microsoft Foundry UX and Content Understanding Studio UX utiliza este método.
analisar API (referência do ficheiro) Máx: 4 GB Max: Duas horas Referenciar ficheiros de vídeo por URL do Armazenamento de Blobs do Azure ou armazenamento semelhante quando usar a API Analyze.

Nota

A análise de vídeo tem as seguintes limitações:

  • analyzeBinary API: Tamanho máximo do ficheiro de 200 MB e duração máxima de 30 minutos ao carregar vídeo diretamente no corpo do pedido
  • Amostragem de frames: Analisa aproximadamente um frame por segundo, o que pode não capturar movimentos rápidos ou eventos breves
  • Resolução: Todos os fotogramas estão escalados para 512 x 512 píxeis, o que pode afetar a visibilidade de pequenos detalhes ou objetos distantes

Limites do esquema de campo

O Content Understanding suporta tanto tipos básicos de valor de campo como estruturas aninhadas, incluindo listas, grupos, tabelas e tabelas fixas.

  • Tipos básicos de valor de campo: string,data, hora, número, inteiro e booleano.
  • Campo de lista: Uma sequência de valores do mesmo tipo, representada como um array de campos básicos na API.
  • Corpo de grupo: Um conjunto de campos semanticamente relacionados, representados como um objeto de campos básicos na API.
  • Campo tabela: Um número variável de itens com subcampos fixos, representados como um array de objetos de campos básicos na API.
  • Campo de tabela fixa: Um grupo de campos com subcampos partilhados, representado como um objeto de objetos de campos básicos na API.

Limites básicos

Propriedade Documento Texto Imagem Áudio Vídeos
Campos máximos 1,000 1,000 1,000 1,000 1,000
Max classificar categorias de campo 300 300 300 300 300
Métodos de geração suportados excerto
gerar
classificar
gerar
classificar
gerar
classificar
gerar
classificar
gerar
classificar
  • O limite de campos Max inclui todos os campos nomeados. Por exemplo, uma lista de cadeias conta como um campo, enquanto um grupo com subcampos de strings e números conta como três campos.
  • O limite para categorias de classificação máxima dos campos é o número total de categorias em todos os campos que utilizam o classify método de geração.

Limites da fonte de conhecimento

Tipo Limites
Dados de treino Apenas documentos
1 GB total
50.000 páginas/imagens no total

Limites de segmentação e classificação

Nota

Estes limites aplicam-se à segmentação e classificação da Compreensão do Conteúdo . Não se aplicam a campos de classificação dentro da capacidade de extração.

Propriedade Limite
Nome da categoria Não pode começar com o cifrão ($).
Nome e descrição da categoria Máximo de 120 caracteres para nome e descrição combinados em cada categoria.
Número de categorias 200 por analisador para documentos, 1 para vídeos.
Classificação hierárquica Cinco camadas para documentos, duas camadas para vídeos