Compreensão de Conteúdo do Azure no serviço de cotas e limites do Foundry Tools

Nota

Versões 2024-12-01-preview de APIs de compreensão de conteúdo e 2025-05-01-preview estão atualmente em versão prévia pública. Estas pré-visualizações são fornecidas sem um acordo de nível de serviço e não são recomendadas para cargas de trabalho de produção. Para obter mais informações, consulte os Termos Suplementares de Uso para Pré-visualizações do Microsoft Azure e o Adendo de Proteção de Dados dos Produtos e Serviços da Microsoft ("DPA").

Este artigo lista as cotas e os limites do serviço Azure Content Understanding in Foundry Tools.

Limites gerais

Propriedade Limite
ID do analisador 1 a 64 caracteres. Alfanumérico, ponto e sublinhado. Padrão: [a-zA-Z0-9._]{1,64}
Propriedades de URL ≤ 8.192 caracteres
Propriedades de descrição ≤ 1.024 caracteres
Nomes de campo ≤ 64 caracteres. Letras Unicode, números, sinais de combinação, pontuação de ligação, ponto, hífen e sublinhado. Padrão: [\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64}
Tags ≤ 10 marcas
Chave de etiqueta ≤ 64 caracteres. Caracteres alfanuméricos e + - . : = _ /. Padrão: [a-zA-Z0-9+-.:=_/]{1,64}
Valor da tag ≤ 256 caracteres. Caracteres alfanuméricos e + - . : = _ /. Pode estar vazio. Padrão: [a-zA-Z0-9+-.:=_/]{0,256}
ID de referência de imagem ≤ 256 caracteres

Limites de recursos

Cota Standard (S0)
Máximo de analisadores 100,000
Análise máxima/min 1.000 páginas/imagens
Quatro horas de áudio
Quatro horas de vídeo
Máximo de operações/min 3,000

Modelos generativos com suporte

A Compreensão de Conteúdo conecta-se aos Modelos Foundry para capacidades generativas. O serviço adiciona periodicamente suporte para mais modelos. Para saber mais, consulte Conecte o seu analisador de compreensão de conteúdo às implantações de modelos do Foundry.

Os modelos com suporte no momento são:

Tipo de modelo Modelo Versão
Conclusão do chat gpt-4o 2024-08-06
Conclusão do chat gpt-4o 2024-11-20
Conclusão do chat gpt-4o-mini 2024-11-20
Conclusão do chat gpt-4.1 2025-04-14
Conclusão do chat gpt-4.1-mini 2025-04-14
Conclusão do chat gpt-4.1-nano 2025-04-14
Inserções text-embedding-3-small
Inserções text-embedding-3-large
Inserções text-embedding-ada-002

Limites de arquivo de entrada

Documento e texto

Tipos de arquivo com suporte Tamanho do arquivo Comprimento Medidor de extração
.pdf
.tiff
.jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic
≤ 200 MB ≤ 300 páginas Básico (OCR) ou Standard (Layout)
.docx, .xlsx, .pptx ≤ 200 MB ≤ 1M de caracteres Mínimo
.txt
.html, .md, .rtf
.eml✓ ,.msg
.xml
≤ 1 MB ≤ 1M de caracteres Mínimo

Contagem de páginas para arquivos não paginados: para fins de cobrança, o Content Understanding usa regras equivalentes à página: arquivos de texto e arquivos de email (TXT, HTML, MD, XML, MSG, EML) contam 3.000 caracteres como uma página (arredondado). As planilhas (XLSX) contam uma planilha como uma página (incluindo planilhas ocultas). As apresentações (PPTX) contam um slide como uma página. Os documentos do Word (DOCX) usam paginação nativa.

Nota

Atualmente, o modo pro (2025-05-01-preview) só dá suporte a tipos de arquivo .pdf, .tiff e imagem como entrada. A entrada total não pode exceder 100 MB e 150 páginas.

Imagem

Tipos de arquivo com suporte Tamanho do arquivo Resolução
.jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic ≤ 200 MB Min: 50 x 50 pixels
Máximo: 10k x 10k pixels

Áudio

Tipos de arquivo com suporte Tamanho do arquivo Comprimento
.wav (PCM: pcm_s8, pcm_u8, pcm_s16*, pcm_u16*, pcm_s24*, pcm_u24*, pcm_s32*, pcm_u32*, pcm_f32*, pcm_f64*)
.mp3
.mp4
.opus✓ , .ogg (Opus)
.flac
.wma
.aac
.webm ✓ (Opus, Vorbis)
.m4a ✓ (AAC, AC-3)
Máximo: 300 MB Máximo: duas horas

O Content Understanding dá suporte a arquivos de áudio de até 1 GB e 4 horas de duração, mas o tempo de transcrição é substancialmente reduzido para arquivos de 300 MB ou menos ou duas horas ou menos.

Vídeo

Tipos de arquivo e resolução com suporte

Tipos de arquivo com suporte Resolução
.mp4✓ ,.m4v
.flv ✓ (H.264 e AAC)
.wmv✓ ,.asf
.avi
.mkv
.mov
Min: 320 x 240 pixels
Máximo: 1920 x 1.080 pixels

Limites de tamanho do arquivo

Método upload Tamanho do arquivo Comprimento Descrição
API analyzeBinary (carregamento direto) ≤ 200 MB ≤ 30 minutos Carregue arquivos de vídeo diretamente no corpo da solicitação de API usando a API analyzeBinary. O Microsoft Foundry UX e o Content Understanding Studio UX usam esse método.
analisar a API (referência de arquivo) Máximo: 4 GB Máximo: duas horas Referencie arquivos de vídeo por URL de Armazenamento de Blobs do Azure ou armazenamento semelhante ao usar a API de Análise.

Nota

A análise de vídeo tem as seguintes limitações:

  • API analyzeBinary: tamanho máximo do arquivo de 200 MB e duração máxima de 30 minutos ao carregar vídeo diretamente no corpo da solicitação
  • Amostragem de quadros: analisa aproximadamente um quadro por segundo, o que pode perder movimentos rápidos ou eventos breves
  • Resolução: todos os quadros são dimensionados para 512 x 512 pixels, o que pode afetar a visibilidade de pequenos detalhes ou objetos distantes

Limites de esquema de campo

O Content Understanding dá suporte a tipos básicos de valor de campo e estruturas aninhadas, incluindo listas, grupos, tabelas e tabelas fixas.

  • Tipos básicos de valor de campo: cadeia de caracteres, data, hora, número, inteiro e booliano.
  • Campo de lista: uma sequência de valores do mesmo tipo, representada como uma matriz de campos básicos na API.
  • Campo de grupo: um conjunto de campos semanticamente relacionados, representados como um objeto de campos básicos na API.
  • Campo tabela: um número variável de itens com subcampos fixos, representados como uma matriz de objetos de campos básicos na API.
  • Campo de tabela fixa: um grupo de campos com subcampos compartilhados, representados como um objeto de objetos de campos básicos na API.

Limites básicos

Propriedade Documento Texto Imagem Áudio Vídeo
Campos máximos 1,000 1,000 1,000 1,000 1,000
Máximo de categorias de campo de classificação 300 300 300 300 300
Métodos de geração com suporte Extrair
Gerar
Classificar
Gerar
Classificar
Gerar
Classificar
Gerar
Classificar
Gerar
Classificar
  • O limite máximo de campos inclui todos os campos nomeados. Por exemplo, uma lista de cadeias de caracteres conta como um campo, enquanto um grupo com subcampos de cadeia de caracteres e número conta como três campos.
  • O limite Máximo de categorias de campo de classificação é o número total de categorias em todos os campos usando o método de geração classify.

Limites da fonte de conhecimento

Tipo Limites
Dados de treinamento Somente documentos
Total de 1 GB
Total de 50.000 páginas/imagens

Limites de segmentação e classificação

Nota

Esses limites se aplicam à segmentação e à própria classificação do Content Understanding . Eles não se aplicam à classificação de campos dentro da capacidade de extração.

Propriedade Limite
Nome da categoria Não pode começar com um sinal de dólar ($).
Nome e descrição da categoria Máximo de 120 caracteres para nome combinado e descrição em cada categoria.
Número de categorias 200 por analisador para documentos, 1 para vídeos.
Classificação hierárquica Cinco camadas para documentos, duas camadas para vídeos