Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Nota
APIs de entendimento de conteúdo 2024-12-01-preview e 2025-05-01-preview estão atualmente em pré-visualização pública. Estas prévias são fornecidas sem um acordo de nível de serviço e não são recomendadas para cargas de trabalho em produção. Para mais informações, consulte Termos Suplementares de Utilização para Versões de Pré-visualização do Microsoft Azure e o Aditamento de Proteção de Dados para Produtos e Serviços da Microsoft ("DPA").
Este artigo lista as quotas e limites para o serviço Azure Content Understanding no Foundry Tools.
Limites gerais
| Propriedade | Limite |
|---|---|
| ID do Analisador | 1-64 caracteres. Alfanumérico, ponto e sublinhado. Padrão: [a-zA-Z0-9._]{1,64} |
| Propriedades da URL | ≤ 8.192 caracteres |
| Propriedades da descrição | ≤ 1.024 caracteres |
| Nomes dos campos | ≤ 64 caracteres. Letras Unicode, números, marcas de combinação, pontuação de ligação, ponto final, hífen e sublinhado. Padrão: [\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64} |
| Etiquetas | ≤ 10 etiquetas |
| Chave da etiqueta | ≤ 64 caracteres. Alfanuméricos e + - . : = _ / caracteres. Padrão: [a-zA-Z0-9+-.:=_/]{1,64} |
| Valor da etiqueta | ≤ 256 caracteres. Alfanuméricos e + - . : = _ / caracteres. Pode estar vazia. Padrão: [a-zA-Z0-9+-.:=_/]{0,256} |
| ID de referência da imagem | ≤ 256 caracteres |
Limites de recursos
| Quota | Padrão (S0) |
|---|---|
| Analisadores Max | 100,000 |
| Análise máxima/min | 1.000 páginas/imagens Quatro horas de áudio Quatro horas de vídeo |
| Operações máximas/min | 3,000 |
Modelos generativos suportados
A Compreensão de Conteúdo conecta-se aos Foundry Models para funcionalidades generativas. O serviço adiciona periodicamente suporte para mais modelos. Para saber mais, consulte Ligar o seu analisador de Compreensão de Conteúdo às implementações do modelo Foundry.
Os modelos atualmente suportados são:
| Tipo de Modelo | Modelo | Versão |
|---|---|---|
| Conclusão do Chat | GPT-4O | 2024-08-06 |
| Conclusão do Chat | GPT-4O | 2024-11-20 |
| Conclusão do Chat | GPT-4O-mini | 2024-11-20 |
| Conclusão do Chat | GPT-4.1 | 2025-04-14 |
| Conclusão do Chat | GPT-4.1-mini | 2025-04-14 |
| Conclusão do Chat | gpt-4.1-nano | 2025-04-14 |
| Embeddings | Embutir texto-3-pequeno | |
| Embeddings | texto-embedding-3-grande | |
| Embeddings | text-embedding-ada-002 |
Limites dos ficheiros de entrada
Documento e texto
| Tipos de ficheiros suportados | Tamanho do ficheiro | Duração | Medidor de extração |
|---|---|---|---|
✓ .pdf✓ .tiff✓ .jpg, .jpeg, .jpe, .png, .bmp, .heif, , .heic |
≤ 200 MB | ≤ 300 páginas | Básico (OCR) ou Padrão (Esquema) |
✓ .docx, .xlsx, .pptx |
≤ 200 MB | ≤ 1 milhão de caracteres | Mínimo |
✓ .txt ✓ .html, .md, .rtf ✓ .eml, .msg ✓ .xml |
≤ 1 MB | ≤ 1 milhão de caracteres | Mínimo |
‡Contagem de páginas para ficheiros não paginados: Para fins de faturação, o Content Understanding utiliza regras equivalentes às páginas: ficheiros de texto e ficheiros de email (TXT, HTML, MD, XML, MSG, EML) contam 3.000 caracteres como uma página (arredondado para cima). As folhas de cálculo (XLSX) contam uma folha como uma página (incluindo folhas ocultas). As apresentações (PPTX) contam um slide como uma página. Documentos Word (DOCX) usam paginação nativa.
Nota
O modo Pro (2025-05-01-preview) atualmente só suporta .pdf, .tiff e tipos de ficheiros de imagem como entrada.
O total de entrada não pode exceder 100 MB e 150 páginas.
Imagem
| Tipos de ficheiros suportados | Tamanho do ficheiro | Resolução |
|---|---|---|
✓ .jpg, .jpeg, .jpe, .png, .bmp, .heif, , .heic |
≤ 200 MB | Mínimo: 50 x 50 píxeis Máximo: 10k x 10k pixels |
Áudio
| Tipos de ficheiros suportados | Tamanho do ficheiro | Duração |
|---|---|---|
✓ .wav (PCM: pcm_s8, pcm_u8, pcm_s16*, pcm_u16*, pcm_s24*, pcm_u24*, pcm_s32*, pcm_u32*, pcm_f32*, pcm_f64*)✓ .mp3 ✓ .mp4 .opus✓ , .ogg (Opus)✓ .flac ✓ .wma ✓ .aac ✓ .webm (Opus, Vorbis) ✓ .m4a (AAC, AC-3) |
Máximo: 300 MB† | Max: Duas horas† |
† O Content Understanding suporta ficheiros de áudio até 1 GB e 4 horas de duração, mas o tempo de transcrição é substancialmente reduzido para ficheiros de 300 MB ou menos ou duas horas ou menos.
Vídeos
Tipos de ficheiros suportados e resolução
| Tipos de ficheiros suportados | Resolução |
|---|---|
✓ .mp4, .m4v ✓ .flv (H.264 e AAC) ✓ .wmv, .asf ✓ .avi ✓ .mkv ✓ .mov |
Mínimo: 320 x 240 pixels Máx: 1920 x 1.080 píxeis |
Limites de tamanho do ficheiro
| Método de Upload | Tamanho do ficheiro | Duração | Descrição |
|---|---|---|---|
| API analyzeBinary (carregamento direto) | ≤ 200 MB | ≤ 30 minutos | Carregue ficheiros de vídeo diretamente no corpo do pedido da API usando a API analyzeBinary. O Microsoft Foundry UX and Content Understanding Studio UX utiliza este método. |
| analisar API (referência do ficheiro) | Máx: 4 GB | Max: Duas horas | Referenciar ficheiros de vídeo por URL do Armazenamento de Blobs do Azure ou armazenamento semelhante quando usar a API Analyze. |
Nota
A análise de vídeo tem as seguintes limitações:
- analyzeBinary API: Tamanho máximo do ficheiro de 200 MB e duração máxima de 30 minutos ao carregar vídeo diretamente no corpo do pedido
- Amostragem de frames: Analisa aproximadamente um frame por segundo, o que pode não capturar movimentos rápidos ou eventos breves
- Resolução: Todos os fotogramas estão escalados para 512 x 512 píxeis, o que pode afetar a visibilidade de pequenos detalhes ou objetos distantes
Limites do esquema de campo
O Content Understanding suporta tanto tipos básicos de valor de campo como estruturas aninhadas, incluindo listas, grupos, tabelas e tabelas fixas.
- Tipos básicos de valor de campo: string,data, hora, número, inteiro e booleano.
- Campo de lista: Uma sequência de valores do mesmo tipo, representada como um array de campos básicos na API.
- Corpo de grupo: Um conjunto de campos semanticamente relacionados, representados como um objeto de campos básicos na API.
- Campo tabela: Um número variável de itens com subcampos fixos, representados como um array de objetos de campos básicos na API.
- Campo de tabela fixa: Um grupo de campos com subcampos partilhados, representado como um objeto de objetos de campos básicos na API.
Limites básicos
| Propriedade | Documento | Texto | Imagem | Áudio | Vídeos |
|---|---|---|---|---|---|
| Campos máximos | 1,000 | 1,000 | 1,000 | 1,000 | 1,000 |
| Max classificar categorias de campo | 300 | 300 | 300 | 300 | 300 |
| Métodos de geração suportados | excerto gerar classificar |
gerar classificar |
gerar classificar |
gerar classificar |
gerar classificar |
- O limite de campos Max inclui todos os campos nomeados. Por exemplo, uma lista de cadeias conta como um campo, enquanto um grupo com subcampos de strings e números conta como três campos.
- O limite para categorias de classificação máxima dos campos é o número total de categorias em todos os campos que utilizam o
classifymétodo de geração.
Limites da fonte de conhecimento
| Tipo | Limites |
|---|---|
| Dados de treino | Apenas documentos 1 GB total 50.000 páginas/imagens no total |
Limites de segmentação e classificação
Nota
Estes limites aplicam-se à segmentação e classificação da Compreensão do Conteúdo . Não se aplicam a campos de classificação dentro da capacidade de extração.
| Propriedade | Limite |
|---|---|
| Nome da categoria | Não pode começar com o cifrão ($). |
| Nome e descrição da categoria | Máximo de 120 caracteres para nome e descrição combinados em cada categoria. |
| Número de categorias | 200 por analisador para documentos, 1 para vídeos. |
| Classificação hierárquica | Cinco camadas para documentos, duas camadas para vídeos |