Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Nota
Versões 2024-12-01-preview de APIs de compreensão de conteúdo e 2025-05-01-preview estão atualmente em versão prévia pública. Estas pré-visualizações são fornecidas sem um acordo de nível de serviço e não são recomendadas para cargas de trabalho de produção. Para obter mais informações, consulte os Termos Suplementares de Uso para Pré-visualizações do Microsoft Azure e o Adendo de Proteção de Dados dos Produtos e Serviços da Microsoft ("DPA").
Este artigo lista as cotas e os limites do serviço Azure Content Understanding in Foundry Tools.
Limites gerais
| Propriedade | Limite |
|---|---|
| ID do analisador | 1 a 64 caracteres. Alfanumérico, ponto e sublinhado. Padrão: [a-zA-Z0-9._]{1,64} |
| Propriedades de URL | ≤ 8.192 caracteres |
| Propriedades de descrição | ≤ 1.024 caracteres |
| Nomes de campo | ≤ 64 caracteres. Letras Unicode, números, sinais de combinação, pontuação de ligação, ponto, hífen e sublinhado. Padrão: [\p{L}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}._-]{1,64} |
| Tags | ≤ 10 marcas |
| Chave de etiqueta | ≤ 64 caracteres. Caracteres alfanuméricos e + - . : = _ /. Padrão: [a-zA-Z0-9+-.:=_/]{1,64} |
| Valor da tag | ≤ 256 caracteres. Caracteres alfanuméricos e + - . : = _ /. Pode estar vazio. Padrão: [a-zA-Z0-9+-.:=_/]{0,256} |
| ID de referência de imagem | ≤ 256 caracteres |
Limites de recursos
| Cota | Standard (S0) |
|---|---|
| Máximo de analisadores | 100,000 |
| Análise máxima/min | 1.000 páginas/imagens Quatro horas de áudio Quatro horas de vídeo |
| Máximo de operações/min | 3,000 |
Modelos generativos com suporte
A Compreensão de Conteúdo conecta-se aos Modelos Foundry para capacidades generativas. O serviço adiciona periodicamente suporte para mais modelos. Para saber mais, consulte Conecte o seu analisador de compreensão de conteúdo às implantações de modelos do Foundry.
Os modelos com suporte no momento são:
| Tipo de modelo | Modelo | Versão |
|---|---|---|
| Conclusão do chat | gpt-4o | 2024-08-06 |
| Conclusão do chat | gpt-4o | 2024-11-20 |
| Conclusão do chat | gpt-4o-mini | 2024-11-20 |
| Conclusão do chat | gpt-4.1 | 2025-04-14 |
| Conclusão do chat | gpt-4.1-mini | 2025-04-14 |
| Conclusão do chat | gpt-4.1-nano | 2025-04-14 |
| Inserções | text-embedding-3-small | |
| Inserções | text-embedding-3-large | |
| Inserções | text-embedding-ada-002 |
Limites de arquivo de entrada
Documento e texto
| Tipos de arquivo com suporte | Tamanho do arquivo | Comprimento | Medidor de extração |
|---|---|---|---|
✓ .pdf✓ .tiff✓ .jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic |
≤ 200 MB | ≤ 300 páginas | Básico (OCR) ou Standard (Layout) |
✓ .docx, .xlsx, .pptx |
≤ 200 MB | ≤ 1M de caracteres | Mínimo |
✓ .txt ✓ .html, .md, .rtf .eml✓ ,.msg ✓ .xml |
≤ 1 MB | ≤ 1M de caracteres | Mínimo |
‡Contagem de páginas para arquivos não paginados: para fins de cobrança, o Content Understanding usa regras equivalentes à página: arquivos de texto e arquivos de email (TXT, HTML, MD, XML, MSG, EML) contam 3.000 caracteres como uma página (arredondado). As planilhas (XLSX) contam uma planilha como uma página (incluindo planilhas ocultas). As apresentações (PPTX) contam um slide como uma página. Os documentos do Word (DOCX) usam paginação nativa.
Nota
Atualmente, o modo pro (2025-05-01-preview) só dá suporte a tipos de arquivo .pdf, .tiff e imagem como entrada.
A entrada total não pode exceder 100 MB e 150 páginas.
Imagem
| Tipos de arquivo com suporte | Tamanho do arquivo | Resolução |
|---|---|---|
✓ .jpg, .jpeg, .jpe, .png, .bmp, .heif, .heic |
≤ 200 MB | Min: 50 x 50 pixels Máximo: 10k x 10k pixels |
Áudio
| Tipos de arquivo com suporte | Tamanho do arquivo | Comprimento |
|---|---|---|
✓ .wav (PCM: pcm_s8, pcm_u8, pcm_s16*, pcm_u16*, pcm_s24*, pcm_u24*, pcm_s32*, pcm_u32*, pcm_f32*, pcm_f64*)✓ .mp3 ✓ .mp4 .opus✓ , .ogg (Opus)✓ .flac ✓ .wma ✓ .aac .webm ✓ (Opus, Vorbis).m4a ✓ (AAC, AC-3) |
Máximo: 300 MB† | Máximo: duas horas† |
† O Content Understanding dá suporte a arquivos de áudio de até 1 GB e 4 horas de duração, mas o tempo de transcrição é substancialmente reduzido para arquivos de 300 MB ou menos ou duas horas ou menos.
Vídeo
Tipos de arquivo e resolução com suporte
| Tipos de arquivo com suporte | Resolução |
|---|---|
.mp4✓ ,.m4v .flv ✓ (H.264 e AAC).wmv✓ ,.asf ✓ .avi ✓ .mkv ✓ .mov |
Min: 320 x 240 pixels Máximo: 1920 x 1.080 pixels |
Limites de tamanho do arquivo
| Método upload | Tamanho do arquivo | Comprimento | Descrição |
|---|---|---|---|
| API analyzeBinary (carregamento direto) | ≤ 200 MB | ≤ 30 minutos | Carregue arquivos de vídeo diretamente no corpo da solicitação de API usando a API analyzeBinary. O Microsoft Foundry UX e o Content Understanding Studio UX usam esse método. |
| analisar a API (referência de arquivo) | Máximo: 4 GB | Máximo: duas horas | Referencie arquivos de vídeo por URL de Armazenamento de Blobs do Azure ou armazenamento semelhante ao usar a API de Análise. |
Nota
A análise de vídeo tem as seguintes limitações:
- API analyzeBinary: tamanho máximo do arquivo de 200 MB e duração máxima de 30 minutos ao carregar vídeo diretamente no corpo da solicitação
- Amostragem de quadros: analisa aproximadamente um quadro por segundo, o que pode perder movimentos rápidos ou eventos breves
- Resolução: todos os quadros são dimensionados para 512 x 512 pixels, o que pode afetar a visibilidade de pequenos detalhes ou objetos distantes
Limites de esquema de campo
O Content Understanding dá suporte a tipos básicos de valor de campo e estruturas aninhadas, incluindo listas, grupos, tabelas e tabelas fixas.
- Tipos básicos de valor de campo: cadeia de caracteres, data, hora, número, inteiro e booliano.
- Campo de lista: uma sequência de valores do mesmo tipo, representada como uma matriz de campos básicos na API.
- Campo de grupo: um conjunto de campos semanticamente relacionados, representados como um objeto de campos básicos na API.
- Campo tabela: um número variável de itens com subcampos fixos, representados como uma matriz de objetos de campos básicos na API.
- Campo de tabela fixa: um grupo de campos com subcampos compartilhados, representados como um objeto de objetos de campos básicos na API.
Limites básicos
| Propriedade | Documento | Texto | Imagem | Áudio | Vídeo |
|---|---|---|---|---|---|
| Campos máximos | 1,000 | 1,000 | 1,000 | 1,000 | 1,000 |
| Máximo de categorias de campo de classificação | 300 | 300 | 300 | 300 | 300 |
| Métodos de geração com suporte | Extrair Gerar Classificar |
Gerar Classificar |
Gerar Classificar |
Gerar Classificar |
Gerar Classificar |
- O limite máximo de campos inclui todos os campos nomeados. Por exemplo, uma lista de cadeias de caracteres conta como um campo, enquanto um grupo com subcampos de cadeia de caracteres e número conta como três campos.
- O limite Máximo de categorias de campo de classificação é o número total de categorias em todos os campos usando o método de geração
classify.
Limites da fonte de conhecimento
| Tipo | Limites |
|---|---|
| Dados de treinamento | Somente documentos Total de 1 GB Total de 50.000 páginas/imagens |
Limites de segmentação e classificação
Nota
Esses limites se aplicam à segmentação e à própria classificação do Content Understanding . Eles não se aplicam à classificação de campos dentro da capacidade de extração.
| Propriedade | Limite |
|---|---|
| Nome da categoria | Não pode começar com um sinal de dólar ($). |
| Nome e descrição da categoria | Máximo de 120 caracteres para nome combinado e descrição em cada categoria. |
| Número de categorias | 200 por analisador para documentos, 1 para vídeos. |
| Classificação hierárquica | Cinco camadas para documentos, duas camadas para vídeos |