Quotas e limites de serviço

Este conteúdo aplica-se a:v4.0 (GA) | Versões anteriores:v3.1 (GA)v3.0 (a retirar-se)

Este conteúdo aplica-se a:v2.1 | Última versão:v4.0 (GA)

Este artigo contém tanto uma referência rápida quanto uma descrição detalhada da Azure Informação Documental nas Ferramentas Foundry, Quotas e Limites para todos os níveis de preços. Contém também algumas boas práticas para evitar limitação de pedidos.

Utilização do modelo

Tipos de documentos suportados	Leia	Disposição	Modelos pré-construídos	Modelos personalizados	Capacidades adicionais
PDF	✔️	✔️	✔️	✔️	✔️
Imagens: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = suportado ✖️ = Não suportado

O Document Intelligence v4.0 2024-11-30 (GA) suporta funcionalidades de página e linha com as seguintes restrições:

Ângulo, largura/altura e unidade não são suportados.
Para cada objeto detetado, não são suportados polígonos limitadores nem regiões limitantes.
O lines objeto não é suportado.

Tipos de documentos suportados	Leia	Disposição	Modelos pré-construídos	Modelos personalizados
PDF	✔️	✔️	✔️	✔️
Imagens: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = suportado ✖️ = Não suportado

Faturamento

A faturação de Inteligência de Documentos é calculada mensalmente com base no tipo de modelo e no número de páginas analisadas. Pode encontrar métricas de utilização no painel de métricas do portal Azure. O painel mostra o número de páginas que o Azure Document Intelligence processa. Pode verificar o custo estimado gasto no recurso usando a calculadora de preços Azure. Para instruções detalhadas, consulte Verificar utilização e estimar o custo. Aqui ficam alguns detalhes:

Quando submete um documento para análise, o serviço analisa todas as páginas, a menos que especifique um intervalo de páginas usando o pages parâmetro do seu pedido. Quando o serviço analisa documentos Microsoft Excel e PowerPoint através do modelo de leitura, OCR ou layout, conta cada folha de cálculo Excel e slide PowerPoint como uma única página.
Quando o serviço analisa ficheiros PDF e TIFF, conta cada página no ficheiro PDF ou cada imagem no ficheiro TIFF como uma página, sem limites máximos de caracteres.
Quando o serviço analisa ficheiros Microsoft Word e HTML suportados pelos modelos de leitura e layout, conta as páginas em blocos de 3.000 caracteres cada. Por exemplo, se o seu documento contém 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres somam um total de três páginas.
Os modelos de leitura e layout não suportam a análise de imagens incorporadas ou ligadas em ficheiros Microsoft Word, Excel, PowerPoint e HTML. Portanto, o serviço não as considera como imagens adicionadas.
Treinar um modelo personalizado é sempre gratuito com Document Intelligence. As cobranças são incorridas apenas quando o serviço utiliza um modelo para analisar um documento.
O preço dos contentores é o mesmo que o preço dos serviços cloud.
O Document Intelligence oferece um nível gratuito (F0) onde pode testar todas as funcionalidades do Document Intelligence. Os limites do nível gratuito analisam a resposta apenas às duas primeiras páginas de um pedido.
A Inteligência de Documentos tem um modelo de preços baseado em compromisso para grandes cargas de trabalho.
O modelo de Layout é necessário para gerar etiquetas para o seu conjunto de dados para treino personalizado. Se o conjunto de dados que usa para treino personalizado não tiver ficheiros de etiquetas disponíveis, o serviço gera-os por si e cobra-lhe pelo uso do modelo de layout.

Quota	Livre (F0)¹	Standard (S0)
Analisar o limite de transações por segundo	1	15 (valor padrão)
Ajustável	Não	Sim ²
Obter limite de operações por segundo	1	50 (valor padrão)
Ajustável	Não	Sim ²
Limite de operações de gestão de modelos por segundo	1	5 (valor padrão)
Ajustável	Não	Sim ²
Limite de operações por segundo	1	10 (valor padrão)
Ajustável	Não	Sim ²
Tamanho máximo do documento	4 MB	500 MB
Ajustável	Não	Não
Número máximo de páginas (Análise)	2	2000
Ajustável	Não	Não
Tamanho máximo do ficheiro de etiquetas	10 MB	10 MB
Ajustável	Não	Não
Tamanho máximo da resposta OCR json	500 MB	500 MB
Ajustável	Não	Não
Número máximo de modelos Template	500	5000
Ajustável	Não	Não
Número máximo de modelos neurais	100	500
Ajustável	Não	Não

Utilização de modelos personalizados

Quota	Livre (F0) ¹	Standard (S0)
Limite do Modelo Compose	5	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treino Neural e Generativo**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treino Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treino) Neural e Generativo**	50,000	50.000 (valor padrão)
Ajustável	Não	Não
Treinar modelo neural personalizado	10 horas por mês ⁵	Sem limite (paga por hora), começa com 10 horas livres por mês
Ajustável	Não	Sim ³
*Número máximo de páginas (Treino) Classificador**	25,000	25.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documentos (classes) Classificador**	1000	1000 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treino Classificador**	1GB	2GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de amostras por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Utilização de modelos personalizados

Quota	Livre (F0) ¹	Standard (S0)
Limite do Modelo Compose	5	200 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treino Neural**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treino Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Neural**	50,000	50.000 (valor padrão)
Ajustável	Não	Não
Treinar modelo neural personalizado	10 por mês	20 por mês
Ajustável	Não	Sim ³
*Número máximo de páginas (Treino) Classificador**	10.000	10.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documentos (classes) Classificador**	500	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treino Classificador**	1GB	1GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de amostras por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Utilização de modelos personalizados

Quota	Livre (F0) ¹	Standard (S0)
Limite do Modelo Compose	5	200 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treino Neural**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treino Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Formação) Neural**	50,000	50.000 (valor padrão)
Ajustável	Não	Não
Treinar modelo neural personalizado	10 por mês	20 por mês
Ajustável	Não	Sim ³
*Número máximo de páginas (Treino) Classificador**	10.000	10.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documentos (classes) Classificador**	500	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treino Classificador**	1GB	1GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de amostras por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Limites de modelos personalizados

Quota	Livre (F0) ¹	Standard (S0)
Limite do Modelo Compose	5	200 (valor padrão)
Ajustável	Não	Não
Tamanho do conjunto de dados de treino	50 MB	50 MB (valor padrão)
Ajustável	Não	Não
Número máximo de páginas (Formação)	500	500 (valor padrão)
Ajustável	Não	Não

¹ Para a categoria de preços Gratuito (F0), veja também os limites mensais na página de preços.
² Consulte as melhores práticas e instruções de ajuste.
³ A contagem de treino de modelos neurais é reiniciada todos os meses do calendário. Abra um pedido de apoio para aumentar o limite mensal de treino. A partir da API v4.0, os pedidos de treino que ultrapassam 20 num mês civil são faturados de acordo com o nível de treino. Consulte os preços para mais detalhes.

⁴ Este limite aplica-se a todos os documentos encontrados na pasta do seu conjunto de dados de treino antes de quaisquer atualizações relacionadas com rotulagem.

⁵ Este limite aplica-se apenas a v 4.0 (2024-11-30 GA) modelos neurais personalizados. A partir de v 4.0, suportamos o treino de documentos de maior dimensão durante períodos mais longos (até 10 horas gratuitamente, incorrendo em custos posteriormente). Para mais informações, consulte a página de modelos neurais personalizados.

Descrição detalhada, ajuste de quotas e boas práticas

Os limites padrão podem ser prolongados solicitando um aumento através de um pedido de suporte ao cliente. Antes de solicitar um aumento da quota (quando aplicável), certifique-se de que é necessário.

Se a sua candidatura devolver o Código de Resposta 429 (Pedidos a mais), está acima do limite para um ou mais dos limites de transações por segundo (TPS):

Limite de transações por segundo para a análise O limite de TPS para o envio de pedidos de análise (POST)
Limite de operações por segundo O TPS para sondagens de resultados em operações de análise (GET)
Limite de operações de gestão de modelos por segundo Operações relacionadas com a gestão de modelos, como compilar/treinar e copiar.
Limite de operações por segundo Operações relacionadas com modelos de listagem, operações.

Melhores práticas gerais para mitigar o controlo

Para minimizar problemas relacionados com o throttling (Código de Resposta 429), recomendamos o uso das seguintes técnicas:

Implemente lógica de repetição no seu aplicativo
Evite mudanças bruscas na carga de trabalho. Aumenta gradualmente a carga de trabalho
Exemplo. A sua aplicação está a usar Inteligência de Documentos e a sua carga de trabalho atual é de 10 TPS (transações por segundo). No segundo seguinte aumentas a carga para 40 TPS. O resultado é um código de resposta 429 para alguns pedidos, pois ultrapassa o limite de 15 TPS para submeter operações de análise. Podes reduzir o processamento para ficares abaixo dos 15 TPS ou pedir um aumento no TPS para suportar volumes mais elevados.

As secções seguintes descrevem casos específicos de ajuste de quotas. Saltar para Inteligência de Documentos: aumentar o limite de pedidos concorrentes

Aumento do limite de pedidos de transações por segundo

Por defeito, o número de transações por segundo está limitado a 15 transações por segundo para um recurso de Inteligência de Documentos. Para o escalão de preços Standard, os pedidos de aumento do TPS podem ser submetidos, mas se poderão ser aprovados e a que nível de ajuste TPS dependerá dos padrões diários de utilização e das melhores práticas que estão a ser seguidas. Antes de submeter o pedido, certifique-se de que está familiarizado com o material desta secção e destas melhores práticas.

Aumentar o limite de pedidos concorrentes não afeta diretamente os seus custos. O serviço de Inteligência Documental utiliza o modelo "Pague apenas pelo que utiliza". O limite define até que ponto o Serviço pode escalar antes de começar a limitar os seus pedidos.

O valor existente das diferentes categorias de limites de pedidos está disponível através do portal Azure, no separador de monitorização da lâmina de visão geral de recursos.

Criar e submeter um pedido de apoio para aumento do TPS

Inicie o aumento do limite de transações por segundo (TPS) para o seu recurso submetendo o Pedido de Suporte:

Iniciar sessão no portal Azure
Selecione o Document Intelligence Resource para o qual pretende aumentar o limite de TPS
Selecione -Novo Pedido de Suporte- (-Grupo Suporte + Resolução de Problemas-). Aparece uma nova janela com informações preenchidas automaticamente sobre a sua Subscrição do Azure e o Recurso do Azure
Introduzir -Resumo- (como "Aumentar o limite TPS de Inteligência Documental")
Selecione "Validação de quota ou utilização" para o campo do tipo de problema.
Selecionar -Próximo: Soluções-
Prossiga com a criação do pedido
Insira a seguinte informação no campo -Description-, no separador Detalhes:
- uma nota: que o pedido diz respeito à cota de Inteligência de Documentos.
- Dê uma expectativa de TPS que gostaria de escalar para cumprir. Embora os aumentos no TPS sejam gratuitos, apenas deve solicitar um TPS que seja adequado à sua carga de trabalho.
- informações de recursos do Azure
- Complete a introdução da informação necessária e selecione o botão -Criar- no separador -Review + criar-
- Note o número de pedido de suporte nas notificações do portal Azure. Espere que o Suporte o contacte em breve para mais processamentos.

Exemplo de melhor prática de um padrão de carga de trabalho

Este exemplo apresenta a abordagem que recomendamos seguir para mitigar possíveis limitações de pedidos. Não é uma receita exata, mas apenas um modelo que convidamos a seguir e ajustar conforme necessário.

Suponhamos que um recurso de Inteligência de Documentos tem o limite padrão definido. Inicie a carga de trabalho para submeter os seus pedidos de análise. Se notar que está a ver throttling frequente com o código de resposta 429 ao verificar a conclusão, comece por implementar um backoff exponencial no pedido de resposta GET analyze. Ao utilizar um tempo de espera cada vez mais longo entre tentativas de pedido para respostas consecutivas de erro, por exemplo, seguindo um padrão de atrasos 2-5-13-34 entre as solicitações. Em geral, recomendamos não chamar a resposta get analyze mais do que uma vez a cada 2 segundos para um pedido POST correspondente. A analyze resposta também contém um cabeçalho retry-after que indica quantos segundos deve esperar antes de verificar a conclusão desse pedido.

Se perceber que está a ser restringido no número de requisições POST para documentos submetidos, considere adicionar um atraso entre as requisições. Se a sua carga de trabalho exigir um grau maior de processamento simultâneo, terá então de criar um pedido de suporte para aumentar os seus limites de serviço em transações por segundo.

De um modo geral, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de passar para produção.

Próximos passos

Aprenda sobre códigos de erro e resolução de problemas

Comentários

Esta página foi útil?

Last updated on 2026-05-08

Quotas e limites de serviço

Utilização do modelo

Faturamento

Utilização de modelos personalizados

Utilização de modelos personalizados

Utilização de modelos personalizados

Limites de modelos personalizados

Descrição detalhada, ajuste de quotas e boas práticas

Melhores práticas gerais para mitigar o controlo

Aumento do limite de pedidos de transações por segundo

Criar e submeter um pedido de apoio para aumento do TPS

Exemplo de melhor prática de um padrão de carga de trabalho

Próximos passos

Comentários

Recursos adicionais