Cotas e limites de serviço

Este conteúdo se aplica a:v4.0 (GA) | Versões anteriores:v3.1 (GA)v3.0 (desativação)

Esse conteúdo se aplica a:v2.1 | Versão mais recente:v4.0 (GA)

Este artigo contém uma referência rápida e uma descrição detalhada da Inteligência de Documentos do Azure em Quotas e Limites das Ferramentas Foundry para todas as camadas de preços. Ele também contém algumas práticas recomendadas para evitar a limitação de solicitações.

Uso de modelo

Tipos de documento com suporte	Ler	Layout	Modelos predefinidos	Modelos personalizados	Capacidades de complemento
PDF	✔️	✔️	✔️	✔️	✔️
Imagens: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = com suporte ✖️ = Sem suporte

O Document Intelligence v4.0 2024-11-30 (GA) suporta recursos de página e linha com as seguintes restrições:

Não há suporte para ângulo, largura/altura e unidade.
Para cada objeto detectado, não há suporte para polígonos delimitadores ou regiões delimitadoras.
O objeto lines não é suportado.

Tipos de documento com suporte	Ler	Layout	Modelos predefinidos	Modelos personalizados
PDF	✔️	✔️	✔️	✔️
Imagens: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`, `PPTX`, `XLS`	✔️	✖️	✖️	✖️

✔️ = com suporte ✖️ = Sem suporte

Faturamento

A cobrança do Document Intelligence é calculada mensalmente com base no tipo de modelo e no número de páginas analisadas. Você pode encontrar métricas de uso no painel de métricas no portal do Azure. O painel exibe o número de páginas que o Azure Document Intelligence processa. Você pode verificar o custo estimado gasto no recurso usando a calculadora de preços Azure. Para obter instruções detalhadas, consulte Verificar o uso e estimar o custo. Aqui estão alguns detalhes:

Quando você envia um documento para análise, o serviço analisa todas as páginas, a menos que você especifique um intervalo de páginas usando o pages parâmetro em sua solicitação. Quando o serviço analisa Microsoft Excel e PowerPoint documentos por meio do modelo de leitura, OCR ou layout, ele conta cada Excel planilha e PowerPoint slide como uma página.
Quando o serviço analisa arquivos PDF e TIFF, ele conta cada página no arquivo PDF ou cada imagem no arquivo TIFF como uma página sem limites máximos de caracteres.
Quando o serviço analisa arquivos Microsoft Word e HTML aos quais os modelos de leitura e layout dão suporte, ele conta páginas em blocos de 3.000 caracteres cada. Por exemplo, se o documento contiver 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres somam um total de três páginas.
Os modelos de leitura e layout não dão suporte à análise de imagens inseridas ou vinculadas em arquivos Microsoft Word, Excel, PowerPoint e HTML. Portanto, o serviço não os conta como imagens adicionadas.
O treinamento de um modelo personalizado é sempre gratuito com o Document Intelligence. Os encargos são incorridos somente quando o serviço usa um modelo para analisar um documento.
O preço do contêiner é o mesmo que o preço do serviço de nuvem.
O Document Intelligence oferece uma camada gratuita (F0), na qual você pode testar todos os recursos do Document Intelligence. Os limites de camada livre analisam a resposta apenas para as duas primeiras páginas em uma solicitação.
O Document Intelligence tem um modelo de preços baseado em compromisso para cargas de trabalho grandes.
O modelo layout é necessário para gerar rótulos para seu conjunto de dados para treinamento personalizado. Se o conjunto de dados usado para treinamento personalizado não tiver arquivos de rótulo disponíveis, o serviço os gerará para você e cobra o uso do modelo de layout.

Cota	Gratuito (F0)¹	Standard (S0)
Analisar o limite de transações por segundo	1	15 (valor padrão)
Ajustável	Não	Sim ²
Obter o limite de operações por segundo	1	50 (valor padrão)
Ajustável	Não	Sim ²
Limite de operações de gerenciamento de modelo por segundo	1	5 (valor padrão)
Ajustável	Não	Sim ²
Limite de operações de lista por segundo	1	10 (valor padrão)
Ajustável	Não	Sim ²
Tamanho máximo do documento	4 MB	500 MB
Ajustável	Não	Não
Número máximo de páginas (Análise)	2	2000
Ajustável	Não	Não
Tamanho máximo do arquivo de rótulos	10 MB	10 MB
Ajustável	Não	Não
Tamanho máximo da resposta JSON do OCR	500 MB	500 MB
Ajustável	Não	Não
Número máximo de modelos de template	500	5000
Ajustável	Não	Não
Número máximo de modelos neurais	100	500
Ajustável	Não	Não

Uso de modelo personalizado

Cota	Gratuito (F0) ¹	Standard (S0)
Compor o limite do modelo	5	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Neural e Generativo**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Neural e Generativo**	50,000	50.000 (valor padrão)
Ajustável	Não	Não
Treinamento de modelo neural personalizado	10 horas por mês ⁵	sem limite (pagamento por hora), comece com 10 horas gratuitas por mês
Ajustável	Não	Sim ³
*Número máximo de páginas (Treinamento) Classificador**	25,000	25.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documento (classes) Classificador**	1000	1000 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1GB	2 GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de exemplos por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Uso de modelo personalizado

Cota	Gratuito (F0) ¹	Standard (S0)
Compor o limite do modelo	5	200 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Neural**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Neural**	50,000	50.000 (valor padrão)
Ajustável	Não	Não
Treinamento de modelo neural personalizado	10 por mês	20 por mês
Ajustável	Não	Sim ³
*Número máximo de páginas (Treinamento) Classificador**	10.000	10.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documento (classes) Classificador**	500	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1GB	1 GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de exemplos por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Uso de modelo personalizado

Cota	Gratuito (F0) ¹	Standard (S0)
Compor o limite do modelo	5	200 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Neural**	1 GB ³	1 GB (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Modelo**	50 MB ⁴	50 MB (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Modelo**	500	500 (valor padrão)
Ajustável	Não	Não
*Número máximo de páginas (Treinamento) Neural**	50,000	50.000 (valor padrão)
Ajustável	Não	Não
Treinamento de modelo neural personalizado	10 por mês	20 por mês
Ajustável	Não	Sim ³
*Número máximo de páginas (Treinamento) Classificador**	10.000	10.000 (valor padrão)
Ajustável	Não	Não
*Número máximo de tipos de documento (classes) Classificador**	500	500 (valor padrão)
Ajustável	Não	Não
*Tamanho do conjunto de dados de treinamento Classificador**	1GB	1 GB (valor padrão)
Ajustável	Não	Não
*Número mínimo de exemplos por classe Classificador**	5	5 (valor padrão)
Ajustável	Não	Não

Limites de modelo personalizado

Cota	Gratuito (F0) ¹	Standard (S0)
Compor o limite do modelo	5	200 (valor padrão)
Ajustável	Não	Não
Tamanho do conjunto de dados de treinamento	50 MB	50 MB (valor padrão)
Ajustável	Não	Não
Número máximo de páginas (Treinamento)	500	500 (valor padrão)
Ajustável	Não	Não

¹ Para o nível de preços Gratuito (F0), veja também os limites mensais na página de preços.
² Veja as práticas recomendadas e as instruções de ajuste.
³ A contagem de treinamento de modelos neurais é redefinida a cada mês. Abra uma solicitação de suporte para aumentar o limite de treinamento mensal. A partir da API v4.0, as solicitações de treinamento com mais de 20 solicitações em um mês de calendário são cobradas na camada de treinamento. Consulte os preços para obter detalhes.

⁴ Esse limite se aplica a todos os documentos encontrados na pasta do conjunto de dados de treinamento antes de quaisquer atualizações relacionadas à rotulagem.

⁵ Esse limite se aplica somente a v 4.0 (2024-11-30 GA) modelos neurais personalizados. A partir de v 4.0, oferecemos suporte ao treinamento de documentos maiores por durações mais longas (até 10 horas gratuitamente e incorrendo em encargos após). Para obter mais informações, consulte a página de modelo neural personalizado.

Descrição detalhada, ajuste de cota e práticas recomendadas

Os limites padrão podem ser estendidos solicitando um aumento por meio de um tíquete de suporte. Antes de solicitar um aumento de cota (quando aplicável), verifique se é necessário.

Se o aplicativo retornar o Código de Resposta 429 (muitas solicitações), você estará acima do limite para um ou mais dos limites de transações por segundo (TPS):

Analisar o limite de transações por segundo O TPS para enviar solicitações de análise (POST)
Obter o limite de operações por segundo O TPS para sondagem de resultados em operações de análise (GET)
Limite de operações de gerenciamento de modelo por segundo Operações relacionadas ao gerenciamento de modelos, como compilar/treinar e copiar.
Limite de operações de lista por segundo Operações relacionadas à listagem de modelos, operações.

Práticas recomendadas gerais para mitigar o estrangulamento

Para reduzir ao máximo problemas relacionados à limitação (Código de Resposta 429), recomendamos usar as técnicas a seguir:

Implementar lógica de repetição em seu aplicativo
Evite alterações acentuadas na carga de trabalho. Aumentar gradualmente a carga de trabalho
Exemplo. Seu aplicativo está usando o Document Intelligence e sua carga de trabalho atual é de 10 TPS (transações por segundo). No próximo segundo, você aumentará a carga para 40 TPS. O resultado é um código de resposta 429 para algumas solicitações, pois você excedeu o limite de 15 TPS para realizar operações de análise. Você pode recuar do processamento para ficar abaixo dos 15 TPS ou solicitar um aumento no TPS para dar suporte a seus volumes mais altos.

As próximas seções descrevem casos específicos de ajuste de cotas. Ir para Document Intelligence: aumentando o limite de solicitações simultâneas

Aumento do limite de transações por segundo solicitadas

Por padrão, o número de transações por segundo é limitado a 15 transações por segundo para um recurso do Document Intelligence. Para a camada de preços Standard, podem ser feitas solicitações de aumento de TPS, mas se elas podem ser aprovadas e em qual ajuste de nível de TPS dependerá dos padrões de uso diário e das melhores práticas que estão sendo seguidas. Antes de enviar a solicitação, verifique se você está familiarizado com o material nesta seção e ciente dessas práticas recomendadas.

Aumentar o limite de Solicitação Simultânea não afeta diretamente seus custos. O serviço de Inteligência de Documentos usa o modelo "Pague apenas pelo que usar". O limite define o nível que o Serviço pode escalar antes de começar a controlar suas solicitações.

O valor existente de diferentes categorias de limite de solicitação está disponível através do portal do Azure, na guia de monitoramento do painel de visão geral do recurso.

Criar e enviar solicitação de suporte para o aumento do TPS

Inicie o aumento do limite de transações por segundo (TPS) para seu recurso enviando a Solicitação de Suporte:

Entre no portal Azure
Selecione o Recurso de Inteligência Documental para o qual você deseja aumentar o limite de TPS
Selecione -Nova solicitação de suporte- (-Suporte + solução de problemas - grupo). Uma nova janela é exibida com informações preenchidas automaticamente sobre sua Assinatura Azure e Azure Recurso
Insira -Resumo- (como "Aumentar o limite do TPS do Document Intelligence")
Selecione "Validação de cota ou uso" para o campo de tipo de problema.
Selecione -Próximo: Soluções-
Prossiga ainda mais com a criação da solicitação
Insira as seguintes informações no campo -Descrição- na guia Detalhes:
- uma observação de que a solicitação é sobre a cota de Document Intelligence.
- Forneça uma expectativa de TPS que você gostaria de dimensionar para atender. Embora os aumentos de TPS sejam gratuitos, você só deve solicitar um TPS que seja razoável para sua carga de trabalho.
- Informações de recursos do Azure
- Conclua a inserção das informações necessárias e selecione o botão -Criar- na guia -Revisar + criar-
- Anote o número da solicitação de suporte nas notificações do portal do Azure. Aguarde que o suporte entre em contato com você em breve para dar continuidade ao processamento.

Exemplo de uma prática recomendada de padrão de carga de trabalho

Este exemplo apresenta a abordagem recomendada para mitigar a possível limitação de solicitações. Não é uma receita exata, mas apenas um modelo que convidamos a seguir e ajustar conforme necessário.

Vamos supor que um recurso de inteligência de documentos tenha seu limite padrão definido. Inicie a carga de trabalho para enviar suas solicitações de análise. Se você descobrir que está vendo uma limitação frequente com o código de resposta 429 ao verificar a conclusão, comece implementando uma retirada exponencial na solicitação de resposta de análise GET. Usando um tempo de espera progressivamente maior entre novas tentativas de respostas de erro consecutivas, por exemplo, um padrão 2-5-13-34 de atrasos entre solicitações. Em geral, recomendamos não chamar a resposta get analyze mais de uma vez a cada 2 segundos para uma solicitação POST correspondente. A resposta analyze também contém um cabeçalho retry-after que indica em segundos quanto tempo você deve esperar antes de verificar a conclusão da solicitação.

Se você descobrir que está sofrendo limitações no número de solicitações POST para documentos enviados, considere adicionar um atraso entre as solicitações. Se sua carga de trabalho exigir um maior grau de processamento simultâneo, você precisará criar uma solicitação de suporte para aumentar os limites de serviço em transações por segundo.

Em geral, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de ir para produção.

Próximas etapas

Saiba mais sobre códigos de erro e solução de problemas

Comentários

Esta página foi útil?

Last updated on 2026-05-08

Cotas e limites de serviço

Uso de modelo

Faturamento

Uso de modelo personalizado

Uso de modelo personalizado

Uso de modelo personalizado

Limites de modelo personalizado

Descrição detalhada, ajuste de cota e práticas recomendadas

Práticas recomendadas gerais para mitigar o estrangulamento

Aumento do limite de transações por segundo solicitadas

Criar e enviar solicitação de suporte para o aumento do TPS

Exemplo de uma prática recomendada de padrão de carga de trabalho

Próximas etapas

Comentários

Recursos adicionais