Cotas e limites de serviço

Este conteúdo se aplica a:checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (desativação)

Esse conteúdo se aplica a:red-checkmarkv2.1 | Versão mais recente:blue-checkmarkv4.0 (GA)

Este artigo contém uma referência rápida e uma descrição detalhada da Inteligência de Documentos do Azure em Quotas e Limites das Ferramentas Foundry para todas as camadas de preços. Ele também contém algumas práticas recomendadas para evitar a limitação de solicitações.

Uso de modelo

Tipos de documento com suporte Ler Layout Modelos predefinidos Modelos personalizados Capacidades de complemento
PDF ✔️ ✔️ ✔️ ✔️ ✔️
Imagens: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = com suporte ✖️ = Sem suporte

O Document Intelligence v4.0 2024-11-30 (GA) suporta recursos de página e linha com as seguintes restrições:

  • Não há suporte para ângulo, largura/altura e unidade.
  • Para cada objeto detectado, não há suporte para polígonos delimitadores ou regiões delimitadoras.
  • O objeto lines não é suportado.
Tipos de documento com suporte Ler Layout Modelos predefinidos Modelos personalizados
PDF ✔️ ✔️ ✔️ ✔️
Imagens: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️

✔️ = com suporte ✖️ = Sem suporte

Faturamento

A cobrança do Document Intelligence é calculada mensalmente com base no tipo de modelo e no número de páginas analisadas. Você pode encontrar métricas de uso no painel de métricas no portal do Azure. O painel exibe o número de páginas que o Azure Document Intelligence processa. Você pode verificar o custo estimado gasto no recurso usando a calculadora de preços Azure. Para obter instruções detalhadas, consulte Verificar o uso e estimar o custo. Aqui estão alguns detalhes:

  • Quando você envia um documento para análise, o serviço analisa todas as páginas, a menos que você especifique um intervalo de páginas usando o pages parâmetro em sua solicitação. Quando o serviço analisa Microsoft Excel e PowerPoint documentos por meio do modelo de leitura, OCR ou layout, ele conta cada Excel planilha e PowerPoint slide como uma página.

  • Quando o serviço analisa arquivos PDF e TIFF, ele conta cada página no arquivo PDF ou cada imagem no arquivo TIFF como uma página sem limites máximos de caracteres.

  • Quando o serviço analisa arquivos Microsoft Word e HTML aos quais os modelos de leitura e layout dão suporte, ele conta páginas em blocos de 3.000 caracteres cada. Por exemplo, se o documento contiver 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres somam um total de três páginas.

  • Os modelos de leitura e layout não dão suporte à análise de imagens inseridas ou vinculadas em arquivos Microsoft Word, Excel, PowerPoint e HTML. Portanto, o serviço não os conta como imagens adicionadas.

  • O treinamento de um modelo personalizado é sempre gratuito com o Document Intelligence. Os encargos são incorridos somente quando o serviço usa um modelo para analisar um documento.

  • O preço do contêiner é o mesmo que o preço do serviço de nuvem.

  • O Document Intelligence oferece uma camada gratuita (F0), na qual você pode testar todos os recursos do Document Intelligence. Os limites de camada livre analisam a resposta apenas para as duas primeiras páginas em uma solicitação.

  • O Document Intelligence tem um modelo de preços baseado em compromisso para cargas de trabalho grandes.

  • O modelo layout é necessário para gerar rótulos para seu conjunto de dados para treinamento personalizado. Se o conjunto de dados usado para treinamento personalizado não tiver arquivos de rótulo disponíveis, o serviço os gerará para você e cobra o uso do modelo de layout.

Cota Gratuito (F0)1 Standard (S0)
Analisar o limite de transações por segundo 1 15 (valor padrão)
Ajustável Não Sim 2
Obter o limite de operações por segundo 1 50 (valor padrão)
Ajustável Não Sim 2
Limite de operações de gerenciamento de modelo por segundo 1 5 (valor padrão)
Ajustável Não Sim 2
Limite de operações de lista por segundo 1 10 (valor padrão)
Ajustável Não Sim 2
Tamanho máximo do documento 4 MB 500 MB
Ajustável Não Não
Número máximo de páginas (Análise) 2 2000
Ajustável Não Não
Tamanho máximo do arquivo de rótulos 10 MB 10 MB
Ajustável Não Não
Tamanho máximo da resposta JSON do OCR 500 MB 500 MB
Ajustável Não Não
Número máximo de modelos de template 500 5000
Ajustável Não Não
Número máximo de modelos neurais 100 500
Ajustável Não Não

Uso de modelo personalizado

Cota Gratuito (F0) 1 Standard (S0)
Compor o limite do modelo 5 500 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento * Neural e Generativo 1 GB 3 1 GB (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável Não Não
Número máximo de páginas (Treinamento) * Modelo 500 500 (valor padrão)
Ajustável Não Não
Número máximo de páginas (Treinamento) * Neural e Generativo 50,000 50.000 (valor padrão)
Ajustável Não Não
Treinamento de modelo neural personalizado 10 horas por mês 5 sem limite (pagamento por hora), comece com 10 horas gratuitas por mês
Ajustável Não Sim 3
Número máximo de páginas (Treinamento) * Classificador 25,000 25.000 (valor padrão)
Ajustável Não Não
Número máximo de tipos de documento (classes) * Classificador 1000 1000 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento * Classificador 1GB 2 GB (valor padrão)
Ajustável Não Não
Número mínimo de exemplos por classe * Classificador 5 5 (valor padrão)
Ajustável Não Não

Uso de modelo personalizado

Cota Gratuito (F0) 1 Standard (S0)
Compor o limite do modelo 5 200 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento * Neural 1 GB 3 1 GB (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável Não Não
Número máximo de páginas (Treinamento) * Modelo 500 500 (valor padrão)
Ajustável Não Não
Número máximo de páginas (Treinamento) * Neural 50,000 50.000 (valor padrão)
Ajustável Não Não
Treinamento de modelo neural personalizado 10 por mês 20 por mês
Ajustável Não Sim 3
Número máximo de páginas (Treinamento) * Classificador 10.000 10.000 (valor padrão)
Ajustável Não Não
Número máximo de tipos de documento (classes) * Classificador 500 500 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento * Classificador 1GB 1 GB (valor padrão)
Ajustável Não Não
Número mínimo de exemplos por classe * Classificador 5 5 (valor padrão)
Ajustável Não Não

Uso de modelo personalizado

Cota Gratuito (F0) 1 Standard (S0)
Compor o limite do modelo 5 200 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento * Neural 1 GB 3 1 GB (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável Não Não
Número máximo de páginas (Treinamento) * Modelo 500 500 (valor padrão)
Ajustável Não Não
Número máximo de páginas (Treinamento) * Neural 50,000 50.000 (valor padrão)
Ajustável Não Não
Treinamento de modelo neural personalizado 10 por mês 20 por mês
Ajustável Não Sim 3
Número máximo de páginas (Treinamento) * Classificador 10.000 10.000 (valor padrão)
Ajustável Não Não
Número máximo de tipos de documento (classes) * Classificador 500 500 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento * Classificador 1GB 1 GB (valor padrão)
Ajustável Não Não
Número mínimo de exemplos por classe * Classificador 5 5 (valor padrão)
Ajustável Não Não

Limites de modelo personalizado

Cota Gratuito (F0) 1 Standard (S0)
Compor o limite do modelo 5 200 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treinamento 50 MB 50 MB (valor padrão)
Ajustável Não Não
Número máximo de páginas (Treinamento) 500 500 (valor padrão)
Ajustável Não Não

1 Para o nível de preços Gratuito (F0), veja também os limites mensais na página de preços.
2 Veja as práticas recomendadas e as instruções de ajuste.
3 A contagem de treinamento de modelos neurais é redefinida a cada mês. Abra uma solicitação de suporte para aumentar o limite de treinamento mensal. A partir da API v4.0, as solicitações de treinamento com mais de 20 solicitações em um mês de calendário são cobradas na camada de treinamento. Consulte os preços para obter detalhes.

4 Esse limite se aplica a todos os documentos encontrados na pasta do conjunto de dados de treinamento antes de quaisquer atualizações relacionadas à rotulagem.

5 Esse limite se aplica somente a v 4.0 (2024-11-30 GA) modelos neurais personalizados. A partir de v 4.0, oferecemos suporte ao treinamento de documentos maiores por durações mais longas (até 10 horas gratuitamente e incorrendo em encargos após). Para obter mais informações, consulte a página de modelo neural personalizado.

Descrição detalhada, ajuste de cota e práticas recomendadas

Os limites padrão podem ser estendidos solicitando um aumento por meio de um tíquete de suporte. Antes de solicitar um aumento de cota (quando aplicável), verifique se é necessário.

Se o aplicativo retornar o Código de Resposta 429 (muitas solicitações), você estará acima do limite para um ou mais dos limites de transações por segundo (TPS):

  • Analisar o limite de transações por segundo O TPS para enviar solicitações de análise (POST)
  • Obter o limite de operações por segundo O TPS para sondagem de resultados em operações de análise (GET)
  • Limite de operações de gerenciamento de modelo por segundo Operações relacionadas ao gerenciamento de modelos, como compilar/treinar e copiar.
  • Limite de operações de lista por segundo Operações relacionadas à listagem de modelos, operações.

Práticas recomendadas gerais para mitigar o estrangulamento

Para reduzir ao máximo problemas relacionados à limitação (Código de Resposta 429), recomendamos usar as técnicas a seguir:

  • Implementar lógica de repetição em seu aplicativo
  • Evite alterações acentuadas na carga de trabalho. Aumentar gradualmente a carga de trabalho
    Exemplo. Seu aplicativo está usando o Document Intelligence e sua carga de trabalho atual é de 10 TPS (transações por segundo). No próximo segundo, você aumentará a carga para 40 TPS. O resultado é um código de resposta 429 para algumas solicitações, pois você excedeu o limite de 15 TPS para realizar operações de análise. Você pode recuar do processamento para ficar abaixo dos 15 TPS ou solicitar um aumento no TPS para dar suporte a seus volumes mais altos.

As próximas seções descrevem casos específicos de ajuste de cotas. Ir para Document Intelligence: aumentando o limite de solicitações simultâneas

Aumento do limite de transações por segundo solicitadas

Por padrão, o número de transações por segundo é limitado a 15 transações por segundo para um recurso do Document Intelligence. Para a camada de preços Standard, podem ser feitas solicitações de aumento de TPS, mas se elas podem ser aprovadas e em qual ajuste de nível de TPS dependerá dos padrões de uso diário e das melhores práticas que estão sendo seguidas. Antes de enviar a solicitação, verifique se você está familiarizado com o material nesta seção e ciente dessas práticas recomendadas.

Aumentar o limite de Solicitação Simultânea não afeta diretamente seus custos. O serviço de Inteligência de Documentos usa o modelo "Pague apenas pelo que usar". O limite define o nível que o Serviço pode escalar antes de começar a controlar suas solicitações.

O valor existente de diferentes categorias de limite de solicitação está disponível através do portal do Azure, na guia de monitoramento do painel de visão geral do recurso.

Criar e enviar solicitação de suporte para o aumento do TPS

Inicie o aumento do limite de transações por segundo (TPS) para seu recurso enviando a Solicitação de Suporte:

  • Entre no portal Azure
  • Selecione o Recurso de Inteligência Documental para o qual você deseja aumentar o limite de TPS
  • Selecione -Nova solicitação de suporte- (-Suporte + solução de problemas - grupo). Uma nova janela é exibida com informações preenchidas automaticamente sobre sua Assinatura Azure e Azure Recurso
  • Insira -Resumo- (como "Aumentar o limite do TPS do Document Intelligence")
  • Selecione "Validação de cota ou uso" para o campo de tipo de problema.
  • Selecione -Próximo: Soluções-
  • Prossiga ainda mais com a criação da solicitação
  • Insira as seguintes informações no campo -Descrição- na guia Detalhes:
    • uma observação de que a solicitação é sobre a cota de Document Intelligence.
    • Forneça uma expectativa de TPS que você gostaria de dimensionar para atender. Embora os aumentos de TPS sejam gratuitos, você só deve solicitar um TPS que seja razoável para sua carga de trabalho.
    • Informações de recursos do Azure
    • Conclua a inserção das informações necessárias e selecione o botão -Criar- na guia -Revisar + criar-
    • Anote o número da solicitação de suporte nas notificações do portal do Azure. Aguarde que o suporte entre em contato com você em breve para dar continuidade ao processamento.

Exemplo de uma prática recomendada de padrão de carga de trabalho

Este exemplo apresenta a abordagem recomendada para mitigar a possível limitação de solicitações. Não é uma receita exata, mas apenas um modelo que convidamos a seguir e ajustar conforme necessário.

Vamos supor que um recurso de inteligência de documentos tenha seu limite padrão definido. Inicie a carga de trabalho para enviar suas solicitações de análise. Se você descobrir que está vendo uma limitação frequente com o código de resposta 429 ao verificar a conclusão, comece implementando uma retirada exponencial na solicitação de resposta de análise GET. Usando um tempo de espera progressivamente maior entre novas tentativas de respostas de erro consecutivas, por exemplo, um padrão 2-5-13-34 de atrasos entre solicitações. Em geral, recomendamos não chamar a resposta get analyze mais de uma vez a cada 2 segundos para uma solicitação POST correspondente. A resposta analyze também contém um cabeçalho retry-after que indica em segundos quanto tempo você deve esperar antes de verificar a conclusão da solicitação.

Se você descobrir que está sofrendo limitações no número de solicitações POST para documentos enviados, considere adicionar um atraso entre as solicitações. Se sua carga de trabalho exigir um maior grau de processamento simultâneo, você precisará criar uma solicitação de suporte para aumentar os limites de serviço em transações por segundo.

Em geral, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de ir para produção.

Próximas etapas