Quotas e limites de serviço

Este conteúdo aplica-se a:checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (a retirar-se)

Este conteúdo aplica-se a:red-checkmarkv2.1 | Última versão:blue-checkmarkv4.0 (GA)

Este artigo contém tanto uma referência rápida quanto uma descrição detalhada da Azure Informação Documental nas Ferramentas Foundry, Quotas e Limites para todos os níveis de preços. Contém também algumas boas práticas para evitar limitação de pedidos.

Utilização do modelo

Tipos de documentos suportados Leia Disposição Modelos pré-construídos Modelos personalizados Capacidades adicionais
PDF ✔️ ✔️ ✔️ ✔️ ✔️
Imagens: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = suportado ✖️ = Não suportado

O Document Intelligence v4.0 2024-11-30 (GA) suporta funcionalidades de página e linha com as seguintes restrições:

  • Ângulo, largura/altura e unidade não são suportados.
  • Para cada objeto detetado, não são suportados polígonos limitadores nem regiões limitantes.
  • O lines objeto não é suportado.
Tipos de documentos suportados Leia Disposição Modelos pré-construídos Modelos personalizados
PDF ✔️ ✔️ ✔️ ✔️
Imagens: JPEG/JPG, PNG, BMP, TIFF, HEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCX, PPTX, XLS ✔️ ✖️ ✖️ ✖️

✔️ = suportado ✖️ = Não suportado

Faturamento

A faturação de Inteligência de Documentos é calculada mensalmente com base no tipo de modelo e no número de páginas analisadas. Pode encontrar métricas de utilização no painel de métricas do portal Azure. O painel mostra o número de páginas que o Azure Document Intelligence processa. Pode verificar o custo estimado gasto no recurso usando a calculadora de preços Azure. Para instruções detalhadas, consulte Verificar utilização e estimar o custo. Aqui ficam alguns detalhes:

  • Quando submete um documento para análise, o serviço analisa todas as páginas, a menos que especifique um intervalo de páginas usando o pages parâmetro do seu pedido. Quando o serviço analisa documentos Microsoft Excel e PowerPoint através do modelo de leitura, OCR ou layout, conta cada folha de cálculo Excel e slide PowerPoint como uma única página.

  • Quando o serviço analisa ficheiros PDF e TIFF, conta cada página no ficheiro PDF ou cada imagem no ficheiro TIFF como uma página, sem limites máximos de caracteres.

  • Quando o serviço analisa ficheiros Microsoft Word e HTML suportados pelos modelos de leitura e layout, conta as páginas em blocos de 3.000 caracteres cada. Por exemplo, se o seu documento contém 7.000 caracteres, as duas páginas com 3.000 caracteres cada e uma página com 1.000 caracteres somam um total de três páginas.

  • Os modelos de leitura e layout não suportam a análise de imagens incorporadas ou ligadas em ficheiros Microsoft Word, Excel, PowerPoint e HTML. Portanto, o serviço não as considera como imagens adicionadas.

  • Treinar um modelo personalizado é sempre gratuito com Document Intelligence. As cobranças são incorridas apenas quando o serviço utiliza um modelo para analisar um documento.

  • O preço dos contentores é o mesmo que o preço dos serviços cloud.

  • O Document Intelligence oferece um nível gratuito (F0) onde pode testar todas as funcionalidades do Document Intelligence. Os limites do nível gratuito analisam a resposta apenas às duas primeiras páginas de um pedido.

  • A Inteligência de Documentos tem um modelo de preços baseado em compromisso para grandes cargas de trabalho.

  • O modelo de Layout é necessário para gerar etiquetas para o seu conjunto de dados para treino personalizado. Se o conjunto de dados que usa para treino personalizado não tiver ficheiros de etiquetas disponíveis, o serviço gera-os por si e cobra-lhe pelo uso do modelo de layout.

Quota Livre (F0)1 Standard (S0)
Analisar o limite de transações por segundo 1 15 (valor padrão)
Ajustável Não Sim 2
Obter limite de operações por segundo 1 50 (valor padrão)
Ajustável Não Sim 2
Limite de operações de gestão de modelos por segundo 1 5 (valor padrão)
Ajustável Não Sim 2
Limite de operações por segundo 1 10 (valor padrão)
Ajustável Não Sim 2
Tamanho máximo do documento 4 MB 500 MB
Ajustável Não Não
Número máximo de páginas (Análise) 2 2000
Ajustável Não Não
Tamanho máximo do ficheiro de etiquetas 10 MB 10 MB
Ajustável Não Não
Tamanho máximo da resposta OCR json 500 MB 500 MB
Ajustável Não Não
Número máximo de modelos Template 500 5000
Ajustável Não Não
Número máximo de modelos neurais 100 500
Ajustável Não Não

Utilização de modelos personalizados

Quota Livre (F0) 1 Standard (S0)
Limite do Modelo Compose 5 500 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino * Neural e Generativo 1 GB 3 1 GB (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável Não Não
Número máximo de páginas (Formação) * Modelo 500 500 (valor padrão)
Ajustável Não Não
Número máximo de páginas (Treino) * Neural e Generativo 50,000 50.000 (valor padrão)
Ajustável Não Não
Treinar modelo neural personalizado 10 horas por mês 5 Sem limite (paga por hora), começa com 10 horas livres por mês
Ajustável Não Sim 3
Número máximo de páginas (Treino) * Classificador 25,000 25.000 (valor padrão)
Ajustável Não Não
Número máximo de tipos de documentos (classes) * Classificador 1000 1000 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino * Classificador 1GB 2GB (valor padrão)
Ajustável Não Não
Número mínimo de amostras por classe * Classificador 5 5 (valor padrão)
Ajustável Não Não

Utilização de modelos personalizados

Quota Livre (F0) 1 Standard (S0)
Limite do Modelo Compose 5 200 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino * Neural 1 GB 3 1 GB (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável Não Não
Número máximo de páginas (Formação) * Modelo 500 500 (valor padrão)
Ajustável Não Não
Número máximo de páginas (Formação) * Neural 50,000 50.000 (valor padrão)
Ajustável Não Não
Treinar modelo neural personalizado 10 por mês 20 por mês
Ajustável Não Sim 3
Número máximo de páginas (Treino) * Classificador 10.000 10.000 (valor padrão)
Ajustável Não Não
Número máximo de tipos de documentos (classes) * Classificador 500 500 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino * Classificador 1GB 1GB (valor padrão)
Ajustável Não Não
Número mínimo de amostras por classe * Classificador 5 5 (valor padrão)
Ajustável Não Não

Utilização de modelos personalizados

Quota Livre (F0) 1 Standard (S0)
Limite do Modelo Compose 5 200 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino * Neural 1 GB 3 1 GB (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino * Modelo 50 MB 4 50 MB (valor padrão)
Ajustável Não Não
Número máximo de páginas (Formação) * Modelo 500 500 (valor padrão)
Ajustável Não Não
Número máximo de páginas (Formação) * Neural 50,000 50.000 (valor padrão)
Ajustável Não Não
Treinar modelo neural personalizado 10 por mês 20 por mês
Ajustável Não Sim 3
Número máximo de páginas (Treino) * Classificador 10.000 10.000 (valor padrão)
Ajustável Não Não
Número máximo de tipos de documentos (classes) * Classificador 500 500 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino * Classificador 1GB 1GB (valor padrão)
Ajustável Não Não
Número mínimo de amostras por classe * Classificador 5 5 (valor padrão)
Ajustável Não Não

Limites de modelos personalizados

Quota Livre (F0) 1 Standard (S0)
Limite do Modelo Compose 5 200 (valor padrão)
Ajustável Não Não
Tamanho do conjunto de dados de treino 50 MB 50 MB (valor padrão)
Ajustável Não Não
Número máximo de páginas (Formação) 500 500 (valor padrão)
Ajustável Não Não

1 Para a categoria de preços Gratuito (F0), veja também os limites mensais na página de preços.
2 Consulte as melhores práticas e instruções de ajuste.
3 A contagem de treino de modelos neurais é reiniciada todos os meses do calendário. Abra um pedido de apoio para aumentar o limite mensal de treino. A partir da API v4.0, os pedidos de treino que ultrapassam 20 num mês civil são faturados de acordo com o nível de treino. Consulte os preços para mais detalhes.

4 Este limite aplica-se a todos os documentos encontrados na pasta do seu conjunto de dados de treino antes de quaisquer atualizações relacionadas com rotulagem.

5 Este limite aplica-se apenas a v 4.0 (2024-11-30 GA) modelos neurais personalizados. A partir de v 4.0, suportamos o treino de documentos de maior dimensão durante períodos mais longos (até 10 horas gratuitamente, incorrendo em custos posteriormente). Para mais informações, consulte a página de modelos neurais personalizados.

Descrição detalhada, ajuste de quotas e boas práticas

Os limites padrão podem ser prolongados solicitando um aumento através de um pedido de suporte ao cliente. Antes de solicitar um aumento da quota (quando aplicável), certifique-se de que é necessário.

Se a sua candidatura devolver o Código de Resposta 429 (Pedidos a mais), está acima do limite para um ou mais dos limites de transações por segundo (TPS):

  • Limite de transações por segundo para a análise O limite de TPS para o envio de pedidos de análise (POST)
  • Limite de operações por segundo O TPS para sondagens de resultados em operações de análise (GET)
  • Limite de operações de gestão de modelos por segundo Operações relacionadas com a gestão de modelos, como compilar/treinar e copiar.
  • Limite de operações por segundo Operações relacionadas com modelos de listagem, operações.

Melhores práticas gerais para mitigar o controlo

Para minimizar problemas relacionados com o throttling (Código de Resposta 429), recomendamos o uso das seguintes técnicas:

  • Implemente lógica de repetição no seu aplicativo
  • Evite mudanças bruscas na carga de trabalho. Aumenta gradualmente a carga de trabalho
    Exemplo. A sua aplicação está a usar Inteligência de Documentos e a sua carga de trabalho atual é de 10 TPS (transações por segundo). No segundo seguinte aumentas a carga para 40 TPS. O resultado é um código de resposta 429 para alguns pedidos, pois ultrapassa o limite de 15 TPS para submeter operações de análise. Podes reduzir o processamento para ficares abaixo dos 15 TPS ou pedir um aumento no TPS para suportar volumes mais elevados.

As secções seguintes descrevem casos específicos de ajuste de quotas. Saltar para Inteligência de Documentos: aumentar o limite de pedidos concorrentes

Aumento do limite de pedidos de transações por segundo

Por defeito, o número de transações por segundo está limitado a 15 transações por segundo para um recurso de Inteligência de Documentos. Para o escalão de preços Standard, os pedidos de aumento do TPS podem ser submetidos, mas se poderão ser aprovados e a que nível de ajuste TPS dependerá dos padrões diários de utilização e das melhores práticas que estão a ser seguidas. Antes de submeter o pedido, certifique-se de que está familiarizado com o material desta secção e destas melhores práticas.

Aumentar o limite de pedidos concorrentes não afeta diretamente os seus custos. O serviço de Inteligência Documental utiliza o modelo "Pague apenas pelo que utiliza". O limite define até que ponto o Serviço pode escalar antes de começar a limitar os seus pedidos.

O valor existente das diferentes categorias de limites de pedidos está disponível através do portal Azure, no separador de monitorização da lâmina de visão geral de recursos.

Criar e submeter um pedido de apoio para aumento do TPS

Inicie o aumento do limite de transações por segundo (TPS) para o seu recurso submetendo o Pedido de Suporte:

  • Iniciar sessão no portal Azure
  • Selecione o Document Intelligence Resource para o qual pretende aumentar o limite de TPS
  • Selecione -Novo Pedido de Suporte- (-Grupo Suporte + Resolução de Problemas-). Aparece uma nova janela com informações preenchidas automaticamente sobre a sua Subscrição do Azure e o Recurso do Azure
  • Introduzir -Resumo- (como "Aumentar o limite TPS de Inteligência Documental")
  • Selecione "Validação de quota ou utilização" para o campo do tipo de problema.
  • Selecionar -Próximo: Soluções-
  • Prossiga com a criação do pedido
  • Insira a seguinte informação no campo -Description-, no separador Detalhes:
    • uma nota: que o pedido diz respeito à cota de Inteligência de Documentos.
    • Dê uma expectativa de TPS que gostaria de escalar para cumprir. Embora os aumentos no TPS sejam gratuitos, apenas deve solicitar um TPS que seja adequado à sua carga de trabalho.
    • informações de recursos do Azure
    • Complete a introdução da informação necessária e selecione o botão -Criar- no separador -Review + criar-
    • Note o número de pedido de suporte nas notificações do portal Azure. Espere que o Suporte o contacte em breve para mais processamentos.

Exemplo de melhor prática de um padrão de carga de trabalho

Este exemplo apresenta a abordagem que recomendamos seguir para mitigar possíveis limitações de pedidos. Não é uma receita exata, mas apenas um modelo que convidamos a seguir e ajustar conforme necessário.

Suponhamos que um recurso de Inteligência de Documentos tem o limite padrão definido. Inicie a carga de trabalho para submeter os seus pedidos de análise. Se notar que está a ver throttling frequente com o código de resposta 429 ao verificar a conclusão, comece por implementar um backoff exponencial no pedido de resposta GET analyze. Ao utilizar um tempo de espera cada vez mais longo entre tentativas de pedido para respostas consecutivas de erro, por exemplo, seguindo um padrão de atrasos 2-5-13-34 entre as solicitações. Em geral, recomendamos não chamar a resposta get analyze mais do que uma vez a cada 2 segundos para um pedido POST correspondente. A analyze resposta também contém um cabeçalho retry-after que indica quantos segundos deve esperar antes de verificar a conclusão desse pedido.

Se perceber que está a ser restringido no número de requisições POST para documentos submetidos, considere adicionar um atraso entre as requisições. Se a sua carga de trabalho exigir um grau maior de processamento simultâneo, terá então de criar um pedido de suporte para aumentar os seus limites de serviço em transações por segundo.

De um modo geral, recomendamos testar a carga de trabalho e os padrões de carga de trabalho antes de passar para produção.

Próximos passos