Modelos personalizados compostos pelo Document Intelligence

Este conteúdo se aplica a:checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (desativação)red-checkmarkv2.1 (desativação)

::: moniker-end

Este conteúdo se aplica a:checkmarkv3.1 (GA) | Versão mais recente:purple-checkmarkv4.0 (GA) | Versões anteriores:blue-checkmarkv3.0blue-checkmarkv2.1

Este conteúdo se aplica a:marca de seleção vermelhav3.0 (descontinuada) | Versões mais recentes:marca de seleção púrpurav4.0 (GA)marca de seleção púrpurav3.1 | Versão anterior:marca de seleção azulv2.1 (descontinuada)

Esse conteúdo se aplica a:red-checkmarkv2.1 | Versão mais recente:blue-checkmarkv4.0 (GA)

Importante

A operação v4.0 2024-11-30 (GA) model compose adiciona um classificador explicitamente treinado em vez de um classificador implícito para análise. Para a versão anterior do modelo composto, consulte Modelos personalizados compostos v3.1. Se você estiver usando modelos compostos no momento, considere atualizar para a implementação mais recente.

O que é um modelo composto?

Com modelos compostos, você pode agrupar vários modelos personalizados em um modelo composto chamado com uma única ID de modelo. Por exemplo, seu modelo composto pode incluir modelos personalizados treinados para analisar seus pedidos de compra de suprimentos, equipamentos e móveis. Em vez de tentar selecionar manualmente o modelo apropriado, você pode usar um modelo composto para determinar o modelo personalizado apropriado para cada análise e extração.

Alguns cenários exigem classificar o documento primeiro e, em seguida, analisar o documento com o modelo mais adequado para extrair os campos do modelo. Esses cenários podem incluir os em que um usuário carrega um documento, mas o tipo de documento não é explicitamente conhecido. Outro cenário pode ser quando vários documentos são digitalizados juntos em um único arquivo e o arquivo é enviado para processamento. Em seguida, seu aplicativo precisa identificar os documentos do componente e selecionar o melhor modelo para cada documento.

Em versões anteriores, a model compose operação executou uma classificação implícita para decidir qual modelo personalizado representa melhor o documento enviado. A implementação 2024-11-30 (GA) da model compose operação substitui a classificação implícita das versões anteriores por uma etapa de classificação explícita e adiciona roteamento condicional.

Benefícios da operação de composição do novo modelo

A nova model compose operação exige que você treine um classificador explícito e forneça vários benefícios.

  • Melhoria incremental contínua. Você pode melhorar consistentemente a qualidade do classificador adicionando mais exemplos e melhorando incrementalmente a classificação. Esse ajuste fino garante que seus documentos sejam sempre roteados para o modelo correto para extração.

  • Controle total sobre o roteamento. Ao adicionar o roteamento baseado em confiança, você fornece um limite de confiança para o tipo de documento e a resposta de classificação.

  • Ignorar tipos específicos de documento durante a operação. Implementações anteriores da model compose operação selecionaram o melhor modelo de análise para extração com base na pontuação de confiança, mesmo que as pontuações de confiança mais altas fossem relativamente baixas. Ao fornecer um limite de confiança ou não mapear explicitamente um tipo de documento conhecido da classificação para um modelo de extração, você pode ignorar tipos de documento específicos.

  • Analise várias instâncias do mesmo tipo de documento. Quando emparelhada com a opção splitMode do classificador, a model compose operação pode detectar várias instâncias do mesmo documento em um arquivo e dividir o arquivo para processar cada documento de forma independente. O uso splitMode habilita o processamento de várias instâncias de um documento em uma única solicitação.

  • Suporte para adicionar recursos. Adicionar recursos como campos de consulta ou códigos de barras também pode ser especificado como parte dos parâmetros do modelo de análise.

  • O máximo de modelo personalizado atribuído foi expandido para 500. A nova implementação da model compose operação permite atribuir até 500 modelos personalizados treinados a um único modelo composto.

Como usar Model Compose

  • Comece coletando amostras de todos os documentos necessários, incluindo amostras com informações que devem ser extraídas ou ignoradas.

  • Treine um classificador organizando os documentos em pastas em que os nomes das pastas são o tipo de documento que você pretende usar em sua definição de modelo composta.

  • Por fim, treine um modelo de extração para cada um dos tipos de documento que você pretende usar.

  • Depois que os modelos de classificação e extração forem treinados, use o Document Intelligence Studio, as bibliotecas de clientes ou a API REST para compor os modelos de classificação e extração em um modelo composto.

Use o splitMode parâmetro para controlar o comportamento de divisão de arquivos:

  • Nenhum. O arquivo inteiro é tratado como um único documento.
  • perPage. Cada página no arquivo é tratada como um documento separado.
  • auto. O arquivo é dividido automaticamente em documentos.

Cobrança e preços

Modelos compostos são cobrados da mesma forma que modelos personalizados individuais. O preço é baseado no número de páginas analisadas pelo modelo de análise downstream. A cobrança é baseada no preço de extração das páginas encaminhadas para um modelo de extração. Com a adição da classificação explícita, encargos são incorridos para a classificação de todas as páginas do arquivo de entrada. Para obter mais informações, consulte a página de preços do Document Intelligence.

Usar a operação de composição de modelo

  • Comece criando uma lista de todas as IDs de modelo que você deseja redigir em um único modelo.

  • Redigir os modelos em uma única ID de modelo usando o Studio, a API REST ou as bibliotecas de cliente.

  • Use a ID do modelo composto para analisar documentos.

Faturamento

Modelos compostos são cobrados da mesma forma que modelos personalizados individuais. O preço é baseado no número de páginas analisadas. A cobrança é baseada no preço de extração das páginas encaminhadas para um modelo de extração. Para obter mais informações, consulte a página de preços do Document Intelligence.

  • Não há nenhuma alteração nos preços para analisar um documento usando um modelo personalizado individual ou um modelo personalizado composto.

Recursos de modelos compostos

  • Custom template e custom neural podem ser integrados em um único modelo composto em várias versões de API.

  • A resposta inclui uma docType propriedade para indicar qual dos modelos compostos foi usado para analisar o documento.

  • Para custom template modelos, o modelo composto pode ser criado usando variações de um modelo personalizado ou tipos de formulário diferentes. Essa operação é útil quando formulários de entrada pertencem a um dos vários modelos.

  • Para custom neural modelos, a melhor prática é adicionar todas as diferentes variações de um único tipo de documento em um único conjunto de dados de treinamento e treinar em um modelo neural personalizado. A model compose operação é mais adequada para cenários quando você tem documentos de diferentes tipos sendo enviados para análise.

Redigir limites de modelo

  • Com a model compose operação, você pode atribuir até 500 modelos a uma única ID de modelo. Se o número de modelos que quero redigir exceder o limite superior de um modelo composto, você poderá usar uma destas alternativas:

  • Analisar um documento usando modelos compostos é idêntico à análise de um documento usando um único modelo. O Analyze Document resultado retorna uma docType propriedade que indica quais dos modelos de componente que você selecionou para analisar o documento.

  • No momento, a operação model compose está disponível somente para modelos personalizados treinados com rótulos.

Compatibilidade de modelos compostos

Tipo de modelo personalizado Modelos treinados com v2.1 e v2.0 Modelo personalizado e modelos neurais v3.1 e v3.0 Template personalizado e modelos neurais v4.0 2024-11-30 (GA)
Modelos treinados com as versões 2.1 e v2.0 Sem suporte Sem suporte Sem suporte
Modelo personalizado e modelos neurais v3.0 e v3.1 Sem suporte Suportado Suportado
Modelo personalizado e modelos neurais v4.0 Sem suporte Suportado Suportado
  • Para compor um modelo treinado com uma versão anterior da API (v2.1 ou anterior), treine um modelo com a API v3.0 usando o mesmo conjunto de dados rotulado. Essa adição garante que o modelo v2.1 possa ser composto com outros modelos.

  • Com modelos compostos usando a v2.1 da API continua a ter suporte, não exigindo atualizações.

Opções de desenvolvimento

O Document Intelligence v4.0:2024-11-30 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos
Modelo personalizado Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modelo composto Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

O Document Intelligence v3.1:2023-07-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos
Modelo personalizado Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modelo composto Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

O Document Intelligence v3.0:2022-08-31 (GA) dá suporte às seguintes ferramentas, aplicativos e bibliotecas:

Recurso Recursos
Modelo personalizado Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modelo composto Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

O Document Intelligence v2.1 dá suporte aos seguintes recursos:

Recurso Recursos
Modelo personalizado Ferramenta de rotulagem do Document Intelligence
REST API
SDK do cliente
Contêiner do Docker do Document Intelligence
Modelo composto • ferramenta de rotulagem Document Intelligence
REST API
C# SDK
Java SDK
• SDK javaScript
Python SDK

Próximas etapas

Saiba como criar e redigir modelos personalizados: