Intelligence sui documenti composta da modelli personalizzati

Questo contenuto si applica a:checkmarkv4.0 (GA) | Versioni precedenti:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (ritiro)red-checkmarkv2.1 (ritiro)

::: moniker-end

Questo contenuto si applica a:segno di spuntav3.1 (GA) | Versione più recente:segno di spunta violav4.0 (GA) | Versioni precedenti:segno di spunta bluv3.0segno di spunta bluv2.1

Questo contenuto si applica a:segno di spunta rossov3.0 (in dismissione) | Versioni più recenti:segno di spunta violav4.0 (GA)segno di spunta violav3.1 | Versione precedente:segno di spunta bluv2.1 (in dismissione)

Questo contenuto si applica a:red-checkmarkv2.1 | Versione più recente:blue-checkmarkv4.0 (GA)

Importante

L'operazione v4.0 2024-11-30 (GA) model compose aggiunge un classificatore sottoposto a training esplicito anziché un classificatore implicito per l'analisi. Per la versione precedente del modello composto, vedere Modelli personalizzati composti v3.1. Se attualmente si usano modelli composti, è consigliabile eseguire l'aggiornamento all'implementazione più recente.

Che cos'è un modello composto?

Con i modelli composti, è possibile raggruppare più modelli personalizzati in un modello composto denominato con un singolo ID modello. Ad esempio, il modello composto può includere modelli personalizzati sottoposti a training per analizzare l'offerta, l'attrezzatura e gli ordini di acquisto di mobili. Anziché tentare manualmente di selezionare il modello appropriato, è possibile usare un modello composto per determinare il modello personalizzato appropriato per ogni analisi ed estrazione.

Alcuni scenari richiedono prima di tutto la classificazione del documento e quindi l'analisi del documento con il modello più adatto per estrarre i campi dal modello. Tali scenari possono includere quelli in cui un utente carica un documento, ma il tipo di documento non è noto in modo esplicito. Un altro scenario può essere quando più documenti vengono analizzati insieme in un singolo file e il file viene inviato per l'elaborazione. L'applicazione deve quindi identificare i documenti dei componenti e selezionare il modello migliore per ogni documento.

Nelle versioni precedenti, l'operazione model compose ha eseguito una classificazione implicita per decidere quale modello personalizzato rappresenta meglio il documento inviato. L'implementazione 2024-11-30 (GA) dell'operazione model compose sostituisce la classificazione implicita delle versioni precedenti con un passaggio di classificazione esplicito e aggiunge il routing condizionale.

Vantaggi dell'operazione di composizione del nuovo modello

La nuova model compose operazione richiede di eseguire il training di un classificatore esplicito e offre diversi vantaggi.

  • Miglioramento incrementale continuo. È possibile migliorare costantemente la qualità del classificatore aggiungendo altri campioni e migliorando in modo incrementale la classificazione. Questa ottimizzazione garantisce che i documenti vengano sempre indirizzati al modello corretto per l'estrazione.

  • Controllo completo sul routing. Aggiungendo il routing basato sull'attendibilità, si fornisce una soglia di attendibilità per il tipo di documento e la risposta di classificazione.

  • Ignorare i tipi di documento specifici durante l'operazione. Le implementazioni precedenti dell'operazione model compose hanno selezionato il modello di analisi migliore per l'estrazione in base al punteggio di attendibilità anche se i punteggi di attendibilità più alti erano relativamente bassi. Fornendo una soglia di attendibilità o non eseguendo in modo esplicito il mapping di un tipo di documento noto dalla classificazione a un modello di estrazione, è possibile ignorare tipi di documento specifici.

  • Analizzare più istanze dello stesso tipo di documento. Se abbinato all'opzione splitMode del classificatore, l'operazione model compose può rilevare più istanze dello stesso documento in un file e suddividere il file per elaborare ogni documento in modo indipendente. L'utilizzo splitMode consente l'elaborazione di più istanze di un documento in una singola richiesta.

  • Supporto per l'aggiunta di funzionalità. È anche possibile specificare funzionalità aggiuntive come campi di query o codici a barre come parte dei parametri del modello di analisi.

  • Il massimo per il modello personalizzato assegnato è stato espanso a 500. La nuova implementazione dell'operazione model compose consente di assegnare fino a 500 modelli personalizzati sottoposti a training a un singolo modello composto.

Come utilizzare il componi modelli

  • Per iniziare, raccogliere esempi di tutti i documenti necessari, inclusi esempi con informazioni che devono essere estratte o ignorate.

  • Addestrare un classificatore organizzando i documenti nelle cartelle dove i nomi delle cartelle rappresentano il tipo di documento che si intende usare nella definizione del modello composto.

  • Infine, addestrare un modello di estrazione per ogni tipo di documento che si intende usare.

  • Dopo aver eseguito il training dei modelli di classificazione ed estrazione, usare Document Intelligence Studio, le librerie client o l'API REST per comporre i modelli di classificazione ed estrazione in un modello composto.

Usare il splitMode parametro per controllare il comportamento di suddivisione dei file:

  • Nessuno. L'intero file viene considerato come un singolo documento.
  • perPage. Ogni pagina del file viene considerata come un documento separato.
  • auto. Il file viene suddiviso automaticamente in documenti.

Fatturazione e prezzi

I modelli composti vengono fatturati come i singoli modelli personalizzati. I prezzi si basano sul numero di pagine analizzate dal modello di analisi downstream. La fatturazione si basa sul prezzo di estrazione delle pagine assegnate a un modello di estrazione. Con l’aggiunta della classificazione esplicita, vengono addebitati costi per la classificazione di tutte le pagine nel file di input. Per altre informazioni, vedere la pagina dei prezzi di Document Intelligence.

Usare l'operazione di composizione del modello

  • Per iniziare, creare un elenco di tutti gli ID modello da comporre in un singolo modello.

  • Comporre i modelli in un singolo ID modello usando Studio, l'API REST o le librerie client.

  • Usare l'ID modello composto per analizzare i documenti.

Fatturazione

I modelli composti vengono fatturati come i singoli modelli personalizzati. I prezzi si basano sul numero di pagine analizzate. La fatturazione si basa sul prezzo di estrazione delle pagine indirizzate a un modello di estrazione. Per altre informazioni, vedere la pagina dei prezzi di Document Intelligence.

  • Non sono state apportate modifiche ai prezzi per l'analisi di un documento usando un singolo modello personalizzato o un modello personalizzato composto.

Funzionalità dei modelli composti

  • Custom template e custom neural i modelli possono essere composti insieme in un singolo modello composto in più versioni dell'API.

  • La risposta include una docType proprietà per indicare quale dei modelli composti è stato usato per analizzare il documento.

  • Per custom template i modelli, il modello composto può essere creato usando varianti di un modello personalizzato o tipi di modulo diversi. Questa operazione è utile quando i moduli in ingresso appartengono a uno dei diversi modelli.

  • Per custom neural i modelli, è consigliabile aggiungere tutte le diverse varianti di un singolo tipo di documento in un singolo set di dati di training ed eseguire il training su un modello neurale personalizzato. L'operazione model compose è più adatta per gli scenari in cui sono presenti documenti di tipi diversi inviati per l'analisi.

Comporre i limiti del modello

  • Con l'operazione model compose , è possibile assegnare fino a 500 modelli a un singolo ID modello. Se il numero di modelli da comporre supera il limite massimo di un modello composto, è possibile usare una di queste alternative:

  • L'analisi di un documento tramite modelli composti è identica all'analisi di un documento tramite un singolo modello. Il Analyze Document risultato restituisce una docType proprietà che indica quale dei modelli di componenti selezionati per l'analisi del documento.

  • L'operazione model compose è attualmente disponibile solo per i modelli personalizzati sottoposti a training con etichette.

Compatibilità del modello composto

Tipo di modello personalizzato Modelli sottoposti a training con v2.1 e v2.0 Modelli personalizzati e modelli neurali v3.1 e v3.0 Modelli personalizzati e modelli neurali v4.0 2024-11-30 (GA)
Modelli addestrati con le versioni 2.1 e 2.0 Non supportato Non supportato Non supportato
Modelli personalizzati e modelli neurali v3.0 e v3.1 Non supportato Supportato Supportato
Modello personalizzato e modelli neurali v4.0 Non supportato Supportato Supportato
  • Per comporre un modello sottoposto a training con una versione precedente dell'API (v2.1 o versioni precedenti), eseguire il training di un modello con l'API v3.0 usando lo stesso set di dati etichettato. Tale aggiunta garantisce che il modello v2.1 possa essere composto con altri modelli.

  • Con i modelli composti con la versione 2.1 dell'API continua a essere supportato, senza richiedere aggiornamenti.

Opzioni di sviluppo

Document Intelligence v4.0:2024-11-30 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello personalizzato Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modello composto Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Document Intelligence v3.1:2023-07-31 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello personalizzato Document Intelligence Studio
• API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modello composto Document Intelligence Studio
API REST
SDK C#
SDK Java
SDK JavaScript
SDK Python

Document Intelligence v3.0:2022-08-31 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello personalizzato Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modello composto Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK

Document Intelligence v2.1 supporta le risorse seguenti:

Funzionalità Risorse
Modello personalizzato Strumento di
etichettatura di Document Intelligence• API
REST• SDK
della libreria client• Contenitore Docker di Document Intelligence
Modello composto • strumento di etichettatura Document Intelligence
APIREST
C# SDK
Java SDK
• JavaScript SDK
Python SDK

Passaggi successivi

Informazioni su come creare e comporre modelli personalizzati: