Modelli di elaborazione documenti

Questo contenuto si applica a:checkmarkv4.0 (GA) | Versioni precedenti:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (ritiro)red-checkmarkv2.1 (ritiro)

Questo contenuto si applica a:segno di spuntav3.1 (GA) | Versione più recente:segno di spunta violav4.0 (GA) | Versioni precedenti:segno di spunta bluv3.0segno di spunta bluv2.1

Questo contenuto si applica a:segno di spunta rossov3.0 (in dismissione) | Versioni più recenti:segno di spunta violav4.0 (GA)segno di spunta violav3.1 | Versione precedente:segno di spunta bluv2.1 (in dismissione)

Questo contenuto si applica a:red-checkmarkv2.1 | Versione più recente:blue-checkmarkv4.0 (GA)

Azure Document Intelligence in Foundry Tools supporta vari modelli che è possibile usare per aggiungere l'elaborazione intelligente dei documenti alle app e ai flussi. È possibile usare un modello predefinito specifico del dominio o eseguire il training di un modello personalizzato per rispondere alle esigenze aziendali e ai casi d'uso specifici. È possibile usare Document Intelligence con l'API REST o Python, C#, Java e le librerie client JavaScript.

Nota

I progetti di elaborazione dei documenti che coinvolgono dati finanziari, dati sanitari protetti, dati personali o dati altamente sensibili richiedono un'attenzione attenta. Assicurarsi di rispettare tutti i requisiti nazionali/regionali e specifici del settore.

Panoramica del modello

La tabella seguente illustra i modelli disponibili a livello generale per ogni API stabile.

Tipo di modello Modello 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Modelli di analisi dei documenti Leggere ✔️ ✔️ ✔️ Non disponibile
Modelli di analisi dei documenti Layout ✔️ ✔️ ✔️ ✔️
Modelli di analisi dei documenti Documento generale** Supportato in
modello di layout
✔️ ✔️ Non disponibile
Modelli predefiniti Assegno bancario ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Estratto conto bancario ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti payStub ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Contratto ✔️ ✔️ Non disponibile Non disponibile
Modelli predefiniti Scheda assicurazione sanitaria ✔️ ✔️ ✔️ Non disponibile
Modelli predefiniti Documento di identificazione ✔️ ✔️ ✔️ ✔️
Modelli predefiniti Fattura ✔️ ✔️ ✔️ ✔️
Modelli predefiniti Ricevuta ✔️ ✔️ ✔️ ✔️
Modelli predefiniti Imposte unificate statunitensi* ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Imposta usa 1040* ✔️ ✔️ Non disponibile Non disponibile
Modelli predefiniti Imposta usa 1095* ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Imposta usa 1098* ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Imposta usa 1099* ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Imposta W2 USA ✔️ ✔️ ✔️ Non disponibile
Modelli predefiniti Imposta US W4 ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Mutuo 1003 URLA negli Stati Uniti ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti US MORTGAGE 1004 URAR ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Ipoteca statunitense 1005 ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Riepilogo dell'ipoteca statunitense 1008 ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Divulgazione della chiusura di mutui statunitensi ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Certificato di matrimonio ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Carta di credito ✔️ Non disponibile Non disponibile Non disponibile
Modelli predefiniti Biglietto da visita Deprecato ✔️ ✔️ ✔️
Modello di classificazione personalizzato Classificatore personalizzato ✔️ ✔️ Non disponibile Non disponibile
Modello di estrazione personalizzato Rete neurale personalizzata ✔️ ✔️ ✔️ Non disponibile
Modello di estrazione personalizzato Modello personalizzato ✔️ ✔️ ✔️ ✔️
Modello di estrazione personalizzato Composto personalizzato ✔️ ✔️ ✔️ ✔️
Tutti i modelli Funzionalità dei componenti aggiuntivi ✔️ ✔️ Non disponibile Non disponibile

* Contiene sottomodelli. Vedere le informazioni specifiche del modello per le varianti e i sottotipi supportati.
** Tutte le funzionalità per il modello di documento generale sono disponibili nel modello di layout. Il modello generale non è più supportato.

Latenza

La latenza è il tempo necessario per un server API per gestire ed elaborare una richiesta in ingresso e recapitare la risposta in uscita al client. Il tempo necessario per analizzare un documento dipende dalle dimensioni (ad esempio, dal numero di pagine) e dal contenuto associato in ogni pagina. Document Intelligence è un servizio asincrono multi-tenant in cui la latenza per documenti simili è paragonabile ma non sempre identica. La variabilità occasionale in latenza e prestazioni è intrinseca in qualsiasi servizio basato su microservizio senza stato che elabora immagini e documenti di grandi dimensioni su larga scala. Anche se si aumentano continuamente le funzionalità hardware e di capacità e scalabilità, è possibile che si verifichino ancora problemi di latenza in fase di esecuzione.

Funzionalità del componente aggiuntivo

Per l'intelligence sui documenti sono disponibili le funzionalità aggiuntive seguenti. Per tutti i modelli ad eccezione del modello di biglietto da visita, Document Intelligence supporta ora funzionalità aggiuntive per consentire un'analisi più sofisticata. È possibile abilitare e disabilitare queste funzionalità facoltative a seconda dello scenario di estrazione dei documenti. Le funzionalità aggiuntive seguenti sono disponibili per la versione 2023-07-31 (GA) e versioni successive dell'API:

Funzionalità del componente aggiuntivo Componente aggiuntivo/Gratuito 30/11/2024 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Estrazione delle proprietà dei tipi di carattere Componente aggiuntivo ✔️ ✔️ Non disponibile Non disponibile
Estrazione di formule Componente aggiuntivo ✔️ ✔️ Non disponibile Non disponibile
Estrazione ad alta risoluzione Componente aggiuntivo ✔️ ✔️ Non disponibile Non disponibile
Estrazione di codice a barre Gratuito ✔️ ✔️ Non disponibile Non disponibile
Rilevamento della lingua Gratuito ✔️ ✔️ Non disponibile Non disponibile
Coppie chiave/valore Gratuito ✔️ Non disponibile Non disponibile Non disponibile
Campi di query Componente aggiuntivo* ✔️ Non disponibile Non disponibile Non disponibile
PDF ricercabile Componente aggiuntivo* ✔️ Non disponibile Non disponibile Non disponibile

Funzionalità di analisi dei modelli

ID modello Estrazione del contenuto Campi di query Paragrafi Ruoli dei paragrafi Segni di selezione Tabelle Coppie chiave/valore Lingue Codici Analisi dei documenti Formule* Stile carattere* Risoluzione elevata* PDF ricercabile
prebuilt-read O O O O O O
prebuilt-layout O O O O O O
prebuilt-contract O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (vari) O O O O O
prebuilt-tax.us.1095A O O O O O
prebuilt-tax.us.1095C O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (vari) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

✓ - Abilitato
O - Facoltativo
* - Le funzionalità Premium comportano costi aggiuntivi

I campi delle query vengono addebitati in modo diverso rispetto alle altre funzionalità del componente aggiuntivo. Per altre informazioni, vedere Prezzi.

Rettangolo delimitatore e coordinate del poligono

Un rettangolo delimitatore (polygon in versione 3.0 e versioni successive) è un rettangolo astratto che circonda gli elementi di testo in un documento. Una bounding box viene usata come punto di riferimento per il rilevamento degli oggetti.

  • La bounding box specifica la posizione utilizzando un piano di coordinate x e y presentato in un array di quattro coppie numeriche. Ogni coppia rappresenta un angolo della casella nell'ordine seguente: in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra.
  • Le coordinate dell'immagine vengono presentate in pixel. Per un PDF, le coordinate vengono presentate in pollici.

Supporto linguistico

I modelli universali di Document Intelligence basati sul Deep Learning supportano molte lingue. I modelli possono estrarre testo multilingue dalle immagini e dai documenti, incluse le righe di testo con lingue miste. Il supporto linguistico varia in base alla funzionalità del servizio Document Intelligence. Per un elenco completo, vedere gli articoli seguenti:

Disponibilità regionale

Document Intelligence è disponibile a livello generale in molte delle aree dell'infrastruttura globale 60+ Azure.

Per scegliere l'area più adatta a te e ai tuoi clienti, vedi Azure aree geografiche.

Dettagli del modello

Questa sezione descrive l'output previsto da ogni modello. È possibile estendere l'output della maggior parte dei modelli con funzionalità aggiuntive.

Leggere OCR

L'API Lettura usa il riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre righe e parole, le relative posizioni, le lingue rilevate e lo stile della grafia, se rilevato.

Questo documento di esempio è stato elaborato usando Document Intelligence Studio.

Screenshot che mostra un documento di esempio elaborato usando Document Intelligence Studio Read.

Analisi del layout

Il modello di analisi del layout analizza ed estrae testo, tabelle, segni di selezione e altri elementi della struttura, ad esempio titoli, intestazioni di sezione, intestazioni di pagina e piè di pagina.

Questo documento di esempio è stato elaborato usando Document Intelligence Studio.

Screenshot che mostra una pagina di giornale di esempio elaborata tramite Document Intelligence Studio.

Scheda assicurazione sanitaria

Il modello di carta assicurativa sanitaria combina potenti funzionalità OCR con modelli di Deep Learning per analizzare ed estrarre le informazioni chiave dalle schede di assicurazione sanitaria degli Stati Uniti.

Questa scheda di assicurazione sanitaria statunitense di esempio è stata elaborata usando Document Intelligence Studio.

Screenshot che mostra un esempio di analisi delle carte assicurative sanitarie negli Stati Uniti in Document Intelligence Studio.

Documenti fiscali degli Stati Uniti

I modelli di documento fiscale degli Stati Uniti analizzano ed estraggono i campi chiave e le voci da un gruppo selezionato di documenti fiscali. L'API supporta l'analisi dei documenti fiscali statunitensi in lingua inglese di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. Sono attualmente supportati i modelli seguenti:

Modello Descrizione ID modello
Imposta statunitense W-2 Estrarre i dettagli del compenso imponibile. prebuilt-tax.us.w2
Imposta statunitense W-4 Estrarre i dettagli del compenso imponibile. prebuilt-tax.us.w4
Imposta usa 1040 Estrarre i dettagli degli interessi ipotecari. prebuilt-tax.us.1040 (varianti)
Imposta usa 1095 Estrarre i dettagli dell'assicurazione sanitaria. prebuilt-tax.us.1095 (varianti)
Imposta statunitense 1098 Estrarre i dettagli degli interessi ipotecari. prebuilt-tax.us.1098 (varianti)
Imposta usa 1099 Estrarre il reddito ricevuto da fonti diverse dal datore di lavoro. prebuilt-tax.us.1099 (varianti)

Questo documento W-2 di esempio è stato elaborato usando Document Intelligence Studio.

Screenshot che mostra un documento W-2 di esempio.

Documenti ipotecari statunitensi

I modelli di documento ipotecario degli Stati Uniti analizzano ed estraggono i campi chiave che includono dati relativi a prestiti, prestiti e proprietà da un gruppo selezionato di documenti ipotecari. L'API supporta l'analisi dei documenti ipotecari statunitensi in lingua inglese di diversi formati e qualità, tra cui immagini acquisite dal telefono, documenti analizzati e PDF digitali. I modelli seguenti sono attualmente supportati.

Modello Descrizione ID modello
1003 Contratto di licenza con l'utente finale Estrarre dettagli sul prestito, sul mutuatario e sulla proprietà. prebuilt-mortgage.us.1003
Rapporto di valutazione residenziale uniforme 1004 (URAR) Estrarre prestito, mutuatario, dettagli della proprietà. prebuilt-mortgage.us.1004
1005 Verifica dell'impiego Estrarre dati su prestito, mutuatario e proprietà. prebuilt-mortgage.us.1005
1008 Documento di riepilogo Estrarre i dettagli del prestito, del venditore, della proprietà, del mutuo e della sottoscrizione. prebuilt-mortgage.us.1008
Divulgazione di chiusura Estrarre costi di chiusura, costi di transazione e dettagli del prestito. prebuilt-mortgage.us.closingDisclosure

Questo esempio di documento di chiusura della divulgazione è stato elaborato usando Document Intelligence Studio.

Screenshot che mostra un esempio di documento di chiusura.

Contratto

Il modello di contratto analizza ed estrae i campi chiave e gli elementi di riga dagli accordi contrattuali, tra cui parti, giurisdizioni, ID del contratto e titolo. Il modello supporta attualmente documenti di contratto in lingua inglese.

Questo contratto di esempio è stato elaborato usando Document Intelligence Studio.

Screenshot che mostra l'estrazione del modello di contratto con Document Intelligence Studio.

Assegno bancario degli Stati Uniti

Il modello contrattuale analizza ed estrae i principali campi dagli assegni bancari degli Stati Uniti, inclusi i dettagli dell'assegno, i dettagli del conto, l'importo e la nota.

Questo esempio di assegno bancario è stato elaborato usando Document Intelligence Studio.

Screenshot che mostra l'estrazione del modello di assegno bancario tramite Document Intelligence Studio.

Estratto conto bancario degli Stati Uniti

Il modello di estratto conto bancario analizza ed estrae i campi chiave e gli elementi di riga dal numero di conto bancario degli Stati Uniti, i dettagli bancari, i dettagli dell'estratto conto e i dettagli delle transazioni.

Questo estratto conto bancario di esempio è stato elaborato tramite Document Intelligence Studio.

Screenshot che mostra l'estrazione del modello di estratto conto corrente tramite Document Intelligence Studio.

payStub

Il modello payStub analizza ed estrae i campi chiave e le voci di riga da documenti e file con informazioni relative alle retribuzioni.

Questo esempio di stub con pagamento è stato elaborato usando Document Intelligence Studio.

Screenshot che mostra l'estrazione di modelli payStub usando Document Intelligence Studio.

Fattura

Il modello di fattura automatizza l'elaborazione delle fatture per estrarre il nome del cliente, l'indirizzo di fatturazione, la data di scadenza, l'importo dovuto, le voci e altri dati chiave.

Questa fattura di esempio è stata elaborata usando Document Intelligence Studio.

Screenshot che mostra una fattura di esempio.

Ricevuta

Usare il modello di ricevuta per analizzare le ricevute di vendita per il nome, le date, le righe, le quantità e i totali delle ricevute stampate e scritte a mano. La versione 3.0 supporta anche l'elaborazione della ricevuta di hotel a pagina singola.

Questa ricevuta di esempio è stata elaborata tramite Document Intelligence Studio.

Screenshot che mostra una ricevuta di esempio.

Documento di identità

Usare il modello di documento di identità (ID) per elaborare le licenze di conducente degli Stati Uniti (tutti i 50 stati e district della Columbia) e le pagine biografiche dei passaporti internazionali (esclusi i visti e altri documenti di viaggio) per estrarre i campi chiave.

Questa patente di guida statunitense di esempio è stata elaborata tramite Document Intelligence Studio.

Screenshot che mostra una scheda di identificazione di esempio.

Certificato di matrimonio

Usare il modello di certificato di matrimonio per elaborare i certificati di matrimonio degli Stati Uniti per estrarre i campi chiave, inclusi gli individui, la data e la posizione.

Questo certificato di matrimonio degli Stati Uniti di esempio è stato elaborato tramite Document Intelligence Studio.

Screenshot che mostra un certificato di matrimonio di esempio.

Carta di credito

Usare il modello di carta di credito per elaborare le carte di credito e di debito per estrarre i campi chiave.

Questa carta di credito di esempio è stata elaborata tramite Document Intelligence Studio.

Screenshot che mostra una carta di credito di esempio.

Modelli personalizzati

I modelli personalizzati sono classificati in modo ampio in due tipi. Modelli di classificazione personalizzati che supportano la classificazione di un "tipo di documento" e modelli di estrazione personalizzati che possono estrarre uno schema definito da un tipo di documento specifico.

Diagramma che mostra i tipi di modelli personalizzati e le modalità di compilazione del modello associate.

I modelli di documento personalizzati analizzano ed estraggono dati da moduli e documenti specifici dell'azienda. Riconoscono i campi del modulo nel tuo contenuto specifico ed estraggono coppie chiave/valore e dati di tabella. Per iniziare, è necessario un solo esempio del tipo di modulo.

Versione v3.0 e successive supportano il rilevamento delle firme in modelli personalizzati (formulario) e tabelle che attraversano più pagine sia nei modelli a template che neurali. Il rilevamento delle firme cerca la presenza di una firma, non l'identità della persona che firma il documento. Se il modello restituisce unsigned per il rilevamento delle firme, il modello non ha trovato una firma nel campo definito.

Questo modello personalizzato di esempio è stato elaborato usando Document Intelligence Studio.

Screenshot che mostra l'analisi di un modulo personalizzato da parte di Document Intelligence.

Estrazione personalizzata

Il modello di estrazione personalizzata è disponibile in due tipi: modello personalizzato e neurale personalizzato. Per creare un modello di estrazione personalizzato, etichettare un set di dati di documenti con i valori da estrarre ed eseguire il training del modello nel set di dati etichettato. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo o documento.

L'estrazione personalizzata di esempio è stata elaborata usando Document Intelligence Studio.

Screenshot che mostra l'analisi personalizzata del modello di estrazione in Document Intelligence Studio.

Classificatore personalizzato

Con il modello di classificazione personalizzato, è possibile identificare il tipo di documento prima di richiamare il modello di estrazione. Il modello di classificazione è disponibile a partire dall'API 2023-07-31 (GA). Il training di un modello di classificazione personalizzato richiede almeno due classi distinte e un minimo di cinque campioni per ogni classe.

Modelli composti

Un modello composto viene creato prendendo una raccolta di modelli personalizzati e assegnandoli a un singolo modello basato sui tuoi tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto chiamato con un singolo ID modello. È possibile assegnare fino a 200 modelli personalizzati sottoposti a training a un singolo modello composto.

Questo modello composto di esempio si trova in Document Intelligence Studio.

Screenshot che mostra il riquadro del modello personalizzato di Document Intelligence Studio Compose.

Requisiti di input

Sono supportati i formati di file seguenti.

Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Leggere
Struttura
Documento generale
Preassemblato
Estrazione personalizzata
Classificazione personalizzata
  • Foto e scansioni: per ottenere risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
  • PDF e TIFF: per pdf e TIFF, è possibile elaborare fino a 2.000 pagine. Con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine.
  • Dimensioni file: le dimensioni del file per l'analisi dei documenti sono pari a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
  • Dimensioni immagine: le dimensioni devono essere comprese tra 50 pixel x 50 pixel e 10.000 pixel x 10.000 pixel.
  • Blocchi password: se i PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
  • Altezza del testo: l'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8 punti di testo a 150 punti per pollice.
  • Addestramento del modello personalizzato: il numero massimo di pagine per i dati di addestramento è 500 per il modello su misura personalizzato e 50.000 per il modello neurale personalizzato.
  • Training del modello di estrazione personalizzato: la dimensione totale dei dati di training è di 50 MB per il modello di template e 1 GB per il modello neurale.
  • Training del modello di classificazione personalizzato: le dimensioni totali dei dati di training sono pari a 1 GB con un massimo di 10.000 pagine. Per 2024-11-30 (GA), le dimensioni totali dei dati di training sono pari a 2 GB con un massimo di 10.000 pagine.
  • Tipi di file di Office (DOCX, XLSX, PPTX): il limite massimo di lunghezza della stringa è di 8 milioni di caratteri.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. La limitazione deriva dallo strumento non dal servizio Document Intelligence.

Migrazione della versione

Informazioni su come usare Document Intelligence v3.0 nelle applicazioni seguendo la procedura descritta nella Guida alla migrazione di Document Intelligence v3.1.

Modello Descrizione
Analisi dei documenti
Layout Estrarre testo e informazioni di layout dai documenti.
Preassemblato
Fattura Estrarre le informazioni chiave dalle fatture in lingua inglese e spagnola.
Ricevuta Estrarre le informazioni chiave dalle ricevute in lingua inglese.
Documento di identificazione Estrarre le informazioni chiave dalle licenze e dai passaporti internazionali degli Stati Uniti.
Biglietto da visita Estrarre le informazioni chiave dai biglietti da visita in lingua inglese.
Personalizzato
Personalizzato Estrarre dati da moduli e documenti specifici dell'azienda. I modelli personalizzati vengono addestrati per i tuoi dati specifici e casi d'uso.
Composto Comporre una raccolta di modelli personalizzati e assegnarli a un singolo modello costruito dai propri tipi di modulo.

Struttura

L'API Layout analizza ed estrae testo, tabelle e intestazioni, segni di selezione e informazioni sulla struttura dai documenti.

Questo documento di esempio è stato elaborato usando lo strumento di etichettatura campione.

Screenshot che mostra l'analisi del layout usando lo strumento di etichettatura di esempio.

Fattura

Il modello di fattura analizza ed estrae le informazioni chiave dalle fatture di vendita. L'API analizza le fatture in vari formati ed estrae informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto.

Questa fattura di esempio è stata elaborata usando il Strumento di Etichettatura di Esempio.

Screenshot che mostra un'analisi di esempio della fattura usando lo strumento di etichettatura di esempio.

Ricevuta

Il modello di ricevuta analizza ed estrae le informazioni chiave dalle ricevute di vendita stampate e scritte a mano.

Questa ricevuta di esempio è stata elaborata usando lo strumento di etichettatura Sample Labeling tool.

Screenshot che mostra una ricevuta di esempio.

Documento d'identità

Il modello di documento ID analizza ed estrae le informazioni chiave dai documenti seguenti:

  • Patenti di conducente degli Stati Uniti (tutti i 50 stati e district della Columbia)
  • Pagine biografiche di passaporti internazionali (esclusi i visti e altri documenti di viaggio). L'API analizza ed estrae documenti di identità.

Questa patente di guida statunitense di esempio è stata elaborata usando lo strumento di etichettatura Sample Labeling tool.

Screenshot che mostra una scheda di identificazione di esempio.

Biglietto da visita

Il modello di biglietto da visita analizza ed estrae le informazioni chiave dalle immagini dei biglietti da visita.

Questo biglietto da visita di esempio è stato elaborato usando lo strumento di etichettatura di esempio.

Screenshot che mostra un biglietto da visita di esempio.

Personalizzato

I modelli personalizzati analizzano ed estraggono dati da moduli e documenti specifici dell'azienda. L'API è un programma di apprendimento automatico addestrato per riconoscere i campi del modulo all'interno del tuo contenuto specifico ed estrarre coppie chiave/valore e dati di tabella. Per iniziare, sono necessari solo cinque esempi dello stesso tipo di modulo. È possibile eseguire il training del modello personalizzato con o senza set di dati etichettati.

Questo modello personalizzato di esempio è stato elaborato usando lo strumento di etichettatura di esempio.

Screenshot che mostra lo strumento Document Intelligence che analizza un riquadro modulo personalizzato.

Modello personalizzato composto

Un modello composto viene creato prendendo una raccolta di modelli personalizzati e assegnandoli a un singolo modello basato sui tuoi tipi di modulo. È possibile assegnare più modelli personalizzati a un modello composto chiamato con un singolo ID modello. È possibile assegnare fino a 100 modelli personalizzati sottoposti a training a un singolo modello composto.

Questo riquadro composto del modello è stato elaborato usando lo strumento di etichettatura di esempio.

Screenshot che mostra il riquadro del modello personalizzato di Document Intelligence Studio Compose.

Estrazione dei dati del modello

Modello Estrazione di testo Rilevamento della lingua Segni di selezione Tabelle Paragrafi Ruoli dei paragrafi Coppie chiave/valore Campi
Layout
Fattura
Ricevuta
ID documento
Biglietto da visita
Modulo personalizzato

Requisiti di input

Sono supportati i formati di file seguenti.

Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Leggere
Struttura
Documento generale
Preassemblato
Estrazione personalizzata
Classificazione personalizzata
  • Foto e scansioni: per ottenere risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
  • PDF e TIFF: per pdf e TIFF, è possibile elaborare fino a 2.000 pagine. Con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine.
  • Dimensioni file: le dimensioni del file per l'analisi dei documenti sono pari a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
  • Dimensioni immagine: le dimensioni devono essere comprese tra 50 pixel x 50 pixel e 10.000 pixel x 10.000 pixel.
  • Blocchi password: se i PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
  • Altezza del testo: l'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8 punti di testo a 150 punti per pollice.
  • Addestramento del modello personalizzato: il numero massimo di pagine per i dati di addestramento è 500 per il modello su misura personalizzato e 50.000 per il modello neurale personalizzato.
  • Training del modello di estrazione personalizzato: la dimensione totale dei dati di training è di 50 MB per il modello di template e 1 GB per il modello neurale.
  • Training del modello di classificazione personalizzato: le dimensioni totali dei dati di training sono pari a 1 GB con un massimo di 10.000 pagine. Per 2024-11-30 (GA), le dimensioni totali dei dati di training sono pari a 2 GB con un massimo di 10.000 pagine.
  • Tipi di file di Office (DOCX, XLSX, PPTX): il limite massimo di lunghezza della stringa è di 8 milioni di caratteri.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. La limitazione deriva dallo strumento, non da Document Intelligence.

Migrazione della versione

Per informazioni su come usare Document Intelligence v3.0 nelle applicazioni, seguire la procedura descritta nella Guida alla migrazione di Document Intelligence v3.1