Dokumentintelligenz-ID-Dokumentmodell

Dieser Inhalt gilt für:v4.0 (GA) | Frühere Versionen:v3.1 (GA)v3.0 (wird eingestellt)v2.1 (wird eingestellt)

::: moniker-end

Dieser Inhalt gilt für:v3.1 (GA) | Neueste Version:v4.0 (GA) | Frühere Versionen:v3.0v2.1

Dieser Inhalt gilt für:v3.0 (retiring) | Neueste Versionen:v4.0 (GA)v3.1 | Vorherige Version:v2.1 (retiring)

Dieser Inhalt gilt für:v2.1 | Neueste Version:v4.0 (GA)

Hinweis

Die Document Intelligence-API v4.0 2024-11-30 (GA) für das vordefinierte Identitätsdokument (ID)-Modell unterstützt jetzt Identifikationsdokumente aus allen Regionen weltweit, einschließlich einer erweiterten Abdeckung über Nordamerika, Südamerika, Asien, Europa, Afrika und Ozeanien.

Das Dokumentintelligenz-Dokumentmodell (ID) kombiniert optische Zeichenerkennung (OCR) mit Deep Learning-Modellen, um wichtige Informationen aus Identitätsdokumenten zu analysieren und zu extrahieren. Die API analysiert Identitätsdokumente (einschließlich der folgenden) und gibt eine strukturierte JSON-Datendarstellung zurück.

Region	Dokumenttypen
Weltweit	Reisepassbuch, Reisepasskarte
USA	Führerschein, Personalausweis, Aufenthaltserlaubnis (Green Card), Sozialversicherungskarte, Militärausweis
Indien	Führerschein, PAN-Karte, Aadhaar-Karte
Australien	Führerschein, Ausweis mit Foto, Schlüsselausweis (einschließlich digitaler Version)
Andere	Führerschein, Personalausweis, Aufenthaltserlaubnis

Document Intelligence kann Informationen aus Identifikationsdokumenten (IDs), die von Behörden ausgestellt wurden, unter Verwendung des vorgefertigten IDs-Modells analysieren und extrahieren. Es kombiniert unsere leistungsstarken OCR-Funktionen (Optical Character Recognition) mit ID-Erkennungsfunktionen, um wichtige Informationen aus Worldwide Passports und U.S. Driver's Licenses (alle 50 Staaten und D.C.) zu extrahieren. Die IDs-API extrahiert wichtige Informationen aus diesen Identitätsdokumenten, z. B. Vorname, Nachname, Geburtsdatum, Dokumentnummer und mehr. Diese API ist in Document Intelligence v2.1 als Clouddienst verfügbar.

Identitätsdokumentverarbeitung

Die Verarbeitung von Identitätsdokumenten umfasst das Extrahieren von Daten aus Identitätsdokumenten entweder manuell oder mithilfe der OCR-basierten Technologie. Die Verarbeitung von ID-Dokumenten ist ein wichtiger Schritt in jedem Geschäftsvorgang, der identitätsnachweise erfordert. Beispiele sind Kundenüberprüfungen in Banken und anderen Finanzinstituten, Hypothekenanträgen, medizinischen Besuchen, Anspruchsverarbeitung, Gastgewerbe und vieles mehr. Einzelpersonen stellen einen Nachweis ihrer Identität über Fahrerlizenzen, Reisepasse und andere ähnliche Dokumente bereit, damit das Unternehmen sie effizient überprüfen kann, bevor Sie Dienste und Vorteile bereitstellen.

Beispiel eines US-amerikanischen Führerscheins, verarbeitet mit Document Intelligence Studio

Bild eines Musterführerscheins.

Datenextraktion

Der vorgefertigte IDs-Dienst extrahiert die Schlüsselwerte aus weltweiten Pässen und US-Führerscheinen und gibt sie in einer organisierten und strukturierten JSON-Antwort zurück.

Beispiel für treiberlizenz

Beispielführerschein

Passport-Beispiel

Beispiel passport

Entwicklungsoptionen

Document Intelligence v4.0: 2024-11-30 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen	Modell-ID
ID-Dokumentmodell	• Document Intelligence Studio • REST-API • C#SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-idDocument

Document Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen	Modell-ID
ID-Dokumentmodell	• Document Intelligence Studio • REST-API • C#SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-idDocument

Document Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen	Modell-ID
ID-Dokumentmodell	• Document Intelligence Studio • REST-API • C#SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-idDocument

Document Intelligence v2.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen
ID-Dokumentmodell	• • REST-API • Client-Bibliotheks-SDK • Document-Intelligence-Docker-Container

Eingabeanforderungen

Die folgenden Dateiformate werden unterstützt.

Modell	PDF	Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lesen	✔	✔	✔
Gestaltung	✔	✔	✔
Allgemeines Dokument	✔	✔
Vorkonfiguriert	✔	✔
Benutzerdefinierte Extraktion	✔	✔
Benutzerdefinierte Klassifizierung	✔	✔	✔

Fotos und Scans: Um optimale Ergebnisse zu erzielen, stellen Sie ein klares Foto oder eine qualitativ hochwertige Überprüfung pro Dokument bereit.
PDFs und TIFFs: Für PDFs und TIFFs können bis zu 2.000 Seiten verarbeitet werden. (Bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet.)
Dateigröße: Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
Bildabmessungen: Die Abmessungen müssen zwischen 50 Pixel x 50 Pixel und 10.000 Pixel x 10.000 Pixel betragen.
Kennwortsperrungen: Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
Texthöhe: Die minimale Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Dimension entspricht einem 8-Punkt-Text bei 150 Punkten pro Zoll.
Schulung für benutzerdefinierte Modelle: Die maximale Anzahl von Seiten für Schulungsdaten beträgt 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
Schulung des benutzerdefinierten Extraktionsmodells: Die Gesamtgröße der Schulungsdaten beträgt 50 MB für das Vorlagenmodell und 1 GB für das neurale Modell.
Schulung des benutzerdefinierten Klassifizierungsmodells: Die Gesamtgröße der Schulungsdaten beträgt 1 GB mit maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Schulungsdaten 2 GB mit maximal 10.000 Seiten.
Office-Dateitypen (DOCX, XLSX, PPTX):Die maximale Zeichenfolgenlängenbeschränkung beträgt 8 Millionen Zeichen.

Unterstützte Dateiformate: JPEG, PNG, PDF und TIFF.
Unterstützte Anzahl von Seiten für PDF- und TIFF-Dateien: bis zu 2.000 Seiten oder nur die ersten beiden Seiten für Freistufenabonnenten.
Unterstützte Dateigröße: weniger als 50 MB GESAMT; Mindestpixel: 50 x 50 px; Maximale Pixel 10.000 x 10.000 px.

Modell zur Datenextraktion von ID-Dokumenten

Extrahieren Sie Daten, einschließlich Name, Geburtsdatum und Ablaufdatum, aus ID-Dokumenten. Sie benötigen die folgenden Ressourcen:

Ein Azure-Abonnement – Sie können eine kostenlos erstellen.
Eine Document Intelligence-Instanz im Azure-Portal. Sie können das kostenlose Preisniveau (F0) verwenden, um den Dienst zu testen. Nachdem Ihre Ressource bereitgestellt wurde, wählen Sie "Zur Ressource wechseln " aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot von Schlüsseln und Endpunktstandorten im Azure portal.

Hinweis

Document Intelligence Studio ist mit v3.1- und v3.0-APIs und höheren Versionen verfügbar.

Wählen Sie auf der Document Intelligence Studio-Startseite"Identitätsdokumente" aus.
Sie können die Beispielrechnung analysieren oder Eigene Dateien hochladen.
Wählen Sie die Schaltfläche " Analyse ausführen " aus, und konfigurieren Sie ggf. die Analyseoptionen:

Testen Sie Document Intelligence Studio.

Dokumentintelligenz-Beispiel-Beschriftungstool

Navigieren Sie zum Dokumentintelligenz-Beispieltool.
Wählen Sie auf der Startseite des Beispieltools die Kachel Vordefiniertes Modell zur Datenerfassung verwenden aus.
Wählen Sie den Zu analysierenden Formulartyp aus dem Dropdownmenü aus.
Wählen Sie eine URL für die Datei aus, die Sie aus den folgenden Optionen analysieren möchten:
Wählen Sie im Feld "Quelle " im Dropdownmenü die URL aus, fügen Sie die ausgewählte URL ein, und wählen Sie die Schaltfläche " Abrufen " aus.
Fügen Sie im Feld "Document Intelligence-Dienstendpunkt " den Endpunkt ein, den Sie mit Ihrem Document Intelligence-Abonnement erhalten haben.
Fügen Sie im Schlüsselfeld den Schlüssel ein, den Sie aus Ihrer Document Intelligence-Ressource abgerufen haben.
Wählen Sie "Analyse ausführen" aus. Das Tool zur Beispiel-Beschriftung für Dokumentenintelligenz ruft die API "Analyze Prebuilt" auf und analysiert das Dokument.
Zeigen Sie die Ergebnisse an – sehen Sie sich die extrahierten Schlüsselwertpaare, Zeilenelemente, hervorgehobenen Text, extrahierten Text und erkannte Tabellen an.
Laden Sie die JSON-Ausgabedatei herunter, um die detaillierten Ergebnisse anzuzeigen.
- Der Knoten "readResults" enthält jede Textzeile mit der entsprechenden Begrenzungsfeldplatzierung auf der Seite.
- Der Knoten "selectionMarks" zeigt jedes Auswahlzeichen (Kontrollkästchen, Optionsfeld) an und gibt an, ob der Status ausgewählt oder nicht ausgewählt ist.
- Der Abschnitt "pageResults" enthält die extrahierten Tabellen. Für jede Tabelle extrahiert Document Intelligence den Text, den Zeilen- und Spaltenindex, das Zeilen- und Spaltenübergreifen, die begrenzende Box und weitere Informationen.
- Das Feld "documentResults" enthält Informationen zu Schlüssel-Wert-Paaren und Zeilenelemente für die relevantesten Teile des Dokuments.

Hinweis

Das Beispielbezeichnungstool unterstützt das BMP-Dateiformat nicht. Diese Beschränkung ist eine Einschränkung des Tools, nicht des Document Intelligence Service.

Feldextraktionen

Für unterstützte Dokumentextraktionsfelder siehe die Seite ID-Dokumentmodellschema in unserem GitHub-Beispiel-Repository.

Unterstützte Dokumenttypen

Das ID-Dokumentmodell unterstützt derzeit die Extraktion von US-Führerscheinen und der biografischen Seite aus internationalen Pässen, aber keine von Visa oder anderen Reisedokumenten.

Extrahierte Felder

Namen	Typ	Beschreibung	Wert
Land	Land	Ländercode gemäß ISO 3166-Standard	"USA"
Geburtsdatum	Datum	DOB im YYYY-MM-DD-Format	"1980-01-01"
Ablaufdatum	Datum	Ablaufdatum im Format JJJJ-MM-DD	"2019-05-05"
Dokumentennummer	Schnur	Relevante Reisepassnummer, Führerscheinnummer usw.	"340020013"
Firstname	Schnur	Extrahierter Vorname und Initiale des zweiten Vornamens, falls zutreffend	"JENNIFER"
Nachname	Schnur	Abgeleiteter Nachname	"BROOKS"
Staatsangehörigkeit	Land	Ländercode gemäß ISO 3166-Standard	"USA"
Sex	Geschlecht	Mögliche extrahierte Werte sind "M" "F" "X"	"F"
maschinenlesbare Zone	Objekt	Extrahierter Passport `MRZ` mit zwei Zeilen mit jeweils 44 Zeichen	"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
Dokumenttyp	Schnur	Dokumenttyp, z. B. Passport, Driver's License	Reisepass
Adresse	Schnur	Extrahierte Adresse (nur Führerschein)	123 STRAßENNAME IHRE STADT WA 99999-1234
Region	Schnur	Extrahierte Region, Bundesland, Provinz usw. (nur Führerschein)	"Washington"

Migrationshandbuch

Befolgen Sie unseren Migrationsleitfaden für Document Intelligence v3.1 , um zu erfahren, wie Sie die Version v3.0 in Ihren Anwendungen und Workflows verwenden.

Nächste Schritte

Versuchen Sie, ihre eigenen Formulare und Dokumente mit dem Document Intelligence Studio zu verarbeiten.
Führen Sie eine Schnellstartanleitung für Dokumentintelligenz aus, und beginnen Sie mit dem Erstellen einer Dokumentverarbeitungs-App in der Entwicklungssprache Ihrer Wahl.

Finden Sie weitere Beispiele zu GitHub.

Finden Sie weitere Beispiele zu GitHub.

Versuchen Sie, ihre eigenen Formulare und Dokumente mit dem Dokumentintelligenz-Beispielbezeichnungstool zu verarbeiten.
Führen Sie eine Schnellstartanleitung für Dokumentintelligenz aus, und beginnen Sie mit dem Erstellen einer Dokumentverarbeitungs-App in der Entwicklungssprache Ihrer Wahl.

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-08

Dokumentintelligenz-ID-Dokumentmodell

Identitätsdokumentverarbeitung

Datenextraktion

Beispiel für treiberlizenz

Passport-Beispiel

Entwicklungsoptionen

Eingabeanforderungen

Modell zur Datenextraktion von ID-Dokumenten

Dokumentintelligenz-Beispiel-Beschriftungstool

Feldextraktionen

Unterstützte Dokumenttypen

Extrahierte Felder

Migrationshandbuch

Nächste Schritte

Feedback

Zusätzliche Ressourcen