Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Dieser Inhalt gilt für:
v4.0 (GA) | Frühere Versionen:
v3.1 (GA)
v3.0 (wird eingestellt)
v2.1 (wird eingestellt)
Dieser Inhalt gilt für:
v3.0 (wird eingestellt) | Neueste Versionen:
v4.0 (GA)
v3.1 | Vorherige Version:
v2.1 (wird eingestellt)
Dieser Inhalt gilt für:
v2.1 | Neueste Version:
v4.0 (GA)
Benutzerdefinierte Vorlage (früher benutzerdefiniertes Formular) ist ein einfach zu trainierende Dokumentmodell, das beschriftete Schlüsselwertpaare, Auswahlmarken, Tabellen, Regionen und Signaturen aus Dokumenten genau extrahiert. Vorlagenmodelle verwenden Layouthinweise, um Werte aus Dokumenten zu extrahieren und eignen sich zum Extrahieren von Feldern aus hochstrukturierten Dokumenten mit definierten visuellen Vorlagen.
Benutzerdefinierte Vorlagenmodelle verwenden das gleiche Bezeichnungsformat und dieselbe Strategie wie benutzerdefinierte neurale Modelle mit Unterstützung für weitere Feldtypen und Sprachen.
Modellfunktionen
Benutzerdefinierte Vorlagenmodelle unterstützen Schlüsselwertpaare, Auswahlmarken, Tabellen, Signaturfelder und ausgewählte Bereiche.
| Formularfelder | Auswahlmarkierungen | Tabellarische Felder (Tabellen) | Signatur | Ausgewählte Regionen | Überlappende Felder |
|---|---|---|---|---|---|
| Unterstützt | Unterstützt | Unterstützt | Unterstützt | Unterstützt | Nicht unterstützt |
Tabellarische Felder
Mit der Veröffentlichung von API-Versionen v3.0 und höher fügen benutzerdefinierte Vorlagenmodelle Unterstützung für seitenübergreifende tabellarische Felder (Tabellen) hinzu:
- Wenn Sie eine Tabelle beschriften möchten, die sich über mehrere Seiten erstreckt, beschriften Sie jede Zeile der Tabelle auf den verschiedenen Seiten in einer einzelnen Tabelle.
- Stellen Sie als bewährte Methode sicher, dass Ihr Dataset einige Beispiele für die erwarteten Variationen enthält. Fügen Sie z. B. Beispiele hinzu, bei denen sich die gesamte Tabelle auf einer einzelnen Seite befindet und in denen Tabellen zwei oder mehr Seiten umfassen, wenn Sie erwarten, dass diese Variationen in Dokumenten angezeigt werden.
Tabellarische Felder sind auch hilfreich beim Extrahieren wiederholter Informationen in einem Dokument, das nicht als Tabelle erkannt wird. Beispielsweise kann ein wiederholter Abschnitt der Arbeitserfahrungen in einem Lebenslauf als tabellarisches Feld bezeichnet und extrahiert werden.
Umgang mit Variationen
Vorlagenmodelle basieren auf einer definierten visuellen Vorlage, änderungen an der Vorlage führen zu einer geringeren Genauigkeit. Teilen Sie in diesen Fällen Ihr Schulungsdatensatz auf, um mindestens fünf Beispiele jeder Vorlage einzuschließen und ein Modell für jede Der Variationen zu trainieren. Anschließend können Sie die Modelle in einem einzelnen Endpunkt zusammenfügen. Für subtile Variationen, z. B. digitale PDF-Dokumente und Bilder, ist es am besten, mindestens fünf Beispiele für jeden Typ im gleichen Schulungsdatensatz einzuschließen.
Eingabeanforderungen
Für optimale Ergebnisse stellen Sie ein klares Foto oder einen qualitativ hochwertigen Scan pro Dokument bereit.
Unterstützte Dateiformate:
Modell PDF Bild:
JPEG/JPG,PNG,BMP,TIFF,HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und HTMLLesen ✔ ✔ ✔ Gestaltung ✔ ✔ ✔ Allgemeines Dokument ✔ ✔ Vorkonfiguriert ✔ ✔ Benutzerdefinierte ✔ ✔ ✱ Microsoft Office Dateien werden derzeit für andere Modelle oder Versionen nicht unterstützt.
Für PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (mit einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).
Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
Bildabmessungen müssen zwischen 50 x 50 Pixel und 10.000 px x 10.000 Pixel betragen.
Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
Die mindeste Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Dimension entspricht etwa
8-Punkt-Text bei 150 Punkten pro Zoll (DPI).Für benutzerdefinierte Modellschulungen beträgt die maximale Anzahl von Seiten für Schulungsdaten 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
Bei der Schulung des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße von Schulungsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neurale Modell.
Bei der Schulung des benutzerdefinierten Klassifizierungsmodells beträgt
1GBdie Gesamtgröße von Schulungsdaten maximal 10.000 Seiten.
Schulung eines Modells
Benutzerdefinierte Vorlagenmodelle sind in der Regel ab v2.0-API und höheren Versionen verfügbar. Wenn Sie mit einem neuen Projekt beginnen oder über ein vorhandenes beschriftetes Dataset verfügen, verwenden Sie die v3.1- oder v3.0-API mit Document Intelligence Studio, um ein benutzerdefiniertes Vorlagenmodell zu trainieren.
| Modell | REST-API | SDK | Beschriftungs- und Testmodelle |
|---|---|---|---|
| Benutzerdefinierte Vorlage | v3.1-API | Document Intelligence SDK | Document Intelligence Studio |
Mit den v3.0- und höheren APIs unterstützt der Buildvorgang zum Trainieren des Modells eine neue buildMode Eigenschaft. Um ein benutzerdefiniertes Vorlagenmodell zu trainieren, legen Sie die buildMode auf template fest.
https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-11-30
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Benutzerdefinierte Vorlagenmodelle sind in der Regel mit der v3.1-API verfügbar. Wenn Sie mit einem neuen Projekt beginnen oder über ein vorhandenes beschriftetes Dataset verfügen, verwenden Sie die v3.1- oder v3.0-API mit Document Intelligence Studio, um ein benutzerdefiniertes Vorlagenmodell zu trainieren.
| Modell | REST-API | SDK | Beschriftungs- und Testmodelle |
|---|---|---|---|
| Benutzerdefinierte Vorlage | v3.1-API | Document Intelligence SDK | Document Intelligence Studio |
Mit den APIs v3.0 und höher unterstützt der Buildvorgang für das Trainieren eines Modells eine neue Eigenschaft buildMode, um ein benutzerdefiniertes Vorlagenmodell zu erstellen; legen Sie buildMode auf template fest.
https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Unterstützte Sprachen und Gebietsschemas
Eine vollständige Liste der unterstützten Sprachen finden Sie auf unserer Seite "Sprachunterstützung – benutzerdefinierte Modelle".
Benutzerdefinierte Modelle (Vorlagen) sind in der Regel mit der v2.1-API verfügbar.
| Modell | REST-API | SDK | Beschriftungs- und Testmodelle |
|---|---|---|---|
| Benutzerdefiniertes Modell (Vorlage) | Document Intelligence 2.1 | Document Intelligence SDK | Beschriftungstool für Dokumentenintelligenz-Beispiele |
Nächste Schritte
Erfahren Sie, wie Sie benutzerdefinierte Modelle erstellen und verfassen: