Benutzerdefiniertes Modell für Dokumentenintelligenz-Vorlagen

Dieser Inhalt gilt für:Häkchenv4.0 (GA) | Frühere Versionen:blaues Häkchenv3.1 (GA)rotes Häkchenv3.0 (wird eingestellt)rotes Häkchenv2.1 (wird eingestellt)

Dieser Inhalt gilt für:checkmarkv3.1 (GA) | Neueste Version:purple-checkmarkv4.0 (GA) | Frühere Versionen:blue-checkmarkv3.0blue-checkmarkv2.1

Dieser Inhalt gilt für:red-checkmarkv3.0 (wird eingestellt) | Neueste Versionen:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Vorherige Version:blue-checkmarkv2.1 (wird eingestellt)

Dieser Inhalt gilt für:red-checkmarkv2.1 | Neueste Version:blue-checkmarkv4.0 (GA)

Benutzerdefinierte Vorlage (früher benutzerdefiniertes Formular) ist ein einfach zu trainierende Dokumentmodell, das beschriftete Schlüsselwertpaare, Auswahlmarken, Tabellen, Regionen und Signaturen aus Dokumenten genau extrahiert. Vorlagenmodelle verwenden Layouthinweise, um Werte aus Dokumenten zu extrahieren und eignen sich zum Extrahieren von Feldern aus hochstrukturierten Dokumenten mit definierten visuellen Vorlagen.

Benutzerdefinierte Vorlagenmodelle verwenden das gleiche Bezeichnungsformat und dieselbe Strategie wie benutzerdefinierte neurale Modelle mit Unterstützung für weitere Feldtypen und Sprachen.

Modellfunktionen

Benutzerdefinierte Vorlagenmodelle unterstützen Schlüsselwertpaare, Auswahlmarken, Tabellen, Signaturfelder und ausgewählte Bereiche.

Formularfelder Auswahlmarkierungen Tabellarische Felder (Tabellen) Signatur Ausgewählte Regionen Überlappende Felder
Unterstützt Unterstützt Unterstützt Unterstützt Unterstützt Nicht unterstützt

Tabellarische Felder

Mit der Veröffentlichung von API-Versionen v3.0 und höher fügen benutzerdefinierte Vorlagenmodelle Unterstützung für seitenübergreifende tabellarische Felder (Tabellen) hinzu:

  • Wenn Sie eine Tabelle beschriften möchten, die sich über mehrere Seiten erstreckt, beschriften Sie jede Zeile der Tabelle auf den verschiedenen Seiten in einer einzelnen Tabelle.
  • Stellen Sie als bewährte Methode sicher, dass Ihr Dataset einige Beispiele für die erwarteten Variationen enthält. Fügen Sie z. B. Beispiele hinzu, bei denen sich die gesamte Tabelle auf einer einzelnen Seite befindet und in denen Tabellen zwei oder mehr Seiten umfassen, wenn Sie erwarten, dass diese Variationen in Dokumenten angezeigt werden.

Tabellarische Felder sind auch hilfreich beim Extrahieren wiederholter Informationen in einem Dokument, das nicht als Tabelle erkannt wird. Beispielsweise kann ein wiederholter Abschnitt der Arbeitserfahrungen in einem Lebenslauf als tabellarisches Feld bezeichnet und extrahiert werden.

Umgang mit Variationen

Vorlagenmodelle basieren auf einer definierten visuellen Vorlage, änderungen an der Vorlage führen zu einer geringeren Genauigkeit. Teilen Sie in diesen Fällen Ihr Schulungsdatensatz auf, um mindestens fünf Beispiele jeder Vorlage einzuschließen und ein Modell für jede Der Variationen zu trainieren. Anschließend können Sie die Modelle in einem einzelnen Endpunkt zusammenfügen. Für subtile Variationen, z. B. digitale PDF-Dokumente und Bilder, ist es am besten, mindestens fünf Beispiele für jeden Typ im gleichen Schulungsdatensatz einzuschließen.

Eingabeanforderungen

  • Für optimale Ergebnisse stellen Sie ein klares Foto oder einen qualitativ hochwertigen Scan pro Dokument bereit.

  • Unterstützte Dateiformate:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und HTML
    Lesen
    Gestaltung
    Allgemeines Dokument
    Vorkonfiguriert
    Benutzerdefinierte

    ✱ Microsoft Office Dateien werden derzeit für andere Modelle oder Versionen nicht unterstützt.

  • Für PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (mit einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).

  • Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).

  • Bildabmessungen müssen zwischen 50 x 50 Pixel und 10.000 px x 10.000 Pixel betragen.

  • Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.

  • Die mindeste Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Dimension entspricht etwa 8-Punkt-Text bei 150 Punkten pro Zoll (DPI).

  • Für benutzerdefinierte Modellschulungen beträgt die maximale Anzahl von Seiten für Schulungsdaten 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.

  • Bei der Schulung des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße von Schulungsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neurale Modell.

  • Bei der Schulung des benutzerdefinierten Klassifizierungsmodells beträgt 1GB die Gesamtgröße von Schulungsdaten maximal 10.000 Seiten.

Schulung eines Modells

Benutzerdefinierte Vorlagenmodelle sind in der Regel ab v2.0-API und höheren Versionen verfügbar. Wenn Sie mit einem neuen Projekt beginnen oder über ein vorhandenes beschriftetes Dataset verfügen, verwenden Sie die v3.1- oder v3.0-API mit Document Intelligence Studio, um ein benutzerdefiniertes Vorlagenmodell zu trainieren.

Modell REST-API SDK Beschriftungs- und Testmodelle
Benutzerdefinierte Vorlage v3.1-API Document Intelligence SDK Document Intelligence Studio

Mit den v3.0- und höheren APIs unterstützt der Buildvorgang zum Trainieren des Modells eine neue buildMode Eigenschaft. Um ein benutzerdefiniertes Vorlagenmodell zu trainieren, legen Sie die buildMode auf template fest.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-11-30


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Benutzerdefinierte Vorlagenmodelle sind in der Regel mit der v3.1-API verfügbar. Wenn Sie mit einem neuen Projekt beginnen oder über ein vorhandenes beschriftetes Dataset verfügen, verwenden Sie die v3.1- oder v3.0-API mit Document Intelligence Studio, um ein benutzerdefiniertes Vorlagenmodell zu trainieren.

Modell REST-API SDK Beschriftungs- und Testmodelle
Benutzerdefinierte Vorlage v3.1-API Document Intelligence SDK Document Intelligence Studio

Mit den APIs v3.0 und höher unterstützt der Buildvorgang für das Trainieren eines Modells eine neue Eigenschaft buildMode, um ein benutzerdefiniertes Vorlagenmodell zu erstellen; legen Sie buildMode auf template fest.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie auf unserer Seite "Sprachunterstützung – benutzerdefinierte Modelle".

Benutzerdefinierte Modelle (Vorlagen) sind in der Regel mit der v2.1-API verfügbar.

Modell REST-API SDK Beschriftungs- und Testmodelle
Benutzerdefiniertes Modell (Vorlage) Document Intelligence 2.1 Document Intelligence SDK Beschriftungstool für Dokumentenintelligenz-Beispiele

Nächste Schritte

Erfahren Sie, wie Sie benutzerdefinierte Modelle erstellen und verfassen: