ドキュメント インテリジェンス カスタム テンプレート モデル

このコンテンツは適用対象:チェックマークv4.0 (GA) | 以前のバージョン:青チェックマークv3.1 (GA)赤チェックマークv3.0 (廃止)赤チェックマークv2.1 (廃止)

このコンテンツは適用対象です:チェックマークv3.1 (GA) | 最新バージョン:purple-checkmarkv4.0 (GA) | 以前のバージョン:blue-checkmarkv3.0blue-checkmarkv2.1

このコンテンツは適用対象:red-checkmarkv3.0 (廃止) | 最新バージョン:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | 以前のバージョン:blue-checkmarkv2.1 (廃止)

このコンテンツの適用対象:red-checkmarkv2.1 | Latest version:blue-checkmarkv4.0 (GA)

カスタム テンプレート (以前のカスタム フォーム) は、ラベル付きのキーと値のペア、選択マーク、テーブル、領域、署名をドキュメントから正確に抽出する、トレーニングしやすいドキュメント モデルです。 テンプレート モデルでは、レイアウト キューを使用してドキュメントから値を抽出し、定義されたビジュアル テンプレートを使用して高度に構造化されたドキュメントからフィールドを抽出するのに適しています。

カスタム テンプレート モデルは、カスタム ニューラル モデルと同じラベル付け形式と戦略を共有し、より多くのフィールド型と言語をサポートします。

モデル機能

カスタム テンプレート モデルでは、キーと値のペア、選択マーク、テーブル、署名フィールド、および選択した領域がサポートされます。

フォーム フィールド 選択マーク 表形式フィールド (テーブル) 署名 選択したリージョン 重複するフィールド
対応 対応 対応 対応 対応 サポートされていません

表形式フィールド

API バージョン v3.0 以降のリリースでは、カスタム テンプレート モデルによって 、クロス ページ 表形式フィールド (テーブル) のサポートが追加されました。

  • 複数のページにまたがるテーブルにラベルを付ける場合は、1 つのテーブル内の異なるページに対してテーブルの各行にラベルを付けます。
  • ベスト プラクティスとして、データセットに予想されるバリエーションのサンプルがいくつか含まれていることを確認します。 たとえば、テーブル全体が 1 つのページ上にあり、ドキュメントにそれらのバリエーションが表示される場合は、テーブルが 2 つ以上のページにまたがるサンプルを含めます。

表形式フィールドは、テーブルとして認識されないドキュメント内で繰り返し情報を抽出する場合にも便利です。 たとえば、履歴書の作業エクスペリエンスの繰り返しセクションにラベルを付け、表形式フィールドとして抽出できます。

バリエーションの処理

テンプレート モデルは、定義されたビジュアル テンプレートに依存し、テンプレートを変更すると精度が低下します。 これらのインスタンスでは、トレーニング データセットを分割して、各テンプレートの少なくとも 5 つのサンプルを含め、各バリエーションのモデルをトレーニングします。 その後、モデルを 1 つのエンドポイントに 作成 できます。 デジタル PDF ドキュメントや画像などの微妙なバリエーションの場合は、同じトレーニング データセットに各種類の少なくとも 5 つの例を含めるのが最善です。

入力要件

  • 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    読む
    レイアウト
    一般文書
    プリビルド
    カスタム

    ✱ Microsoft Office ファイルは現在、他のモデルまたはバージョンではサポートされていません。

  • PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のサイズは、50 x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。

  • 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。 このディメンションは、約 150 ドット/インチ (8) のDPIポイント テキストに対応します。

  • カスタム モデル トレーニングの場合、トレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500 ページ、カスタム ニューラル モデルの場合は 50,000 ページです。

  • カスタム抽出モデルトレーニングの場合、トレーニング データの合計サイズはテンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1G-MB です。

  • カスタム分類モデルトレーニングの場合、トレーニング データの合計サイズは最大 10,000 ページで 1GB されます。

モデルのトレーニング

カスタム テンプレート モデルは、v2.0 API 以降のバージョンから一般公開されています。 新しいプロジェクトを開始する場合、または既存のラベル付きデータセットがある場合は、Document Intelligence Studio で v3.1 または v3.0 API を使用して、カスタム テンプレート モデルをトレーニングします。

モデル REST API SDK ラベルとテスト モデル
カスタム テンプレート v3.1 API ドキュメント インテリジェンス SDK ドキュメント インテリジェンス スタジオ

v3.0 以降の API では、モデルをトレーニングするビルド操作で新しい buildMode プロパティがサポートされ、カスタム テンプレート モデルをトレーニングし、 buildModetemplateに設定します。

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-11-30


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

カスタム テンプレート モデルは、 v3.1 API で一般提供されています。 新しいプロジェクトを開始する場合、または既存のラベル付きデータセットがある場合は、Document Intelligence Studio で v3.1 または v3.0 API を使用して、カスタム テンプレート モデルをトレーニングします。

モデル REST API SDK ラベルとテスト モデル
カスタム テンプレート v3.1 API ドキュメント インテリジェンス SDK ドキュメント インテリジェンス スタジオ

v3.0 以降の API では、モデルをトレーニングするビルド操作で新しい buildMode プロパティがサポートされ、カスタム テンプレート モデルをトレーニングし、 buildModetemplateに設定します。

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

サポートされている言語とロケール

サポート されている言語の完全な一覧については、 言語サポートのカスタム モデル に関するページを参照してください。

カスタム (テンプレート) モデルは、 v2.1 API で一般提供されています。

モデル REST API SDK ラベルとテスト モデル
カスタム モデル (テンプレート) ドキュメント インテリジェンス 2.1 ドキュメント インテリジェンス SDK ドキュメント インテリジェンスのサンプル ラベル付けツール

次の手順

カスタムモデルを作成し、構成する方法を学びます。