ドキュメントインテリジェンスカスタムテンプレートモデル

このコンテンツは適用対象:v4.0 (GA) | 以前のバージョン:v3.1 (GA)v3.0 (廃止)v2.1 (廃止)

このコンテンツは適用対象です:v3.1 (GA) | 最新バージョン:v4.0 (GA) | 以前のバージョン:v3.0v2.1

このコンテンツは適用対象:v3.0 (廃止) | 最新バージョン:v4.0 (GA)v3.1 | 以前のバージョン:v2.1 (廃止)

このコンテンツの適用対象:v2.1 | Latest version:v4.0 (GA)

カスタムテンプレート (以前のカスタムフォーム) は、ラベル付きのキーと値のペア、選択マーク、テーブル、領域、署名をドキュメントから正確に抽出する、トレーニングしやすいドキュメントモデルです。テンプレートモデルでは、レイアウトキューを使用してドキュメントから値を抽出し、定義されたビジュアルテンプレートを使用して高度に構造化されたドキュメントからフィールドを抽出するのに適しています。

カスタムテンプレートモデルは、カスタムニューラルモデルと同じラベル付け形式と戦略を共有し、より多くのフィールド型と言語をサポートします。

モデル機能

カスタムテンプレートモデルでは、キーと値のペア、選択マーク、テーブル、署名フィールド、および選択した領域がサポートされます。

フォームフィールド	選択マーク	表形式フィールド (テーブル)	署名	選択したリージョン	重複するフィールド
対応	対応	対応	対応	対応	サポートされていません

表形式フィールド

API バージョン v3.0 以降のリリースでは、カスタムテンプレートモデルによって 、クロスページ 表形式フィールド (テーブル) のサポートが追加されました。

複数のページにまたがるテーブルにラベルを付ける場合は、1 つのテーブル内の異なるページに対してテーブルの各行にラベルを付けます。
ベストプラクティスとして、データセットに予想されるバリエーションのサンプルがいくつか含まれていることを確認します。たとえば、テーブル全体が 1 つのページ上にあり、ドキュメントにそれらのバリエーションが表示される場合は、テーブルが 2 つ以上のページにまたがるサンプルを含めます。

表形式フィールドは、テーブルとして認識されないドキュメント内で繰り返し情報を抽出する場合にも便利です。たとえば、履歴書の作業エクスペリエンスの繰り返しセクションにラベルを付け、表形式フィールドとして抽出できます。

バリエーションの処理

テンプレートモデルは、定義されたビジュアルテンプレートに依存し、テンプレートを変更すると精度が低下します。これらのインスタンスでは、トレーニングデータセットを分割して、各テンプレートの少なくとも 5 つのサンプルを含め、各バリエーションのモデルをトレーニングします。その後、モデルを 1 つのエンドポイントに作成できます。デジタル PDF ドキュメントや画像などの微妙なバリエーションの場合は、同じトレーニングデータセットに各種類の少なくとも 5 つの例を含めるのが最善です。

入力要件

最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。

サポートされているファイル形式:

モデル	PDF	画像: J`PEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	Microsoft Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
読む	✔	✔	✔
レイアウト	✔	✔	✔
一般文書	✔	✔
プリビルド	✔	✔
カスタム	✔	✔

✱ Microsoft Office ファイルは現在、他のモデルまたはバージョンではサポートされていません。

PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ドキュメントを分析するためのファイルサイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。
画像のサイズは、50 x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。このディメンションは、約 150 ドット/インチ (8) のDPIポイントテキストに対応します。
カスタムモデルトレーニングの場合、トレーニングデータの最大ページ数は、カスタムテンプレートモデルの場合は 500 ページ、カスタムニューラルモデルの場合は 50,000 ページです。
カスタム抽出モデルトレーニングの場合、トレーニングデータの合計サイズはテンプレートモデルの場合は 50 MB、ニューラルモデルの場合は 1G-MB です。
カスタム分類モデルトレーニングの場合、トレーニングデータの合計サイズは最大 10,000 ページで 1GB されます。

モデルのトレーニング

カスタムテンプレートモデルは、v2.0 API 以降のバージョンから一般公開されています。新しいプロジェクトを開始する場合、または既存のラベル付きデータセットがある場合は、Document Intelligence Studio で v3.1 または v3.0 API を使用して、カスタムテンプレートモデルをトレーニングします。

モデル	REST API	SDK	ラベルとテストモデル
カスタムテンプレート	v3.1 API	ドキュメントインテリジェンス SDK	ドキュメントインテリジェンススタジオ

v3.0 以降の API では、モデルをトレーニングするビルド操作で新しい buildMode プロパティがサポートされ、カスタムテンプレートモデルをトレーニングし、 buildMode を templateに設定します。

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-11-30


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

カスタムテンプレートモデルは、 v3.1 API で一般提供されています。新しいプロジェクトを開始する場合、または既存のラベル付きデータセットがある場合は、Document Intelligence Studio で v3.1 または v3.0 API を使用して、カスタムテンプレートモデルをトレーニングします。

モデル	REST API	SDK	ラベルとテストモデル
カスタムテンプレート	v3.1 API	ドキュメントインテリジェンス SDK	ドキュメントインテリジェンススタジオ

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

サポートされている言語とロケール

サポート されている言語の完全な一覧については、言語サポートのカスタムモデルに関するページを参照してください。

カスタム (テンプレート) モデルは、 v2.1 API で一般提供されています。

モデル	REST API	SDK	ラベルとテストモデル
カスタムモデル (テンプレート)	ドキュメントインテリジェンス 2.1	ドキュメントインテリジェンス SDK	ドキュメントインテリジェンスのサンプルラベル付けツール

次の手順

カスタムモデルを作成し、構成する方法を学びます。

カスタムモデルを作成するカスタムモデルを作成する

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-08