ドキュメントインテリジェンスのIDドキュメントモデル

このコンテンツは適用対象:v4.0 (GA) | 以前のバージョン:v3.1 (GA)v3.0 (廃止)v2.1 (廃止)

::: moniker-end

このコンテンツは適用対象です:v3.1 (GA) | 最新バージョン:v4.0 (GA) | 以前のバージョン:v3.0v2.1

このコンテンツは適用対象:v3.0 (廃止) | 最新バージョン:v4.0 (GA)v3.1 | 以前のバージョン:v2.1 (廃止)

このコンテンツの適用対象:v2.1 | Latest version:v4.0 (GA)

メモ

事前構築済みの ID ドキュメント (ID) モデル用のドキュメントインテリジェンス v4.0 2024-11-30 (GA) API では、北米、南米、アジア、ヨーロッパ、アフリカ、およびオセアニア全体で拡大されたカバレッジを含む、世界中のすべてのリージョンからの ID ドキュメントがサポートされるようになりました。

ドキュメントインテリジェンス ID ドキュメント (ID) モデルは、光学式文字認識 (OCR) とディープラーニングモデルを組み合わせて、ID ドキュメントから重要な情報を分析および抽出します。 API は ID ドキュメント (以下を含む) を分析し、構造化された JSON データ表現を返します。

地域	ドキュメントの種類
全世界	パスポートブック、パスポートカード
米国	運転免許証、身分証明書、居住許可証(グリーンカード)、社会保障カード、軍事ID
インド	運転免許証、PAN カード、アーダーカード
オーストラリア	運転免許証、フォトカード、キーパスID(デジタル版を含む)
その他	運転免許証、身分証明書、居住許可証

ドキュメントインテリジェンスは、事前構築済みの ID モデルを使用して、政府発行の ID (ID) から情報を分析および抽出できます。強力な光学式文字認識 (OCR) 機能と ID 認識機能を組み合わせて、ワールドワイドパスポートと米国運転免許証 (すべての 50 州と D.C.) から重要な情報を抽出します。 ID API は、名、姓、生年月日、ドキュメント番号など、これらの ID ドキュメントからキー情報を抽出します。この API は、クラウドサービスとしてのドキュメントインテリジェンス v2.1 で使用できます。

ID ドキュメントの処理

ID ドキュメント処理では、手動または OCR ベースのテクノロジを使用して、ID ドキュメントからデータを抽出します。 ID ドキュメントの処理は、ID 証明を必要とするビジネス操作において重要な手順です。例としては、銀行やその他の金融機関での顧客検証、住宅ローンの申請、医療訪問、クレーム処理、ホスピタリティ業界などがあります。個人は、運転免許証、パスポート、その他の同様の書類を介して本人確認を行い、サービスや特典を提供する前に効率的に検証できるようにします。

Document Intelligence Studio で処理された米国の運転免許証のサンプル

サンプルの運転免許証の画像。

データ抽出

事前構築済みの ID サービスは、世界中のパスポートと米国の運転免許証からキー値を抽出し、構造化された JSON 応答で返します。

運転免許証の例

サンプルの運転免許証

Passport の例

サンプルパスポート

開発オプション

ドキュメントインテリジェンス v4.0: 2024-11-30 (GA) では、次のツール、アプリケーション、ライブラリがサポートされています。

機能	リソース	モデル ID
ID ドキュメントモデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-idDocument

ドキュメントインテリジェンス v3.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能	リソース	モデル ID
ID ドキュメントモデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-idDocument

ドキュメントインテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能	リソース	モデル ID
ID ドキュメントモデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	prebuilt-idDocument

ドキュメントインテリジェンス v2.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能	リソース
ID ドキュメントモデル	• ドキュメントインテリジェンスラベル付けツール • REST API • クライアントライブラリ SDK • ドキュメントインテリジェンス Docker コンテナー

入力要件

次のファイル形式がサポートされています。

モデル	PDF	画像: JPEG/JPG、PNG、BMP、TIFF、HEIF	Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
読む	✔	✔	✔
レイアウト	✔	✔	✔
一般ドキュメント	✔	✔
プリビルド	✔	✔
カスタム抽出	✔	✔
カスタム分類	✔	✔	✔

写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ファイルサイズ: ドキュメントを分析するためのファイルサイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
パスワードロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
カスタムモデルトレーニング: トレーニングデータの最大ページ数は、カスタムテンプレートモデルの場合は 500 ページ、カスタムニューラルモデルの場合は 50,000 ページです。
カスタム抽出モデルトレーニング: トレーニングデータの合計サイズは、テンプレートモデルの場合は 50 MB、ニューラルモデルの場合は 1 GB です。
カスタム分類モデルトレーニング: トレーニングデータの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニングデータの合計サイズは 2 GB で、最大 10,000 ページです。
Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。

サポートされているファイル形式: JPEG、PNG、PDF、TIFF。
PDF ファイルと TIFF ファイルでサポートされるページ数: 最大 2,000 ページ、または Free レベルのサブスクライバーの場合は最初の 2 ページのみ。
サポートされているファイルサイズ: 合計 50 MB 未満。最小ピクセル: 50 x 50 px;最大ピクセル 10,000 x 10,000 ピクセル。

ID ドキュメントモデルのデータ抽出

ID ドキュメントから、名前、生年月日、有効期限などのデータを抽出します。次のリソースが必要です。

Azure サブスクリプション- 無料で作成できます。
Azure ポータルの Document Intelligence インスタンス。無料価格レベル (F0) を使用して、サービスを試すことができます。リソースがデプロイされたら、[ リソースに移動 ] を選択してキーとエンドポイントを取得します。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

メモ

Document Intelligence Studio は、v3.1 および v3.0 API 以降のバージョンで使用できます。

ドキュメントインテリジェンススタジオのホームページで、[ID ドキュメント] を選択します。
サンプル請求書を分析したり、独自のファイルをアップロードしたりできます。
[ 分析の実行 ] ボタンを選択し、必要に応じて [分析] オプションを構成します。

Document Intelligence Studio をお試しください。

ドキュメントインテリジェンスのサンプルラベル付けツール

ドキュメントインテリジェンスサンプルツールに移動します。
サンプルツールのホームページで、[ 事前構築済みモデルを使用してデータを取得する ] タイルを選択します。
ドロップダウンメニューから分析する フォームの種類 を選択します。
分析するファイルの URL を次のオプションから選択します。
[ ソース ] フィールドで、ドロップダウンメニューから [URL ] を選択し、選択した URL を貼り付けて、[ フェッチ ] ボタンを選択します。
[ ドキュメントインテリジェンスサービスエンドポイント ] フィールドに、ドキュメントインテリジェンスサブスクリプションで取得したエンドポイントを貼り付けます。
キーフィールドに、ドキュメントインテリジェンスリソースから取得したキーを貼り付けます。
[ 分析の実行] を選択します。ドキュメントインテリジェンスサンプルラベル付けツールは、事前構築済みの分析 API を呼び出し、ドキュメントを分析します。
結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示されたテキスト、検出されたテーブルを確認します。
JSON 出力ファイルをダウンロードして、詳細な結果を表示します。
- "readResults" ノードには、ページ上のそれぞれの境界ボックスの配置を含むテキストのすべての行が含まれます。
- "selectionMarks" ノードには、すべての選択マーク (チェックボックス、ラジオマーク) と、その状態が選択されているか 選択されていないかが表示されます。
- "pageResults" セクションには、抽出されたテーブルが含まれています。ドキュメントインテリジェンスでは、テーブルごとに、テキスト、行、列のインデックス、行と列のスパン、境界ボックスなどが抽出されます。
- "documentResults" フィールドには、ドキュメントの最も関連性の高い部分のキーと値のペアの情報と明細情報が含まれます。

メモ

サンプルラベル付けツールでは、BMP ファイル形式はサポートされていません。この制限は、ドキュメントインテリジェンスサービスではなくツールの制限です。

フィールド抽出

サポートされているドキュメント抽出フィールドについては、see GitHub サンプルリポジトリの ID ドキュメントモデルスキーマ ページを参照してください。

サポートされているドキュメントの種類

ID ドキュメントモデルでは、現在、米国の運転免許証と、国際パスポート (ビザやその他の旅行書類を除く) からの伝記ページの抽出がサポートされています。

抽出されたフィールド

名前	タイプ	説明	値
国	国	ISO 3166 標準に準拠している国コード	"USA"
生年月日	日付	生年月日 (YYYY-MM-DD 形式)	"1980-01-01"
有効期限	日付	有効期限 (YYYY-MM-DD 形式)	"2019-05-05"
ドキュメント番号	文字列	該当するパスポート番号、運転免許証番号など	"340020013"
Firstname	文字列	抽出された名前と中間のイニシャル (該当する場合)	"JENNIFER"
苗字	文字列	抽出された姓	"ブルックス"
国籍	国	ISO 3166 標準に準拠している国コード	"USA"
セックス	性別	抽出可能な値には、"M" "F" "X" が含まれます	"F"
機械可読領域 (MachineReadableZone)	オブジェクト	抽出された Passport `MRZ` (それぞれ 44 文字の 2 行を含む)	"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
文書タイプ (DocumentType)	文字列	ドキュメントの種類 (Passport、Driver's License など)	パスポート
アドレス	文字列	抽出されたアドレス (運転免許証のみ)	〒99999-1234 ワシントン州 YOUR CITY 123 ストリートアドレス
地域	文字列	抽出されたリージョン、州、都道府県など (運転免許証のみ)	"Washington"

移行ガイド

ドキュメントインテリジェンス v3.1 移行ガイドに従って、アプリケーションとワークフローで v3.0 バージョンを使用する方法について説明します。

次の手順

Document Intelligence Studio で独自のフォームとドキュメントを処理してみてください。
ドキュメントインテリジェンスのクイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

GitHub.

GitHub.

ドキュメントインテリジェンスサンプルラベル付けツールを使用して、独自のフォームとドキュメントを処理してみてください。
ドキュメントインテリジェンスのクイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-08