ドキュメントインテリジェンスのIDドキュメントモデル

このコンテンツは適用対象:チェックマークv4.0 (GA) | 以前のバージョン:青チェックマークv3.1 (GA)赤チェックマークv3.0 (廃止)赤チェックマークv2.1 (廃止)

::: moniker-end

このコンテンツは適用対象です:チェックマークv3.1 (GA) | 最新バージョン:purple-checkmarkv4.0 (GA) | 以前のバージョン:blue-checkmarkv3.0blue-checkmarkv2.1

このコンテンツは適用対象:red-checkmarkv3.0 (廃止) | 最新バージョン:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | 以前のバージョン:blue-checkmarkv2.1 (廃止)

このコンテンツの適用対象:red-checkmarkv2.1 | Latest version:blue-checkmarkv4.0 (GA)

メモ

事前構築済みの ID ドキュメント (ID) モデル用のドキュメント インテリジェンス v4.0 2024-11-30 (GA) API では、北米、南米、アジア、ヨーロッパ、アフリカ、およびオセアニア全体で拡大されたカバレッジを含む、世界中のすべてのリージョンからの ID ドキュメントがサポートされるようになりました。

ドキュメント インテリジェンス ID ドキュメント (ID) モデルは、光学式文字認識 (OCR) とディープ ラーニング モデルを組み合わせて、ID ドキュメントから重要な情報を分析および抽出します。 API は ID ドキュメント (以下を含む) を分析し、構造化された JSON データ表現を返します。

地域 ドキュメントの種類
全世界 パスポートブック、パスポートカード
米国 運転免許証、身分証明書、居住許可証(グリーンカード)、社会保障カード、軍事ID
インド 運転免許証、PAN カード、アーダー カード
オーストラリア 運転免許証、フォトカード、キーパスID(デジタル版を含む)
その他 運転免許証、身分証明書、居住許可証

ドキュメント インテリジェンスは、事前構築済みの ID モデルを使用して、政府発行の ID (ID) から情報を分析および抽出できます。 強力な 光学式文字認識 (OCR) 機能と ID 認識機能を組み合わせて、ワールドワイド パスポートと米国運転免許証 (すべての 50 州と D.C.) から重要な情報を抽出します。 ID API は、名、姓、生年月日、ドキュメント番号など、これらの ID ドキュメントからキー情報を抽出します。 この API は、クラウド サービスとしてのドキュメント インテリジェンス v2.1 で使用できます。

ID ドキュメントの処理

ID ドキュメント処理では、手動または OCR ベースのテクノロジを使用して、ID ドキュメントからデータを抽出します。 ID ドキュメントの処理は、ID 証明を必要とするビジネス操作において重要な手順です。 例としては、銀行やその他の金融機関での顧客検証、住宅ローンの申請、医療訪問、クレーム処理、ホスピタリティ業界などがあります。 個人は、運転免許証、パスポート、その他の同様の書類を介して本人確認を行い、サービスや特典を提供する前に効率的に検証できるようにします。

Document Intelligence Studio で処理された米国の運転免許証のサンプル

サンプルの運転免許証の画像。

データ抽出

事前構築済みの ID サービスは、世界中のパスポートと米国の運転免許証からキー値を抽出し、構造化された JSON 応答で返します。

運転免許証の例

サンプルの運転免許証

Passport の例

サンプルパスポート

開発オプション

ドキュメント インテリジェンス v4.0: 2024-11-30 (GA) では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース モデル ID
ID ドキュメント モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

ドキュメント インテリジェンス v3.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能 リソース モデル ID
ID ドキュメント モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

ドキュメント インテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能 リソース モデル ID
ID ドキュメント モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

ドキュメント インテリジェンス v2.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能 リソース
ID ドキュメント モデル ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー

入力要件

次のファイル形式がサポートされています。

モデル PDF 画像:
JPEG/JPG、PNG、BMP、TIFF、HEIF
Office:
Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
読む
レイアウト
一般ドキュメント
プリビルド
カスタム抽出
カスタム分類
  • 写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
  • PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
  • ファイル サイズ: ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
  • 画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
  • パスワード ロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
  • テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。 このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
  • カスタム モデル トレーニング: トレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500 ページ、カスタム ニューラル モデルの場合は 50,000 ページです。
  • カスタム抽出モデルトレーニング: トレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。
  • カスタム分類モデル トレーニング: トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。
  • Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。
  • サポートされているファイル形式: JPEG、PNG、PDF、TIFF。

  • PDF ファイルと TIFF ファイルでサポートされるページ数: 最大 2,000 ページ、または Free レベルのサブスクライバーの場合は最初の 2 ページのみ。

  • サポートされているファイル サイズ: 合計 50 MB 未満。最小ピクセル: 50 x 50 px;最大ピクセル 10,000 x 10,000 ピクセル。

ID ドキュメント モデルのデータ抽出

ID ドキュメントから、名前、生年月日、有効期限などのデータを抽出します。 次のリソースが必要です。

  • Azure サブスクリプション- 無料で作成できます

  • Azure ポータルの Document Intelligence インスタンス。 無料価格レベル (F0) を使用して、サービスを試すことができます。 リソースがデプロイされたら、[ リソースに移動 ] を選択してキーとエンドポイントを取得します。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

メモ

Document Intelligence Studio は、v3.1 および v3.0 API 以降のバージョンで使用できます。

  1. ドキュメント インテリジェンス スタジオのホーム ページで、[ID ドキュメント] を選択します

  2. サンプル請求書を分析したり、独自のファイルをアップロードしたりできます。

  3. [ 分析の実行 ] ボタンを選択し、必要に応じて [分析] オプションを構成します。

    ドキュメント インテリジェンス スタジオの [分析の実行] ボタンと [分析] オプション ボタンのスクリーンショット。

ドキュメント インテリジェンスのサンプル ラベル付けツール

  1. ドキュメント インテリジェンス サンプル ツールに移動します。

  2. サンプル ツールのホーム ページで、[ 事前構築済みモデルを使用してデータを取得する ] タイルを選択します。

    レイアウト モデルの分析結果操作のスクリーンショット。

  3. ドロップダウン メニューから分析する フォームの種類 を選択します。

  4. 分析するファイルの URL を次のオプションから選択します。

  5. [ ソース ] フィールドで、ドロップダウン メニューから [URL ] を選択し、選択した URL を貼り付けて、[ フェッチ ] ボタンを選択します。

    ソースの場所のドロップダウン メニューのスクリーンショット。

  6. [ ドキュメント インテリジェンス サービス エンドポイント ] フィールドに、ドキュメント インテリジェンス サブスクリプションで取得したエンドポイントを貼り付けます。

  7. キー フィールドに、ドキュメント インテリジェンス リソースから取得したキーを貼り付けます。

    ドキュメントの種類を選択するドロップダウン メニューのスクリーンショット。

  8. [ 分析の実行] を選択します。 ドキュメント インテリジェンス サンプル ラベル付けツールは、事前構築済みの分析 API を呼び出し、ドキュメントを分析します。

  9. 結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示されたテキスト、検出されたテーブルを確認します。

    ID モデルの分析結果操作のスクリーンショット。

  10. JSON 出力ファイルをダウンロードして、詳細な結果を表示します。

    • "readResults" ノードには、ページ上のそれぞれの境界ボックスの配置を含むテキストのすべての行が含まれます。
    • "selectionMarks" ノードには、すべての選択マーク (チェック ボックス、ラジオ マーク) と、その状態が 選択 されているか 選択されていないかが表示されます。
    • "pageResults" セクションには、抽出されたテーブルが含まれています。 ドキュメント インテリジェンスでは、テーブルごとに、テキスト、行、列のインデックス、行と列のスパン、境界ボックスなどが抽出されます。
    • "documentResults" フィールドには、ドキュメントの最も関連性の高い部分のキーと値のペアの情報と明細情報が含まれます。

メモ

サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 この制限は、ドキュメント インテリジェンス サービスではなくツールの制限です。

フィールド抽出

サポートされているドキュメント抽出フィールドについては、see GitHub サンプル リポジトリの ID ドキュメント モデル スキーマ ページを参照してください。

サポートされているドキュメントの種類

ID ドキュメント モデルでは、現在、米国の運転免許証と、国際パスポート (ビザやその他の旅行書類を除く) からの伝記ページの抽出がサポートされています。

抽出されたフィールド

名前 タイプ 説明
ISO 3166 標準に準拠している国コード "USA"
生年月日 日付 生年月日 (YYYY-MM-DD 形式) "1980-01-01"
有効期限 日付 有効期限 (YYYY-MM-DD 形式) "2019-05-05"
ドキュメント番号 文字列 該当するパスポート番号、運転免許証番号など "340020013"
Firstname 文字列 抽出された名前と中間のイニシャル (該当する場合) "JENNIFER"
苗字 文字列 抽出された姓 "ブルックス"
国籍 ISO 3166 標準に準拠している国コード "USA"
セックス 性別 抽出可能な値には、"M" "F" "X" が含まれます "F"
機械可読領域 (MachineReadableZone) オブジェクト 抽出された Passport MRZ (それぞれ 44 文字の 2 行を含む) "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
文書タイプ (DocumentType) 文字列 ドキュメントの種類 (Passport、Driver's License など) パスポート
アドレス 文字列 抽出されたアドレス (運転免許証のみ) 〒99999-1234 ワシントン州 YOUR CITY 123 ストリートアドレス
地域 文字列 抽出されたリージョン、州、都道府県など (運転免許証のみ) "Washington"

移行ガイド

次の手順

  • GitHub.
  • GitHub.