ドキュメント処理モデル

このコンテンツは適用対象:v4.0 (GA) | 以前のバージョン:v3.1 (GA)v3.0 (廃止)v2.1 (廃止)

このコンテンツは適用対象です:v3.1 (GA) | 最新バージョン:v4.0 (GA) | 以前のバージョン:v3.0v2.1

このコンテンツは適用対象:v3.0 (廃止) | 最新バージョン:v4.0 (GA)v3.1 | 以前のバージョン:v2.1 (廃止)

このコンテンツの適用対象:v2.1 | Latest version:v4.0 (GA)

Foundry Tools の Azure ドキュメントインテリジェンスでは、インテリジェントなドキュメント処理をアプリやフローに追加するために使用できるさまざまなモデルがサポートされています。事前構築済みのドメイン固有のモデルを使用することも、特定のビジネスニーズやユースケースに合わせてカスタマイズされたカスタムモデルをトレーニングすることもできます。ドキュメントインテリジェンスは、REST API または Python、C#、Java、JavaScript クライアントライブラリで使用できます。

メモ

財務データ、保護された正常性データ、個人データ、または機密性の高いデータを含むドキュメント処理プロジェクトには、注意が必要です。国/地域および業界固有のすべての要件を必ず遵守してください。

モデルの概要

次の表は、各安定した API の一般公開 (GA) モデルを示しています。

モデルの種類	モデル	2024-11-30 (GA)	2023-07-31 (GA)	2022-08-31 (GA)	v2.1 (GA)
ドキュメント分析モデル	読む	✔️	✔️	✔️	利用できません
ドキュメント分析モデル	レイアウト	✔️	✔️	✔️	✔️
ドキュメント分析モデル	一般的なドキュメント**	でサポートされていますレイアウトモデル	✔️	✔️	利用できません
事前構築済みモデル	銀行小切手	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	銀行取引明細書	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	payStub	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	契約	✔️	✔️	利用できません	利用できません
事前構築済みモデル	健康保険証	✔️	✔️	✔️	利用できません
事前構築済みモデル	ID文書	✔️	✔️	✔️	✔️
事前構築済みモデル	請求書	✔️	✔️	✔️	✔️
事前構築済みモデル	領収書	✔️	✔️	✔️	✔️
事前構築済みモデル	米国統一税*	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	米国 1040 税*	✔️	✔️	利用できません	利用できません
事前構築済みモデル	米国 1095 税*	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	米国 1098 税*	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	米国 1099 税*	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	米国 W2 税	✔️	✔️	✔️	利用できません
事前構築済みモデル	米国 W4 税	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	米国住宅ローン 1003 URLA	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	米国住宅ローン 1004 URAR	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	米国住宅ローン 1005	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	米国住宅ローン 1008 の概要	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	米国住宅ローン決算開示	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	結婚証明書	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	クレジットカード	✔️	利用できません	利用できません	利用できません
事前構築済みモデル	名刺	使用されていない	✔️	✔️	✔️
カスタム分類モデル	カスタム分類子	✔️	✔️	利用できません	利用できません
カスタム抽出モデル	カスタムニューラル	✔️	✔️	✔️	利用できません
カスタム抽出モデル	カスタムテンプレート	✔️	✔️	✔️	✔️
カスタム抽出モデル	カスタム構成済み	✔️	✔️	✔️	✔️
すべてのモデル	アドオン機能	✔️	✔️	利用できません	利用できません

* サブモデルが含まれています。サポートされているバリエーションとサブタイプについては、モデル固有の情報を参照してください。
** 一般的なドキュメントモデルのすべての機能は、レイアウトモデルで使用できます。一般的なモデルはサポートされなくなりました。

遅延

待機時間は、API サーバーが受信要求を処理して処理し、送信応答をクライアントに配信するのにかかる時間です。ドキュメントを分析する時間は、各ページのサイズ (ページ数など) と関連するコンテンツによって異なります。ドキュメントインテリジェンスはマルチテナント非同期サービスであり、類似したドキュメントの待機時間は同等ですが、常に同じとは限りません。待機時間とパフォーマンスの変動は、イメージと大規模なドキュメントを大規模に処理するマイクロサービスベースのステートレスサービスに固有です。ハードウェアと容量とスケーリングの機能を継続的にスケールアップしていますが、実行時に待機時間の問題が発生する可能性があります。

アドオン機能

ドキュメントインテリジェンスでは、次のアドオン機能を使用できます。名刺モデルを除くすべてのモデルについて、ドキュメントインテリジェンスでは、より高度な分析を可能にするアドオン機能がサポートされるようになりました。ドキュメント抽出のシナリオに応じて、これらのオプション機能を有効または無効にすることができます。 2023-07-31 (GA) 以降の API バージョンでは、次のアドオン機能を使用できます。

ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
queryFields (米国の税モデルでは使用できません)
searchablePDF (読み取りモデルでのみ使用できます)

アドオン機能	アドオン/無料	2024-11-30 (GA)	2023-07-31 (GA)	2022-08-31 (GA)	v2.1 (GA)
フォントプロパティの抽出	アドオン	✔️	✔️	利用できません	利用できません
数式の抽出	アドオン	✔️	✔️	利用できません	利用できません
高解像度抽出	アドオン	✔️	✔️	利用できません	利用できません
バーコード抽出	Free	✔️	✔️	利用できません	利用できません
言語検出	Free	✔️	✔️	利用できません	利用できません
キーと値のペア	Free	✔️	利用できません	利用できません	利用できません
クエリフィールド	アドオン*	✔️	利用できません	利用できません	利用できません
検索可能な PDF	アドオン*	✔️	利用できません	利用できません	利用できません

モデル分析機能

モデル ID	コンテンツ抽出	クエリフィールド	段落	段落の役割	選択マーク	テーブル	キーと値のペア	言語	バーコード	ドキュメント分析	数式*	スタイル書体*	高解像度*	検索可能な PDF
`prebuilt-read`	✓		✓					O	O		O	O	O	O
`prebuilt-layout`	✓	✓	✓	✓	✓	✓	O	O	O		O	O	O
`prebuilt-contract`	✓	✓	✓	✓	✓			O	O	✓	O	O
`prebuilt-healthInsuranceCard.us`	✓	✓						O	O	✓	O	O	O
`prebuilt-idDocument`	✓	✓						O	O	✓	O	O	O
`prebuilt-invoice`	✓	✓			✓	✓	O	O	O	✓	O	O	O
`prebuilt-receipt`	✓	✓						O	O	✓	O	O	O
`prebuilt-marriageCertificate.us`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-creditCard`	✓	✓						O	O	✓	O	O	O
`prebuilt-check.us`	✓	✓						O	O	✓	O	O	O
`prebuilt-payStub.us`	✓	✓						O	O	✓	O	O	O
`prebuilt-bankStatement`	✓	✓						O	O	✓	O	O	O
`prebuilt-mortgage.us.1003`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.1004`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.1005`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.1008`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-mortgage.us.closingDisclosure`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.w2`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.w4`	✓	✓						O	O	✓	O	O	O
`prebuilt-tax.us.1040` (各種)	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1095A`	✓	✓						O	O	✓	O	O	O
`prebuilt-tax.us.1095C`	✓	✓						O	O	✓	O	O	O
`prebuilt-tax.us.1098`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1098E`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1098T`	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1099` (各種)	✓	✓			✓			O	O	✓	O	O	O
`prebuilt-tax.us.1099SSA`	✓	✓						O	O	✓	O	O	O
`{ customModelName }`	✓	✓	✓	✓	✓	✓		O	O	✓	O	O	O

✓ - 有効
O - 省略可能
* - Premium 機能には追加コストが発生します

クエリフィールドの価格は、他のアドオン機能とは異なります。詳細については、「価格」を参照してください。

境界ボックスと多角形の座標

境界ボックス (v3.0 以降のバージョンでpolygon ) は、ドキュメント内のテキスト要素を囲む抽象的な四角形です。境界ボックスは、オブジェクト検出の参照ポイントとして使用されます。

境界ボックスは、4 つの数値ペアの配列に表示される x 座標平面と y 座標平面を使用して位置を指定します。各ペアは、左上、右上、右下、左下の順序でボックスの角を表します。
画像座標はピクセル単位で表示されます。 PDF の場合、座標はインチ単位で表示されます。

言語のサポート

ディープラーニングに基づくドキュメントインテリジェンスのユニバーサルモデルでは、多くの言語がサポートされています。モデルでは、言語が混在するテキスト行など、画像やドキュメントから多言語テキストを抽出できます。言語サポートは、ドキュメントインテリジェンスサービスの機能によって異なります。完全な一覧については、次の記事を参照してください。

リージョン別の可用性

ドキュメントインテリジェンスは、60 以上Azureグローバルインフラストラクチャリージョンの多くで一般提供されています。

自分や顧客に最適なリージョンを選択するには、Azure地域を参照してください。

モデルの詳細

このセクションでは、各モデルで期待できる出力について説明します。アドオン機能を使用して、ほとんどのモデルの出力を拡張できます。

OCR の読み取り

Read API では、光学式文字認識 (OCR) を使用して、行と単語、場所、検出された言語、手書きスタイル (検出された場合) を分析および抽出します。

このサンプルドキュメントは、 Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio Read を使用して処理されたサンプルドキュメントを示すスクリーンショット。

詳細情報: モデルの読み取り

レイアウト分析

レイアウト分析モデルは、テキスト、テーブル、選択マーク、およびタイトル、セクション見出し、ページヘッダー、ページフッターなどのその他の構造要素を分析して抽出します。

このサンプルドキュメントは、 Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用して処理された新聞ページのサンプルを示すスクリーンショット。

詳細情報: レイアウトモデル

健康保険証

医療保険カードモデルは、強力な OCR 機能とディープラーニングモデルを組み合わせて、米国の医療保険カードから重要な情報を分析および抽出します。

このサンプルの米国医療保険カードは、Document Intelligence Studio を使用して処理されました。

詳細情報: 医療保険カードモデル

米国の税務書類

米国の税ドキュメントモデルでは、税ドキュメントの選択されたグループから主要なフィールドと明細を分析および抽出します。この API は、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式と品質の英語の米国税ドキュメントの分析をサポートしています。現在、次のモデルがサポートされています。

モデル	説明	モデル ID
米国税 W-2	課税対象の報酬の詳細を抽出します。	`prebuilt-tax.us.w2`
米国税 W-4	課税対象の報酬の詳細を抽出します。	`prebuilt-tax.us.w4`
米国税 1040	住宅ローン金利の詳細を抽出します。	`prebuilt-tax.us.1040` (バリエーション)
米国税 1095	医療保険の詳細を抽出します。	`prebuilt-tax.us.1095` (バリエーション)
米国税 1098	住宅ローン金利の詳細を抽出します。	`prebuilt-tax.us.1098` (バリエーション)
米国税 1099	雇用主以外のソースから受け取った収入を抽出します。	`prebuilt-tax.us.1099` (バリエーション)

このサンプル W-2 ドキュメントは、 Document Intelligence Studio を使用して処理されました。

W-2 ドキュメントのサンプルを示すスクリーンショット。

詳細情報: 税ドキュメントモデル

米国の住宅ローンドキュメント

米国の住宅ローンドキュメントモデルでは、住宅ローンドキュメントの選択されたグループから、借り手、ローン、および不動産情報を含む主要なフィールドを分析および抽出します。この API は、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式と品質の英語の米国住宅ローンドキュメントの分析をサポートしています。現在、次のモデルがサポートされています。

モデル	説明	モデル ID
1003 消費者使用許諾契約書	ローン、借り手、プロパティの詳細を抽出します。	`prebuilt-mortgage.us.1003`
1004 均一住宅評価報告書(URAR)	ローン、借り手、プロパティの詳細を抽出します。	`prebuilt-mortgage.us.1004`
1005 雇用の検証	ローン、借り手、プロパティの詳細を抽出します。	`prebuilt-mortgage.us.1005`
1008 概要ドキュメント	借り手、売り手、財産、住宅ローン、引受の詳細を抽出します。	`prebuilt-mortgage.us.1008`
決算開示	決算、トランザクションコスト、およびローンの詳細を抽出します。	`prebuilt-mortgage.us.closingDisclosure`

このサンプルのクロージング開示ドキュメントは、 Document Intelligence Studio を使用して処理されました。

クローズ開示のサンプルを示すスクリーンショット。

詳細情報: 住宅ローンドキュメントモデル

契約

契約モデルは、当事者、管轄区域、契約 ID、役職など、契約契約の主要なフィールドと品目を分析して抽出します。このモデルでは現在、英語のコントラクトドキュメントがサポートされています。

このサンプルコントラクトは、Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用したコントラクトモデルの抽出を示すスクリーンショット。

詳細情報: コントラクトモデル

米国の銀行小切手

契約モデルでは、チェックの詳細、勘定の詳細、金額、メモなど、米国の銀行小切手の主要なフィールドが分析および抽出されます。

この銀行小切手のサンプルは、Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用した銀行チェックモデルの抽出を示すスクリーンショット。

詳細情報: コントラクトモデル

米国の銀行明細書

銀行取引明細書モデルでは、米国の銀行明細書の口座番号、銀行詳細、明細書の詳細、トランザクションの詳細から、主要なフィールドと明細を分析および抽出します。

このサンプル銀行報告書は、Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用した銀行取引明細書モデルの抽出を示すスクリーンショット。

詳細情報: コントラクトモデル

payStub

payStub モデルは、給与に関連する情報を含むドキュメントやファイルの主要なフィールドと明細を分析および抽出します。

このサンプルの支払いスタブは、Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用した payStub モデルの抽出を示すスクリーンショット。

詳細情報: コントラクトモデル

請求書

請求書モデルは、請求書の処理を自動化して、顧客名、請求先住所、期限、金額、明細、およびその他のキーデータを抽出します。

このサンプル請求書は、Document Intelligence Studio を使用して処理されました。

詳細情報: 請求書モデル

領収書

レシートモデルを使用して、販売者の名前、日付、品目、数量、および印刷されたレシートと手書きのレシートの合計の売上レシートをスキャンします。バージョン v3.0 では、単一ページのホテルレシート処理もサポートされています。

このサンプルレシートは、Document Intelligence Studio を使用して処理されました。

詳細情報: レシートモデル

ID ドキュメント

ID ドキュメント (ID) モデルを使用して、米国の運転免許証 (50 州とコロンビア特別区すべて) と国際パスポート (ビザやその他の旅行書類を除く) の略歴ページを処理して、重要なフィールドを抽出します。

このサンプルの米国の運転免許証は、Document Intelligence Studio を使用して処理されました。

詳細情報: ID ドキュメントモデル

結婚証明書

結婚証明書モデルを使用して、米国の結婚証明書を処理して、個人、日付、場所などの主要なフィールドを抽出します。

このサンプルの米国結婚証明書は、Document Intelligence Studio を使用して処理されました。

詳細情報: ID ドキュメントモデル

クレジットカード

クレジットカードモデルを使用してクレジットカードとデビットカードを処理し、キーフィールドを抽出します。

このサンプルクレジットカードは、Document Intelligence Studio を使用して処理されました。

詳細情報: ID ドキュメントモデル

カスタムモデル

カスタムモデルは、大きく 2 種類に分類されます。 "ドキュメントの種類" の分類をサポートするカスタム分類モデルと、特定のドキュメントの種類から定義されたスキーマを抽出できるカスタム抽出モデル。

カスタムモデルの種類と関連するモデルビルドモードを示す図。

カスタムドキュメントモデルでは、ビジネスに固有のフォームやドキュメントからデータを分析して抽出します。個別のコンテンツ内のフォームフィールドを認識し、キーと値のペアとテーブルデータを抽出します。開始するには、フォームの種類の例が 1 つだけ必要です。

バージョン v3.0 以降のカスタムモデルでは、テンプレートモデルとニューラルモデルの両方で、カスタムテンプレート (フォーム) テーブルとクロスページテーブルでの署名検出がサポートされています。署名の検出では、ドキュメントに署名するユーザーの ID ではなく、署名の存在が検索されます。モデルが署名検出のために 符号なし を返した場合、定義されたフィールドに署名が見つかりませんでした。

このサンプルカスタムテンプレートは、 Document Intelligence Studio を使用して処理されました。

カスタムフォームを分析するドキュメントインテリジェンスを示すスクリーンショット。

詳細情報: カスタムモデル

カスタム抽出

カスタム抽出モデルには、カスタムテンプレートとカスタムニューラルの 2 種類があります。カスタム抽出モデルを作成するには、抽出する値を使用してドキュメントのデータセットにラベルを付け、ラベル付けされたデータセットでモデルをトレーニングします。作業を開始するには、同じフォームまたはドキュメントの種類の例が 5 つだけ必要です。

このサンプルのカスタム抽出は、 Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio でのカスタム抽出モデル分析を示すスクリーンショット。

詳細情報: カスタムテンプレートモデル

詳細情報: カスタムニューラルモデル

カスタム分類子

カスタム分類モデルを使用すると、抽出モデルを呼び出す前にドキュメントの種類を識別できます。分類モデルは、2023-07-31 (GA) API 以降で使用できます。カスタム分類モデルをトレーニングするには、少なくとも 2 つの異なるクラスと、クラスごとに少なくとも 5 つのサンプルが必要です。

詳細情報: カスタム分類モデル

構成済みモデル

作成されたモデルは、カスタムモデルのコレクションを取得し、フォーム型から構築された 1 つのモデルに割り当てることで作成されます。 1 つのモデル ID で呼び出される構成済みモデルに複数のカスタムモデルを割り当てることができます。 1 つの構成済みモデルに最大 200 個のトレーニング済みカスタムモデルを割り当てることができます。

このサンプル構成済みモデルは、Document Intelligence Studio にあります。

Document Intelligence Studio Compose カスタムモデルペインを示すスクリーンショット。

詳細情報: カスタムモデル

入力要件

次のファイル形式がサポートされています。

モデル	PDF	画像: JPEG/JPG、PNG、BMP、TIFF、HEIF	Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
読む	✔	✔	✔
レイアウト	✔	✔	✔
一般ドキュメント	✔	✔
プリビルド	✔	✔
カスタム抽出	✔	✔
カスタム分類	✔	✔	✔

写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ファイルサイズ: ドキュメントを分析するためのファイルサイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
パスワードロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
カスタムモデルトレーニング: トレーニングデータの最大ページ数は、カスタムテンプレートモデルの場合は 500 ページ、カスタムニューラルモデルの場合は 50,000 ページです。
カスタム抽出モデルトレーニング: トレーニングデータの合計サイズは、テンプレートモデルの場合は 50 MB、ニューラルモデルの場合は 1 GB です。
カスタム分類モデルトレーニング: トレーニングデータの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニングデータの合計サイズは 2 GB で、最大 10,000 ページです。
Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。

メモ

サンプルラベル付けツールでは、BMP ファイル形式はサポートされていません。この制限は、ドキュメントインテリジェンスサービスではなくツールから派生します。

バージョンの移行

ドキュメントインテリジェンス v3.1 移行ガイドの手順に従って、アプリケーションでドキュメントインテリジェンス v3.0 を使用する方法について説明します。

モデル	説明
ドキュメント分析
レイアウト	ドキュメントからテキストとレイアウト情報を抽出します。
プリビルド
請求書	英語とスペイン語の請求書から重要な情報を抽出します。
領収書	英語のレシートから重要な情報を抽出します。
ID文書	米国の運転免許証と国際パスポートから重要な情報を抽出します。
名刺	英語の名刺から重要な情報を抽出します。
カスタム
カスタム	ビジネスに固有のフォームやドキュメントからデータを抽出します。カスタムモデルは、個別のデータとユースケースに合わせてトレーニングされます。
構成	カスタムモデルのコレクションを作成し、フォーム型から構築された 1 つのモデルに割り当てます。

レイアウト

Layout API は、ドキュメントのテキスト、テーブルとヘッダー、選択マーク、および構造情報を分析して抽出します。

このサンプルドキュメントは、サンプルラベル付けツールを使用して処理されました。

サンプルラベル付けツールを使用したレイアウト分析を示すスクリーンショット。

詳細情報: レイアウトモデル

請求書

請求書モデルは、売上請求書の主要な情報を分析して抽出します。 API はさまざまな形式で請求書を分析し、顧客名、請求先住所、期限、支払額などの重要な情報を抽出します。

このサンプル請求書は、サンプルラベル付けツールを使用して処理されました。

サンプルラベル付けツールを使用したサンプル請求書分析を示すスクリーンショット。

詳細情報: 請求書モデル

領収書

レシートモデルは、印刷されたレシートと手書きのレシートから重要な情報を分析して抽出します。

このサンプルレシートは、サンプルラベル付けツールを使用して処理されました。

詳細情報: レシートモデル

ID ドキュメント

ID ドキュメントモデルは、次のドキュメントの重要な情報を分析して抽出します。

米国の運転免許証 (50 州すべておよびコロンビア特別区)
国際パスポートの略歴ページ(ビザおよびその他の旅行書類を除く)。 API は ID ドキュメントを分析して抽出します。

このサンプル米国の運転免許証は、サンプルラベル付けツールを使用して処理されました。

サンプル ID カードを示すスクリーンショット。

詳細情報: ID ドキュメントモデル

名刺

名刺モデルは、名刺の画像から重要な情報を分析して抽出します。

このサンプル名刺は、サンプルラベル付けツールを使用して処理されました。

サンプル名刺を示すスクリーンショット。

詳細情報: 名刺モデル

カスタム

カスタムモデルは、ビジネスに固有のフォームやドキュメントからデータを分析および抽出します。この API は、個別のコンテンツ内のフォームフィールドを認識し、キーと値のペアとテーブルデータを抽出するようにトレーニングされた機械学習プログラムです。作業を開始するには、同じフォームの種類の例が 5 つだけ必要です。ラベル付きデータセットの有無にかかわらず、カスタムモデルをトレーニングできます。

このサンプルカスタムモデルは、サンプルラベル付けツールを使用して処理されました。

カスタムフォームウィンドウを分析するドキュメントインテリジェンスツールを示すスクリーンショット。

詳細情報: カスタムモデル

構成済みカスタムモデル

作成されたモデルは、カスタムモデルのコレクションを取得し、フォーム型から構築された 1 つのモデルに割り当てることで作成されます。 1 つのモデル ID で呼び出される構成済みモデルに複数のカスタムモデルを割り当てることができます。 1 つの構成済みモデルに最大 100 個のトレーニング済みカスタムモデルを割り当てることができます。

この構成済みのモデルペインは、サンプルラベル付けツールを使用して処理されました。

Document Intelligence Studio Compose カスタムモデルペインを示すスクリーンショット。

詳細情報: カスタムモデル

モデルデータの抽出

モデル	テキスト抽出	選択マーク	テーブル	段落	段落の役割	キーと値のペア	フィールド
レイアウト	✓	✓	✓	✓	✓
請求書	✓	✓	✓	✓		✓	✓
領収書	✓			✓			✓
ID ドキュメント	✓			✓			✓
名刺	✓			✓			✓
ユーザー設定フォーム	✓	✓	✓	✓			✓

入力要件

次のファイル形式がサポートされています。

モデル	PDF	画像: JPEG/JPG、PNG、BMP、TIFF、HEIF	Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
読む	✔	✔	✔
レイアウト	✔	✔	✔
一般ドキュメント	✔	✔
プリビルド	✔	✔
カスタム抽出	✔	✔
カスタム分類	✔	✔	✔

写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ファイルサイズ: ドキュメントを分析するためのファイルサイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
パスワードロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
カスタムモデルトレーニング: トレーニングデータの最大ページ数は、カスタムテンプレートモデルの場合は 500 ページ、カスタムニューラルモデルの場合は 50,000 ページです。
カスタム抽出モデルトレーニング: トレーニングデータの合計サイズは、テンプレートモデルの場合は 50 MB、ニューラルモデルの場合は 1 GB です。
カスタム分類モデルトレーニング: トレーニングデータの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニングデータの合計サイズは 2 GB で、最大 10,000 ページです。
Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。

メモ

サンプルラベル付けツールでは、BMP ファイル形式はサポートされていません。この制限は、ドキュメントインテリジェンスではなくツールから派生します。

バージョンの移行

Document Intelligence Studio を使用して、独自のフォームとドキュメントを処理します。
ドキュメントインテリジェンスのクイックスタートを完了し、任意の開発言語でドキュメント処理アプリを作成します。

ドキュメントインテリジェンスサンプルラベル付けツールを使用して、独自のフォームとドキュメントを処理します。
ドキュメントインテリジェンスのクイックスタートを完了し、任意の開発言語でドキュメント処理アプリを作成します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-08

ドキュメント処理モデル

モデルの概要

遅延

アドオン機能

モデル分析機能

境界ボックスと多角形の座標

言語のサポート

リージョン別の可用性

モデルの詳細

OCR の読み取り

レイアウト分析

健康保険証

米国の税務書類

米国の住宅ローンドキュメント

契約

米国の銀行小切手

米国の銀行明細書

payStub

請求 書

領収 書

ID ドキュメント

結婚証明書

クレジット カード

カスタム モデル

カスタム抽出

カスタム分類子

構成済みモデル

入力要件

バージョンの移行

レイアウト

請求 書

領収 書

ID ドキュメント

名刺

カスタム

構成済みカスタム モデル

モデル データの抽出

入力要件

バージョンの移行

関連コンテンツ

フィードバック

その他のリソース

請求書

領収書

クレジットカード

カスタムモデル

請求書

領収書

構成済みカスタムモデル

モデルデータの抽出