ドキュメントインテリジェンス請求書モデル

このコンテンツは適用対象:v4.0 (GA) | 以前のバージョン:v3.1 (GA)v3.0 (廃止)v2.1 (廃止)

::: moniker-end

このコンテンツは適用対象です:v3.1 (GA) | 最新バージョン:v4.0 (GA) | 以前のバージョン:v3.0v2.1

このコンテンツは適用対象:v3.0 (廃止) | 最新バージョン:v4.0 (GA)v3.1 | 以前のバージョン:v2.1 (廃止)

このコンテンツの適用対象:v2.1 | Latest version:v4.0 (GA)

ドキュメントインテリジェンス請求書モデルでは、強力な光学式文字認識 (OCR) 機能を使用して、売上請求書、公共料金、発注書から主要なフィールドと品目を分析および抽出します。請求書には、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式と品質を使用できます。 API は請求書テキストを分析します。顧客名、請求先住所、期限、支払額などの重要な情報を抽出します。構造化された JSON データ表現を返します。このモデルでは現在、27 言語の請求書がサポートされています。

サポートされているドキュメントの種類:

請求書
光熱費
販売注文
発注書

自動請求書処理

自動請求書処理は、請求先アカウントドキュメントからキー accounts payable フィールドを抽出するプロセスです。抽出されたデータには、レビューと支払いのための買掛金 (AP) ワークフローと統合された請求書の明細が含まれます。従来、買掛金勘定プロセスは手動で実行されるため、非常に時間がかかります。請求書からのキーデータの正確な抽出は、通常、請求書自動化プロセスの最も重要な手順の 1 つです。

Document Intelligence Studio で処理された請求書のサンプル:

ドキュメントインテリジェンスサンプルラベル付けツールで処理されたサンプル請求書:

サンプル請求書のスクリーンショット。

開発オプション

ドキュメントインテリジェンス v4.0: 2024-11-30 (GA) では、次のツール、アプリケーション、ライブラリがサポートされています。

機能	リソース	モデル ID
請求書モデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	事前構築済み請求書

ドキュメントインテリジェンス v3.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能	リソース	モデル ID
請求書モデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	事前構築済み請求書

ドキュメントインテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能	リソース	モデル ID
請求書モデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	事前構築済み請求書

ドキュメントインテリジェンス v2.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能	リソース
請求書モデル	• ドキュメントインテリジェンスラベル付けツール • REST API • クライアントライブラリ SDK • ドキュメントインテリジェンス Docker コンテナー

入力要件

次のファイル形式がサポートされています。

モデル	PDF	画像: JPEG/JPG、PNG、BMP、TIFF、HEIF	Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
読む	✔	✔	✔
レイアウト	✔	✔	✔
一般ドキュメント	✔	✔
プリビルド	✔	✔
カスタム抽出	✔	✔
カスタム分類	✔	✔	✔

写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ファイルサイズ: ドキュメントを分析するためのファイルサイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
パスワードロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
カスタムモデルトレーニング: トレーニングデータの最大ページ数は、カスタムテンプレートモデルの場合は 500 ページ、カスタムニューラルモデルの場合は 50,000 ページです。
カスタム抽出モデルトレーニング: トレーニングデータの合計サイズは、テンプレートモデルの場合は 50 MB、ニューラルモデルの場合は 1 GB です。
カスタム分類モデルトレーニング: トレーニングデータの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニングデータの合計サイズは 2 GB で、最大 10,000 ページです。
Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。

サポートされているファイル形式: JPEG、PNG、PDF、TIFF。
サポートされている PDF と TIFF では、最大 2,000 ページが処理されます。 Free レベルのサブスクライバーの場合、最初の 2 ページのみが処理されます。
サポートされるファイルサイズは 50 MB 未満で、50 x 50 ピクセル以上、最大 10,000 x 10,000 ピクセルのサイズである必要があります。

請求書モデルのデータ抽出

顧客情報、仕入先の詳細、明細などのデータを請求書から抽出する方法を確認します。次のリソースが必要です。

Azure サブスクリプション- 無料で作成できます。
Azure ポータルの Document Intelligence インスタンス。無料価格レベル (F0) を使用して、サービスを試すことができます。リソースがデプロイされたら、[ リソースに移動 ] を選択してキーとエンドポイントを取得します。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

ドキュメントインテリジェンススタジオのホームページで、[請求書] を選択します。
サンプル請求書を分析したり、独自のファイルをアップロードしたりできます。
[ 分析の実行 ] ボタンを選択し、必要に応じて [分析] オプション を構成します。

ドキュメントインテリジェンススタジオを試す

ドキュメントインテリジェンスのサンプルラベル付けツール

ドキュメントインテリジェンスサンプルツールに移動します。
サンプルツールのホームページで、[ 事前構築済みモデルを使用してデータを取得する ] タイルを選択します。
ドロップダウンメニューから分析する フォームの種類 を選択します。
分析するファイルの URL を次のオプションから選択します。
[ ソース ] フィールドで、ドロップダウンメニューから [URL ] を選択し、選択した URL を貼り付けて、[ フェッチ ] ボタンを選択します。
[ ドキュメントインテリジェンスサービスエンドポイント ] フィールドに、ドキュメントインテリジェンスサブスクリプションで取得したエンドポイントを貼り付けます。
キーフィールドに、ドキュメントインテリジェンスリソースから取得したキーを貼り付けます。
[ 分析の実行] を選択します。ドキュメントインテリジェンスサンプルラベル付けツールは、事前構築済みの分析 API を呼び出してドキュメントを分析します。
結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示されたテキスト、検出されたテーブルを確認します。

メモ

サンプルラベル付けツールでは、BMP ファイル形式はサポートされていません。これは、ドキュメントインテリジェンスサービスではなくツールの制限です。

サポートされている言語とロケール

サポートされている言語の完全な一覧については、事前構築済みのモデル言語のサポート ページを参照してください。

フィールド抽出

サポートされているドキュメント抽出フィールドについては、see GitHub サンプルリポジトリの invoice モデルスキーマ ページを参照してください。
抽出された請求書キーと値のペアと品目は、JSON 出力の documentResults セクションにあります。

キーと値のペア

事前構築済みの請求書モデルでは、キーと値のペアの省略可能な戻り値がサポートされます。既定では、キーと値のペアの返却は無効になっています。キーと値のペアは、ラベルまたはキーとそれに関連付けられている応答または値を識別する請求書内の特定のスパンです。請求書では、これらのペアは、そのフィールドまたは電話番号に対してユーザーが入力したラベルと値になります。 AI モデルは、さまざまなドキュメントの種類、形式、構造に基づいて識別可能なキーと値を抽出するようにトレーニングされています。

また、キーが存在することをモデルが検出した場合や、関連付けられた値がない場合、または省略可能なフィールドを処理するときに、キーを分離して存在することもできます。たとえば、一部のインスタンスでは、フォームのミドルネームフィールドを空白のままにすることができます。キーと値のペアは、常にドキュメントに含まれるテキストのスパンです。顧客/ユーザーなど、同じ値が異なる方法で記述されているドキュメントの場合、関連付けられているキーは顧客またはユーザー (コンテキストに基づく) です。

JSON 出力

JSON 出力には、次の 3 つの部分があります。

"readResults" ノードには、認識されたすべてのテキストと選択マークが含まれています。テキストは、ページ、行、個々の単語で整理されます。
"pageResults" ノードには、境界ボックス、信頼度と一緒に抽出されたテーブルやセル、そして readResults 内の行と単語への参照が含まれます。
"documentResults" ノードには、モデルが検出した請求書固有の値と品目が含まれます。請求書 ID、出荷先、請求先、顧客、合計、明細など、請求書のすべてのフィールドを検索する場所です。

移行ガイド

ドキュメントインテリジェンス v3.1 移行ガイドに従って、アプリケーションとワークフローで v3.0 バージョンを使用する方法について説明します。

::: moniker-end

次の手順

Document Intelligence Studio で独自のフォームとドキュメントを処理してみてください。
ドキュメントインテリジェンスのクイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

GitHub.

GitHub.

ドキュメントインテリジェンスサンプルラベル付けツールを使用して、独自のフォームとドキュメントを処理してみてください。
ドキュメントインテリジェンスのクイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-08