ドキュメントインテリジェンスレシートモデル

このコンテンツは適用対象:v4.0 (GA) | 以前のバージョン:v3.1 (GA)v3.0 (廃止)v2.1 (廃止)

このコンテンツは適用対象です:v3.1 (GA) | 最新バージョン:v4.0 (GA) | 以前のバージョン:v3.0v2.1

このコンテンツは適用対象:v3.0 (廃止) | 最新バージョン:v4.0 (GA)v3.1 | 以前のバージョン:v2.1 (廃止)

このコンテンツの適用対象:v2.1 | Latest version:v4.0 (GA)

ドキュメントインテリジェンスレシートモデルは、強力な光学式文字認識 (OCR) 機能とディープラーニングモデルを組み合わせて、売上レシートから重要な情報を分析および抽出します。レシートは、印刷されたレシートや手書きのレシートなど、さまざまな形式と品質にすることができます。 API は、マーチャント名、販売者の電話番号、取引日、税金、トランザクションの合計などの重要な情報を抽出し、構造化された JSON データを返します。レシートモデル v4.0 (GA) では、一般的なホテル領収書の VAT テーブル抽出と共に、 ReceiptType、 TaxDetails.NetAmount、 TaxDetails.Description、 TaxDetails.Rate 、 CountryRegion などのその他のフィールドがサポートされています。

レシートデータの抽出

レシートのデジタル化には、スキャン、撮影、印刷されたコピーなど、さまざまな種類のレシートをデジタル形式に変換して、合理化されたダウンストリーム処理を行います。たとえば、経費管理、消費者行動分析、税の自動化などです。ドキュメントインテリジェンスと OCR (光学式文字認識) テクノロジを使用すると、これらの多様なレシート形式からデータを抽出して解釈できます。ドキュメントインテリジェンス処理は変換プロセスを簡略化するだけでなく、必要な時間と労力を大幅に削減し、効率的なデータ管理と取得を容易にします。

Document Intelligence Studio で処理されたレシートのサンプル:

ドキュメントインテリジェンスサンプルラベル付けツールで処理されたサンプルレシート:

フォームサンプルラベル付けツールで処理されたサンプルレシートのスクリーンショット。

開発オプション

ドキュメントインテリジェンス v4.0: 2024-11-30 (GA) では、次のツール、アプリケーション、ライブラリがサポートされています。

機能	リソース	モデル ID
レシートモデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	事前構築済みレシート

ドキュメントインテリジェンス v3.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能	リソース	モデル ID
レシートモデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	事前構築済みレシート

ドキュメントインテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能	リソース	モデル ID
レシートモデル	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	事前構築済みレシート

ドキュメントインテリジェンス v2.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能	リソース
レシートモデル	• ドキュメントインテリジェンスラベル付けツール • REST API • クライアントライブラリ SDK • ドキュメントインテリジェンス Docker コンテナー

入力要件

次のファイル形式がサポートされています。

モデル	PDF	画像: JPEG/JPG、PNG、BMP、TIFF、HEIF	Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
読む	✔	✔	✔
レイアウト	✔	✔	✔
一般ドキュメント	✔	✔
プリビルド	✔	✔
カスタム抽出	✔	✔
カスタム分類	✔	✔	✔

写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ファイルサイズ: ドキュメントを分析するためのファイルサイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
パスワードロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
カスタムモデルトレーニング: トレーニングデータの最大ページ数は、カスタムテンプレートモデルの場合は 500 ページ、カスタムニューラルモデルの場合は 50,000 ページです。
カスタム抽出モデルトレーニング: トレーニングデータの合計サイズは、テンプレートモデルの場合は 50 MB、ニューラルモデルの場合は 1 GB です。
カスタム分類モデルトレーニング: トレーニングデータの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニングデータの合計サイズは 2 GB で、最大 10,000 ページです。
Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。

サポートされているファイル形式: JPEG、PNG、PDF、TIFF。
PDF および TIFF でサポートされているページ許容量: ドキュメントインテリジェンスでは、Standard レベルのサブスクライバーの場合は最大 2,000 ページ、Free レベルのサブスクライバーの場合は最初の 2 ページのみを処理できます。
サポートされているファイルサイズ: 50 MB 未満。最小ピクセル 50 x 50 px;最大ピクセル 10,000 x 10,000 ピクセル。

レシートモデルのデータ抽出

ドキュメントインテリジェンスがデータを抽出する方法 (トランザクションの日時、販売者情報、レシートからの合計金額など) を参照してください。次のリソースが必要です。

Azure サブスクリプション- 無料で作成できます。
Azure ポータルの Document Intelligence インスタンス。無料価格レベル (F0) を使用して、サービスを試すことができます。リソースがデプロイされたら、[ リソースに移動 ] を選択してキーとエンドポイントを取得します。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

メモ

Document Intelligence Studio は、v3.1 および v3.0 API 以降のバージョンで使用できます。

ドキュメントインテリジェンススタジオのホームページで、[領収書] を選択します。
サンプルのレシートを分析したり、独自のファイルをアップロードしたりできます。
[ 分析の実行 ] ボタンを選択し、必要に応じて [分析] オプションを構成します。

Document Intelligence Studio をお試しください。

ドキュメントインテリジェンスのサンプルラベル付けツール

ドキュメントインテリジェンスサンプルツールに移動します。
サンプルツールのホームページで、[ 事前構築済みモデルを使用してデータを取得する ] タイルを選択します。
ドロップダウンメニューから分析する フォームの種類 を選択します。
分析するファイルの URL を次のオプションから選択します。
[ ソース ] フィールドで、ドロップダウンメニューから [URL ] を選択し、選択した URL を貼り付けて、[ フェッチ ] ボタンを選択します。
[ ドキュメントインテリジェンスサービスエンドポイント ] フィールドに、ドキュメントインテリジェンスサブスクリプションで取得したエンドポイントを貼り付けます。
キーフィールドに、ドキュメントインテリジェンスリソースから取得したキーを貼り付けます。
[ 分析の実行] を選択します。ドキュメントインテリジェンスサンプルラベル付けツールは、事前構築済みの分析 API を呼び出してドキュメントを分析します。
結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示されたテキスト、検出されたテーブルを確認します。

メモ

サンプルラベル付けツールでは、BMP ファイル形式はサポートされていません。これは、ドキュメントインテリジェンスサービスではなくツールの制限です。

サポートされている言語とロケール

サポートされている言語の完全な一覧については、事前構築済みのモデルの言語サポート ページを参照してください。

フィールド抽出

サポートされているドキュメント抽出フィールドについては、GitHub サンプルリポジトリの receipt モデルスキーマページを参照してください

名前	タイプ	説明	標準化された出力
ReceiptType	文字列	売上受領書の種類	項目別
商人名	文字列	レシートを発行している販売者の名前
加盟店電話番号	電話番号	販売者の一覧に記載されている電話番号	+1 xxx xxx xxxx
店舗住所	文字列	販売者の住所の一覧
取引日	日付	領収書が発行された日付	yyyy-mm-dd
トランザクション時間	時間	領収書が発行された時刻	hh-mm-ss (24 時間)
合計	数値 (USD)	領収書の取引合計	2 桁の 10 進浮動小数点数
小計	数値 (USD)	領収書の小計は、多くの場合、税金が適用される前の金額です。	2 桁の 10 進浮動小数点数
税	数値 (USD)	領収書の合計税 (多くの場合、売上税、または同等)。 2022-06-30 バージョンで "TotalTax" に名前を変更しました。	2 桁の 10 進浮動小数点数
ヒント	数値 (USD)	購入者が含むヒント	2 桁の 10 進浮動小数点数
アイテム	オブジェクトの配列	抽出された品目(名前、数量、単価、および合計価格が抽出された)
名前	文字列	アイテムの説明。 2022-06-30 バージョンで "Description" に名前を変更しました。
量	数値	各項目の数量	2 桁の 10 進浮動小数点数
価格	番号	各項目ユニットの個別価格	2 桁の 10 進浮動小数点数
合計価格	ナンバー	品目の合計価格	2 桁の 10 進浮動小数点数

移行ガイドと REST API v3.1

ドキュメントインテリジェンス v3.1 移行ガイドに従って、アプリケーションとワークフローで v3.1 バージョンを使用する方法を学習します。

次の手順

Document Intelligence Studio で独自のフォームとドキュメントを処理してみてください。
ドキュメントインテリジェンスのクイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

GitHub.

GitHub.

ドキュメントインテリジェンスサンプルラベル付けツールを使用して、独自のフォームとドキュメントを処理してみてください。
ドキュメントインテリジェンスのクイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-08