ドキュメント インテリジェンス レシートモデル

このコンテンツは適用対象:チェックマークv4.0 (GA) | 以前のバージョン:青チェックマークv3.1 (GA)赤チェックマークv3.0 (廃止)赤チェックマークv2.1 (廃止)

このコンテンツは適用対象です:チェックマークv3.1 (GA) | 最新バージョン:purple-checkmarkv4.0 (GA) | 以前のバージョン:blue-checkmarkv3.0blue-checkmarkv2.1

このコンテンツは適用対象:red-checkmarkv3.0 (廃止) | 最新バージョン:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | 以前のバージョン:blue-checkmarkv2.1 (廃止)

このコンテンツの適用対象:red-checkmarkv2.1 | Latest version:blue-checkmarkv4.0 (GA)

ドキュメント インテリジェンスレシート モデルは、強力な光学式文字認識 (OCR) 機能とディープ ラーニング モデルを組み合わせて、売上レシートから重要な情報を分析および抽出します。 レシートは、印刷されたレシートや手書きのレシートなど、さまざまな形式と品質にすることができます。 API は、マーチャント名、販売者の電話番号、取引日、税金、トランザクションの合計などの重要な情報を抽出し、構造化された JSON データを返します。 レシート モデル v4.0 (GA) では、一般的なホテル領収書の VAT テーブル抽出と共に、 ReceiptTypeTaxDetails.NetAmountTaxDetails.DescriptionTaxDetails.RateCountryRegion などのその他のフィールドがサポートされています。

レシート データの抽出

レシートのデジタル化には、スキャン、撮影、印刷されたコピーなど、さまざまな種類のレシートをデジタル形式に変換して、合理化されたダウンストリーム処理を行います。 たとえば、経費管理、消費者行動分析、税の自動化などです。ドキュメント インテリジェンスと OCR (光学式文字認識) テクノロジを使用すると、これらの多様なレシート形式からデータを抽出して解釈できます。 ドキュメント インテリジェンス処理は変換プロセスを簡略化するだけでなく、必要な時間と労力を大幅に削減し、効率的なデータ管理と取得を容易にします。

Document Intelligence Studio で処理されたレシートのサンプル:

Document Intelligence Studio で処理されたサンプルレシートのスクリーンショット。

ドキュメント インテリジェンスサンプルラベル付けツールで処理されたサンプルレシート:

フォーム サンプル ラベル付けツールで処理されたサンプルレシートのスクリーンショット。

開発オプション

ドキュメント インテリジェンス v4.0: 2024-11-30 (GA) では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース モデル ID
レシート モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
事前構築済みレシート

ドキュメント インテリジェンス v3.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能 リソース モデル ID
レシート モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
事前構築済みレシート

ドキュメント インテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能 リソース モデル ID
レシート モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
事前構築済みレシート

ドキュメント インテリジェンス v2.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。

機能 リソース
レシート モデル ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー

入力要件

次のファイル形式がサポートされています。

モデル PDF 画像:
JPEG/JPG、PNG、BMP、TIFF、HEIF
Office:
Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
読む
レイアウト
一般ドキュメント
プリビルド
カスタム抽出
カスタム分類
  • 写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
  • PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
  • ファイル サイズ: ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
  • 画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
  • パスワード ロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
  • テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。 このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
  • カスタム モデル トレーニング: トレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500 ページ、カスタム ニューラル モデルの場合は 50,000 ページです。
  • カスタム抽出モデルトレーニング: トレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。
  • カスタム分類モデル トレーニング: トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。
  • Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。
  • サポートされているファイル形式: JPEG、PNG、PDF、TIFF。
  • PDF および TIFF でサポートされているページ許容量: ドキュメント インテリジェンスでは、Standard レベルのサブスクライバーの場合は最大 2,000 ページ、Free レベルのサブスクライバーの場合は最初の 2 ページのみを処理できます。
  • サポートされているファイル サイズ: 50 MB 未満。最小ピクセル 50 x 50 px;最大ピクセル 10,000 x 10,000 ピクセル。

レシート モデルのデータ抽出

ドキュメント インテリジェンスがデータを抽出する方法 (トランザクションの日時、販売者情報、レシートからの合計金額など) を参照してください。 次のリソースが必要です。

  • Azure サブスクリプション- 無料で作成できます

  • Azure ポータルの Document Intelligence インスタンス。 無料価格レベル (F0) を使用して、サービスを試すことができます。 リソースがデプロイされたら、[ リソースに移動 ] を選択してキーとエンドポイントを取得します。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

メモ

Document Intelligence Studio は、v3.1 および v3.0 API 以降のバージョンで使用できます。

  1. ドキュメント インテリジェンス スタジオのホーム ページで、[領収書] を選択します

  2. サンプルのレシートを分析したり、独自のファイルをアップロードしたりできます。

  3. [ 分析の実行 ] ボタンを選択し、必要に応じて [分析] オプションを構成します。

    ドキュメント インテリジェンス スタジオの [分析の実行] ボタンと [分析] オプション ボタンのスクリーンショット。

ドキュメント インテリジェンスのサンプル ラベル付けツール

  1. ドキュメント インテリジェンス サンプル ツールに移動します。

  2. サンプル ツールのホーム ページで、[ 事前構築済みモデルを使用してデータを取得する ] タイルを選択します。

    レイアウト モデルの分析結果プロセスのスクリーンショット。

  3. ドロップダウン メニューから分析する フォームの種類 を選択します。

  4. 分析するファイルの URL を次のオプションから選択します。

  5. [ ソース ] フィールドで、ドロップダウン メニューから [URL ] を選択し、選択した URL を貼り付けて、[ フェッチ ] ボタンを選択します。

    ソースの場所のドロップダウン メニューのスクリーンショット。

  6. [ ドキュメント インテリジェンス サービス エンドポイント ] フィールドに、ドキュメント インテリジェンス サブスクリプションで取得したエンドポイントを貼り付けます。

  7. キー フィールドに、ドキュメント インテリジェンス リソースから取得したキーを貼り付けます。

    [フォームの種類の選択] ドロップダウン メニューのスクリーンショット。

  8. [ 分析の実行] を選択します。 ドキュメント インテリジェンス サンプル ラベル付けツールは、事前構築済みの分析 API を呼び出してドキュメントを分析します。

  9. 結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示されたテキスト、検出されたテーブルを確認します。

    レイアウト モデルの分析結果操作のスクリーンショット。

メモ

サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 これは、ドキュメント インテリジェンス サービスではなくツールの制限です。

サポートされている言語とロケール

サポートされている言語の完全な一覧については、事前構築済みのモデルの言語サポート ページを参照してください

フィールド抽出

サポートされているドキュメント抽出フィールドについては、GitHub サンプル リポジトリの receipt モデル スキーマ ページを参照してください

名前 タイプ 説明 標準化された出力
ReceiptType 文字列 売上受領書の種類 項目別
商人名 文字列 レシートを発行している販売者の名前
加盟店電話番号 電話番号 販売者の一覧に記載されている電話番号 +1 xxx xxx xxxx
店舗住所 文字列 販売者の住所の一覧
取引日 日付 領収書が発行された日付 yyyy-mm-dd
トランザクション時間 時間 領収書が発行された時刻 hh-mm-ss (24 時間)
合計 数値 (USD) 領収書の取引合計 2 桁の 10 進浮動小数点数
小計 数値 (USD) 領収書の小計は、多くの場合、税金が適用される前の金額です。 2 桁の 10 進浮動小数点数
数値 (USD) 領収書の合計税 (多くの場合、売上税、または同等)。 2022-06-30 バージョンで "TotalTax" に名前を変更しました 2 桁の 10 進浮動小数点数
ヒント 数値 (USD) 購入者が含むヒント 2 桁の 10 進浮動小数点数
アイテム オブジェクトの配列 抽出された品目(名前、数量、単価、および合計価格が抽出された)
名前 文字列 アイテムの説明。 2022-06-30 バージョンで "Description" に名前を変更しました
数値 各項目の数量 2 桁の 10 進浮動小数点数
価格 番号 各項目ユニットの個別価格 2 桁の 10 進浮動小数点数
合計価格 ナンバー 品目の合計価格 2 桁の 10 進浮動小数点数

移行ガイドと REST API v3.1

次の手順

  • GitHub.
  • GitHub.