このコンテンツの適用対象:
v2.1 | Latest version:
v4.0 (GA)
ドキュメント インテリジェンスレシート モデルは、強力な光学式文字認識 (OCR) 機能とディープ ラーニング モデルを組み合わせて、売上レシートから重要な情報を分析および抽出します。 レシートは、印刷されたレシートや手書きのレシートなど、さまざまな形式と品質にすることができます。 API は、マーチャント名、販売者の電話番号、取引日、税金、トランザクションの合計などの重要な情報を抽出し、構造化された JSON データを返します。 レシート モデル v4.0 (GA) では、一般的なホテル領収書の VAT テーブル抽出と共に、 ReceiptType、 TaxDetails.NetAmount、 TaxDetails.Description、 TaxDetails.Rate 、 CountryRegion などのその他のフィールドがサポートされています。
レシート データの抽出
レシートのデジタル化には、スキャン、撮影、印刷されたコピーなど、さまざまな種類のレシートをデジタル形式に変換して、合理化されたダウンストリーム処理を行います。 たとえば、経費管理、消費者行動分析、税の自動化などです。ドキュメント インテリジェンスと OCR (光学式文字認識) テクノロジを使用すると、これらの多様なレシート形式からデータを抽出して解釈できます。 ドキュメント インテリジェンス処理は変換プロセスを簡略化するだけでなく、必要な時間と労力を大幅に削減し、効率的なデータ管理と取得を容易にします。
Document Intelligence Studio で処理されたレシートのサンプル:
ドキュメント インテリジェンスサンプルラベル付けツールで処理されたサンプルレシート:
開発オプション
ドキュメント インテリジェンス v4.0: 2024-11-30 (GA) では、次のツール、アプリケーション、ライブラリがサポートされています。
| 機能 | リソース | モデル ID |
|---|---|---|
| レシート モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
事前構築済みレシート |
ドキュメント インテリジェンス v3.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。
| 機能 | リソース | モデル ID |
|---|---|---|
| レシート モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
事前構築済みレシート |
ドキュメント インテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています。
| 機能 | リソース | モデル ID |
|---|---|---|
| レシート モデル | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
事前構築済みレシート |
ドキュメント インテリジェンス v2.1 では、次のツール、アプリケーション、およびライブラリがサポートされています。
| 機能 | リソース |
|---|---|
| レシート モデル | • ドキュメント インテリジェンス ラベル付けツール • REST API • クライアント ライブラリ SDK • ドキュメント インテリジェンス Docker コンテナー |
入力要件
次のファイル形式がサポートされています。
| モデル | 画像: JPEG/JPG、PNG、BMP、TIFF、HEIF |
Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML |
|
|---|---|---|---|
| 読む | ✔ | ✔ | ✔ |
| レイアウト | ✔ | ✔ | ✔ |
| 一般ドキュメント | ✔ | ✔ | |
| プリビルド | ✔ | ✔ | |
| カスタム抽出 | ✔ | ✔ | |
| カスタム分類 | ✔ | ✔ | ✔ |
- 写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
- PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
- ファイル サイズ: ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
- 画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
- パスワード ロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
- テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。 このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
- カスタム モデル トレーニング: トレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500 ページ、カスタム ニューラル モデルの場合は 50,000 ページです。
- カスタム抽出モデルトレーニング: トレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。
- カスタム分類モデル トレーニング: トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。
- Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。
- サポートされているファイル形式: JPEG、PNG、PDF、TIFF。
- PDF および TIFF でサポートされているページ許容量: ドキュメント インテリジェンスでは、Standard レベルのサブスクライバーの場合は最大 2,000 ページ、Free レベルのサブスクライバーの場合は最初の 2 ページのみを処理できます。
- サポートされているファイル サイズ: 50 MB 未満。最小ピクセル 50 x 50 px;最大ピクセル 10,000 x 10,000 ピクセル。
レシート モデルのデータ抽出
ドキュメント インテリジェンスがデータを抽出する方法 (トランザクションの日時、販売者情報、レシートからの合計金額など) を参照してください。 次のリソースが必要です。
Azure サブスクリプション- 無料で作成できます。
Azure ポータルの Document Intelligence インスタンス。 無料価格レベル (
F0) を使用して、サービスを試すことができます。 リソースがデプロイされたら、[ リソースに移動 ] を選択してキーとエンドポイントを取得します。
メモ
Document Intelligence Studio は、v3.1 および v3.0 API 以降のバージョンで使用できます。
ドキュメント インテリジェンス スタジオのホーム ページで、[領収書] を選択します。
サンプルのレシートを分析したり、独自のファイルをアップロードしたりできます。
[ 分析の実行 ] ボタンを選択し、必要に応じて [分析] オプションを構成します。
ドキュメント インテリジェンスのサンプル ラベル付けツール
ドキュメント インテリジェンス サンプル ツールに移動します。
サンプル ツールのホーム ページで、[ 事前構築済みモデルを使用してデータを取得する ] タイルを選択します。
ドロップダウン メニューから分析する フォームの種類 を選択します。
分析するファイルの URL を次のオプションから選択します。
[ ソース ] フィールドで、ドロップダウン メニューから [URL ] を選択し、選択した URL を貼り付けて、[ フェッチ ] ボタンを選択します。
[ ドキュメント インテリジェンス サービス エンドポイント ] フィールドに、ドキュメント インテリジェンス サブスクリプションで取得したエンドポイントを貼り付けます。
キー フィールドに、ドキュメント インテリジェンス リソースから取得したキーを貼り付けます。
[ 分析の実行] を選択します。 ドキュメント インテリジェンス サンプル ラベル付けツールは、事前構築済みの分析 API を呼び出してドキュメントを分析します。
結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示されたテキスト、検出されたテーブルを確認します。
メモ
サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 これは、ドキュメント インテリジェンス サービスではなくツールの制限です。
サポートされている言語とロケール
サポートされている言語の完全な一覧については、事前構築済みのモデルの言語サポート ページを参照してください。
フィールド抽出
サポートされているドキュメント抽出フィールドについては、GitHub サンプル リポジトリの receipt モデル スキーマ ページを参照してください
| 名前 | タイプ | 説明 | 標準化された出力 |
|---|---|---|---|
| ReceiptType | 文字列 | 売上受領書の種類 | 項目別 |
| 商人名 | 文字列 | レシートを発行している販売者の名前 | |
| 加盟店電話番号 | 電話番号 | 販売者の一覧に記載されている電話番号 | +1 xxx xxx xxxx |
| 店舗住所 | 文字列 | 販売者の住所の一覧 | |
| 取引日 | 日付 | 領収書が発行された日付 | yyyy-mm-dd |
| トランザクション時間 | 時間 | 領収書が発行された時刻 | hh-mm-ss (24 時間) |
| 合計 | 数値 (USD) | 領収書の取引合計 | 2 桁の 10 進浮動小数点数 |
| 小計 | 数値 (USD) | 領収書の小計は、多くの場合、税金が適用される前の金額です。 | 2 桁の 10 進浮動小数点数 |
| 税 | 数値 (USD) | 領収書の合計税 (多くの場合、売上税、または同等)。 2022-06-30 バージョンで "TotalTax" に名前を変更しました。 | 2 桁の 10 進浮動小数点数 |
| ヒント | 数値 (USD) | 購入者が含むヒント | 2 桁の 10 進浮動小数点数 |
| アイテム | オブジェクトの配列 | 抽出された品目(名前、数量、単価、および合計価格が抽出された) | |
| 名前 | 文字列 | アイテムの説明。 2022-06-30 バージョンで "Description" に名前を変更しました。 | |
| 量 | 数値 | 各項目の数量 | 2 桁の 10 進浮動小数点数 |
| 価格 | 番号 | 各項目ユニットの個別価格 | 2 桁の 10 進浮動小数点数 |
| 合計価格 | ナンバー | 品目の合計価格 | 2 桁の 10 進浮動小数点数 |
移行ガイドと REST API v3.1
- ドキュメント インテリジェンス v3.1 移行ガイドに従って、アプリケーションとワークフローで v3.1 バージョンを使用する方法を学習します。
次の手順
Document Intelligence Studio で独自のフォームとドキュメントを処理してみてください。
ドキュメント インテリジェンスのクイック スタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。
GitHub.
GitHub.
ドキュメント インテリジェンス サンプル ラベル付けツールを使用して、独自のフォームとドキュメントを処理してみてください。
ドキュメント インテリジェンスのクイック スタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。