このコンテンツの適用対象:
v2.1 | Latest version:
v4.0 (GA)
Foundry Tools の Azure ドキュメント インテリジェンスでは、インテリジェントなドキュメント処理をアプリやフローに追加するために使用できるさまざまなモデルがサポートされています。 事前構築済みのドメイン固有のモデルを使用することも、特定のビジネス ニーズやユース ケースに合わせてカスタマイズされたカスタム モデルをトレーニングすることもできます。 ドキュメント インテリジェンスは、REST API または Python、C#、Java、JavaScript クライアント ライブラリで使用できます。
メモ
財務データ、保護された正常性データ、個人データ、または機密性の高いデータを含むドキュメント処理プロジェクトには、注意が必要です。 国/地域および業界固有のすべての要件を必ず遵守してください。
モデルの概要
次の表は、各安定した API の一般公開 (GA) モデルを示しています。
| モデルの種類 | モデル | 2024-11-30 (GA) | 2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| ドキュメント分析モデル | 読む | ✔️ | ✔️ | ✔️ | 利用できません |
| ドキュメント分析モデル | レイアウト | ✔️ | ✔️ | ✔️ | ✔️ |
| ドキュメント分析モデル | 一般的なドキュメント** | でサポートされています レイアウト モデル |
✔️ | ✔️ | 利用できません |
| 事前構築済みモデル | 銀行小切手 | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 銀行取引明細書 | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | payStub | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 契約 | ✔️ | ✔️ | 利用できません | 利用できません |
| 事前構築済みモデル | 健康保険証 | ✔️ | ✔️ | ✔️ | 利用できません |
| 事前構築済みモデル | ID文書 | ✔️ | ✔️ | ✔️ | ✔️ |
| 事前構築済みモデル | 請求 書 | ✔️ | ✔️ | ✔️ | ✔️ |
| 事前構築済みモデル | 領収 書 | ✔️ | ✔️ | ✔️ | ✔️ |
| 事前構築済みモデル | 米国統一税* | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 米国 1040 税* | ✔️ | ✔️ | 利用できません | 利用できません |
| 事前構築済みモデル | 米国 1095 税* | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 米国 1098 税* | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 米国 1099 税* | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 米国 W2 税 | ✔️ | ✔️ | ✔️ | 利用できません |
| 事前構築済みモデル | 米国 W4 税 | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 米国住宅ローン 1003 URLA | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 米国住宅ローン 1004 URAR | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 米国住宅ローン 1005 | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 米国住宅ローン 1008 の概要 | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 米国住宅ローン決算開示 | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 結婚証明書 | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | クレジット カード | ✔️ | 利用できません | 利用できません | 利用できません |
| 事前構築済みモデル | 名刺 | 使用されていない | ✔️ | ✔️ | ✔️ |
| カスタム分類モデル | カスタム分類子 | ✔️ | ✔️ | 利用できません | 利用できません |
| カスタム抽出モデル | カスタム ニューラル | ✔️ | ✔️ | ✔️ | 利用できません |
| カスタム抽出モデル | カスタム テンプレート | ✔️ | ✔️ | ✔️ | ✔️ |
| カスタム抽出モデル | カスタム構成済み | ✔️ | ✔️ | ✔️ | ✔️ |
| すべてのモデル | アドオン機能 | ✔️ | ✔️ | 利用できません | 利用できません |
* サブモデルが含まれています。 サポートされているバリエーションとサブタイプについては、モデル固有の情報を参照してください。
** 一般的なドキュメント モデルのすべての機能は、レイアウト モデルで使用できます。 一般的なモデルはサポートされなくなりました。
遅延
待機時間は、API サーバーが受信要求を処理して処理し、送信応答をクライアントに配信するのにかかる時間です。 ドキュメントを分析する時間は、各ページのサイズ (ページ数など) と関連するコンテンツによって異なります。 ドキュメント インテリジェンスはマルチテナント非同期サービスであり、類似したドキュメントの待機時間は同等ですが、常に同じとは限りません。 待機時間とパフォーマンスの変動は、イメージと大規模なドキュメントを大規模に処理するマイクロサービスベースのステートレス サービスに固有です。 ハードウェアと容量とスケーリングの機能を継続的にスケールアップしていますが、実行時に待機時間の問題が発生する可能性があります。
アドオン機能
ドキュメント インテリジェンスでは、次のアドオン機能を使用できます。 名刺モデルを除くすべてのモデルについて、ドキュメント インテリジェンスでは、より高度な分析を可能にするアドオン機能がサポートされるようになりました。 ドキュメント抽出のシナリオに応じて、これらのオプション機能を有効または無効にすることができます。 2023-07-31 (GA) 以降の API バージョンでは、次のアドオン機能を使用できます。
ocrHighResolutionformulasstyleFontbarcodeslanguageskeyValuePairs-
queryFields(米国の税モデルでは使用できません) -
searchablePDF(読み取りモデルでのみ使用できます)
| アドオン機能 | アドオン/無料 | 2024-11-30 (GA) | 2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| フォントプロパティの抽出 | アドオン | ✔️ | ✔️ | 利用できません | 利用できません |
| 数式の抽出 | アドオン | ✔️ | ✔️ | 利用できません | 利用できません |
| 高解像度抽出 | アドオン | ✔️ | ✔️ | 利用できません | 利用できません |
| バーコード抽出 | Free | ✔️ | ✔️ | 利用できません | 利用できません |
| 言語検出 | Free | ✔️ | ✔️ | 利用できません | 利用できません |
| キーと値のペア | Free | ✔️ | 利用できません | 利用できません | 利用できません |
| クエリ フィールド | アドオン* | ✔️ | 利用できません | 利用できません | 利用できません |
| 検索可能な PDF | アドオン* | ✔️ | 利用できません | 利用できません | 利用できません |
モデル分析機能
| モデル ID | コンテンツ抽出 | クエリ フィールド | 段落 | 段落の役割 | 選択マーク | テーブル | キーと値のペア | 言語 | バーコード | ドキュメント分析 | 数式* | スタイル書体* | 高解像度* | 検索可能な PDF |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read |
✓ | ✓ | O | O | O | O | O | O | ||||||
prebuilt-layout |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | O | ||
prebuilt-contract |
✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | ||||
prebuilt-healthInsuranceCard.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-invoice |
✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
prebuilt-receipt |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-creditCard |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-bankStatement |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1003 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1004 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1005 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w4 |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1040 (各種) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1095A |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1095C |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1098 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098E |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098T |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099 (各種) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099SSA |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - 有効
O - 省略可能
* - Premium 機能には追加コストが発生します
クエリ フィールドの価格は、他のアドオン機能とは異なります。 詳細については、「 価格」を参照してください。
境界ボックスと多角形の座標
境界ボックス (v3.0 以降のバージョンでpolygon ) は、ドキュメント内のテキスト要素を囲む抽象的な四角形です。 境界ボックスは、オブジェクト検出の参照ポイントとして使用されます。
- 境界ボックスは、4 つの数値ペアの配列に表示される x 座標平面と y 座標平面を使用して位置を指定します。 各ペアは、左上、右上、右下、左下の順序でボックスの角を表します。
- 画像座標はピクセル単位で表示されます。 PDF の場合、座標はインチ単位で表示されます。
言語のサポート
ディープ ラーニングに基づくドキュメント インテリジェンスのユニバーサル モデルでは、多くの言語がサポートされています。 モデルでは、言語が混在するテキスト行など、画像やドキュメントから多言語テキストを抽出できます。 言語サポートは、ドキュメント インテリジェンス サービスの機能によって異なります。 完全な一覧については、次の記事を参照してください。
リージョン別の可用性
ドキュメント インテリジェンスは、60 以上Azureグローバル インフラストラクチャ リージョンの多くで一般提供されています。
自分や顧客に最適なリージョンを選択するには、Azure地域を参照してください。
モデルの詳細
このセクションでは、各モデルで期待できる出力について説明します。 アドオン機能を使用して、ほとんどのモデルの出力を拡張できます。
OCR の読み取り
Read API では、光学式文字認識 (OCR) を使用して、行と単語、場所、検出された言語、手書きスタイル (検出された場合) を分析および抽出します。
このサンプル ドキュメントは、 Document Intelligence Studio を使用して処理されました。
レイアウト分析
レイアウト分析モデルは、テキスト、テーブル、選択マーク、およびタイトル、セクション見出し、ページ ヘッダー、ページ フッターなどのその他の構造要素を分析して抽出します。
このサンプル ドキュメントは、 Document Intelligence Studio を使用して処理されました。
健康保険証
医療保険カード モデルは、強力な OCR 機能とディープ ラーニング モデルを組み合わせて、米国の医療保険カードから重要な情報を分析および抽出します。
このサンプルの米国医療保険カードは 、Document Intelligence Studio を使用して処理されました。
米国の税務書類
米国の税ドキュメント モデルでは、税ドキュメントの選択されたグループから主要なフィールドと明細を分析および抽出します。 この API は、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式と品質の英語の米国税ドキュメントの分析をサポートしています。 現在、次のモデルがサポートされています。
| モデル | 説明 | モデル ID |
|---|---|---|
| 米国税 W-2 | 課税対象の報酬の詳細を抽出します。 | prebuilt-tax.us.w2 |
| 米国税 W-4 | 課税対象の報酬の詳細を抽出します。 | prebuilt-tax.us.w4 |
| 米国税 1040 | 住宅ローン金利の詳細を抽出します。 |
prebuilt-tax.us.1040 (バリエーション) |
| 米国税 1095 | 医療保険の詳細を抽出します。 |
prebuilt-tax.us.1095 (バリエーション) |
| 米国税 1098 | 住宅ローン金利の詳細を抽出します。 |
prebuilt-tax.us.1098 (バリエーション) |
| 米国税 1099 | 雇用主以外のソースから受け取った収入を抽出します。 |
prebuilt-tax.us.1099 (バリエーション) |
このサンプル W-2 ドキュメントは、 Document Intelligence Studio を使用して処理されました。
米国の住宅ローンドキュメント
米国の住宅ローンドキュメント モデルでは、住宅ローンドキュメントの選択されたグループから、借り手、ローン、および不動産情報を含む主要なフィールドを分析および抽出します。 この API は、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式と品質の英語の米国住宅ローン ドキュメントの分析をサポートしています。 現在、次のモデルがサポートされています。
| モデル | 説明 | モデル ID |
|---|---|---|
| 1003 消費者使用許諾契約書 | ローン、借り手、プロパティの詳細を抽出します。 | prebuilt-mortgage.us.1003 |
| 1004 均一住宅評価報告書(URAR) | ローン、借り手、プロパティの詳細を抽出します。 | prebuilt-mortgage.us.1004 |
| 1005 雇用の検証 | ローン、借り手、プロパティの詳細を抽出します。 | prebuilt-mortgage.us.1005 |
| 1008 概要ドキュメント | 借り手、売り手、財産、住宅ローン、引受の詳細を抽出します。 | prebuilt-mortgage.us.1008 |
| 決算開示 | 決算、トランザクション コスト、およびローンの詳細を抽出します。 | prebuilt-mortgage.us.closingDisclosure |
このサンプルのクロージング開示ドキュメントは、 Document Intelligence Studio を使用して処理されました。
契約
契約モデルは、当事者、管轄区域、契約 ID、役職など、契約契約の主要なフィールドと品目を分析して抽出します。 このモデルでは現在、英語のコントラクト ドキュメントがサポートされています。
このサンプル コントラクトは 、Document Intelligence Studio を使用して処理されました。
米国の銀行小切手
契約モデルでは、チェックの詳細、勘定の詳細、金額、メモなど、米国の銀行小切手の主要なフィールドが分析および抽出されます。
この銀行小切手のサンプルは 、Document Intelligence Studio を使用して処理されました。
米国の銀行明細書
銀行取引明細書モデルでは、米国の銀行明細書の口座番号、銀行詳細、明細書の詳細、トランザクションの詳細から、主要なフィールドと明細を分析および抽出します。
このサンプル銀行報告書は 、Document Intelligence Studio を使用して処理されました。
payStub
payStub モデルは、給与に関連する情報を含むドキュメントやファイルの主要なフィールドと明細を分析および抽出します。
このサンプルの支払いスタブは 、Document Intelligence Studio を使用して処理されました。
請求 書
請求書モデルは、請求書の処理を自動化して、顧客名、請求先住所、期限、金額、明細、およびその他のキー データを抽出します。
このサンプル請求書は 、Document Intelligence Studio を使用して処理されました。
領収 書
レシート モデルを使用して、販売者の名前、日付、品目、数量、および印刷されたレシートと手書きのレシートの合計の売上レシートをスキャンします。 バージョン v3.0 では、単一ページのホテルレシート処理もサポートされています。
このサンプルレシートは 、Document Intelligence Studio を使用して処理されました。
ID ドキュメント
ID ドキュメント (ID) モデルを使用して、米国の運転免許証 (50 州とコロンビア特別区すべて) と国際パスポート (ビザやその他の旅行書類を除く) の略歴ページを処理して、重要なフィールドを抽出します。
このサンプルの米国の運転免許証は 、Document Intelligence Studio を使用して処理されました。
結婚証明書
結婚証明書モデルを使用して、米国の結婚証明書を処理して、個人、日付、場所などの主要なフィールドを抽出します。
このサンプルの米国結婚証明書は 、Document Intelligence Studio を使用して処理されました。
クレジット カード
クレジット カード モデルを使用してクレジット カードとデビット カードを処理し、キー フィールドを抽出します。
このサンプル クレジット カードは 、Document Intelligence Studio を使用して処理されました。
カスタム モデル
カスタム モデルは、大きく 2 種類に分類されます。 "ドキュメントの種類" の分類をサポートするカスタム分類モデルと、特定のドキュメントの種類から定義されたスキーマを抽出できるカスタム抽出モデル。
カスタム ドキュメント モデルでは、ビジネスに固有のフォームやドキュメントからデータを分析して抽出します。 個別のコンテンツ内のフォーム フィールドを認識し、キーと値のペアとテーブル データを抽出します。 開始するには、フォームの種類の例が 1 つだけ必要です。
バージョン v3.0 以降のカスタム モデルでは、テンプレート モデルとニューラル モデルの両方で、カスタム テンプレート (フォーム) テーブルとクロスページ テーブルでの署名検出がサポートされています。 署名の検出 では、ドキュメントに署名するユーザーの ID ではなく、署名の存在が検索されます。 モデルが署名検出のために 符号なし を返した場合、定義されたフィールドに署名が見つかりませんでした。
このサンプル カスタム テンプレートは、 Document Intelligence Studio を使用して処理されました。
カスタム抽出
カスタム抽出モデルには、カスタム テンプレートとカスタム ニューラルの 2 種類があります。 カスタム抽出モデルを作成するには、抽出する値を使用してドキュメントのデータセットにラベルを付け、ラベル付けされたデータセットでモデルをトレーニングします。 作業を開始するには、同じフォームまたはドキュメントの種類の例が 5 つだけ必要です。
このサンプルのカスタム抽出は、 Document Intelligence Studio を使用して処理されました。
カスタム分類子
カスタム分類モデルを使用すると、抽出モデルを呼び出す前にドキュメントの種類を識別できます。 分類モデルは、2023-07-31 (GA) API 以降で使用できます。 カスタム分類モデルをトレーニングするには、少なくとも 2 つの異なるクラスと、クラスごとに少なくとも 5 つのサンプルが必要です。
構成済みモデル
作成されたモデルは、カスタム モデルのコレクションを取得し、フォーム型から構築された 1 つのモデルに割り当てることで作成されます。 1 つのモデル ID で呼び出される構成済みモデルに複数のカスタム モデルを割り当てることができます。 1 つの構成済みモデルに最大 200 個のトレーニング済みカスタム モデルを割り当てることができます。
このサンプル構成済みモデルは 、Document Intelligence Studio にあります。
入力要件
次のファイル形式がサポートされています。
| モデル | 画像: JPEG/JPG、PNG、BMP、TIFF、HEIF |
Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML |
|
|---|---|---|---|
| 読む | ✔ | ✔ | ✔ |
| レイアウト | ✔ | ✔ | ✔ |
| 一般ドキュメント | ✔ | ✔ | |
| プリビルド | ✔ | ✔ | |
| カスタム抽出 | ✔ | ✔ | |
| カスタム分類 | ✔ | ✔ | ✔ |
- 写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
- PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
- ファイル サイズ: ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
- 画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
- パスワード ロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
- テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。 このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
- カスタム モデル トレーニング: トレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500 ページ、カスタム ニューラル モデルの場合は 50,000 ページです。
- カスタム抽出モデルトレーニング: トレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。
- カスタム分類モデル トレーニング: トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。
- Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。
メモ
サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 この制限は、ドキュメント インテリジェンス サービスではなくツールから派生します。
バージョンの移行
ドキュメント インテリジェンス v3.1 移行ガイドの手順に従って、アプリケーションで ドキュメント インテリジェンス v3.0 を使用する方法について説明します。
| モデル | 説明 |
|---|---|
| ドキュメント分析 | |
| レイアウト | ドキュメントからテキストとレイアウト情報を抽出します。 |
| プリビルド | |
| 請求 書 | 英語とスペイン語の請求書から重要な情報を抽出します。 |
| 領収 書 | 英語のレシートから重要な情報を抽出します。 |
| ID文書 | 米国の運転免許証と国際パスポートから重要な情報を抽出します。 |
| 名刺 | 英語の名刺から重要な情報を抽出します。 |
| カスタム | |
| カスタム | ビジネスに固有のフォームやドキュメントからデータを抽出します。 カスタム モデルは、個別のデータとユース ケースに合わせてトレーニングされます。 |
| 構成 | カスタム モデルのコレクションを作成し、フォーム型から構築された 1 つのモデルに割り当てます。 |
レイアウト
Layout API は、ドキュメントのテキスト、テーブルとヘッダー、選択マーク、および構造情報を分析して抽出します。
このサンプル ドキュメントは、 サンプル ラベル付けツールを使用して処理されました。
請求 書
請求書モデルは、売上請求書の主要な情報を分析して抽出します。 API はさまざまな形式で請求書を分析し、顧客名、請求先住所、期限、支払額などの重要な情報を抽出します。
このサンプル請求書は、 サンプル ラベル付けツールを使用して処理されました。
領収 書
レシート モデルは、印刷されたレシートと手書きのレシートから重要な情報を分析して抽出します。
このサンプルレシートは、 サンプルラベル付けツールを使用して処理されました。
ID ドキュメント
ID ドキュメント モデルは、次のドキュメントの重要な情報を分析して抽出します。
- 米国の運転免許証 (50 州すべておよびコロンビア特別区)
- 国際パスポートの略歴ページ(ビザおよびその他の旅行書類を除く)。 API は ID ドキュメントを分析して抽出します。
このサンプル米国の運転免許証は、 サンプル ラベル付けツールを使用して処理されました。
名刺
名刺モデルは、名刺の画像から重要な情報を分析して抽出します。
このサンプル 名刺は、 サンプル ラベル付けツールを使用して処理されました。
カスタム
カスタム モデルは、ビジネスに固有のフォームやドキュメントからデータを分析および抽出します。 この API は、個別のコンテンツ内のフォーム フィールドを認識し、キーと値のペアとテーブル データを抽出するようにトレーニングされた機械学習プログラムです。 作業を開始するには、同じフォームの種類の例が 5 つだけ必要です。 ラベル付きデータセットの有無にかかわらず、カスタム モデルをトレーニングできます。
このサンプル カスタム モデルは、 サンプル ラベル付けツールを使用して処理されました。
構成済みカスタム モデル
作成されたモデルは、カスタム モデルのコレクションを取得し、フォーム型から構築された 1 つのモデルに割り当てることで作成されます。 1 つのモデル ID で呼び出される構成済みモデルに複数のカスタム モデルを割り当てることができます。 1 つの構成済みモデルに最大 100 個のトレーニング済みカスタム モデルを割り当てることができます。
この構成済みのモデル ペインは、 サンプル ラベル付けツールを使用して処理されました。
モデル データの抽出
| モデル | テキスト抽出 | 言語検出 | 選択マーク | テーブル | 段落 | 段落の役割 | キーと値のペア | フィールド |
|---|---|---|---|---|---|---|---|---|
| レイアウト | ✓ | ✓ | ✓ | ✓ | ✓ | |||
| 請求 書 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
| 領収 書 | ✓ | ✓ | ✓ | |||||
| ID ドキュメント | ✓ | ✓ | ✓ | |||||
| 名刺 | ✓ | ✓ | ✓ | |||||
| ユーザー設定フォーム | ✓ | ✓ | ✓ | ✓ | ✓ |
入力要件
次のファイル形式がサポートされています。
| モデル | 画像: JPEG/JPG、PNG、BMP、TIFF、HEIF |
Office: Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML |
|
|---|---|---|---|
| 読む | ✔ | ✔ | ✔ |
| レイアウト | ✔ | ✔ | ✔ |
| 一般ドキュメント | ✔ | ✔ | |
| プリビルド | ✔ | ✔ | |
| カスタム抽出 | ✔ | ✔ | |
| カスタム分類 | ✔ | ✔ | ✔ |
- 写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
- PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
- ファイル サイズ: ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
- 画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
- パスワード ロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
- テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。 このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
- カスタム モデル トレーニング: トレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500 ページ、カスタム ニューラル モデルの場合は 50,000 ページです。
- カスタム抽出モデルトレーニング: トレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。
- カスタム分類モデル トレーニング: トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。
- Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。
メモ
サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 この制限は、ドキュメント インテリジェンスではなくツールから派生します。
バージョンの移行
ドキュメント インテリジェンス v3.1 移行ガイドの手順に従って、アプリケーションでドキュメント インテリジェンス v3.0 を使用する方法について説明します。
関連コンテンツ
- Document Intelligence Studio を使用して、独自のフォームとドキュメントを処理します。
- ドキュメント インテリジェンスのクイック スタートを完了し、任意の開発言語でドキュメント処理アプリを作成します。
- ドキュメント インテリジェンスサンプルラベル付けツールを使用して、独自のフォームとドキュメントを処理します。
- ドキュメント インテリジェンスのクイック スタートを完了し、任意の開発言語でドキュメント処理アプリを作成します。