サービス クォータと制限

このコンテンツは適用対象:チェックマークv4.0 (GA) | 以前のバージョン:青色チェックマークv3.1 (GA)赤色チェックマークv3.0 (廃止)

このコンテンツの適用対象:red-checkmarkv2.1 | Latest version:blue-checkmarkv4.0 (GA)

この記事では、Foundry Tools のクォータと制限における Azure ドキュメント インテリジェンスについて、すべての価格ティアに関するクイックリファレンスと詳細な説明を提供します。 また、リクエストの制限を回避するためのベスト プラクティスもいくつか含まれています。

モデルの使用

サポートされているドキュメントの種類 読む レイアウト 事前構築済みモデル カスタム モデル アドオン機能
PDF ✔️ ✔️ ✔️ ✔️ ✔️
画像: JPEG/JPGPNGBMPTIFFHEIF ✔️ ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCXPPTXXLS ✔️ ✔️ ✖️ ✖️ ✖️

✔️ = supported ✖️ = サポートされていません

ドキュメント インテリジェンス v4.0 2024-11-30 (GA) では、次の制限があるページ機能とライン機能がサポートされます。

  • 角度、幅/高さ、および単位はサポートされていません。
  • 検出されたオブジェクトごとに、境界ポリゴンまたは境界領域はサポートされていません。
  • lines オブジェクトはサポートされていません。
サポートされているドキュメントの種類 読む レイアウト 事前構築済みモデル カスタム モデル
PDF ✔️ ✔️ ✔️ ✔️
画像: JPEG/JPGPNGBMPTIFFHEIF ✔️ ✔️ ✔️ ✔️
Microsoft Office: DOCXPPTXXLS ✔️ ✖️ ✖️ ✖️

✔️ = supported ✖️ = サポートされていません

請求

ドキュメント インテリジェンスの課金は、モデルの種類と分析されたページ数に基づいて毎月計算されます。 使用状況メトリックは、Azure ポータルのメトリック ダッシュボードで確認できます。 ダッシュボードには、ドキュメント インテリジェンスプロセスAzureページの数が表示されます。 Azure料金計算ツールを使用して、リソースに費やされた推定コストを確認できます。 詳細な手順については、 使用状況の確認とコストの見積もりを参照してください。 いくつかの詳細を次に示します。

  • 分析のためにドキュメントを送信すると、要求で pages パラメーターを使用してページ範囲を指定しない限り、サービスはすべてのページを分析します。 サービスは、読み取り、OCR、またはレイアウト モデルを使用してMicrosoft ExcelおよびPowerPointドキュメントを分析すると、各ExcelワークシートとPowerPointスライドを 1 ページとしてカウントします。

  • サービスが PDF ファイルと TIFF ファイルを分析すると、PDF ファイル内の各ページまたは TIFF ファイル内の各画像が、最大文字数制限のない 1 ページとしてカウントされます。

  • 読み取りモデルとレイアウト モデルでサポートされているMicrosoft Wordおよび HTML ファイルを分析すると、各ページが 3,000 文字のブロック単位でカウントされます。 たとえば、文書に 7,000 文字が含まれている場合、それぞれ 3,000 文字の 2 つのページと 1,000 文字の 1 ページが合計で 3 ページになります。

  • 読み取りモデルとレイアウト モデルでは、Microsoft Word、Excel、PowerPoint、および HTML ファイル内の埋め込み画像またはリンクされた画像の分析はサポートされていません。 そのため、サービスでは追加されたイメージとしてカウントされません。

  • ドキュメント インテリジェンスでは、カスタム モデルのトレーニングは常に無料です。 料金は、サービスがモデルを使用してドキュメントを分析する場合にのみ発生します。

  • コンテナーの価格は、クラウド サービスの価格と同じです。

  • ドキュメント インテリジェンスには、すべてのドキュメント インテリジェンス機能をテストできる Free レベル (F0) が用意されています。 Free レベルでは、要求の最初の 2 ページのみに対する分析応答が制限されます。

  • ドキュメント インテリジェンスには、大規模なワークロード用のコミットメント ベースの価格モデルがあります。

  • レイアウト モデルは、カスタム トレーニング用のデータセットのラベルを生成するために必要です。 カスタム トレーニングに使用するデータセットに使用できるラベル ファイルがない場合、サービスによってラベル ファイルが生成され、レイアウト モデルの使用に対して課金されます。

クォータ Free (F0)1 Standard (S0)
1 秒あたりのトランザクション数の制限を分析する 1 15 (既定値)
調節可能 いいえ はい 2
1 秒あたりの操作数の制限を取得する 1 50 (既定値)
調節可能 いいえ はい 2
1 秒あたりのモデル管理操作の制限 1 5 (既定値)
調節可能 いいえ はい 2
1 秒あたりの操作数の制限を一覧表示する 1 10 (既定値)
調節可能 いいえ はい 2
ドキュメントの最大サイズ 4 MB 500 MB
調節可能 いいえ いいえ
ページの最大数 (分析) 2 2000
調節可能 いいえ いいえ
ラベル ファイルの最大サイズ 10 MB 10 MB
調節可能 いいえ いいえ
OCR json 応答の最大サイズ 500 MB 500 MB
調節可能 いいえ いいえ
テンプレート モデルの最大数 500 5000
調節可能 いいえ いいえ
ニューラル モデルの最大数 100 500
調節可能 いいえ いいえ

カスタム モデルの使用

クォータ Free (F0) 1 Standard (S0)
モデルの作成の制限 5 500 (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ * ニューラルとジェネレーティブ 1 GB 3 1 GB (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ * テンプレート 50 MB 4 50 MB (既定値)
調節可能 いいえ いいえ
ページの最大数 (トレーニング) * テンプレート 500 500 (既定値)
調節可能 いいえ いいえ
ページの最大数 (トレーニング) * ニューラルネットワークと生成モデル 50,000 50,000 (既定値)
調節可能 いいえ いいえ
カスタム ニューラル モデルトレーニング 1 か月あたり 10 時間 5 制限なし (時間単位で支払う)、毎月 10 時間の無料時間から始める
調節可能 いいえ はい 3
ページの最大数 (トレーニング) * 分類子 25,000 25,000 (既定値)
調節可能 いいえ いいえ
ドキュメント型 (クラス) の最大数 * 分類子 1000 1000 (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ * 分類子 1 GB 2 GB (既定値)
調節可能 いいえ いいえ
クラスあたりの最小サンプル数 * 分類子 5 5 (既定値)
調節可能 いいえ いいえ

カスタム モデルの使用

クォータ Free (F0) 1 Standard (S0)
モデルの作成の制限 5 200 (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ * ニューラル 1 GB 3 1 GB (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ * テンプレート 50 MB 4 50 MB (既定値)
調節可能 いいえ いいえ
ページの最大数 (トレーニング) * テンプレート 500 500 (既定値)
調節可能 いいえ いいえ
ページの最大数 (トレーニング) * ニューラル 50,000 50,000 (既定値)
調節可能 いいえ いいえ
カスタム ニューラル モデルトレーニング 1 か月あたり 10 1 か月あたり 20
調節可能 いいえ はい 3
ページの最大数 (トレーニング) * 分類子 10,000 10,000 (既定値)
調節可能 いいえ いいえ
ドキュメント型 (クラス) の最大数 * 分類子 500 500 (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ * 分類子 1 GB 1 GB (既定値)
調節可能 いいえ いいえ
クラスあたりの最小サンプル数 * 分類子 5 5 (既定値)
調節可能 いいえ いいえ

カスタム モデルの使用

クォータ Free (F0) 1 Standard (S0)
モデルの作成の制限 5 200 (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ * ニューラル 1 GB 3 1 GB (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ * テンプレート 50 MB 4 50 MB (既定値)
調節可能 いいえ いいえ
ページの最大数 (トレーニング) * テンプレート 500 500 (既定値)
調節可能 いいえ いいえ
ページの最大数 (トレーニング) * ニューラル 50,000 50,000 (既定値)
調節可能 いいえ いいえ
カスタム ニューラル モデルトレーニング 1 か月あたり 10 1 か月あたり 20
調節可能 いいえ はい 3
ページの最大数 (トレーニング) * 分類子 10,000 10,000 (既定値)
調節可能 いいえ いいえ
ドキュメント型 (クラス) の最大数 * 分類子 500 500 (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ * 分類子 1 GB 1 GB (既定値)
調節可能 いいえ いいえ
クラスあたりの最小サンプル数 * 分類子 5 5 (既定値)
調節可能 いいえ いいえ

カスタム モデルの制限

クォータ Free (F0) 1 Standard (S0)
モデルの作成の制限 5 200 (既定値)
調節可能 いいえ いいえ
トレーニング データセットのサイズ 50 MB 50 MB (既定値)
調節可能 いいえ いいえ
ページの最大数 (トレーニング) 500 500 (既定値)
調節可能 いいえ いいえ

1無料 (F0) 価格レベルについては、 価格ページで毎月の許容量も参照してください。
2ベスト プラクティス調整手順を参照してください。
3 ニューラル モデルのトレーニング数は、毎月リセットされます。 毎月のトレーニング制限を引き上げるサポート リクエストを開きます。 v4.0 API 以降では、カレンダー月に 20 件を超えるトレーニング要求がトレーニングレベルで課金されます。 詳細については 、価格 を参照してください。

4 この制限は、ラベル付け関連の更新の前にトレーニング データセット フォルダー内で見つかったすべてのドキュメントに適用されます。

5 この制限は、カスタム ニューラル モデル v 4.0 (2024-11-30 GA) にのみ適用されます。 v 4.0以降、より長い期間 (無料で最大 10 時間、その後に料金が発生する) より大きなドキュメントのトレーニングがサポートされます。 詳細については、 カスタム ニューラル モデルのページを参照してください。

詳細な説明、クォータの調整、ベスト プラクティス

既定の制限は、サポート チケットを使用して引き上げを要求することで拡張できます。 クォータの引き上げを要求する前に (該当する場合)、必要であることを確認します。

アプリケーションから応答コード 429 (要求が多すぎます) が返された場合、1 秒あたりの 1 つまたは複数のトランザクション制限 (TPS) のしきい値を超えています。

  • 1 秒あたりのトランザクション数の制限を分析する 分析要求を送信するための TPS (POST)
  • 1 秒あたりの操作数の制限を取得する 分析操作の結果をポーリングするための TPS (GET)
  • 1 秒あたりのモデル管理操作の制限 ビルド/トレーニングやコピーなどのモデル管理に関連する操作。
  • 一覧操作の1秒あたりの制限 モデルの一覧表示に関連する操作。

調整を軽減するための一般的なベスト プラクティス

調整 (応答コード 429) に関連する問題を最小限に抑えるには、次の手法を使用することをお勧めします。

  • アプリケーションに再試行ロジックを実装する
  • ワークロードの急激な変更を避けます。 ワークロードを徐々に増やす
    例。 アプリケーションでドキュメント インテリジェンスを使用しており、現在のワークロードは 10 TPS (1 秒あたりのトランザクション数) です。 次に、負荷を 40 TPS に増やします。 結果は、分析操作を送信するための 15 TPS 制限を超えているため、一部の要求に対する 429 応答コードになります。 処理をバックオフして 15 TPS 以下にするか、より高いボリュームをサポートするために TPS の引き上げを要求できます。

次のセクションでは、クォータを調整する具体的なケースについて説明します。 ドキュメント インテリジェンスへのジャンプ: 同時要求の制限の増加

1 秒あたりのトランザクション数の要求制限の増加

既定では、1 秒あたりのトランザクション数は、ドキュメント インテリジェンス リソースの 1 秒あたり 15 トランザクションに制限されます。 Standard 価格レベルの場合、TPS の増加要求は送信できますが、承認できるかどうかと TPS レベルの調整は、毎日の使用パターンと従っているベスト プラクティスによって異なります。 要求を送信する前に、 このセクション の資料を理解し、これらの ベスト プラクティスを理解していることを確認してください。

同時要求の制限を増やすことは、コストに直接影響 しません 。 ドキュメント インテリジェンス サービスでは、"使用した分だけ支払う" モデルが使用されます。 この制限は、サービスが要求のスロットルを開始する前に、サービスがスケーリングできる高さを定義します。

異なる要求制限カテゴリの既存の値は、Azure ポータルの [リソースの概要] ブレードの [監視] タブで使用できます。

TPS の増加に関するサポート 要求を作成して送信する

サポート リクエストを送信して、リソースの 1 秒あたりのトランザクション数 (TPS) 制限の引き上げを開始します。

  • Azure ポータル
  • TPS 制限を引き上げるドキュメント インテリジェンス リソースを選択します
  • 「サポート + トラブルシューティング」グループの「新しいサポート要求」を選択します。 Azure サブスクリプションと Azure リソースに関する情報が自動的に入力された新しいウィンドウが表示されます
  • 「概要」と入力します ("ドキュメント インテリジェンス TPS 制限の引き上げ" など)
  • [問題の種類] フィールドに [クォータまたは使用状況の検証] を選択します。
  • [次へ: ソリューション] を選択します。
  • 要求の作成に進む
  • [詳細] タブの -Description- フィールドに、次の情報を入力します。
    • ドキュメント インテリジェンス クォータに関する要求であることに注意してください。
    • どの TPS 目標にスケーリングしたいかを指定してください。 TPS の増加は無料ですが、ワークロードに適した TPS のみを要求する必要があります。
    • Azureリソース情報
    • 必要な情報の入力を完了し、[-Review + 作成] タブの [作成] ボタンを選択します
    • ポータルの通知で、Azureのサポート要求番号をメモしてください。 今後の処理については、サポートを探してすぐにお問い合わせください。

ワークロード パターンのベスト プラクティスの例

この例では、リクエストのスロットリングを軽減するために、推奨するアプローチを提示します。 それは 正確なレシピではありませんが、必要に応じて従って調整するために招待するテンプレートにすぎません。

ドキュメント インテリジェンス リソースに既定の制限が設定されたとします。 ワークロードを開始して分析要求を送信します。 完了を確認する際に、応答コード429で頻繁にアクセス制限が発生する場合は、まずGETの解析応答リクエストに指数バックオフを実装してください。 連続するエラー応答に対して再試行の間に徐々に長い待機時間を使用する (たとえば、要求間の遅延の 2-5-13-34 パターン)。 一般に、対応する POST 要求に対して get analyze 応答を 2 秒ごとに複数回呼び出すことはお勧めしません。 analyze応答には、その要求の完了を確認するまでの待機時間を秒単位で示す retry-after ヘッダーも含まれています。

POST 要求の数が制限されている場合は、ドキュメントに対する要求間に遅延を追加することを検討してください。 ワークロードで高度な同時処理が必要な場合は、1 秒あたりのトランザクションに対するサービス制限を引き上げるサポート要求を作成する必要があります。

一般に、運用環境に移行する前に、ワークロードとワークロード パターンをテストすることをお勧めします。

次の手順