Microsoft Foundry (クラシック) ポータルで Content Understanding Standard タスクと Pro タスクを作成する (プレビュー)

重要

プレビューAPIのバージョン 2024-12-01-preview および 2025-05-01-preview は2026年7月15日までに廃止されます。まだプレビューAPIを使っているなら、最新のAPIバージョン 2025-11-01 (GA)をターゲットにコードを更新してください。

APIのバージョン 2024-12-01-preview と 2025-05-01-preview はパブリックプレビュー中です。これらのプレビューはサービスレベル契約なしで提供されており、本番ワークロードには推奨されません。詳細については、Microsoft Azureプレビュー補足利用規約およびMicrosoft製品およびサービスデータ保護付録(「DPA」)をご参照ください。

ドキュメント、画像、オーディオ、ビデオなど、さまざまな種類のファイルがあり、そこからキー情報を自動的に抽出するとします。 Content Understanding を使用すると、データ処理を整理するタスクを作成し、抽出または生成する情報を指定するフィールドスキーマを定義してから、アナライザーを構築できます。アナライザーは、アプリケーションまたはワークフローに統合できる API エンドポイントになります。

このガイドでは、Microsoft Foundry (クラシック) ポータルで Content Understanding Standard モードと Pro モードを使用して、データから構造化された情報を抽出するカスタムアナライザーを構築してテストする方法について説明します。

メモ

Foundry (クラシック) ポータルでは、プレビュー API (2025-05-01-preview) が使用されます。

Standard モードと Pro モードの選択 (プレビュー)

Content Understanding には、シナリオごとに 2 つのモードがあります。

標準モード - フィールド抽出が簡単な単一ファイルの処理に最適です。ファイル間分析や複雑な推論要件なしで、個々のドキュメント、画像、オーディオ、またはビデオファイルから構造化データを抽出する必要がある場合は、標準モードを使用します。
Pro モード - マルチステップ推論とファイル間分析を必要とする高度なシナリオ向けに設計されています。必要な場合は pro モードを使用します。
- 1 つの要求で複数の入力ファイルを処理する
- さまざまなドキュメントに推論を適用して、データの検証、強化、集計を行う
- 参照データ (ナレッジベース) を使用して抽出と検証をガイドする
- 単純なフィールド抽出を超えた複雑なマルチステップ分析を実行する

シナリオにどのモードを選択するかの詳細なガイダンスについては、「Azure Content Understanding の標準モードと Pro モード (プレビュー)を参照してください。

メモ

Pro モードは、このプレビュー API バージョン (2025-05-01-preview) でのみ使用できるプレビュー機能です。 Standard モードの場合は、最小限の変更で GA API (2025-11-01) に移行できます。 GA 移行ガイドを参照してください。

前提条件

開始するには、次のリソースとアクセス許可があることを確認します。

Azure サブスクリプション。 Azureサブスクリプションをお持ちでない場合は、無料アカウントを作成します。
サポートされているリージョンの Foundry プロジェクト。サポートされているリージョンの完全な一覧については、言語とリージョンのサポートを確認してください。最初のプロジェクトを作成する方法については、以下の手順を参照してください。

最初のプロジェクトを作成する

Foundry ポータルで Content Understanding の使用を開始するには、次の手順に従ってプロジェクトを作成します。プロジェクトを使用すると、カスタマイズされた AI アプリを構築しながら、作業を整理し、状態を保存できます。 Content Understanding を使用するすべての作業は、プロジェクトで行われます。

Foundry ポータルのホームページで、右上隅にある [新規作成] を選択します。
Foundry では、 Foundry resource と AI hub resourceの 2 種類のプロジェクトがサポートされています。どちらのプロジェクトの種類も Content Understanding で動作します。最新のエクスペリエンスの場合は、Foundry resourceを使用します。プロジェクトの種類の詳細については、「 Foundry のプロジェクトを作成する」を参照してください。
- Foundry プロジェクトを作成する場合は、Advanced options選択し、サポートされているリージョンを選択します。
- ハブベースのプロジェクトを作成する場合は、続行するハブを選択または作成します。ハブがサポートされているリージョンにあることを確認します。ハブがない場合、またはハブがサポートされているリージョンにない場合は、ドロップダウンの上部にあるオプションを選択して新しいハブを作成し、必要な入力を入力します。

標準モード
Pro モード

Content Understanding Standard モードを利用して単一ファイルタスクを作成する

Foundry でカスタムタスクを作成するには、次の手順に従います。このタスクを使用して、最初のアナライザーをビルドします。

Foundry のホームページに移動します。
プロジェクトを選択します。プロジェクトを表示するには、[ すべてのリソースの表示 ] を選択する必要がある場合があります。
左側のナビゲーションウィンドウから [Content Understanding ] を選択します。
[ + 作成] を選択します。
選択すると、Content Understanding Standard モードを使用する Single-file task が作成されます。シナリオに適したモードの詳細については、「Azure Foundry Tools の Pro モードと標準モード (プレビュー)のコンテンツの理解」を参照してください。
タスクの名前を入力します。必要に応じて、説明を入力し、他の設定を変更します。
[作成] を選択します。

最初のアナライザーを作成する

すべてが構成されたので、最初のアナライザーをビルドできます。

単一ファイルの Content Understanding タスクを作成する場合は、まずデータのサンプルをアップロードし、フィールドスキーマを作成します。スキーマは、アナライザーがデータから分析情報を抽出できるようにするカスタマイズ可能なフレームワークです。この例では、請求書ドキュメントからキーデータを抽出するスキーマを作成しますが、任意の種類のデータを取り込むことができますが、手順は変わりません。サポートされているファイルの種類の完全な一覧については、入力ファイルの制限を参照してください。

請求書ドキュメントまたはその他のシナリオに関連するデータのサンプルファイルをアップロードします。
次に、Content Understanding サービスは、コンテンツタイプに基づいてアナライザーテンプレートを提案します。各モダリティに提供されるすべてのテンプレートの完全な一覧については、Content Understanding で提供されているアナライザーテンプレートを確認してください。この例では、[ ドキュメント分析 ] を選択して、請求書のシナリオに合わせて独自のスキーマを作成します。独自のデータを使用する場合は、ニーズに最適なアナライザーテンプレートを選択するか、独自のアナライザーテンプレートを作成します。使用可能なテンプレートの完全な一覧については、アナライザーテンプレートを参照してください。
[作成] を選択します。
次に、生成するすべての出力を反映するフィールドをスキーマに追加します。
- 明確で単純なフィールド名を指定します。フィールドの例としては、 vendorName、 items、 price などがあります。
- 各フィールドの値の種類 (文字列、日付、数値、リスト、グループ) を示します。詳細については、サポートされているフィールドの種類に関するページを参照してください。
- [省略可能] フィールドの説明を入力して、例外やルールなど、目的の動作を説明します。
- 各フィールドの値を生成するメソッドを指定します。
  
  フィールドスキーマを定義する方法のベストプラクティスについては、 Content Understanding のベストプラクティスを参照してください。スキーマの構築には数分かかる場合があります。
スキーマをテストする準備ができたら、[ 保存] を選択します。いつでも戻って、必要に応じて変更を加えることができます。
完成したスキーマを使用して、Content Understanding によってサンプルデータに対する出力が生成されるようになりました。この手順では、さらにデータを追加してアナライザーの精度をテストしたり、必要に応じてスキーマに変更を加えたりすることができます。
出力の品質に問題がなければ、[ Build analyzer] を選択します。このアクションにより、独自のアプリケーションに統合できるアナライザー ID が作成され、コードからアナライザーを呼び出すことができます。

最初の Content Understanding アナライザーが正常に構築され、データから分析情報の抽出を開始する準備が整いました。クイックスタート: REST API を使用してアナライザーを呼び出す Content Understanding REST API を参照してください。

Content Understanding Pro モードを利用してマルチファイルタスクを作成する

Foundry でカスタムタスクを作成するには、次の手順に従います。このタスクを使用して、最初のアナライザーをビルドします。

Foundry のホームページに移動します。
プロジェクトを選択します。プロジェクトを表示するには、[ すべてのリソースの表示 ] を選択する必要がある場合があります。
左側のナビゲーションウィンドウから [Content Understanding ] を選択します。
[ + 作成] を選択します。
選択すると、Content Understanding Pro モードを使用する Multi-file task が作成されます。シナリオに適したモードの詳細については、 Content Understanding のプロモードと標準モード (プレビュー) を参照してください。
タスクの名前を入力します。必要に応じて、説明を入力し、他の設定を変更します。
[作成] を選択します。

最初のアナライザーを作成する

複数ファイルの Content Understanding タスクを作成するには、まず、データの 1 つ以上のサンプルをアップロードし、フィールドスキーマを構築します。スキーマは、データから好みの分析情報を抽出するようにアナライザーをガイドするカスタマイズ可能なフレームワークです。

この例では、請求書ドキュメントからキーフィールドを抽出するスキーマを作成しますが、ドキュメントベースのデータを取り込むことができますが、手順は変わりません。サポートされているファイルの種類の完全な一覧については、入力ファイルの制限を参照してください。

請求書ドキュメントの 1 つまたは複数のサンプルファイル、またはシナリオに関連するその他のドキュメントデータをアップロードします。
スキーマにフィールドを追加します。
- 明確で単純なフィールド名を指定します。フィールドの例としては、 vendorName、 items、 price などがあります。
- 各フィールドの値の種類 (文字列、日付、数値、リスト、グループ) を示します。詳細については、サポートされているフィールドの種類に関するページを参照してください。
- [省略可能] フィールドの説明を入力して、例外やルールなど、目的の動作を説明します。
- 各フィールドの値を生成するメソッドを指定します。
スキーマをテストする準備ができたら、[ 保存] を選択します。いつでも戻って、必要に応じて変更を加えることができます。
サービスが分析する参照データ用のドキュメントを 1 つ以上アップロードします。参照データを追加すると、モデルは複数ステップの推論を比較し、テストデータに適用して、そのデータに関する結論を推測できます。
データに対して分析を実行します。分析を開始すると、作成したスキーマに基づいてテストファイルに出力が生成され、その出力を参照データと比較して予測が適用されます。