重要
プレビューAPIのバージョン 2024-12-01-preview および 2025-05-01-preview は2026年7月15日までに廃止されます。 まだプレビューAPIを使っているなら、最新のAPIバージョン 2025-11-01 (GA)をターゲットにコードを更新してください。
APIのバージョン 2024-12-01-preview と 2025-05-01-preview はパブリックプレビュー中です。 これらのプレビューはサービスレベル契約なしで提供されており、本番ワークロードには推奨されません。 詳細については、Microsoft Azureプレビュー補足利用規約およびMicrosoft製品およびサービスデータ保護付録(「DPA」)をご参照ください。
ドキュメント、画像、オーディオ、ビデオなど、さまざまな種類のファイルがあり、そこからキー情報を自動的に抽出するとします。 Content Understanding を使用すると、データ処理を整理するタスクを作成し、抽出または生成する情報を指定するフィールド スキーマを定義してから、アナライザーを構築できます。 アナライザーは、アプリケーションまたはワークフローに統合できる API エンドポイントになります。
このガイドでは、Microsoft Foundry (クラシック) ポータルで Content Understanding Standard モードと Pro モードを使用して、データから構造化された情報を抽出するカスタム アナライザーを構築してテストする方法について説明します。
メモ
Foundry (クラシック) ポータルでは、プレビュー API (2025-05-01-preview) が使用されます。
Standard モードと Pro モードの選択 (プレビュー)
Content Understanding には、シナリオごとに 2 つのモードがあります。
標準モード - フィールド抽出が簡単な単一ファイルの処理に最適です。 ファイル間分析や複雑な推論要件なしで、個々のドキュメント、画像、オーディオ、またはビデオ ファイルから構造化データを抽出する必要がある場合は、標準モードを使用します。
Pro モード - マルチステップ推論とファイル間分析を必要とする高度なシナリオ向けに設計されています。 必要な場合は pro モードを使用します。
- 1 つの要求で複数の入力ファイルを処理する
- さまざまなドキュメントに推論を適用して、データの検証、強化、集計を行う
- 参照データ (ナレッジ ベース) を使用して抽出と検証をガイドする
- 単純なフィールド抽出を超えた複雑なマルチステップ分析を実行する
シナリオにどのモードを選択するかの詳細なガイダンスについては、「Azure Content Understanding の標準モードと Pro モード (プレビュー)を参照してください。
メモ
Pro モードは、このプレビュー API バージョン (2025-05-01-preview) でのみ使用できるプレビュー機能です。 Standard モードの場合は、最小限の変更で GA API (2025-11-01) に移行できます。
GA 移行ガイドを参照してください。
前提 条件
開始するには、次のリソースとアクセス許可があることを確認します。
- Azure サブスクリプション。 Azureサブスクリプションをお持ちでない場合は、無料アカウントを作成します。
- サポートされているリージョンの Foundry プロジェクト。 サポートされているリージョンの完全な一覧については、 言語とリージョンのサポートを確認してください。 最初のプロジェクトを作成する方法については、以下の手順を参照してください。
最初のプロジェクトを作成する
Foundry ポータルで Content Understanding の使用を開始するには、次の手順に従ってプロジェクトを作成します。 プロジェクトを使用すると、カスタマイズされた AI アプリを構築しながら、作業を整理し、状態を保存できます。 Content Understanding を使用するすべての作業は、プロジェクトで行われます。
Foundry ポータルのホーム ページで、右上隅にある [新規作成] を選択します。
Foundry では、
Foundry resourceとAI hub resourceの 2 種類のプロジェクトがサポートされています。 どちらのプロジェクトの種類も Content Understanding で動作します。 最新のエクスペリエンスの場合は、Foundry resourceを使用します。 プロジェクトの種類の詳細については、「 Foundry のプロジェクトを作成する」を参照してください。Foundry プロジェクトを作成する場合は、
Advanced options選択し、サポートされているリージョンを選択します。ハブ ベースのプロジェクトを作成する場合は、続行するハブを選択または作成します。 ハブが サポートされているリージョンにあることを確認します。 ハブがない場合、またはハブがサポートされているリージョンにない場合は、ドロップダウンの上部にあるオプションを選択して新しいハブを作成し、必要な入力を入力します。
Content Understanding Standard モードを利用して単一ファイル タスクを作成する
Foundry でカスタム タスクを作成するには、次の手順に従います。 このタスクを使用して、最初のアナライザーをビルドします。
- Foundry のホーム ページに移動します。
- プロジェクトを選択します。 プロジェクトを表示するには、[ すべてのリソースの表示 ] を選択する必要がある場合があります。
- 左側のナビゲーション ウィンドウから [Content Understanding ] を選択します。
- [ + 作成] を選択します。
- 選択すると、Content Understanding Standard モードを使用する
Single-file taskが作成されます。 シナリオに適したモードの詳細については、「Azure Foundry Tools の Pro モードと標準モード (プレビュー)のコンテンツの理解」を参照してください。 - タスクの名前を入力します。 必要に応じて、説明を入力し、他の設定を変更します。
- [作成] を選択します。
最初のアナライザーを作成する
すべてが構成されたので、最初のアナライザーをビルドできます。
単一ファイルの Content Understanding タスクを作成する場合は、まずデータのサンプルをアップロードし、フィールド スキーマを作成します。 スキーマは、アナライザーがデータから分析情報を抽出できるようにするカスタマイズ可能なフレームワークです。 この例では、請求書ドキュメントからキー データを抽出するスキーマを作成しますが、任意の種類のデータを取り込むことができますが、手順は変わりません。 サポートされているファイルの種類の完全な一覧については、 入力ファイルの制限を参照してください。
請求書ドキュメントまたはその他のシナリオに関連するデータの
サンプル ファイルをアップロードします。
次に、Content Understanding サービスは、コンテンツ タイプに基づいてアナライザー テンプレートを提案します。 各モダリティ に提供されるすべてのテンプレート の完全な一覧については、Content Understanding で提供されているアナライザー テンプレートを確認してください。 この例では、[ ドキュメント分析 ] を選択して、請求書のシナリオに合わせて独自のスキーマを作成します。 独自のデータを使用する場合は、ニーズに最適なアナライザー テンプレートを選択するか、独自のアナライザー テンプレートを作成します。 使用可能 なテンプレートの 完全な一覧については、アナライザー テンプレートを参照してください。
[作成] を選択します。
次に、生成するすべての出力を反映するフィールドをスキーマに追加します。
明確で単純なフィールド名を指定します。 フィールドの例としては、 vendorName、 items、 price などがあります。
各フィールドの値の種類 (文字列、日付、数値、リスト、グループ) を示します。 詳細については、サポートされているフィールドの種類に関するページを参照してください。
[省略可能] フィールドの説明を入力して、例外やルールなど、目的の動作を説明します。
各フィールドの値を生成するメソッドを指定します。
フィールド スキーマを定義する方法のベスト プラクティスについては、 Content Understanding のベスト プラクティスを参照してください。 スキーマの構築には数分かかる場合があります。
スキーマをテストする準備ができたら、[ 保存] を選択します。 いつでも戻って、必要に応じて変更を加えることができます。
完成したスキーマを使用して、Content Understanding によってサンプル データに対する出力が生成されるようになりました。 この手順では、さらにデータを追加してアナライザーの精度をテストしたり、必要に応じてスキーマに変更を加えたりすることができます。
出力の品質に問題がなければ、[ Build analyzer] を選択します。 このアクションにより、独自のアプリケーションに統合できるアナライザー ID が作成され、コードからアナライザーを呼び出すことができます。
最初の Content Understanding アナライザーが正常に構築され、データから分析情報の抽出を開始する準備が整いました。 クイック スタート: REST API を使用してアナライザーを呼び出す Content Understanding REST API を参照してください。
プロジェクトの共有
作成したプロジェクトを共有し、アクセスを管理するには、管理センターに移動します。 プロジェクトのナビゲーション ウィンドウの下部にあります。
管理センターでは、ユーザーを管理し、個々のロールを割り当てることができます。
次の手順
- REST API を呼び出す方法については、「クイック スタート: Content Understanding REST API」を参照してください