Microsoft Foundry アーキテクチャ (クラシック)

現在表示中:Foundry (クラシック) ポータルのバージョン - 新しい Foundry ポータルのバージョンに切り替える

メモ

この記事のリンクは、現在表示している Foundry (クラシック) ドキュメントではなく、新しい Microsoft Foundry ドキュメントのコンテンツを開く場合があります。

Microsoft Foundry は、多層アーキテクチャを通じて AI ワークロードを整理します。これは、ガバナンスのための最上位の Foundry リソース、開発の分離のためのプロジェクト、ストレージ、検索、シークレットの管理のための接続されたAzure サービスです。

この記事では、IT 運用チームとセキュリティ チームに、Foundry リソースと基になるAzure サービス アーキテクチャ、そのコンポーネント、およびその他のAzure リソースの種類との関係について詳しく説明します。 この情報を使用して、Foundry の展開を組織の要件に 合わせてカスタマイズ する方法について説明します。 組織で Foundry をロールアウトする方法の詳細については、「 Foundry ロールアウト」を参照してください。

このアーキテクチャを使用する場合

このシナリオに関連する場合は、Foundry リソース モデルを検討してください。

  • 初回セットアップ: 新しい AI プロジェクトを開始し、モデルアクセス、エージェントホスティング、評価ツールをバンドルする単一のリソースが必要です。
  • マルチチーム アクセス: 複数のチームには、共有モデルのデプロイと一元化されたガバナンスを備えた分離されたプロジェクトが必要です。
  • コンプライアンスに基づく設計: 組織では、リソースレベルとプロジェクト レベルの両方でプライベート ネットワーク、カスタマー マネージド暗号化、またはAzure RBAC スコープが必要です。
  • Azure OpenAI の移行: スタンドアロン Azure OpenAI リソースから移行しており、エージェントと評価機能を追加しながら既存のポリシーと RBAC を維持する必要があります。

単一開発者の探索では、1 つのプロジェクトを含む Foundry リソースが推奨される既定値です。 エージェントのホスティングや評価を行わず、ワークロードに Azure OpenAI のコンプリーションのみが必要な場合は、単体の Azure OpenAI リソースで十分なことがあります。

AZURE AI リソースの種類とプロバイダー

Azure AI 製品ファミリ内では、スタック内のさまざまなレイヤーでユーザーのニーズをサポートするこれらの Azure リソース プロバイダーを使用できます。

リソース プロバイダー 目的 サポートされているサービス
Microsoft.CognitiveServices 事前構築済みモデルの作成とカスタマイズを行う Agentic および GenAI アプリケーション開発をサポートします。 ファウンドリー; Azure OpenAI; Foundry Tools における Azure Speech; Foundry Tools における Azure 言語; Foundry Tools における Azure Vision
Microsoft。検索 データに対するナレッジ取得をサポートします Azure AI 検索

エージェントの構築、モデルのデプロイ、評価ワークフローなど、ほとんどの AI 開発シナリオでは、Foundry リソースが推奨される開始点です。 Foundry リソースは、Azure OpenAI、Speech、Vision、Language などのサービスと一緒に、Microsoft.CognitiveServices プロバイダ名前空間を共有しています。 この共有プロバイダー名前空間は、関連する AI リソース間で管理 API、アクセス制御パターン、ネットワーク、ポリシー動作を調整するのに役立ちます。

次の表を使用して、ワークロードに一致するリソースの種類を特定します。 Microsoft.CognitiveServices プロバイダー内の特定のリソースの種類と機能が表示されます。

リソースの種類 リソース プロバイダーと種類 サブタイプ サポートされている機能
Microsoft Foundry Microsoft.CognitiveServices/accounts AIServices エージェント、評価、Azure OpenAI、音声、ビジョン、言語、コンテンツ理解
Foundry プロジェクト Microsoft.CognitiveServices/accounts/projects AIServices 前述のサブリソース
Foundry Tools での Azure Speech Microsoft.CognitiveServices/accounts Speech 音声
Foundry Tools のAzure言語 Microsoft.CognitiveServices/accounts Language Language
Foundry Tools の Azure Vision Microsoft.CognitiveServices/accounts Vision Vision

同じプロバイダー名前空間に属するリソースの種類は、同じ管理 API を共有し、Azure Policy の構成では、同様の Azure ロールベースのアクセス制御 (Azure RBAC) アクション、ネットワーク構成、およびエイリアスを使用します。 Azure OpenAI から Foundry にアップグレードする場合は、既存のカスタム Azure ポリシーとAzure RBAC アクションが引き続き適用されます。

Foundry リソース階層

次の図は、モデルのデプロイ、セキュリティ設定、接続、および 2 つのプロジェクトを含む Foundry リソースを示しています。 ストレージ、Key Vault、Azure AI 検索などの接続Azure サービスは、独自のガバナンス境界の下で個別のAzure リソースです。

モデルのデプロイ、セキュリティ設定、接続、および 2 つのプロジェクトを含むガバナンス境界を持つ Foundry リソース階層を示すダイアグラム。ストレージ、Key Vault、Azure AI 検索などの接続されたリソースは、個別のガバナンス境界として表示されます。

重要

ストレージ、Key Vault、Azure AI 検索などの接続されたリソースは、独自のガバナンス境界を持つ独立したAzure リソースです。 これらのリソースのネットワーク、アクセス ポリシー、コンプライアンス設定は、Foundry リソースとは別に管理します。

アーキテクチャとアクセス境界を計画するときは、次のモデルを使用します。

  • Foundry リソース: ネットワーク、セキュリティ、モデルのデプロイなどのガバナンス設定を管理する最上位のAzure リソース。
  • Project: チームがユース ケースを構築して評価する Foundry リソース内の開発境界。 プロジェクトを使用すると、構成済みの環境内でチームのプロトタイプを作成し、IT セットアップを繰り返すことなく既存のモデルのデプロイと接続を再利用できます。
  • プロジェクト資産: ファイル、エージェント、評価、およびプロジェクトに関連する成果物。
  • 接続されたリソース: Azure Storage、Key Vault、Azure AI 検索 などの Azure サービスで、Foundry リソースが接続を介して参照するものです。 これらのリソースには個別のガバナンス境界があるため、ネットワーク ポリシーとアクセス ポリシーは個別に管理します。

この分離により、IT チームはリソース レベルで集中管理を適用し、開発チームはプロジェクト レベルの境界内で作業できます。

メモ

ほとんどの新しい API は、プロジェクト スコープで使用できます。 ただし、Azure OpenAI、Speech、Vision、Language サービスを通じてアカウント レベルで最初にサポートされていた一部の機能は、プロジェクト スコープではなく Foundry リソース レベルでのみ使用できます。 たとえば、Translator API は Foundry リソース レベルからのみ使用できます。 ワークロードに必要な API スコープに基づいてデプロイ構造を計画します。

セキュリティ主導の懸念事項の分離

Foundry は、セキュリティで保護されたスケーラブルな AI ワークロードを確保するために、管理操作と開発操作を明確に分離します。

最上位レベルのリソース ガバナンス

最上位の Foundry リソースは、セキュリティの構成、他のAzure サービスとの接続の確立、デプロイの管理などの管理操作を対象とします。 専用のプロジェクト コンテナーは、開発アクティビティを分離し、アクセス制御、ファイル、エージェント、および評価の境界を提供します。

ロールベースのアクセス制御

Azure RBAC アクションは、この懸念事項の分離を反映しています。 デプロイやプロジェクトの作成などのコントロール プレーン アクションは、エージェントの構築、評価の実行、ファイルのアップロードなどのデータ プレーン アクションとは異なります。 RBAC の割り当てのスコープは、最上位レベルのリソースと個々のプロジェクト レベルの両方で行うことができます。 セキュリティで保護された自動化とサービス アクセスをサポートするために、いずれかのスコープで マネージド ID を 割り当てます。 詳細については、Microsoft Foundry の Role ベースのアクセス制御に関するページを参照してください。

最小限の権限導入の一般的な基本の割り当てには、次のようなものがあります。

  • Foundry リソース スコープにおける各開発者ユーザー プリンシパルのための Azure AI ユーザー
  • Foundry リソース スコープで、各プロジェクト マネージド ID に対して Azure AI ユーザーを割り当てます。

ロール定義とスコープ計画のガイダンスについては、Microsoft Foundry の Role ベースのアクセス制御に関するページを参照してください。

監視と可観測性

Azure Monitorメトリックをスコープ別にセグメント化します。 管理メトリックと使用状況メトリックは最上位レベルのリソースで表示できますが、評価パフォーマンスやエージェント アクティビティなどのプロジェクト固有のメトリックは、個々のプロジェクト コンテナーにスコープが設定されます。

主な監視機能は次のとおりです。

  • リソース レベルのメトリック: トークン消費量、モデルの待機時間、要求数、およびすべてのプロジェクトのエラー率。
  • Project レベルのメトリック: 評価の実行結果、エージェント呼び出し数、およびファイル操作アクティビティ。
  • Diagnostic logging: 診断設定を有効にして、分析と保持のためにログをLog Analytics、ストレージ、または Event Hubs にルーティングします。

詳細については、Azure Monitorの概要を参照してください。

コンピューティング インフラストラクチャ

Foundry は、モデルのホスティング、エージェントの実行、バッチ処理のためのコンピューティング インフラストラクチャを管理します。

モデルデプロイの種類

Foundry リソースの標準デプロイでは、モデル ホスティング アーキテクチャが提供されます。

エージェントと評価用のマネージド コンピューティング

エージェント、評価、および Batch ジョブは、Microsoftによってフル マネージドのマネージド コンテナー コンピューティングとして実行されます。 評価はモデル エンドポイントを呼び出し、出力を評価基準と比較します。 Foundry は、ポータルまたは SDK からアクセスできるプロジェクト スコープ内に結果を格納します。

仮想ネットワークの統合

エージェントが外部システムに接続する場合は、コンテナーインジェクションを使用してネットワーク トラフィックを分離できます。この場合、プラットフォームはサブネットを仮想ネットワークに挿入し、同じ仮想ネットワーク内のAzure リソースとのローカル通信を可能にします。

Foundry では、送信分離のために次の 2 つのネットワーク モデルがサポートされています。

モデル しくみ トレードオフ
カスタマー マネージド VNet (BYO) VNet と、Microsoft.App/environments に委任された専用サブネットを指定します。 プラットフォームがサブネットに挿入され、プライベート Azure リソースとのローカル通信が可能になります。 ネットワーク構成を完全に制御する。には、独自のネットワーク管理が必要です。
マネージド VNet (プレビュー) Foundry は、ユーザーに代わって VNet を管理します。 より簡単なセットアップ。では、カスタマイズ オプションが制限されます。 詳細については、 マネージド仮想ネットワークの構成に関するページを参照してください。

メモ

一部のネットワーク分離シナリオでは、ポータルではなく SDK または CLI が必要です。 たとえば、すべてのパブリック アクセスをブロックするプライベート エンドポイントを使用したデプロイは、ポータル UI を使用して構成することはできません。 詳細については、「 Foundry のプライベート リンクを構成する方法」を参照してください。

テナントの分離

Microsoftマネージド コンピューティングは、プロジェクトごとに論理的に分離された環境でワークロードを実行します。 顧客コードは、ランタイム コンテナーを他のテナントと共有しません。

コンテンツの安全性とガードレール

Foundry は、コンテンツの安全性コントロールをモデルとエージェントの推論パイプラインに統合します。 ガードレールは、検出するリスク、スキャンする介入ポイント (ユーザー入力、出力、ツール呼び出し (プレビュー))、およびツールの応答 (プレビュー))、およびリスクが検出されたときの対応アクションを定義します。 コンテンツ フィルターはモデル要求と共にインラインで実行され、デプロイごとに構成できます。 詳細については、「 ガードレールとコントロールの概要」およびコンテンツ フィルタリングの重大度レベル」を参照してください。

スケーリング

エージェントと評価のマネージド コンピューティングは、ワークロードの需要に基づいて自動的にスケーリングされます。 モデル ホスティングは、デプロイ構成に基づいてスケーリングされます。

リージョン別の可用性

コンピューティング機能は、Azureリージョンによって異なります。 モデルの可用性、デプロイの種類のオプション、エージェントや評価などの機能のサポートは、リージョンによって異なる場合があります。 プロビジョニングする前に、ターゲット リージョンで必要な機能がサポートされていることを確認します。 現在の可用性については、 クラウド リージョン間の機能の可用性に関するページを参照してください。

データ ストレージ

Foundry には、幅広い AI ワークロードをサポートする柔軟で安全なデータ ストレージ オプションが用意されています。

ファイルアップロード用のマネージド ストレージ

既定のセットアップでは、Foundry は論理的に分離されたMicrosoftマネージド ストレージ アカウントを使用し、OpenAI モデルやエージェントなどの一部のユース ケースに対してファイルの直接アップロードをサポートします。顧客が指定したストレージ アカウントは必要ありません。

独自のストレージを持ち込む

必要に応じて、独自のAzure Storage アカウントを接続できます。 評価やバッチ処理などの Foundry ツールは、これらのアカウントから入力を読み取り、出力を書き込むことができます。 サポートされているシナリオの詳細については、「 エージェント サービスを使用した独自のリソースの持ち込み」を参照してください。

エージェント状態保存

  • basic エージェントのセットアップでは、エージェント サービスは、Microsoftマネージド マルチテナント ストレージにスレッド、メッセージ、およびファイルを論理的に分離して格納します。
  • 標準エージェントのセットアップでは、ファイル、会話、ベクター ストアなど、すべての顧客データに対して独自のAzure リソースを使用できます。 この構成では、データはストレージ アカウント内のプロジェクトによって分離されます。

カスタマー マネージド キーの暗号化

既定では、Azure サービスは、FIPS 140-2 準拠の 256 ビット AES 暗号化を使用して、Microsoftマネージド キーを使用して保存中および転送中のデータを暗号化します。 コードの変更は必要ありません。

代わりに独自のキーを使用するには、Foundry のカスタマー マネージド キーを有効にする前に、次の前提条件を確認してください。

  • Key Vaultは、Foundry リソースと同じAzure リージョンにデプロイされます。
  • ソフト削除とパージ保護がKey Vaultで有効になっています。
  • マネージド ID には、Azure RBAC を使用する場合に必要なキーアクセス許可 (Key Vault Crypto User ロールなど) があります。

独自のKey Vaultを持ち込む

既定では、Foundry は、すべての API キーベースの接続シークレットをマネージド Azure Key Vaultに格納します。 シークレットを自分で管理する場合は、キー コンテナーを Foundry リソースに接続します。 1 つのAzure Key Vault接続によって、すべてのプロジェクトおよびリソース レベルの接続シークレットが管理されます。 詳細については、「 Foundryを参照してください。

データ暗号化の詳細については、 Foundry での暗号化に関するカスタマー マネージド キーに関するページを参照してください。

データの保存場所とコンプライアンス

Foundry は、すべての保存データを指定されたAzure地域に格納します。 推論データ(プロンプトとコンプリート)は、デプロイの種類によって処理される場所が異なります。グローバルデプロイメントでは、任意のAzureリージョンにルーティングされる可能性があり、データゾーンデプロイメントは米国またはEUゾーン内で処理され、標準デプロイまたはリージョンデプロイメントはデプロイメントリージョン内で処理されます。 詳細については、「 デプロイの種類」を参照してください。 Foundry では、リージョン間の自動フェールオーバーはサポートされていません。 組織で複数リージョンの可用性が必要な場合は、各ターゲット リージョンに個別の Foundry リソースをデプロイし、アプリケーション 層でデータの同期とルーティングを管理します。 コンプライアンス認定の詳細については、Azureコンプライアンスドキュメントを参照してください。

アーキテクチャの決定を検証する

ロールアウトの前に、ターゲット環境に対して次の内容を検証します。

  • デプロイ リージョンで必要なモデルと機能が使用可能であることを確認します。 詳細については、 クラウド リージョン間の機能の可用性に関するページを参照してください。
  • Foundry リソース レベルとプロジェクト レベルの両方でロールの割り当てが正しくスコープ設定されていることを確認します。 詳細については、Microsoft Foundry の Role ベースのアクセス制御に関するページを参照してください。
  • ネットワーク分離要件とプライベート アクセス パスを検証します。 詳細については、「 Foundry のプライベート リンクを構成する方法」を参照してください。
  • カスタマー マネージド キーやAzure Key Vault統合など、暗号化とシークレット管理の要件を確認します。 詳細については、Foundry を使用した暗号化用の Customer マネージド キーと Foundry へのAzure Key Vault接続の設定方法に関するページを参照してください。
  • モデルデプロイの制限やレート制限など、ターゲット リソースのクォータと制限を確認します。 詳細については、「Azure OpenAI のクォータと制限およびAgent サービスの制限、クォータ、リージョンを参照してください。