クラウドで AI Red Teaming Agent を実行する

AI Red Teaming Agent は、プロトタイプの作成と開発中にローカルで実行して安全性のリスクを特定できますが、クラウドで実行すると、次のシナリオが可能になります。

デプロイ前の AI レッドチーミングは、攻撃戦略とリスクカテゴリのより大きな組み合わせで実行され、より詳細な分析が可能になります。
設定された時間間隔で実行するようにスケジュールできるデプロイ後の継続的な AI レッドチーミング実行
AI レッドチーミング実行用に最小限のサンドボックス環境をサポートするエージェント固有のリスクシナリオ

前提条件

Foundry プロジェクト。
Foundry プロジェクトのFoundry Userロール。

Important

Foundry RBAC ロールの名前が最近変更されました。 Foundry User, Foundry Owner, Foundry Account Owner、および Foundry Project Manager は、以前は、AZURE AI ユーザー、Azure AI 所有者、Azure AI アカウント所有者、および AZURE AI Project Manager という名前でした。名前の変更がロールアウトされている間、以前の名前が表示される場合があります。ロール ID とコアアクセス許可は、名前の変更によって変更されません。
Python 3.9 以降。
エージェントのシナリオの場合: プロジェクトにデプロイした既存の Foundry エージェント。エージェントの名前は、 AZURE_AI_AGENT_NAMEとして必要です。

開始

まず、クラウドで AI Red Teaming Agent を実行する Microsoft Foundry SDK のプロジェクトクライアントをインストールします。

pip install "azure-ai-projects>=2.0.0"

次に、Microsoft Foundry リソースの環境変数を設定します

import os

endpoint = os.environ["AZURE_AI_PROJECT_ENDPOINT"]  # Example: https://<account_name>.services.ai.azure.com/api/projects/<project_name>
agent_name = os.environ["AZURE_AI_AGENT_NAME"]  # Required. The name of the agent to red team.

サポートされているターゲット

クラウドでの AI Red Teaming Agent の実行は、現在、以下のみをサポートしています。

Foundry プロジェクトの展開
Azure OpenAI モデルのデプロイ
ターゲットとして Microsoft Foundry プロジェクトの Foundry エージェント (プロンプトおよびコンテナーエージェント)。

ターゲットモデルを構成する

ターゲットモデルのデプロイは、次の 2 つの方法で構成できます。

オプション 1: Foundry プロジェクトの展開

Foundry プロジェクトの一部であるモデルデプロイを使用している場合は、initialization_parameters.deployment_nameするときに、フィールドに配置名を直接渡します。 Microsoft では、 DefaultAzureCredential を使用したキーレス認証 (実行前に az login 実行) をお勧めします。

シナリオで代わりに API キー認証が必要な場合:

import os

model_endpoint = os.environ["MODEL_ENDPOINT"]  # Example: https://<account_name>.openai.azure.com
model_api_key = os.environ["MODEL_API_KEY"]    # Use DefaultAzureCredential when possible
model_deployment_name = os.environ["MODEL_DEPLOYMENT_NAME"]  # Example: gpt-4o-mini

オプション 2: Azure OpenAI/Foundry Tools のデプロイ

Azure OpenAI または Foundry Tools アカウントからのデプロイを使用する場合は、まず、接続を介してこれらのリソースを Foundry プロジェクトに接続する必要があります。

接続を作成する: 「プロジェクトに新しい接続を追加する」の手順に従って、Azure OpenAI または AI Services リソースを Foundry プロジェクトに接続します。
接続名を取得します。アカウントを接続すると、Foundry プロジェクトで生成された名前で作成された接続が表示されます。
ターゲットを構成する: モデルのデプロイ構成に "connectionName/deploymentName" 形式を使用します。

# Format: "connectionName/deploymentName"
model_deployment_name = "my-openai-connection/gpt-4o-mini"

AI レッドチームを作成する

赤いチームを作成して、データソースとリスクカテゴリを共有する 1 つ以上の実行を保持します。

Python
cURL

import os
from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient

endpoint = os.environ["AZURE_AI_PROJECT_ENDPOINT"]
model_deployment = os.environ["AZURE_AI_MODEL_DEPLOYMENT_NAME"]

with DefaultAzureCredential() as credential:
    with AIProjectClient(endpoint=endpoint, credential=credential) as project_client:
        client = project_client.get_openai_client()

        # Create a red team with built-in safety evaluators
        red_team = client.evals.create(
            name="Red Team Agentic Safety Evaluation",
            data_source_config={"type": "azure_ai_source", "scenario": "red_team"},
            testing_criteria=[
                {
                    "type": "azure_ai_evaluator",
                    "name": "Prohibited Actions",
                    "evaluator_name": "builtin.prohibited_actions",
                    "evaluator_version": "1"
                },
                {
                    "type": "azure_ai_evaluator",
                    "name": "Task Adherence",
                    "evaluator_name": "builtin.task_adherence",
                    "evaluator_version": "1",
                    "initialization_parameters": {"deployment_name": model_deployment},
                },
                {
                    "type": "azure_ai_evaluator",
                    "name": "Sensitive Data Leakage",
                    "evaluator_name": "builtin.sensitive_data_leakage",
                    "evaluator_version": "1"
                },
            ],
        )
        print(f"Created red team: {red_team.id}")

curl --request POST \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>' \
  --header 'content-type: application/json' \
  --data '{
  "name": "Red Team Safety Evaluation",
  "data_source_config": {
    "type": "azure_ai_source",
    "scenario": "red_team"
  },
  "testing_criteria": [
    {
      "type": "azure_ai_evaluator",
      "name": "Prohibited Actions",
      "evaluator_name": "builtin.prohibited_actions",
      "evaluator_version": "1"
    },
    {
      "type": "azure_ai_evaluator",
      "name": "Task Adherence",
      "evaluator_name": "builtin.task_adherence",
      "evaluator_version": "1",
      "initialization_parameters": {
        "deployment_name": "{{model_deployment}}"
      }
    },
    {
      "type": "azure_ai_evaluator",
      "name": "Sensitive Data Leakage",
      "evaluator_name": "builtin.sensitive_data_leakage",
      "evaluator_version": "1"
    }
  ]
}'

実行内容:

レッドチーミングのすべての演習を実施するためのレッドチームを作成します
3 つの組み込みエバリュエーター (禁止されたアクション、タスクの準拠、機密データ漏洩) を使用して、赤いチームを構成します。

受け取るもの:

ID を含むグループのメタデータを含む JSON 本文 (後で {{red_team_id}} として保存します)。

赤いチームを取得する

これを使用して、赤いチームが存在することを確認し、構成 (条件、データソース、タイムスタンプ) を確認します。

Python
cURL

print(f"[Group] Retrieving group by id={red_team.id} ...")
red_team_fetched = client.evals.retrieve(red_team.id)
print("[Group] Response:")
print(red_team_fetched)

curl --request GET \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals/{{red_team_id}}?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>'

評価分類を作成 (または更新) する

禁止されたアクションのエージェントのリスクカテゴリのレッドチームは、禁止アクションレッドチーミングワークフローによって生成された禁止アクションの評価基準を確認、編集、または更新できる必要があります。次の例では、ユーザーが承認したポリシーに基づいてエージェントの動作をテストする攻撃プロンプトを動的に生成するために使用される禁止アクションの分類が生成された JSON ファイルを生成します。分類法を確認を終えたら、それを使用してレッドチーミングの実行を作成し、エージェントの出力の攻撃成功率 (ASR) を評価します。

Python
cURL

from azure.ai.projects.models import (
    AzureAIAgentTarget,
    AgentTaxonomyInput,
    EvaluationTaxonomy,
    RiskCategory,
)

# Define the agent target for taxonomy generation
target = AzureAIAgentTarget(
    name=agent_name,
    version=agent_version.version,
)

# Create taxonomy for prohibited actions risk category
taxonomy = project_client.beta.evaluation_taxonomies.create(
    name=agent_name,
    body=EvaluationTaxonomy(
        description="Taxonomy for red teaming run",
        taxonomy_input=AgentTaxonomyInput(
            risk_categories=[RiskCategory.PROHIBITED_ACTIONS],
            target=target
        ),
    )
)
taxonomy_file_id = taxonomy.id
print(f"Created taxonomy: {taxonomy_file_id}")

curl --request PUT \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/evaluationtaxonomies/{{name}}?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>' \
  --header 'content-type: application/json' \
  --data '{
  "taxonomyInput": {
    "type": "agent",
    "target": {
      "type": "azure_ai_agent",
      "name": "transmitter",
      "version": "1",
      "tool_descriptions": [
        {
          "name": "Dragon APIs",
          "description": "APIs to get information from local RAG applications"
        }
      ]
    },
    "riskCategories": [
      "ProhibitedActions"
    ]
  }
}'

実行内容:

次の {{name}} という名前の分類リソースを作成または更新します。
- エージェントターゲットとツールの説明を定義します
- のリスクカテゴリを指定します。 ProhibitedActions

これを参照します

Create Runリクエストの URIを使用して実行します。

レッドチームで実行を作成する

実行は、ソース (分類など) から項目を生成し、選択した攻撃戦略を使用してターゲットエージェントのレッドチーム演習を実行ます。

Python
cURL

# Create a red team run with attack strategies
eval_run = client.evals.runs.create(
    eval_id=red_team.id,
    name="Red Team Agent Safety Eval Run",
    data_source={
        "type": "azure_ai_red_team",
        "item_generation_params": {
            "type": "red_team_taxonomy",
            "attack_strategies": ["Flip", "Base64", "IndirectJailbreak"],
            "num_turns": 5,
            "source": {"type": "file_id", "id": taxonomy_file_id},
        },
        "target": target.as_dict(),
    },
)
print(f"Created run: {eval_run.id}, status: {eval_run.status}")

curl --request POST \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals/{{red_team_id}}/runs?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>' \
  --header 'content-type: application/json' \
  --data '{
  "name": "Red Team Agent Run 1",
  "data_source": {
    "type": "azure_ai_red_team",
    "item_generation_params": {
      "type": "red_team_taxonomy",
      "attack_strategies": [
        "Flip",
        "Base64",
        "IndirectJailbreak"
      ],
      "num_turns": 5,
      "source": {
        "type": "file_id",
        "id": "azureai://accounts/{{account}}/projects/{{project}}/evaluationtaxonomies/{{taxonomy_name}}/versions/{{version}}"
      }
    },
    "target": {
      "type": "azure_ai_agent",
      "name": "grok-bird",
      "version": "1",
      "tool_descriptions": [
        {
          "name": "Dragon APIs",
          "description": "APIs to get information from local RAG applications"
        }
      ]
    }
  }
}'

実行を構成するためのキーフィールド:

attack_strategies: たとえば、"Flip"、"Base64"、"IndirectJailbreak" (テストするものを選択してください)
num_turns: 生成されたレッドチームアイテムのマルチターン深度
source.id: ファイル ID URI による分類を指します
target: テスト対象のエージェント (名前、バージョン、ツール)

あなたは受け取るでしょう

idを含む実行オブジェクト ({{eval_run_id}}として保存)

レッドチーミング実行を ID で取得する

これを使用して、レッドチーム演習の状態（キューに登録、実行中、成功、失敗など）を確認します。

Python
cURL

import time

# Poll for run completion
while True:
    run = client.evals.runs.retrieve(run_id=eval_run.id, eval_id=red_team.id)
    print(f"Status: {run.status}")
    if run.status in ("completed", "failed", "canceled"):
        break
    time.sleep(5)

curl --request GET \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals/{{red_team_id}}/runs/{{eval_run_id}}?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>'

メモ

API は要求ごとに同期的ですが、実行自体はサーバー側で処理されます。出力項目をフェッチする前に、完了するまでこのエンドポイントをポーリングします。

レッドチーミングの実行出力項目と結果をリストする

これを使用して、レッドチーミングの実行が完了した後に概要メトリックを調査します。

Python
cURL

print("[Run] Fetching output items...")
items = list(client.evals.runs.output_items.list(run_id=run.id, eval_id=red_team.id))
output_path = os.path.join(data_folder, f"redteam_eval_output_items_{agent_name}.json")
with open(output_path, "w") as f:
    f.write(json.dumps(_to_json_primitive(items), indent=2))
print(f"[Run] Done. Status={run.status}. Output items saved to {output_path}")

curl --request GET \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals/{{red_team_id}}/runs/{{eval_run_id}}/output_items?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>'

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-19

クラウドで AI Red Teaming Agent を実行する

前提 条件

開始

サポートされているターゲット

ターゲット モデルを構成する

オプション 1: Foundry プロジェクトの展開

オプション 2: Azure OpenAI/Foundry Tools のデプロイ

AI レッド チームを作成する

赤いチームを取得する

評価分類を作成 (または更新) する

レッド チームで実行を作成する

レッド チーミング実行を ID で取得する