Ausführen von AI Red Teaming Agent in der Cloud

Obwohl der AI Red Teaming Agent während der Prototyperstellung und -entwicklung lokal ausgeführt werden kann, um Sicherheitsrisiken zu identifizieren, ermöglicht die Ausführung in der Cloud die folgenden Szenarien:

Ausführungen von KI Red Teaming vor der Bereitstellung auf größeren Kombinationen von Angriffsstrategien und Risikokategorien zur umfassenderen Analyse
Kontinuierliche Ausführungen von KI Red Teaming-Tests nach der Bereitstellung, die in festgelegten Zeitintervallen ausgeführt werden können
Agent-spezifische Risikoszenarien zur Unterstützung einer minimalen Sandboxumgebung für die KI Red Teaming-Ausführung

Voraussetzungen

Ein Foundry-Projekt.
Rolle "Foundry User " im Foundry-Projekt.

Important

Die Foundry-RBAC-Rollen wurden kürzlich umbenannt. Foundry User, Foundry Owner, Foundry Account Owner und Foundry Project Manager wurden zuvor Azure KI-Benutzer, Azure KI-Besitzer, Azure KI-Kontobesitzer und Azure AI Project Manager benannt. Möglicherweise werden die vorherigen Namen an einigen Stellen weiterhin angezeigt, während der Umbenennungsrollout ausgeführt wird. Die Rollen-IDs und Kernberechtigungen bleiben durch die Umbenennung unverändert.
Python 3.9 oder höher.
Für agentenbasierte Szenarien: ein bestehender Foundry-Agent, der in Ihrem Projekt bereits bereitgestellt ist. Der Name des Agenten ist als AZURE_AI_AGENT_NAME erforderlich.

Erste Schritte

Installieren Sie zuerst den Projektclient des Microsoft Foundry SDK, der den AI Red Teaming Agent in der Cloud ausführt.

pip install "azure-ai-projects>=2.0.0"

Legen Sie dann Die Umgebungsvariablen für Ihre Microsoft Foundry-Ressourcen fest.

import os

endpoint = os.environ["AZURE_AI_PROJECT_ENDPOINT"]  # Example: https://<account_name>.services.ai.azure.com/api/projects/<project_name>
agent_name = os.environ["AZURE_AI_AGENT_NAME"]  # Required. The name of the agent to red team.

Unterstützte Ziele

Das Ausführen des AI Red Teaming Agent in der Cloud unterstützt derzeit nur Folgendes:

Bereitstellungen von Foundry-Projekten
Azure OpenAI-Modellbereitstellungen
Foundry Agents (Prompt- und Container-Agents) in Ihrem Microsoft Foundry-Projekt als Ziel.

Konfigurieren Des Zielmodells

Sie können ihre Zielmodellbereitstellung auf zwei Arten konfigurieren:

Option 1: Bereitstellungen von Foundry-Projekten

Wenn Sie Modellbereitstellungen verwenden, die Teil Ihres Foundry-Projekts sind, übergeben Sie den Bereitstellungsnamen direkt im initialization_parameters.deployment_name Feld, wenn Sie ein rotes Team erstellen. Microsoft empfiehlt die schlüssellose Authentifizierung über DefaultAzureCredential – vor der Ausführung ausführen az login .

Wenn Für Ihr Szenario stattdessen die API-Schlüsselauthentifizierung erforderlich ist:

import os

model_endpoint = os.environ["MODEL_ENDPOINT"]  # Example: https://<account_name>.openai.azure.com
model_api_key = os.environ["MODEL_API_KEY"]    # Use DefaultAzureCredential when possible
model_deployment_name = os.environ["MODEL_DEPLOYMENT_NAME"]  # Example: gpt-4o-mini

Option 2: Bereitstellungen von Azure OpenAI und Foundry Tools

Wenn Sie Bereitstellungen aus Ihren Azure OpenAI- oder Foundry Tools-Konten verwenden möchten, müssen Sie diese Ressourcen zunächst über Verbindungen mit Ihrem Foundry-Projekt verbinden.

Erstellen Sie eine Verbindung: Befolgen Sie die Anweisungen unter Hinzufügen einer neuen Verbindung zu Ihrem Projekt , um Ihre Azure OpenAI- oder AI Services-Ressource mit Ihrem Foundry-Projekt zu verbinden.
Erhalten Sie den Namen der Verbindung: Nachdem Sie das Konto verbunden haben, sehen Sie die erstellte Verbindung mit einem generierten Namen in Ihrem Foundry-Projekt.
Konfigurieren Sie das Ziel: Verwenden Sie das Format "connectionName/deploymentName" für die Modellbereitstellungskonfiguration:

# Format: "connectionName/deploymentName"
model_deployment_name = "my-openai-connection/gpt-4o-mini"

Erstellen eines roten KI-Teams

Erstellen Sie ein Red Team, um einen oder mehrere Läufe durchzuführen, die eine gemeinsame Datenquelle und Risikokategorien nutzen.

Python
cURL

import os
from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient

endpoint = os.environ["AZURE_AI_PROJECT_ENDPOINT"]
model_deployment = os.environ["AZURE_AI_MODEL_DEPLOYMENT_NAME"]

with DefaultAzureCredential() as credential:
    with AIProjectClient(endpoint=endpoint, credential=credential) as project_client:
        client = project_client.get_openai_client()

        # Create a red team with built-in safety evaluators
        red_team = client.evals.create(
            name="Red Team Agentic Safety Evaluation",
            data_source_config={"type": "azure_ai_source", "scenario": "red_team"},
            testing_criteria=[
                {
                    "type": "azure_ai_evaluator",
                    "name": "Prohibited Actions",
                    "evaluator_name": "builtin.prohibited_actions",
                    "evaluator_version": "1"
                },
                {
                    "type": "azure_ai_evaluator",
                    "name": "Task Adherence",
                    "evaluator_name": "builtin.task_adherence",
                    "evaluator_version": "1",
                    "initialization_parameters": {"deployment_name": model_deployment},
                },
                {
                    "type": "azure_ai_evaluator",
                    "name": "Sensitive Data Leakage",
                    "evaluator_name": "builtin.sensitive_data_leakage",
                    "evaluator_version": "1"
                },
            ],
        )
        print(f"Created red team: {red_team.id}")

curl --request POST \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>' \
  --header 'content-type: application/json' \
  --data '{
  "name": "Red Team Safety Evaluation",
  "data_source_config": {
    "type": "azure_ai_source",
    "scenario": "red_team"
  },
  "testing_criteria": [
    {
      "type": "azure_ai_evaluator",
      "name": "Prohibited Actions",
      "evaluator_name": "builtin.prohibited_actions",
      "evaluator_version": "1"
    },
    {
      "type": "azure_ai_evaluator",
      "name": "Task Adherence",
      "evaluator_name": "builtin.task_adherence",
      "evaluator_version": "1",
      "initialization_parameters": {
        "deployment_name": "{{model_deployment}}"
      }
    },
    {
      "type": "azure_ai_evaluator",
      "name": "Sensitive Data Leakage",
      "evaluator_name": "builtin.sensitive_data_leakage",
      "evaluator_version": "1"
    }
  ]
}'

Funktionsweise:

Erstellt ein Red Team für alle Red Teaming-Ausführungen
Konfiguriert das rote Team mit drei integrierten Auswertungen (Verbotene Aktionen, Aufgabenbefolgung, vertrauliche Datenlecks).

Sie erhalten Folgendes:

Ein JSON-Textkörper mit den Metadaten der Gruppe, einschließlich der ID (speichern Sie diese als {{red_team_id}} für später).

Ein rotes Team zusammenstellen

Verwenden Sie diese Einstellung, um zu überprüfen, ob das rote Team vorhanden ist, und die Konfiguration überprüfen (Kriterien, Datenquelle, Zeitstempel).

Python
cURL

print(f"[Group] Retrieving group by id={red_team.id} ...")
red_team_fetched = client.evals.retrieve(red_team.id)
print("[Group] Response:")
print(red_team_fetched)

curl --request GET \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals/{{red_team_id}}?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>'

Erstellen (oder Aktualisieren) einer Auswertungstaxonomie

Um für die Agent-Risikokategorie der verbotenen Aktionen ein Red Team einzusetzen, müssen Sie in der Lage sein, die Bewertungstaxonomie der verbotenen Aktionen, die durch den Red Teaming-Workflow für verbotene Aktionen generiert wurde, zu bestätigen, zu bearbeiten oder zu aktualisieren. Im nächsten Beispiel wird eine JSON-Datei mit einer generierten Taxonomie von verbotenen Aktionen generiert, die zur dynamischen Generierung der Angriffsaufforderungen verwendet werden, um das agentische Verhalten basierend auf der vom Benutzer genehmigten Richtlinie zu testen. Nachdem Sie die Taxonomie überprüft und bestätigt haben, wird sie verwendet, um eine Red Teaming-Ausführung zu erstellen und die Angriffserfolgsrate (ASR) der Agent-Ausgaben zu bewerten.

Python
cURL

from azure.ai.projects.models import (
    AzureAIAgentTarget,
    AgentTaxonomyInput,
    EvaluationTaxonomy,
    RiskCategory,
)

# Define the agent target for taxonomy generation
target = AzureAIAgentTarget(
    name=agent_name,
    version=agent_version.version,
)

# Create taxonomy for prohibited actions risk category
taxonomy = project_client.beta.evaluation_taxonomies.create(
    name=agent_name,
    body=EvaluationTaxonomy(
        description="Taxonomy for red teaming run",
        taxonomy_input=AgentTaxonomyInput(
            risk_categories=[RiskCategory.PROHIBITED_ACTIONS],
            target=target
        ),
    )
)
taxonomy_file_id = taxonomy.id
print(f"Created taxonomy: {taxonomy_file_id}")

curl --request PUT \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/evaluationtaxonomies/{{name}}?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>' \
  --header 'content-type: application/json' \
  --data '{
  "taxonomyInput": {
    "type": "agent",
    "target": {
      "type": "azure_ai_agent",
      "name": "transmitter",
      "version": "1",
      "tool_descriptions": [
        {
          "name": "Dragon APIs",
          "description": "APIs to get information from local RAG applications"
        }
      ]
    },
    "riskCategories": [
      "ProhibitedActions"
    ]
  }
}'

Funktionsweise:

Erstellt/aktualisiert eine Taxonomieressource mit dem Namen {{name}} :
- Definiert Ziele für Agenten und Toolbeschreibungen
- Gibt die Risikokategorien von ProhibitedActions

Sie nutzen sie als Referenz

über einen file_id URI in der Create Run-Anforderung .

Erstellen einer Ausführung in einem Red Team

Eine Ausführung generiert Elemente aus einer Quelle (z. B. Taxonomie) und führt gegen den Ziel-Agent mit ausgewählten Angriffsstrategien ein Red Teaming durch.

Python
cURL

# Create a red team run with attack strategies
eval_run = client.evals.runs.create(
    eval_id=red_team.id,
    name="Red Team Agent Safety Eval Run",
    data_source={
        "type": "azure_ai_red_team",
        "item_generation_params": {
            "type": "red_team_taxonomy",
            "attack_strategies": ["Flip", "Base64", "IndirectJailbreak"],
            "num_turns": 5,
            "source": {"type": "file_id", "id": taxonomy_file_id},
        },
        "target": target.as_dict(),
    },
)
print(f"Created run: {eval_run.id}, status: {eval_run.status}")

curl --request POST \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals/{{red_team_id}}/runs?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>' \
  --header 'content-type: application/json' \
  --data '{
  "name": "Red Team Agent Run 1",
  "data_source": {
    "type": "azure_ai_red_team",
    "item_generation_params": {
      "type": "red_team_taxonomy",
      "attack_strategies": [
        "Flip",
        "Base64",
        "IndirectJailbreak"
      ],
      "num_turns": 5,
      "source": {
        "type": "file_id",
        "id": "azureai://accounts/{{account}}/projects/{{project}}/evaluationtaxonomies/{{taxonomy_name}}/versions/{{version}}"
      }
    },
    "target": {
      "type": "azure_ai_agent",
      "name": "grok-bird",
      "version": "1",
      "tool_descriptions": [
        {
          "name": "Dragon APIs",
          "description": "APIs to get information from local RAG applications"
        }
      ]
    }
  }
}'

Schlüsselfelder zum Konfigurieren der Ausführung:

attack_strategies: Beispiel: "Flip", "Base64", "IndirectJailbreak" (wählen Sie die aus, die Sie testen möchten)
num_turns: Tiefe der Mehrfachdurchläufe für generierte Red Team-Elemente
source.id: verweist per Datei-ID-URI auf Ihre Taxonomie
target: der Agent unter Test (Name, Version, Tools)

Sie erhalten

Eine Ausführung einschließlich id (speichern als {{eval_run_id}})

Abrufen einer Red Teaming-Ausführung (nach ID)

Verwenden Sie dies, um den Status Ihrer Red Teaming-Ausführung zu überprüfen (z. B. in der Warteschlange, wird ausgeführt, erfolgreich, Fehler).

Python
cURL

import time

# Poll for run completion
while True:
    run = client.evals.runs.retrieve(run_id=eval_run.id, eval_id=red_team.id)
    print(f"Status: {run.status}")
    if run.status in ("completed", "failed", "canceled"):
        break
    time.sleep(5)

curl --request GET \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals/{{red_team_id}}/runs/{{eval_run_id}}?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>'

Hinweis

Die API ist pro Anforderung synchron, aber die Ausführungen selbst werden serverseitig verarbeitet. Rufen Sie diesen Endpunkt bis zum Abschluss wiederholt ab, bevor Sie Ausgabeelemente abrufen.

Auflisten der Ausgabeelemente und Ergebnisse von Red Teaming-Ausführungen

Verwenden Sie dies, um Zusammenfassungsmetriken nach Abschluss der Red Teaming-Ausführung zu prüfen.

Python
cURL

print("[Run] Fetching output items...")
items = list(client.evals.runs.output_items.list(run_id=run.id, eval_id=red_team.id))
output_path = os.path.join(data_folder, f"redteam_eval_output_items_{agent_name}.json")
with open(output_path, "w") as f:
    f.write(json.dumps(_to_json_primitive(items), indent=2))
print(f"[Run] Done. Status={run.status}. Output items saved to {output_path}")

curl --request GET \
  --url 'https://{{account}}.services.ai.azure.com/api/projects/{{project}}/openai/evals/{{red_team_id}}/runs/{{eval_run_id}}/output_items?api-version=2025-11-15-preview' \
  --header 'authorization: Bearer <token>'

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-20