Tester, déployer et intégrer des agents

Effectué

Les tests, le déploiement et la publication des agents sont des étapes critiques pour passer du développement à la production. Microsoft Foundry fournit des fonctionnalités complètes pour valider le comportement de l’agent, le déploiement sur votre projet Foundry et la publication d’agents en tant que points de terminaison appelants que les consommateurs externes et les applications peuvent utiliser.

Stratégies de test pour les agents

Les tests approfondis garantissent que vos agents se comportent de manière fiable dans différents scénarios avant d’atteindre les utilisateurs. Le portail Foundry et l’extension Visual Studio Code fournissent des terrains de jeu pour les tests interactifs.

Utilisation efficace du terrain de jeu :

  • Test de chemin d’accès heureux : vérifiez que l’agent gère correctement les demandes courantes et attendues.
  • Test de cas Edge : essayez des entrées ambiguës, des informations incomplètes et des demandes inhabituelles pour révéler comment les agents gèrent l’incertitude.
  • Test des limites : vérifiez que l’agent respecte les limites définies dans ses instructions en testant les demandes hors portée.
  • Test de conversation à plusieurs tour - Vérifiez que l’agent conserve le contexte entre plusieurs échanges et s’appuie sur les réponses précédentes.
  • Test d’appel d’outil : vérifiez que les agents appellent les bons outils au bon moment et incorporent correctement les résultats.

Enregistrez les résultats des tests pour suivre les améliorations et intercepter les régressions.

Déploiement d’agents sur votre projet

Microsoft Foundry prend en charge le déploiement d’agents à partir du portail ou de Visual Studio Code. Le déploiement enregistre la configuration de votre agent dans votre projet Foundry afin de pouvoir tester et itérer.

Déploiement à partir du portail Foundry

  1. Accédez à votre agent dans le portail Foundry
  2. Vérifier que la configuration et les résultats des tests sont satisfaisants
  3. Sélectionner Enregistrer dans la page de l’agent
  4. Confirmer les paramètres de version et de déploiement

Déploiement à partir de Visual Studio Code

  1. Ouvrez votre agent dans l'AI Toolkit
  2. Sélectionnez Enregistrer dans Foundry pour envoyer (push) les modifications de configuration
  3. Pour les agents hébergés, ouvrez le menu +Générer dans les outils de développement, puis sélectionnez Déployer sur Microsoft Foundry
  4. Sélectionnez votre configuration de conteneur et confirmez

Les deux approches conservent votre agent dans votre espace de travail de projet où les membres de l’équipe peuvent y accéder et les tester.

Déploiement d’agents sur un point de terminaison

La publication déplace un agent de votre espace de travail de projet dans une ressource Azure managée appelée application agent. Cette étape est ce qui rend votre agent pouvant être appelé en externe par le biais d’un point de terminaison stable.

Ce que la publication produit

Lorsque vous publiez une version de l’agent, Foundry crée :

  • Application de l’agent : ressource Azure avec son propre URL d’appel, stratégie d’authentification et identité de l’agent Entra.
  • Déploiement : instance en cours d’exécution d’une version d’agent spécifique à l’intérieur de l’application, avec la gestion du cycle de vie de démarrage/arrêt.

La principale différence entre le déploiement et la publication est l’étendue. Le déploiement conserve l’agent au sein de votre projet. La publication crée un point de terminaison dédié que les consommateurs externes peuvent appeler sans avoir à accéder à votre projet Foundry.

Publication à partir du portail Foundry

  1. Dans le portail, sélectionnez la version de l’agent que vous souhaitez publier
  2. Sélectionnez Publier pour créer l’application et le déploiement de l’agent

Publication à partir de Visual Studio Code

  1. Ouvrez la palette de commandes (Ctrl+Maj+P) et exécutez Microsoft Foundry : Déployer l’agent hébergé pour les agents hébergés
  2. Sélectionner l’espace de travail cible et la configuration du conteneur
  3. Confirmer et déployer

Après la publication, l’agent apparaît dans la section Agents hébergés (préversion) de l’arborescence de l’extension AI Toolkit.

Point de terminaison de l'application Agent

Les agents publiés exposent un point de terminaison stable à l’aide du protocole API Réponses :

https://<foundry-resource-name>.services.ai.azure.com/api/projects/<project-name>/applications/<app-name>/protocols/openai/responses

Cette URL reste la même que vous déployez de nouvelles versions d’agent, de sorte que les consommateurs en aval ne sont pas perturbés par les mises à jour.

Authentification et identité

Les applications agent utilisent l’ID Microsoft Entra pour l’authentification. Les appelants doivent avoir le rôle d’utilisateur Azure AI sur la ressource Application agent. L’authentification par clé API n’est pas prise en charge pour les applications agent.

Important

Lorsque vous publiez un agent, il reçoit sa propre identité Entra dédiée, distincte de l’identité partagée du projet. Les autorisations ne sont pas transférées automatiquement. Vous devez réaffecter des rôles RBAC à la nouvelle identité de l’agent pour chaque ressource à laquelle l’agent accède. Si vous ignorez cette étape, les appels d’outils qui fonctionnent pendant le développement échouent avec des erreurs d’autorisation une fois l’agent publié.

Vérification du point de terminaison

Après la publication, vérifiez que le point de terminaison fonctionne :

  1. Obtenez un jeton d’accès :

    az account get-access-token --resource https://ai.azure.com
    
  2. Appelez le point de terminaison d’application de l’agent :

    curl -X POST \
      "https://<foundry-resource-name>.services.ai.azure.com/api/projects/<project-name>/applications/<app-name>/protocols/openai/responses?api-version=2025-11-15-preview" \
      -H "Authorization: Bearer <access-token>" \
      -H "Content-Type: application/json" \
      -d '{"input":"Say hello"}'
    

Si vous recevez 403 Forbidden, vérifiez que l’appelant a le rôle d’utilisateur Azure AI sur la ressource Application agent.

Mise à jour des agents publiés

Pour déployer une nouvelle version de l’agent :

  1. Apportez des modifications à votre environnement de développement et testez soigneusement
  2. Dans le portail Foundry, sélectionnez Publier les mises à jour à partir du terrain de jeu de l’agent
  3. L’application agent achemine automatiquement 100% du trafic vers la nouvelle version

L’URL du point de terminaison reste inchangée, de sorte que les intégrations existantes continuent de fonctionner.

Génération de code d’intégration

L’extension Microsoft Foundry VS Code génère un exemple de code d’intégration pour connecter votre application à un agent publié :

  1. Sélectionnez votre agent déployé dans la vue Mes ressources
  2. Sélectionner Afficher le code
  3. Choisir votre dossier
  4. L’extension génère du code pour l’authentification, la connexion, l’envoi de messages et le traitement des réponses

Modèles d’intégration

Les modèles courants pour l’intégration d’agents publiés sont les suivants :

  • Applications web : envoyez des messages utilisateur au point de terminaison de l’API Réponses et affichez les réponses dans votre interface utilisateur. Stocker l’historique des conversations côté client pour les interactions à plusieurs tours.
  • Flux de travail pilotés par l’API : appelez le point de terminaison de l’agent à partir des services principaux déclenchés par des événements ou des planifications. Traitez les réponses par programmation pour générer des actions en aval.
  • Interfaces de chatbot : mapper les sessions utilisateur aux conversations. Gérez l’échange de messages en temps réel via le point de terminaison.
  • Automatisation en arrière-plan - Planifier des appels d’agent pour les tâches périodiques. Alimentez les données système dans les agents et traitez les sorties pour mettre à jour les systèmes métier.

Considérations relatives à la production

L’exécution d’agents dans des environnements de production nécessite une attention particulière à plusieurs domaines opérationnels :

  • Surveillance : suivez les temps de réponse, les taux de réussite des appels d’outils, les modèles d’erreur et la consommation de jetons à l’aide de l’intégration d’Application Insights.
  • Sécurité : utilisez des identités managées pour l’authentification, appliquez l’accès avec des privilèges minimum et définissez des stratégies de rétention des données.
  • Gestion des coûts : surveillez l’utilisation des jetons, définissez des limites de longueur de réponse et implémentez la limitation du débit pour éviter les pics inattendus.
  • Gestion des erreurs : implémentez une logique de nouvelle tentative avec interruption exponentielle pour les échecs temporaires. Gérer la limitation du débit avec des stratégies de limitation progressive. Validez les entrées avant d’envoyer aux agents.
  • Gestion des conversations – Les points de terminaison de l’application Agent prennent actuellement en charge uniquement l’API stateless Responses. Stockez l’historique des conversations dans votre application client pour des expériences à tours multiples.