Agents testen, implementeren en integreren

Voltooid

Testen, implementeren en publiceren van agents zijn essentiële stappen bij het overstappen van ontwikkeling naar productie. Microsoft Foundry biedt uitgebreide mogelijkheden voor het valideren van agentgedrag, het implementeren in uw Foundry-project en het publiceren van agents als aanroepbare eindpunten die externe consumenten en toepassingen kunnen gebruiken.

Teststrategieën voor agents

Grondige tests zorgen ervoor dat uw agents zich betrouwbaar gedragen in diverse scenario's voordat ze gebruikers bereiken. Zowel de Foundry-portal als Visual Studio Code-extensie bieden speeltuinen voor interactieve tests.

De speeltuin effectief gebruiken:

  • Gelukkige padtests : controleer of de agent veelvoorkomende, verwachte aanvragen correct verwerkt.
  • Edge case testen - Probeer dubbelzinnige invoer, onvolledige informatie en ongebruikelijke aanvragen om aan te geven hoe agenten onzekerheid verwerken.
  • Grenstests : controleer of de agent de grenzen respecteert die zijn gedefinieerd in de instructies door aanvragen buiten het bereik te testen.
  • Gesprekstests met meerdere paden : controleer of de agent context behoudt in meerdere uitwisselingen en bouwt voort op eerdere antwoorden.
  • Aanroepen van hulpprogramma's: controleer of agents de juiste hulpprogramma's op de juiste momenten aanroepen en de resultaten correct opnemen.

Noteer testresultaten om verbeteringen bij te houden en regressies te vangen.

Agents inzetten in uw project

Microsoft Foundry biedt ondersteuning voor het implementeren van agents vanuit de portal of Visual Studio Code. Door de implementatie wordt uw agentconfiguratie opgeslagen in uw Foundry-project, zodat u deze kunt testen en herhalen.

Implementeren vanuit de Foundry-portal

  1. Navigeer naar uw agent in de Foundry-portal
  2. Controleer of de configuratie- en testresultaten voldoende zijn
  3. Selecteer Opslaan op de pagina van de agent
  4. Versie- en implementatie-instellingen bevestigen

Implementeren vanuit Visual Studio Code

  1. Open uw agent in de AI Toolkit
  2. Selecteer Opslaan in Foundry om configuratiewijzigingen te pushen
  3. Voor gehoste agents opent u het menu +Build in de ontwikkelhulpprogramma's en selecteert u Implementeren in Microsoft Foundry
  4. Selecteer uw containerconfiguratie en bevestig

Bij beide benaderingen blijft uw agent binnen uw projectwerkruimte waar teamleden deze kunnen openen en testen.

Agents publiceren naar een eindpunt

Publiceren verplaatst een agent van uw projectwerkruimte naar een beheerde Azure-resource met de naam agenttoepassing. Deze stap is wat uw agent extern aanroepbaar maakt via een stabiel eindpunt.

Wat publiceren oplevert

Wanneer u een agentversie publiceert, maakt Foundry het volgende:

  • Agenttoepassing : een Azure-resource met een eigen aanroep-URL, verificatiebeleid en Entra-agentidentiteit.
  • Implementatie : een actief exemplaar van een specifieke agentversie in de toepassing, met levenscyclusbeheer starten/stoppen.

Het belangrijkste verschil tussen implementeren en publiceren is bereik. Door de implementatie blijft de agent binnen uw project. Publiceren maakt een toegewezen eindpunt dat externe consumenten kunnen aanroepen zonder dat ze toegang nodig hebben tot uw Foundry-project.

Publiceren vanuit de Foundry-portal

  1. Selecteer in de portal de agentversie die u wilt publiceren
  2. Selecteer Publiceren om de agent-applicatie en implementatie te creëren.

Publiceren vanuit Visual Studio Code

  1. Open het opdrachtenpalet (Ctrl+Shift+P) en voer Microsoft Foundry uit: Gehoste agent implementeren voor gehoste agents
  2. Selecteer de doelwerkruimte en containerconfiguratie
  3. Bevestigen en implementeren

Na publicatie wordt de agent weergegeven in de sectie Gehoste agents (preview) van de structuurweergave van de AI Toolkit-extensie.

Het eindpunt van de agenttoepassing

Gepubliceerde agents maken een stabiel eindpunt beschikbaar met behulp van het protocol Response-API:

https://<foundry-resource-name>.services.ai.azure.com/api/projects/<project-name>/applications/<app-name>/protocols/openai/responses

Deze URL blijft hetzelfde, zelfs als u nieuwe agentversies uitrolt, zodat downstreamgebruikers niet worden onderbroken door updates.

Verificatie en identiteit

Agenttoepassingen gebruiken Microsoft Entra-id voor verificatie. Bellers moeten de rol Azure AI-gebruiker hebben op de resource Agenttoepassing. VERIFICATIE van API-sleutels wordt niet ondersteund voor agenttoepassingen.

Belangrijk

Wanneer u een agent publiceert, ontvangt deze een eigen toegewezen Entra-identiteit, gescheiden van de gedeelde identiteit van het project. Machtigingen worden niet automatisch overgedragen. U moet RBAC-rollen opnieuw toewijzen aan de nieuwe agentidentiteit voor alle resources die de agent benadert. Als u deze stap overslaat, kunnen oproepen van hulpmiddelen die tijdens de ontwikkeling werken, vanwege autorisatiefouten mislukken zodra de agent is gepubliceerd.

Het eindpunt verifiëren

Controleer na publicatie of het eindpunt werkt:

  1. Een toegangstoken ophalen:

    az account get-access-token --resource https://ai.azure.com
    
  2. Roep het eindpunt van de agenttoepassing aan:

    curl -X POST \
      "https://<foundry-resource-name>.services.ai.azure.com/api/projects/<project-name>/applications/<app-name>/protocols/openai/responses?api-version=2025-11-15-preview" \
      -H "Authorization: Bearer <access-token>" \
      -H "Content-Type: application/json" \
      -d '{"input":"Say hello"}'
    

Als u 403 Forbidden ontvangt, controleer of de beller de rol Azure AI-gebruiker heeft voor de agenttoepassingsresource.

Gepubliceerde agenten bijwerken

Een nieuwe agentversie implementeren:

  1. Breng wijzigingen aan in uw ontwikkelomgeving en test grondig
  2. In de Foundry-portal selecteer je Updates Publiceren in de Agent-playground.
  3. De agenttoepassing stuurt automatisch 100% verkeer naar de nieuwe versie

De eindpunt-URL blijft ongewijzigd, zodat bestaande integraties blijven werken.

Integratiecode genereren

De Microsoft Foundry VS Code-extensie genereert voorbeeldintegratiecode om uw toepassing te verbinden met een gepubliceerde agent:

  1. Selecteer uw geïmplementeerde agent in de weergave Mijn bronnen
  2. Selecteer Code weergeven
  3. Uw map kiezen
  4. De extensie genereert code voor verificatie, verbinding maken, berichten verzenden en antwoorden verwerken

Integratiepatronen

Veelvoorkomende patronen voor het integreren van gepubliceerde agents zijn:

  • Webtoepassingen : gebruikersberichten verzenden naar het eindpunt van de antwoorden-API en antwoorden weergeven in uw gebruikersinterface. Sla de gespreksgeschiedenis bij de client op voor interacties met meerdere wendingen.
  • API-gestuurde werkstromen : roep het agenteindpunt aan vanuit back-endservices die worden geactiveerd door gebeurtenissen of planningen. Reacties programmatisch verwerken om downstreamacties te stimuleren.
  • Chatbotinterfaces : gebruikerssessies toewijzen aan gesprekken. Afhandelen van realtime berichtuitwisseling via het eindpunt.
  • Automatisering op de achtergrond : plan agentoproepen voor terugkerende taken. Voer systeemgegevens in agents en procesuitvoer om bedrijfssystemen bij te werken.

Overwegingen voor productie

Het uitvoeren van agents in de productieomgeving vereist aandacht voor verschillende operationele gebieden.

  • Bewaking: reactietijden bijhouden, slagingspercentages voor hulpprogramma's, foutpatronen en tokenverbruik bijhouden met behulp van Application Insights-integratie.
  • Beveiliging : gebruik beheerde identiteiten voor verificatie, pas toegang met minimale bevoegdheden toe en definieer beleid voor gegevensretentie.
  • Kostenbeheer : bewaak het tokengebruik, stel de limieten voor de reactielengte in en implementeer frequentielimieten om onverwachte pieken te voorkomen.
  • Foutafhandeling: implementeer logica voor opnieuw proberen met exponentieel uitstel voor tijdelijke fouten. Snelheidslimieten verwerken met back-off-strategieën. Valideer invoer voordat u naar agents verzendt.
  • Gespreksbeheer : agenttoepassingseindpunten ondersteunen momenteel alleen de stateless Response-API. Sla de gespreksgeschiedenis op in uw client voor ervaringen met meerdere beurten.