Merk
Tilgang til denne siden krever autorisasjon. Du kan prøve å logge på eller endre kataloger.
Tilgang til denne siden krever autorisasjon. Du kan prøve å endre kataloger.
Å bygge en effektiv agent strekker seg utover redigeringsinstruksjoner og tilkobling av data og verktøy. Etter distribusjonen må team kontinuerlig evaluere, diagnostisere og forbedre agentatferden for å sikre at den oppfyller forretnings-, kvalitets- og sikkerhetsforventningene.
Dette settet med artikler introduserer et praktisk rammeverk for forbedringsfasen av livssyklusen for agentutvikling. Rammeverket hjelper deg med å ta evalueringsresultater (resultater, mislykkede testtilfeller og regresjoner) og gjøre dem om til klare, prioriterte handlinger.
Bruk dette rammeverket når du har evalueringsresultater og må bestemme deg for hva du skal gjøre videre. Vanlige scenarioer omfatter:
- Et evalueringssett scorer under en forventet terskel.
- Bestemte testtilfeller mislykkes, og årsaken er uklar.
- Resultatene forbedres i ett område, men regress i et annet.
- Flere evalueringssett mislykkes og prioriteringer er uklare.
- Virkemåten til en agent endres uventet etter en oppdatering.
Dette rammeverket forutsetter at du allerede har bestått eller mislykket resultater for individuelle testtilfeller på tvers av ett eller flere evalueringssett.
Tips
Før du bruker dette rammeverket for triage og utbedring, kan du konfigurere og kjøre evalueringer for agenten din. Lær mer om utforming av et iterativt evalueringsrammeverk.
Neste trinn
Forstå målene for rammeverket for triage og utbedring, inkludert struktur- og utformingsprinsipper.